王麗 譚凱波 黃云
(1. 吉首大學旅游管理與工程學院,張家界 427000;2. 吉首大學軟件學院,張家界 427000;3. 吉首大學圖書館,張家界 427000)
1998年,交互設計之父Cooper[1]提出了用戶畫像的概念,用戶畫像是目標用戶的具體表示,即“建立在一系列屬性數據之上的目標用戶模型”。此后,關于用戶畫像的概念、特性、構建及應用等研究廣泛開展,取得了豐碩成果。在圖書情報領域,研究者嘗試引入用戶畫像技術以幫助圖書館更好地提供個性化服務。裘惠麟等[2]從大數據利用狀況、圖書館服務轉型需要以及技術發展3個層面分析了基于用戶畫像技術的高校圖書館個性化精準服務的可行性。也有研究者開始構建適用于圖書館個性化服務的高精度用戶畫像模型,例如:陳臣等[3]建立了基于讀者小數據的用戶精準畫像;劉海鷗等[4]利用圖書館用戶的基本信息、內容偏好數據、互動數據、會話數據、情境數據構建用戶畫像;蔣弘毅[5]基于用戶的閱讀行為建立用戶畫像;趙楊等[6]利用用戶移動大數據構建用戶畫像。還有一些研究者重點研究了基于用戶畫像的圖書館個性化服務的具體應用:王順箐[7]將用戶畫像和觀點分析方法應用于個性化閱讀推薦服務;李書寧[8]構建文史學科用戶畫像用以分析學科忠誠用戶和關鍵用戶,實現文史學科研究服務的個性化;何娟[9]提出基于用戶個人和群體畫像結合的圖書個性化推薦服務;劉海鷗等[10]提出應用深度學習技術實現基于深度畫像的個性化學習服務;陳丹等[11]從知識服務、閱讀推廣、場景推薦、主動定制等方面提出圖書館個性化智慧服務策略;李寶[12]提出基于冷啟動用戶畫像和閱讀過程用戶畫像的個性化閱讀資源推送。
許多公共圖書館、高校圖書館在智慧圖書館建設過程中,利用圖書館用戶的屬性、行為、狀態等相關數據,結合大數據、人工智能等技術,深度挖掘用戶信息,構建用戶畫像模型,將其應用于圖書館個性化服務中,實現了圖書推薦、知識推送等部分業務的個性化服務,產生了一定的應用成效。然而,筆者在閱讀相關文獻和對圖書館用戶進行調研的基礎上,發現當前基于用戶畫像的圖書館個性化服務中存在一些典型問題,通過對這些問題的分析,繼而提出相應的改進策略,以期提高基于用戶畫像的圖書館個性化服務的質量、效率和用戶滿意度。
首先,通過對相關領域文獻的調研初步發現基于用戶畫像的圖書館個性化服務可能存在的問題,如郝雨[13]、周東波[14]、韓志超[15]、任秋菊[16]、李春生[17]等學者指出基于用戶畫像的個性化服務中存在價值迷失、促進壞習慣養成、群體極化、形成信息繭房等問題。董哲瑾[18]、吳樹芳[19]等學者研究了基于微博用戶畫像的個體成長路徑預測和關注主題變化的規律,其成果可借鑒并引入到基于用戶畫像的個性化成長路徑規劃和個性化學習進度規劃之中。
其次,分別于2019年12月、2020年12月和2021年7月針對吉首大學軟件學院學生接受基于用戶畫像的圖書館個性化服務的情況開展問卷調查。3次調查分別發放了542份、828份和711份問卷,回收有效答卷486份、711份和304份。第一次調查問題包括“是否了解圖書館個性化服務功能”“是否接收過個性化推送”等問題;第二次調查問題包括“你認為吉首大學的個性化服務是否存在過度推送”“有哪些需要改進的服務”等問題;第三次調查針對智慧校園下的個性化資源服務進行調研,包括對超星平臺、云資源平臺的個性化功能評價及期望等。此外,2021年6月在2個班級中開展了個性化服務改進建議的專題座談,學生建議增加適應個人能力和學習進度的數字資源推送,并在接受個性化服務時能獲得專業老師對前沿知識的指導。
最后,針對學生接受基于用戶畫像的個性化服務的數據進行統計分析,包括學生接受服務的頻次、人群分布,以及學生對推送服務的認可(如點擊率)等。
1.2.1 過度服務與不當服務
用戶畫像的構建利用了用戶興趣偏好、行為習慣、社交關系等特征信息,能真實反映用戶需求。利用用戶畫像模型中的用戶喜好特征標簽集合,基于用戶畫像的個性化服務通過匹配關聯性知識資源,為用戶提供個性化閱讀推廣[3,7,11,12,20]、個性化圖書推薦[21-22]、個性化知識推送[23]等服務。
基于用戶喜好的個性化服務有利于獲得用戶較高的滿意度,有利于服務的推廣,然而,一方面,對用戶喜好不進行辨識的個性化服務可能產生不當服務。張慧敏等[24]認為,基于用戶畫像的服務應具有價值取向維度,須有利于用戶個人價值和社會價值提升。郝雨等[13]研究表明,許多基于用戶畫像的個性化服務可能導致價值迷失:“由于用戶興趣中充斥著大量的低級趣味,僅以用戶興趣為內容衡量標準往往會造成隱含負面價值取向的內容被大量推送。”另一方面,對用戶喜好不加限制地提供服務可能導致過度服務,讓愛好變成一種嗜好。課題組針對吉首大學軟件學院18~20級學生的問卷調查發現:22.6%的學生認為在電子閱覽和圖書借閱中存在過度推送;對42名多門課程不及格學生的圖書借閱和推送記錄進一步調查發現,45.2%的學生在借閱小說等圖書后,系統連續為其推送了大量相關圖書。例如,2020年10月,某學生持續借閱了《星辰變》等小說,圖書借閱系統為其推薦了《斗羅大陸》《酒神》等相關圖書,該學生花費了大量時間和精力閱讀系統推薦的圖書,而系統基于該學生的行為反饋逐漸加強了對同一類型小說的推送。這種不加分析的個性化服務推送對于自我控制能力較差的學生學業發展及身心健康成長都極為不利。
此外,蔣弘毅[5]、孫守強[25]利用用戶行為習慣數據建立標簽,并基于用戶行為提出了滿足個體習慣的圖書館個性化服務,例如按用戶閱讀周期、就座習慣等標簽安排服務時間、自習位置等。周東波等[14]認為,部分不加區分的個性化服務會促進壞習慣的養成,“壞習慣將阻礙個人發展與成才”。筆者經調研發現:基于學生作息習慣,校園云資源平臺在晚上11點后為超過50%的同學提供平臺最新咨詢;基于學生閱讀位置習慣,選座系統為15%的學生推薦燈光昏暗的角落。對個體行為習慣提供非正確方式的個性化服務,可能帶來學生身體素質下降、人格扭曲等不良結果。
此外,基于用戶畫像開展團隊分析,在進行進行個性化閱讀好友、學習好友推薦時,基于社交關系標簽的推薦算法讓交互頻繁或者興趣、習慣等相似的用戶聚類成簇,然而這種個性化好友推薦可能會導致少量與社會發展不協調的團隊形成,產生信息同質激蕩風險,造成用戶價值觀念的群體極化[15],如放棄學業的群體、悲觀抑郁群體等。
1.2.2 服務“內卷”嚴重
“內卷”(Involution)是指事物發展到一定狀態之后無法繼續向上、向前發展,而是向內卷曲,呈現停滯或倒退趨勢的現象。曾建勛[26]認為,在文獻情報領域存在“內卷化”現象,主要表現在資源建設、平臺建設、服務質量等方面。同樣,基于用戶畫像的個性化服務也存在“內卷化”的現象。
(1)逐漸形成“信息繭房”。“信息繭房”的概念最早由凱斯·桑斯坦[27]提出,是指受到個體興趣引導,用戶被動接收與其興趣相關的信息,長此以往,個人接觸到的信息深度與廣度受限,從而將自己禁錮在蠶繭一樣的封閉空間。任秋菊等[16]認為,個性化推薦技術充分迎合了用戶的興趣偏好,在幫助用戶解決信息獲取成本與質量等問題的同時,讓用戶對固化的信息交流渠道形成依賴,無意識地陷入以個體為中心的“信息繭房”中。通過對校園云資源平臺個性化推送的點擊反饋情況統計,有70%的瀏覽為推送的前10條記錄,而這10條記錄主要覆蓋了用戶的前3個興趣偏好相關的主題。由此可見,基于用戶興趣的個性化服務易促使“信息繭房”的形成,導致信息服務的廣度變得越來越小,信息交流的圈子越來越窄,信息獲得的方式越來越單一。
(2)個性化服務的知識總體缺乏結構化設計。為提升學習的效率,充分利用碎片化時間[28],基于用戶畫像的個性化服務更加注重微閱讀、微視頻、微課程等服務方式。然而,個性化服務的知識堆積、斷裂,快餐式、碎片化、重疊型的知識服務讓個性化服務“內卷”嚴重[17]。一方面,基于用戶畫像的圖書館個性化服務強調資源標簽與用戶標簽的匹配,以匹配度高低排列知識推送、個性搜索順序。然而多個資源之間的關聯關系、資源與知識之間的覆蓋關系、用戶不同興趣之間的主題結構關系等諸多因素考慮不足,導致個性化服務的質量難以提高。另一方面,對同一用戶前后多次服務之間的知識類別、知識銜接、知識互補等分析不足,不同時間的推送知識之間重復知識過多,導致用戶對服務的滿意度逐漸下降。在對吉首大學軟件學院18級專業成績排名前100的學生接受圖書館數字資源推送服務情況的調查顯示,知識與專業相關度超過90%,但連續5次推送存在重復內容超過70%,知識相關且知識點連貫的不足10%,知識簡單但注重展現形式的超過75%,知識講解深入的不足20%,學生亟需注重知識連貫、知識深度和知識拓展的個性化服務。
1.2.3 忽略成長過程
基于用戶畫像的圖書館個性化服務依據用戶當前屬性、興趣、能力、習慣、活動等信息,雖能正確反映用戶當前需求,卻忽略了用戶成長過程的差異,忽略了對用戶成長規律的挖掘,忽略了用戶追求夢想和達成目標的深刻分析等,一方面造成服務的個性化和準確性下降,另一方面讓歷史數據失去了應有的價值。
(1)缺乏用戶成長路徑的挖掘。許多基于動態用戶畫像的個性化服務強調了用戶標簽的即時更新,按用戶最新形象進行精準服務[29-31]。然而,董哲瑾等[18]在基于微博用戶畫像的研究中發現,即使當前興趣愛好、行為習慣完全相同的不同個體,其歷史信息仍可能存在較大差異。由于用戶歷史標簽雖有部分被記錄,但并未利用其對用戶成長過程進行關聯、分類、聚類等運算,導致用戶成長經歷不能真實還原和可視化呈現,進而無法根據其成長特征進行更精準、更具個性化的知識服務。
(2)缺少用戶學習進度的分析。在針對微博用戶的個性化推送中,吳樹芳等[19]利用興趣轉移衰減函數實現用戶關注詞條變化的預測,進而建立基于用戶畫像的個體興趣變化分析模型。但在基于用戶畫像的圖書館個性化服務中,目前還缺少針對用戶學習進度的分析。由于未對歷史畫像進行詳細的分析和處理,用戶歷史標簽變化規律、模式等未被分析與利用,不能充分了解用戶的學習進度,也就無法掌握用戶的學習進展規律、關鍵節點,不能深入分析用戶間學習進度產生差異的原因,以及促進學生學習進度迅速提升的核心因素等,也就無法基于用戶知識增長的速度適應性地調整為用戶推送知識的數量與難度,無法讓用戶進行高效且有成就感的學習。在對吉首大學軟件學院18級3班、5班學生接受專業知識推送的分析中發現,當前學習狀態相似的學生收到的推送知識基本一致,當某學生連續關注和其他學生同樣的知識點后,其推送的內容也趨于一致,而未考慮該學生以前興趣的影響。
(3)缺少用戶知識獲取目標及達成度的分析。基于用戶畫像的圖書館個性化服務往往通過用戶對推送知識的采納程度預測服務的質量,前文已經分析由此可能導致“信息繭房”的產生。現實中,即使用戶未獲得希望推送的知識資源,往往也愿意被動接受個性化服務為其提供的資源。由此可見,僅以信息使用率評價服務的滿意度,無法真實反映用戶需求的達成度,也無法證實用戶知識獲取目標。因為基于現實數據的用戶畫像構建,缺少對用戶知識獲取目標的分析,進而無法提供基于用戶真實目標的個性化服務。在吉首大學軟件學院18~20級828名學生中關于云資源平臺知識個性化推送的滿意度調查結果顯示,其滿意度僅為65.1%;針對學生對個性化推送知識的點擊信息反饋情況分析,有89.4%的推送信息被用戶點擊,有83.3%的推送信息被瀏覽或下載。
余孟杰[32]認為用戶畫像是以大數據環境提供數據基礎,抽象出能完美呈現用戶全貌的標簽信息集合;余傳明等[33]認為用戶畫像是依據用戶的人口統計學特征、社交關系和行為模式等抽象構造出的標簽化的用戶模型。本文基于上述定義,通過優化并合理利用代表真實用戶的標簽信息集合,在此基礎上提出基于用戶畫像的個性化服務的改進策略。
課題組認為,為了提高個性化服務質量,首先需要優化用戶畫像質量,然后在此基礎上提升個性化服務水平。在用戶畫像構建階段,首先需要對用戶標簽集進行辨識、區分,確保用戶畫像蘊含正確的價值取向;其次,將個體用戶標簽與群體標簽集進行關聯,并通過關聯主題知識圖譜,確保用戶畫像標簽集不被束縛在狹窄的主題領域內;最后,還需要利用序列挖掘、回歸分析等算法對用戶歷史畫像建模,確保用戶的成長規律能動態呈現。在個性化服務階段,首先需要利用用戶標簽的標識信息,對個性化服務內容進行分級,以確保最有利于用戶發展的個體興趣被優先服務;其次,除了最大限度考慮服務內容、方式與用戶興趣、習慣相匹配,還需考慮群體興趣、知識關聯領域等知識服務,有效預測用戶在其他領域的潛在興趣,避免服務“內卷”;此外,也可借助用戶成長路徑和學習進度分析,為用戶定制個性化閱讀計劃、個性化知識推送時間進度安排等;最后,還需多方接受用戶反饋,形成客觀全面的個性化服務評價,并以此為依據不斷改善個性化服務質量。
在進行個性化服務前,首先可對用戶畫像的標簽進行識別與標記,包括不利于用戶發展的興趣偏好和行為習慣的判定與標識、需進一步細化挖掘的標簽集合等,然后根據標簽的標記信息,提供更有利于用戶健康發展的個性化服務。
(1)識別可能阻礙用戶成長的標簽,遏制與其相關的個性化服務。利用聚類及關聯分析算法等對用戶興趣偏好標簽及其權重分析,找出與其身份標簽不相符但權重特別大的興趣標簽,以及影響青少年成長的興趣偏好如賭博、暴力、悲觀厭世等相關標簽,在個性化服務時過濾相關服務內容,給出終止相關服務提醒,用戶僅在特別授權后方可獲得相關服務。在識別用戶具有上述興趣后,可進一步聯系學生工作輔導員及心理疏導教師等,對學生進行特別關注;也可提供對遏制相關興趣有幫助的知識服務,如發放賭博危害宣傳資料等。
(2)識別影響個體持續健康發展的標簽,抑制與其相關的個性化服務。結合用戶能力特長標簽及興趣偏好標簽信息,以及用戶對提供個性化知識服務的接收情況,運用主題發現及關聯分析方法,識別與能力特長不相匹配、權重加大且大量接收相關知識服務的興趣偏好,在個性化服務中減少相關內容、拖后服務順序、降低服務頻率。將用戶行為習慣特征中的訪問周期標簽等與用戶的身份類別、作息時間進行匹配,對于影響用戶正常作息的習慣標簽,在個性化服務時隨機調整到空閑時間,并基于用戶使用反饋情況,最終確定服務時間。
(3)識別與能力特長及發展目標相符的標簽,增加服務的深度與廣度。通過對專業標簽、興趣標簽、能力標簽的整理,結合用戶發展愿景調研,利用時間序列分析及回歸預測算法等,建立用戶成長路徑規劃圖,依照用戶成長模式分析,識別有能力基礎、與目標方向一致的標簽主題,結合知識圖譜中的主題匹配,提供更系統、更深入、更全面的個性化主題服務,包括提供基于能力標簽初選和興趣標簽二次篩選的個性化信息檢索,基于用戶興趣、能力、個體發展愿景的知識推送服務,基于知識圖譜與個性標簽結合的個性化知識問答服務等。
為防止圖書館個性化服務的“內卷”,將用戶興趣標簽與專業屬性及能力特長標簽進行關聯,將用戶標簽與群體標簽進行關聯,引入知識圖譜,將資源的內容與主題關聯,將資源的應用領域進行關聯,實現領域內知識的體系化服務,實現不同領域知識的跨界遷移服務。
(1)生成包含用戶個體信息的知識子圖。將用戶個體興趣標簽、專業標簽及能力標簽與知識圖譜中的相應主題進行映射,并在知識圖譜中將映射的主題進行關聯擴展,構建包含用戶標簽映射主題的極小子圖。
(2)建立面向用戶群體的知識關聯子圖。通過對用戶所在的群體用戶挖掘,以群體用戶畫像中的興趣標簽為中心并結合用戶密接好友的興趣標簽,將其映射到相應的知識圖譜之中,然后以映射的主題為中心進行主題關聯擴展,建立包含群體畫像標簽映射的群體用戶知識關聯子圖。
(3)領域內知識體系化服務和多學科知識跨界遷移服務。基于用戶興趣標簽和專業屬性標簽,結合包含用戶個體信息的知識子圖,并通過與知識資源庫的主題匹配,為用戶提供覆蓋用戶領域知識關聯子圖、層層深入、緊密關聯的知識服務,以保證用戶獲得知識的連貫和深度,包括為用戶提供基于領域知識和個體興趣的個性化信息檢索服務,基于領域知識上下文分析的個性化知識群系列化推送服務,個體知識體系可視化建模服務等。為防止“信息繭房”的形成,可在用戶關聯子圖、群體知識關聯子圖中,找出跨學科的相關知識主題,并進行跨界遷移學習,如隨機遷移、主題相關遷移等,為用戶提供非其關注領域的相關知識,包括基于主題周期性遷移的知識推送服務、基于反向排序規則的知識檢索服務、基于應用領域隨機遷移的知識應答服務等。
為了深入分析用戶成長過程,挖掘學習用戶畫像發展演化規律,需要將用戶標簽的變化信息詳細記錄,通過時間序列挖掘算法,找出標簽變化的關鍵節點,然后通過因果關系的解釋學習算法,找出發展變化的內在關鍵因素,可通過Logistics回歸(對數幾率回歸)分析等對用戶變化規律進行預測,進而提供更符合用戶持續發展需要的個性化服務。
(1)用戶歷史標簽記錄與歷史畫像形成。通過記錄用戶畫像標簽變化的時間,并通過關鍵時間節點的用戶畫像生成與存儲,形成基于時間軸的用戶歷史畫像集合。
(2)歷史畫像演化模式構建。運用序列挖掘算法,發現對全體用戶歷史畫像演化規律,并運用K-means算法、增強學習算法等,聚類、抽象得到用戶歷史畫像常規演化模式集合。
(3)用戶成長路徑生成及學習進度分析。通過回歸分析及路徑規劃算法等,將用戶個體成長數據與歷史畫像演化模式相對比,找出用戶個體知識發展規律。
(4)基于用戶成長的個性化服務。通過對用戶個體發展特征分析,結合全體用戶發展演化的普遍規律和模式,利用演化推薦算法和基于時間序列的推薦算法等,為用戶提供個性化知識推送服務。例如,通過對用戶興趣標簽變化的路徑擬合,預測用戶興趣未來發展,并結合知識發展前沿,為其推送符合個人發展和時代發展需要的知識。
基于用戶對個性化服務的采納程度,無法實現對服務質量的全面評價。一方面,需要多方位獲取用戶對服務的反饋信息,進而建立綜合性評價指標體系;另一方面,也可改變服務部門自身評價或系統自動評價的方式,采用第三方評價、部門互評等多種評價方式。基于全面客觀的服務評價,針對個性化知識服務中的不足之處進行改進,進而實現用戶真實滿意度的有效提升。
用戶的反饋方式可包括調查問卷反饋、平臺點贊/拍磚反饋、平臺留言反饋、平臺打分反饋等顯性反饋方式;也可通過智慧圖書館對用戶表情、情緒及留言等分析,挖掘用戶接受服務時的真實心情,進而計算用戶對個性化服務質量的打分;此外,基于對用戶能力增長幅度與服務內容關聯度分析,計算服務對用戶成長的弱影響力,也可適當用于服務質量評價。
基于多路反饋和多方評價,圖書館個性化服務體系可逐步優化服務方式和服務內容,包括實行基于優先改進最差評價的個性化服務方式調整策略、提供基于優先滿足用戶當前愿景實現的個性化知識推送服務等。
基于用戶畫像的標簽統計、關聯、聚類、演化分析等,深入發掘用戶對知識的個性化需求以及獲取知識的習慣特征,結合語義分析、主題發現算法等為其提供極大滿足個體需要的精準服務,提升了個性化服務的質量,提高了知識服務的效率。然而,基于用戶畫像的圖書館個性化服務仍在研究改進中,研究發現,由于未對用戶畫像標簽進行有效分析,圖書館個性化服務中出現了助長負面喜好、放任不良習慣問題;由于大量研究與應用以用戶的點擊瀏覽率等相關反饋作為服務質量衡量的標準,導致服務主題緊縮,進而形成“信息繭房”,同時過度注重服務形式,以碎片化、重疊性、淺層次服務代替體系化、多形式、深度服務,讓圖書館個性化服務“內卷”;由于放棄對用戶歷史畫像的建模挖掘,未對用戶的學習演化規律進行深入研究,無法對其知識成長軌跡和學習進度等情況加以分析利用,無法提供更有利于個體成長的知識服務。針對這些不可忽視的問題,本文從標簽辨識、標簽關聯分析和標簽演化規律發現入手,提出進行服務分級、服務遷移和服務拓展的個性化服務策略。在后續的研究中,還可分析不同用戶間的相似度,實現基于用戶差異的興趣遷移服務;可通過個性化服務中的第三方評價,輔助調整服務方式和服務內容。