

摘要:在大數據背景下,從傳統圖書館到智慧圖書館,圖書資源呈指數級增長。隨著館藏圖書資源的增加,讀者在選取圖書時愈發凸顯出“選擇困難癥”的問題,找不到需要的圖書資源。圖書館只有更了解讀者,才不至于讓海量的圖書資源長期只存儲在設備中休眠。文章設計的圖書推薦系統是基于用戶畫像的個性化推薦系統,是在協同過濾等算法的基礎上,結合用戶的畫像信息,來更精準地推薦書籍和提供服務。該系統通過收集用戶靜態數據,挖掘用戶的動態數據,分析用戶行為,進而實現圖書精確推薦,提高圖書資源的利用率。
關鍵詞:智慧圖書館;用戶畫像;個性化;推薦系統
中圖分類號:TP311.56
文獻標志碼:A
0 引言
隨著數字化技術的發展,圖書的數量和種類呈現指數級增長,這使得用戶在選擇圖書時面臨巨大的挑戰。用戶往往難以從海量的圖書資源中找到真正符合自己興趣和需求的圖書,因此,傳統紙質圖書館逐漸朝圖書數字化轉變。智慧圖書館通過結合信息技術、人工智能和大數據分析等先進技術,為圖書館的圖書管理提供了新的機遇和方向。數字化圖書館的建設為圖書館的資源共享和讀者服務提供了更便捷的方式。更重要的是,智慧圖書館通過獲取讀者的基本信息、搜索信息以及圖書館系統個人日志等,預測用戶行為,為用戶推薦所需的圖書資源,大大減少了用戶查找圖書消耗的時間,營造了更加便捷的圖書借閱體驗。
1 智能圖書館發展現狀
1.1 智能圖書館現狀
國內智慧圖書館的建設進程在逐步加快。例如移動智慧借閱服務,上海圖書館推出了支付寶圖書館城市服務微站,深圳圖書館創新了“微信”“支付寶”等移動社交平臺的“圖書館之城”移動服務。智慧圖書館將圖書館服務鏈接到各類App、小程序、公眾號中,如支付寶、微信錢包的城市服務[1]。讀者可通過相關軟件進行書籍借閱,還可以一鍵續借、查詢所借館藏,通過線上操作就可實現查書、借書、續借、還書的完整程序。
1.2 智慧圖書館存在的問題
1.2.1 用戶畫像構建不全面
大部分圖書館僅僅根據書籍進行檢索,少部分是基于用戶的基礎個人信息以及搜索記錄來優化和改進推薦算法,從而忽略了用戶畫像,導致推薦準確率不高。
1.2.2 用戶需求不明確
在圖書館,讀者往往只借閱圖書,很少有反饋信息的,并且許多讀者不太積極表露出自身的需求。這造成了圖書館無法精準定位讀者的真實需求,也影響了個性化服務的發展進程。為此,圖書館可以從讀者的動態數據中挖掘分析,獲取用戶潛在需求。
2 智能化圖書館書籍推薦發展探討
2.1 更全面構建讀者用戶畫像
首先,根據高校這一特殊場景,圖書館記錄了學生的基礎信息,聯合調取其他部門信息(如各個專業教材、培養方案等信息)以獲取用戶基礎信息。其次,提取讀者借閱時長、借閱頻次、借閱種類等特征信息。最后,指引用戶根據自身需求,在描述欄輸入需要解決的問題內容或書籍相關信息等,通過提取關鍵字等技術,分析用戶興趣。
2.2 逐步完善多角度推薦算法
推薦系統從用戶的動靜態數據中分析用戶可能感興趣的圖書,也可以根據用戶目前借閱的圖書,推送相近的圖書資源。推薦方式可以通過用戶推薦,也可以通過書籍推薦。
2.3 讀者書籍需求不明確情況探討
為了滿足讀者的信息獲取需求,圖書館應優化其信息檢索系統,引入先進的搜索引擎技術,提供智能化的檢索建議和相關推薦,為讀者提供更精準、更全面的搜索方式。
3 相關技術介紹
3.1 用戶畫像
用戶畫像(Persona)最早由交互之父AlanCooper于1998年提出,他表示用戶畫像是基于用戶真實數據的虛擬代表[2]。用戶畫像采用數據挖掘和機器學習等技術,通過對用戶數據的分析和建模,得出用戶的特征標簽,從而將用戶進行分類。用戶畫像最初是在電商領域得到應用,在大數據時代背景下,用戶信息充斥在網絡中,將用戶的每個具體信息抽象成標簽,利用這些標簽將用戶形象具體化,從而為用戶提供有針對性的服務[3]。通過分析用戶的閱讀行為、興趣愛好等信息,圖書館可以更準確地為用戶推薦合適的書籍。
用戶畫像能夠幫助管理方認知用戶。在認識用戶群體的基礎上,可以基于用戶的身份特征和行為特征,了解用戶的需求和消費場景,從而幫助管理方更好地制定產品策略,實現用戶增長和提升用戶體驗。
3.2 基于用戶的協同過濾(User-based CF)
基于用戶的協同過濾方法的原理是先“找到相似用戶”,再“找到他們喜歡的物品”。簡單而言,基于用戶的協同過濾,就是給用戶推薦“和他興趣相似的其他用戶”喜歡的物品[4]。這種方法通過尋找與目標用戶有相似行為的其他用戶來進行推薦,具體步驟如下。
(1)相似度計算:計算目標用戶與其他用戶的相似程度。常用的相似度計算方法包括余弦相似度、皮爾遜相關系數等。
(2)鄰居選擇:根據相似度,選擇一定數量的與目標用戶最相似的用戶作為鄰居[5]。
(3)預測評分:對于目標用戶未評分的物品,通過鄰居用戶的評分進行加權平均來預測目標用戶的評分[6]。
(4)生成推薦:推薦那些預測評分較高的物品。
3.3 基于物品的協同過濾(Item-based CF)
與基于用戶的協同過濾不同,基于物品的協同過濾方法通過尋找目標用戶喜歡的物品與哪些物品相似來進行推薦,具體步驟如下。
(1)相似度計算:計算所有物品之間的相似度。通常2個物品的相似度是通過它們的屬性等特征以及用戶對其評分來計算的。
(2)推薦物品:對于目標用戶已經評分的物品,找出與這些物品相似的其他物品并推薦給用戶。
3.4 基于內容的推薦算法
基于內容的推薦算法是一種根據用戶過去喜歡的物品,為用戶推薦與其過去喜歡的物品相似的物品的方法[7]。這種算法的核心是通過用戶的歷史行為來學習用戶的偏好,從而刻畫出用戶畫像并通過相似性度量找出與用戶偏好最接近的N個物品[8]。
4 推薦系統設計
4.1 總體設計
圖書推薦系統總體設計如圖1所示。首先,收集用戶信息和書籍信息;其次,提取用戶和內容的特征構建用戶畫像模型等;再次,依據用戶數據和內容數據,利用各種推薦算法生成個性化推薦結果;最后,對推薦結果進行排序得出最終推薦列表并收集用戶反饋和行為數據,根據用戶的反饋和偏好調整推薦結果,實現個性化的推薦服務。
4.2 數據層
(1)用戶數據收集。收集用戶的基本數據、行為數據、偏好和社交關系等信息,建立構建用戶畫像的基礎。
(2)書籍信息收集。包括書籍的作者、出版社、出版日期、書籍類別等信息。
(3)內容數據索引。使用搜索引擎建立內容數據的索引,支持快速地檢索和查詢。
4.3 模型層
用戶畫像的構建。人口屬性:基礎信息(年齡、性別、學歷等)和附加屬性。社交屬性:用戶的通訊錄、朋友圈好友等,發現用戶所處的圈層以及具體的社會影響力等。行為特征:用戶在使用產品的過程中,通過自身的各種行為累積出的用戶信息。如點擊、分享、收藏、評論等數據以及與用戶活躍度、忠誠度有關的指標等。
4.4 推薦算法層
4.4.1 基于用戶畫像的個性化推薦算法
首先要了解的是協同過濾算法和內容推薦算法。協同過濾算法是根據用戶歷史行為數據,如購買記錄、點擊記錄等,尋找其他與之相似的用戶喜好,然后推薦相似用戶感興趣的物品。內容推薦算法則是根據用戶對某一特定主題或關鍵詞的偏好,將相應的物品推薦給用戶。但是這些算法都有局限性,協同過濾算法需要有足夠多的相似用戶才能準確推薦,而內容推薦算法則須要給出用戶的興趣范圍。基于用戶畫像的個性化推薦算法是在協同過濾和內容推薦算法的基礎上,結合用戶的畫像信息以及多種推薦算法和模型,更精準地推薦物品和服務,實現多樣化的推薦策略。
4.4.2 召回及排序
使用相對簡單高效的召回算法從海量候選集中召回用戶可能感興趣的對象,第一次縮小范圍;利用排序模型對初篩的候選集進行精排序[9];再排序,對于排序層的結果,綜合額外的因素,補充算法進行進一步的篩選和排序。
4.5 應用層
實時處理用戶行為和內容變化,提供實時的個性化推薦服務。結合推薦算法、召回排序和評分等,產生最后推薦列表,推薦給用戶。同時,系統可設置熱門圖書列表欄,供用戶了解圖書館近期熱門借閱的書籍,提供借閱參考。讀者也可對推薦書籍進行打分或選擇喜歡、不喜歡等,對推薦內容進行評價,以便優化系統推薦內容。
4.6 邏輯框架
圖書推薦系統邏輯結構如圖2所示。
在獲知用戶動靜態數據、書籍數據及其他數據的基礎上,推薦系統要處理的問題可以較形式化地定義為:對于用戶 U (user),針對海量的書籍信息,構建一個函數 f(U,B) ,預測用戶對特定候選書籍 B (book) 的喜好程度[10],再根據喜好程度對所有候選物品進行排序,生成書籍推薦列表的問題。
5 相似度計算原理
5.1 皮爾遜相關系數
皮爾遜相關系數通常表示為r ,此法適用于判斷2列連續型數據(雙變量正態)之間的相關性。它的值介于-1與1之間,從而判斷2個變量的線性關系強弱。
5.2 余弦相似性
余弦相似度是一種衡量2個向量在向量空間中夾角大小的方法。在二維空間中,可以將向量看作是從原點出發的箭頭,而余弦相似度就是這2個箭頭夾角的余弦值。這個值介于-1和1之間,值越大表示2個向量越相似,值越小表示2個向量越不相似。在推薦系統中,可以通過計算用戶向量和物品向量的余弦相似度來找出用戶可能感興趣的物品。
5.3 實驗案例
計算用戶A對圖書甲的興趣度:
假設系統里有A、B、C、D、E 5個用戶,經過用戶畫像匹配和相似度計算后,得出用戶A與其他4個用戶的相似度分別為0.8、0.9、0.7、0.3,數值越大表示用戶越相似。
圖書甲是相似用戶們看過的,有歷史數據存在,可以根據點擊、收藏、評論等計算得出興趣度分別為0、2、1、3,興趣值越大表示對圖書甲越感興趣,0表示用戶沒有看過物品或者對物品不感興趣。根據B、C、D、E對圖書甲的興趣度,得出用戶A對圖書甲的預估興趣值。
6 改進優化
6.1 增量學習
使用增量學習為讀者提供個性化內容。此功能使用增量學習來了解用戶隨時間的閱讀習慣和偏好。當用戶閱讀更多關于某些主題或來自特定出版商的圖書時,系統的機器學習模型會更新以反映這些偏好。隨著時間的推移,智能圖書推薦系統需要不斷學習和更新推薦模型,以適應用戶興趣的變化。通過增量學習的方式,可以根據用戶最新的行為數據實時更新模型參數,提高推薦的準確性和實時性,從而提供高度個性化的閱讀體驗[11]。
6.2 多樣性推薦
通過推薦多樣性更高的內容,既能夠給用戶更多的機會去發現新內容,又能夠讓推薦系統更容易發現用戶潛在的興趣[12]。在推薦過程中,系統應該注重推薦多樣化的圖書,以滿足用戶潛在需求。一個簡單的策略是在推薦列表中加入不同類型、作者或主題的圖書,提供給用戶更為豐富的選擇。對于用戶明確表達出興趣的標簽以較大的概率曝光,而對于用戶沒有行為數據的標簽也以一定的概率曝光。
6.3 評估與反饋
在推薦系統中,內容質量評估主要通過2種方法進行:一種是用戶反饋,另一種是自動評估。用戶反饋通常包括點擊、借閱、收藏等行為,這些行為可以用來衡量推薦結果的質量。自動評估則通過對推薦結果進行排序、篩選等操作,得到一個數值評分,用于評估推薦系統的性能。根據評估結果,可以針對性地改進和優化系統,提高推薦系統的性能。
7 結語
通過分析用戶的歷史行為數據和用戶間的相似度關系,圖書館能夠提高推薦系統的準確性和個性化程度,提升用戶的使用體驗和滿意度,推動圖書館數字化發展。智慧圖書館推薦系統的設計與實現不僅可以提供個性化的服務,還可以幫助圖書館更好地了解用戶需求,提高圖書的利用率和借閱率。未來,隨著數據收集和推薦算法的不斷優化,智慧圖書館推薦系統有望進一步借助大數據和深度學習等技術,推薦系統的技術也會不斷進步和優化,提供更加精準和智能的推薦服務,更好地滿足用戶需求。
參考文獻
[1]王嬌.5G時代智慧圖書館服務創新研究[J].圖書館學刊,2022(1):59-62.
[2]馮太琴.高校圖書館精準服務助教師高質量發展[J].文化產業,2023(23):150-153.
[3]劉佳.基于GIS的卷煙營銷數據畫像分析與研究[J].中國市場,2021(34):140-142.
[4]王文.非典型序列推薦若干問題研究[D].上海:華東師范大學,2021.
[5]潘濤濤.基于協同過濾的推薦算法研究[D].鄭州:解放軍信息工程大學,2017.
[6]周歡.融合時間信息的音樂推薦系統研究[D].太原:太原師范學院,2023.
[7]蘇湛,陳學謙,艾均,等.基于用戶相似性選擇及標簽距離的推薦算法[J].應用科學學報,2023(6):940-957.
[8]萬雯赟.基于評論文本的深度推薦系統[D].廈門:廈門大學,2021.
[9]司亮.智慧教育資訊平臺中的個性化推薦系統設計研究[D].石家莊:河北科技大學,2020.
[10]陳倩.基于知識圖譜的影視推薦算法[D].武漢:華中科技大學,2022.
[11]劉鑫.協同過濾技術在智能推薦系統中的應用[J].集成電路應用,2024(4):118-119.
[12]張思洋.復雜網絡中信息融合與傳播關鍵技術研究[D].北京:北京郵電大學,2022.
(編輯 沈 強)
Design and research of book recommendation system based on user profile
ZOU Zihui1,2, HU Shengli1, LYU Fei2
(1.Anhui University of Science and Technology, Huainan 232001, China;
2.Hefei Technology College, Hefei 230012, China)
Abstract:In the context of big data, book resources are growing exponentially from traditional libraries to smart libraries. With the increase of library resources, readers are increasingly facing the problem of “selection difficulties” when selecting books, and are unable to find the necessary book resources. Only by gaining a better understanding of readers can libraries prevent massive book resources from being stored in devices for a long time. The book recommendation system designed in the article is a personalized recommendation system based on user profiles. It combines collaborative filtering and other algorithms with user profile information to more accurately recommend books and provide services. This system collects static user data, mines dynamic user data, analyzes user behavior, and achieves precise book recommendation, improving the utilization rate of book resources.
Key words:smart library; user profile; personalization; recommendation system