尹婷婷 曾憲玉
摘要:[目的/意義]深度學習技術作為大數據、“互聯網+”環境下用戶分析和服務設計的有力工具,為圖書館館藏資源推薦服務提供了新的研究思路和發展方向。[方法/過程]首先,基于文獻查閱法、網絡調查法對國內外圖書館館藏資源推薦服務的研究現狀、應用情況進行了分析與研究。然后,在概述深度學習技術及其相關應用實踐的基礎上,在深度學習視角下提出了一種以讀者用戶興趣值為基礎的圖書館館藏資源推薦模型。[結果/結論]分別從數據關聯、情景分析和協同過濾技術3個方面探討了圖書館館藏資源推薦模式,為大數據環境下面向用戶的圖書館資源精準推薦提供參考。
關鍵詞:圖書館;館藏資源;推薦模型;深度學習;用戶興趣值
DOI:10.3969/j.issn.1008-0821.2019.04.012
〔中圖分類號〕G25;G64〔文獻標識碼〕A〔文章編號〕1008-0821(2019)04-0103-05
Design and Analysis of the Library Resources Recommendation
System Based on the Deep Learning
Yin Tingting1Zeng Xianyu2
(1.Teaching Affairs Department,Northwestern Polytechnical University,Xian 710072,China;
2.Library,Northwestern Polytechnical University,Xian 710072,China)
Abstract:As a useful tool for user analysis and service design in big data and“Internet+”environments,the deep learning provides new research ideas and development directions for the recommendation services of library resources.Firstly,this paper analysed and summarized the current status and application of recommendation services of library resources at home and abroad through literature review and network survey.Secondly,based on the overview of deep learning technology and related application practices,this paper proposed the library resource recommendation model from the perspective of users interest value.Finally,the recommendation model of library collection resources was discussed respectively from three aspects:data association,scenario analysis and collaborative filtering technology,which could provide reference for the user-oriented accurate recommendation of library resources in big data environment.
Key words:library;library resources;recommendation model;deep learning;users interest value
隨著“互聯網+”技術的飛速發展,網絡信息量呈現爆炸式增長態勢,海量的數據資源中蘊含著豐富的利用價值與巨大潛力,同時也極易導致諸如“信息擁塞”和“信息超載”等現象的出現[1]。如何從復雜、體系龐雜的數據資源中快速有效地獲取有利用價值的信息已經成為當今圖情專業、信息科學等領域專家和學者們研究的熱門話題和關鍵問題[2]。近年來出現的資源推薦系統為解決上述難題提供了可能性與發展途徑[3]。資源推薦技術主要指的是通過分析、計算目標用戶的個人興趣偏好、歷史信息記錄及其他相關條件,挖掘用戶的隱含興趣與行為傾向,從而向目標用戶主動提供個性化信息資源推薦服務的技術[4]。隨著科學技術及社會的不斷進步,目前,圖書情報界及相關研究機構已經積極開展了個性化推薦服務系統的研究與實踐工作[5],然而當前已有的資源推薦系統存在推薦效率不高、個性化推薦特征不明顯等缺點[6-7],構建一種準確率更高的智能化推薦系統是目前亟待解決的問題。
深度學習技術作為人工智能領域發展的核心與基礎[8],其本質是一類利用特征級、多層非線性處理單元進行特征提取、變換的機器學習及訓練算法,具有從已知的樣本集合中主動學習、挖掘數據最本質特征的強大功能,同時可以獲得用戶和相關項目的深層次、隱藏的特征表示。通過對數據、資源的深度加工,深度學習技術能夠理解和掌握原本復雜的知識概念,將已經構建的個人知識結構體系有效遷移、轉化并應用到真實場景中以解決各類實際問題。在圖書情報界,已有學者意識到深度學習技術帶來的影響并對該主題進行了研究:羅蔚[9]在全面介紹、分析個性化信息服務模式的基礎上,提出了基于深度學習技術的主動型個性化信息服務的理論;李新廣[10]通過對本體、關聯規則和信息推薦之間相互關系的分析,提出了針對圖書館讀者用戶的館藏資源個性化推薦模型。因此,本文借鑒已在圖像識別、信息檢索、語音識別等諸多領域取得了重大研究進展成果的深度學習技術的應用實踐,在深度學習視角下提出了一種以用戶借閱時間為基礎的圖書館館藏資源推薦模型,為實現資源精準推薦服務提供參考。
1圖書館館藏資源推薦服務研究現狀
目前,在圖書館館藏資源推薦研究領域中,主要以建立讀者用戶個性化推薦方法的模型以及相關推薦模型在圖書情報領域及信息科學領域中的應用、發展和改進等內容為主[11-12]。其中,讀者用戶個性化推薦系統作為一種智能信息服務模式,可以快速、有效地解決“信息擁塞”等現象,具體推薦流程如圖1所示。李默等[13]通過設計多功能Agent提出適用于多種學術資源類型的推薦策略,提高了高校圖書館學術資源推薦的效率;張煒等[14]以聯機公共查詢目錄系統以基礎,闡述了如何將數據挖掘技術應用于聯機公共查詢目錄系統中讀者行為數據的分析與研究;陳淑英等[15]利用圖書關聯規則進行數據挖掘,探索圖書推薦服務方案及實現推薦服務的算法模型;袁輝[16]通過對讀者用戶各類信息數據進行充分挖掘分析,預測出用戶的各類潛在、確定、個性化的需求,從而實現有針對性的館藏資源推薦服務。縱觀圖情界資源推薦領域相關的研究文獻,不難發現在圖書館館藏資源推薦服務過程中,讀者用戶很難從龐雜、冗余的文獻中便捷、快速、準確地獲取到自己所需要資源這一普遍存在的現象。因此,圖書館員需要進一步調整館藏資源推薦服務模式及服務手段,通過研究讀者用戶借閱記錄、興趣偏好等個性化信息,對讀者用戶的基本特征和特定需求進行挖掘與提取,進而提供讀者用戶所需的定制資源,進一步細化館藏資源的推薦服務工作。
綜上所述,基于深度學習技術的讀者用戶需求分析有利于進一步提高館藏資源推薦服務的質量和效率,圖書情報機構、圖書館應積極借鑒以深度學習為基礎的應用與研究成果,將深度學習技術和智能推薦技術整合、引入到館藏資源推薦模型中。然而,作者通過參閱近年來已經發表的圖書情報專業、信息科學專業相關的主要文獻,發現關于深度學習技術在圖書館資源推薦系統中應用的研究成果很少[17-18]。因此,本文通過介紹深度學習技術的基本原理及應用狀況,探討深度學習技術在圖書情報領域中的應用問題,提出深度學習與圖書館館藏資源推薦的融合模型及發展模式,以期為解決圖書情報學研究中面臨的諸多問題提供重要參考。
2基于用戶興趣值的館藏資源推薦模型的構建
21用戶興趣值的計算
根據讀者用戶借閱某一館藏資源的單次時長及借閱次數,能夠判斷出該用戶對該館藏資源的感興趣程度,因此本文利用這些信息數據計算讀者用戶的興趣程度值,并將讀者用戶借閱某種館藏資源的總時長具體分為兩個部分:一部分為館藏資源借閱時間;另一部分是館藏資源的續借時間。在充分考慮到高校不同學歷層次讀者用戶借閱館藏資源的期限、權限不一致的基礎上[19],本文提出采用“絕對借閱時間”的定義來表征讀者用戶的興趣程度值:即假設每個時間段用戶產生的最大興趣值為1,并且同一用戶可以多次借閱同一館藏資源,因此可以用如下公式計算出讀者用戶對某項館藏資源產生的興趣值:
prefk(Ui,Rj)=BorrowTimek(Ui,Rj)MaxBorrowTime(Ui)+RenewTimek(Ui,Rj)MaxRenewTime(Ui),BorrowTimek(Ui,Rj)≤MaxBorrowTime(Ui)RenewTimek(Ui,Rj)≤MaxRenewTime(Ui)
1+RenewTimek(Ui,Rj)MaxRenewTime(Ui)×Rating(Ui,Rj),BorrowTimek(UiRj)>MaxBorrowTime(Ui)RenewTime(Ui,Rj)≤MaxRenewTime(Ui)
BorrowTimek(Ui,Rj)MaxBorrowTime(Ui)+1×Rating(Ui,Rj),BorrowTime(Ui,Rj)≤MaxBorrowTime(Ui)RenewTimek(Ui,Rj)>MaxRenewTime(Ui)
2×Rating(Ui,Rj),BorrowTimek(Ui,Rj)>MaxBorrowTime(Ui)BorrowTimek(Ui,Rj)>MaxBorrowTime(Ui)(1)
其中,prefk(Ui,Rj)代表讀者用戶Ui第k次借閱館藏資源Rj時產生的興趣值,且k≥0;Ui代表第i個借閱用戶;Rj代表圖書館中館藏資源j;BorrowTimek(Ui,Rj)和RenewTimek(Ui,Rj)分別代表用戶Ui第k次借閱Rj的時長和續借時長;MaxBorrowTime(Ui)、MaxRenewTime(Ui)分別代表用戶Ui借閱Rj最大借閱時長和最大續借時長;Rating(Ui,Rj)代表用戶Ui對Rj的興趣評分,通常只考慮用戶對其借閱過的圖書館藏資源的評分,對用戶沒有借閱過的資源評分設置為0,并將讀者用戶借閱館藏資源時產生的逾期行為分為兩種具體情況:一種是續借前逾期;另一種是續借后逾期。根據讀者用戶的不同逾期行為選取式(1)中的相應情況計算其興趣值[20]。
根據上述分析,在一段時間范圍內計算用戶Ui對館藏資源Rj的興趣偏好值時,需要將該時間范圍內Ui對Rj產生的所有借閱記錄的偏好值累計相加,考慮到Ui可能在同一天內借閱Rj的多個復本,因此在這種情況下,可以取最大值作為相應的偏好值用于計算過程,經歸一化后可得用戶最終興趣平均值為:
prefk(Ui,Rj)=∑Kk=1BorrowTimek(Ui,Rj)MaxBorrowTime(Ui)(2)
其中,K代表讀者用戶Ui在某一時間段范圍內借閱館藏資源Rj的次數。
22館藏資源推薦模型的建立
隨著讀者用戶學習年級、學歷、研究內容等的變化,其借閱行為也會隨之發生變化,因此在建立館藏資源推薦模型中,將讀者用戶對信息資源的需求分為兩類:短期信息資源需求和長期信息資源需求,其中,兩者的區別主要依據時間范圍的長短進行劃分,具體而言,讀者用戶的短期信息資源需求主要界定為在最近一學期或者一學年內讀者用戶研究或學習內容相關的資源需求,而長期信息資源需求主要界定為一年或者更長時間范圍內依據讀者用戶長期借閱記錄而可能產生的館藏資源需求。因此,在針對讀者用戶的短期信息資源需求進行推薦時,首先需要將讀者用戶的整個借閱記錄按照學期或者學年分成若干部分,只依據最近一學期或者一學年的借閱記錄計算讀者用戶的興趣偏好;針對讀者用戶的長期信息資源需求進行推薦時,則要依據該讀者用戶全部借閱記錄計算其興趣偏好值。在上述完成用戶興趣值計算基礎上,根據讀者的借閱記錄數據,生成用戶的興趣值及偏好等數據信息;其次,將得到的關于館藏資源及讀者用戶的標準化數據作為館藏資源推薦模型的輸入數據,進行匹配操作,具體的推薦模型如圖2所示。由圖2可以看出,該模型可以針對讀者用戶的短期信息資源需求和長期信息資源需求,分別提供館藏資源的個性化推薦服務。
3基于深度學習技術的館藏資源推薦模式分析
圖書館館藏資源推薦系統是讀者用戶需求與館藏資源之間的聯系點[21]:一方面,通過提取、挖掘圖書館館藏資源,建立館藏資源的特征模型并形成圖書館館藏資源模型的集合;另一方面,可以采用聚類分析、協同過濾技術等信息處理手段對圖書館讀者用戶個人信息進行標記與分類,依據讀者用戶屬性信息的相似性以及讀者用戶對館藏資源借閱記錄和評價反饋等數據信息,將具有相似屬性信息的讀者用戶聚類至同一類簇,實現對讀者用戶的聚類操作;最后,將得到的資源模型集合與讀者用戶類簇執行匹配操作,如果匹配成功,將使用館藏資源推薦系統主動為讀者用戶推薦相應的館藏資源,匹配不成功,將執行反饋信息操作,循環往復,直至匹配操作成功后循環終止,具體操作步驟如圖3所示[21]。一言以蔽之,館藏資源推薦系統的成功推薦取決于形成的讀者用戶類簇與館藏資源信息的匹配程度:通過分析匯總館藏資源,形成館藏資源模型的特征集合;同時,通過聚類操作將讀者用戶的資源偏好映射到相似或者不用的主題;最后,執行多個相似或者不同主題與相似資源集合之間的匹配操作。因此,基于深度學習視角,本文將分別從數據關聯、情景分析和協同過濾技術3個方面具體分析圖書館館藏資源推薦模式,進一步為大數據環境下面向讀者用戶的個性化精準推薦服務提供參考。
31基于數據關聯的館藏資源推薦模式
數據關聯技術為館藏資源信息之間的發現與快速查找提供了途徑,基于數據關聯的館藏資源推薦模式主要是在分析讀者用戶歷史借閱記錄的基礎上,利用數據挖掘技術分析、處理圖書館館藏資源以及網絡信息資源之間的關聯與鏈接,從圖書館館藏資源中抽取最核心部分的數據源信息進行加工、提煉和數據整合,并依據各館藏資源之間的關聯規則實現館藏資源的聚類,并將處理完成后的數據信息保存至圖書館推薦資源的知識庫;隨后,基于相應的關聯規則對館藏資源數據進行挖掘,得到關聯結果,形成圖書館館藏資源關聯規則知識庫;最后,基于深度學習技術,建立針對讀者用戶的個性化推薦服務模式,并將得到的結果主動推薦給相應的讀者用戶。基于數據關聯的館藏資源推薦系統主要是由實現以上不同功能的3個模塊共同構成,其中最主要的是基于關聯規則的數據挖掘模塊,它是整個館藏資源推薦系統的核心組成部分。基于數據關聯的館藏資源推薦模式主要考慮的是用戶個性化需求,同時設置相同的身份認證機制,降低了用戶身份信息認證的復雜度,便于推薦系統收集用戶的需求信息,從而提高了個性化推薦服務的準確性。
32基于情景分析的館藏資源推薦模式
基于讀者用戶的個人特征和使用館藏資源的情景歷史等可以推斷出讀者用戶的個人偏好習慣和知識需求目標,基于情景分析的館藏資源推薦模式主要是利用個人資料庫記錄與讀者用戶情景模型相關的信息,資源記錄模塊存儲可利用的學習資源以及每種學習資源具體應用的情景信息,依據情景分析模式得到讀者用戶的偏好習慣和當前知識需求目標、
用戶所處的環境、可獲得的學習資源及其情景信息等數據,借助深度學習技術挖掘與讀者用戶情景模型相匹配的圖書館館藏資源,或挖掘與讀者用戶檢索結果相似度較高的館藏資源信息,將館藏資源進行排序并向讀者用戶推薦其可能感興趣的信息。在向讀者用戶提供資源推薦服務的過程中,進一步構建用于描述用戶當前所處情景的用戶情景模型,實時調取讀者用戶感興趣、相似度高的館藏資源并及時推薦給讀者用戶,用戶對資源的反饋及評論信息可以作為資源使用情景的一部分儲存到資源中心和情景庫中,從而為以后的資源推薦服務提供參考依據。該推薦模式由于充分考慮了用戶身份、行為、關注對象及偏好習慣等讀者用戶的個人特征,提高了推薦結果的準確性,而且能夠改善讀者用戶的體驗度,因而在基于情景分析的館藏資源推薦模式中,館藏資源的利用率和讀者用戶的滿意度均較高。
33基于協同過濾的館藏資源推薦模式
基于協同過濾的圖書館館藏資源推薦模式,其主要步驟為:首先,通過對讀者用戶的借閱記錄信息進行數據分析與挖掘,利用聚類的處理思想,依據讀者用戶屬性信息的相似性,將具有相似屬性信息的讀者用戶聚類至同一類簇,實現對讀者用戶的聚類操作;隨后,計算目標讀者用戶與其對應的類簇讀者之間的相似性;最后,對相似讀者借閱的館藏資源進行排序,并選擇相似性較高的讀者所借閱次數最高的館藏資源作為推薦結果,從而推薦給目標用戶。基于協同過濾技術的館藏資源推薦模式具有較強的自我修復與系統優化的特性,在系統運行過程中可以不斷積累有效的數據信息,并且推薦系統可以實時進行自我更新,推薦結果的準確性較高,更新速度較快。然而,這種推薦模式只有在讀者用戶登錄推薦系統并對相應的館藏資源進行有效評價后,其相關信息才能夠被推薦系統記錄,并用于后續的推薦工作,否則,將會降低相應館藏資源的有效轉化率,導致該館藏資源也很難被推薦給其他的讀者用戶。
4結語
在大數據、“互聯網+”背景下,基于深度學習技術的圖書館館藏資源推薦服務是提高館藏資源利用率的重要保障,也為館藏資源服務質量的進一步提升指明了發展方向。本文在分析讀者用戶興趣偏好的基礎上,從讀者用戶與館藏資源相關的數據信息入手,挖掘用戶潛在需求,形成聚類體系,并在深度學習視角下提出了以讀者用戶興趣值為基礎的圖書館館藏資源推薦模型,為讀者用戶提供個性化、有價值的館藏資源信息,為大數據環境下面向讀者用戶的圖書館推薦服務指明了研究思路和發展方向。下一步的研究重點在于深度學習技術的具體應與發展,擴大數據規模量,用實證結果對本文提出的推薦模型進行評估與分析,
進一步驗證方案的實用性與有效性。
參考文獻
[1]劉忠寶,趙文娟,賈君枝.深度學習及其對圖書情報學的啟示[J].情報工程,2017,3(4):62-70.
[2]孫守川.基于深度學習的讀者檢索借閱研究[D].蘭州:蘭州交通大學,2015.
[3]牛名一.基于用戶簽到軌跡的推薦系統的研究與實現[D].北京:北京郵電大學,2017.
[4]李春,朱珍民,葉劍,等.個性化服務研究綜述[J].計算機應用研究,2009,(11):4001-4005.
[5]唐細英.高校圖書館個性化服務現狀分析[J].科技文獻信息管理,2012,26(1):43-45.
[6]龍姝言.基于用戶的協同過濾推薦算法研究[D].重慶:重慶理工大學,2018.
[7]陳艷.基于地理位置和社交關系的興趣點推薦算法研究[D].合肥:中國科學技術大學,2018.
[8]Bengio Y,Lamblin P,Popovici D,et al.Greedy Layer-wise Training of Deep Networks[J].Advances in Neural Information Processing Systems,2007,19:153-160.
[9]羅蔚.數字化信息服務的個性化發展:從可適應到自適應[J].情報資料工作,2010,(2):74-76.
[10]李新廣.數字圖書館的用戶偏好模型及個性化推薦研究[D].武漢:武漢大學,2011.
[11]張小峰.基于關聯數據的圖書館學術資源推薦研究[J].圖書館學研究,2012,(5):87-89.
[12]袁靜,焦玉英.基于情景信息的學習資源個性化推薦[J].情報理論與實踐,2009,32(7):116-119.
[13]李默,梁永全.高校圖書館學術資源推薦策略及系統架構研究[J].圖書館學研究,2015,(14):57-61.
[14]張煒,洪霞.基于OPAC讀者行為的知識發現研究[J].圖書館論壇,2011,31(1):17-19.
[15]陳淑英,徐劍英,劉玉魏,等.關聯規則應用下的高校圖書館圖書推薦服務[J].圖書館論壇,2018,38(2):97-102.
[16]袁輝.基于確定事件的智慧圖書館推薦服務策略實施探究[J].圖書館建設,2017,(8):74-77.
[17]Sedhain S,Menon A K,Sanner S,et al.Autorec:Autoencoders Meet Collaborative Filtering[C].Proceedings of the 24th International Conference on World Wide Web.ACM,2015:111-112.
[18]Aron Van Den O,Dieleman S,Schrauwen B.Deep Content-based Music Recommendation[C].Advances in Neural Information Processing Systems,2013:2643-2651.
[19]邱均平,張聰.高校圖書館館藏資源協同推薦系統研究[J].圖書情報工作,2013,57(22):132-137.
[20]熊回香,楊雪萍,高連花.基于用戶興趣主題模型的個性化推薦研究[J].情報學報,2017,36(9):916-929.
[21]王慶,趙發珍.基于“用戶畫像”的圖書館資源推薦模式設計與分析[J].現代情報,2018,38(3):105-109.
(責任編輯:郭沫含)