







摘要研究針對協同過濾推薦存在的矩陣稀疏性和冷啟動問題,提出一種融合圖書屬性和用戶借閱行為的自適應圖書推薦方法,旨在提高圖書推薦系統的精度和效果。通過量化用戶的借閱行為并結合圖書的屬性信息,設計了一種新的用戶相似性度量和評分預測模型。首先,根據用戶借閱類型、用戶類型及借閱時長對用戶行為進行量化,然后建立“用戶-圖書”借閱關系模型和“圖書-圖書屬性”關系模型。采用協同過濾算法,基于用戶的借閱記錄和圖書屬性,對未借閱圖書的用戶興趣進行預測和推薦。通過與傳統的協同過濾推薦方法和時間上下文優化的協同過濾推薦方法進行比較,實驗結果顯示,融合圖書屬性和用戶借閱行為分析的自適應圖書推薦方法在精確率和召回率方面都有所提高,有效解決了傳統推薦系統中的矩陣稀疏性和冷啟動問題。
關鍵詞協同過濾;自適應推薦;用戶行為分析;圖書推薦
分類號G203;G252.1
DOI10.16810/j.cnki.1672-514X.2024.12.008
ResearchonAdaptiveBookRecommendationbyIntegratingBookAttributesandUserBorrowingBehaviorAnalysis
WangGang,GuoXuemei
AbstractThestudyaimstoaddresstheissuesofmatrixsparsityandcoldstartincollaborativefilteringrecommendationsbyproposinganadaptivebookrecommendationmethodthatintegratesbookattributesanduserborrowingbehavior,withthegoalofimprovingtheaccuracyandeffectivenessofthebookrecommendationsystem.Byquantifyinguserborrowingbehaviorandcombiningitwithbookattributeinformation,anewusersimilaritymeasurementandratingpredictionmodelweredesigned.First,userbehaviorisquantifiedbasedonborrowingtype,usertype,andborrowingduration,andthenthe“user-book”borrowingrelationshipmodeland“book-bookattribute”relationshipmodelareestablished.Usingcollaborativefilteringalgorithms,basedonusers’borrowingrecordsandbookattributes,theinterestofusersinunborrowedbooksispredictedandrecommended.Comparedwithtraditionalcollaborativefilteringmethodsandtime-contextoptimizedcollaborativefilteringmethods,experimentalresultsshowthattheadaptivebookrecommendationmethod,whichintegratesbookattributesanduserborrowingbehavioranalysis,improvesbothprecisionandrecallrates,effectivelysolvingtheissuesofmatrixsparsityandcoldstartintraditionalrecommendationsystems.
KeywordsCollaborativefiltering.Adaptiverecommendation.Userbehavioranalysis.Bookrecommendation.
0引言
國內外高等教育發展的經驗表明,一流大學圖書館是一流大學建設的重要支撐[1]。為配合“雙一流”的建設,圖書館館藏資源特別是圖書資源不斷豐富,隨著圖書館由“數字化”向“智慧化”的發展,圖書館的館藏資源已經由被動的接收用戶檢索再返回檢索結果轉向主動向用戶提供所需資源。在這種情況下,為了能夠精準地把握用戶的興趣偏好,識別用戶的興趣需求,以便主動地為用戶推薦其所需的館藏資源,個性化推薦技術得到了廣泛的應用。其中,協同過濾推薦技術在圖書館的個性化推薦服務中應用最為廣泛,該方法主要是通過對目標用戶興趣偏好相近的最近鄰用戶集合實現的,通過計算用戶之間的相似性度量,將最近鄰訪問項目集合的評分來預測目標用戶未訪問項目的評分實現的。但是協同過濾推薦中用戶對于項目的評分會存在矩陣稀疏性的問題,會造成推薦質量不高,因此本文將圖書屬性和用戶的借閱行為相結合,在用戶相似性度量時模擬用戶對于未借閱圖書的評分借閱矩陣稀疏性的問題,提高推薦質量。
1相關研究
由于協同過濾推薦方法不需要分析信息資源的內容,僅僅通過用戶對信息資源的使用行為便能夠得到用戶的興趣偏好,因此在圖書資源推薦服務中得到了廣泛的應用。董坤[2]通過將讀者專業、角色、學歷、借閱記錄引入讀者特征模型構建之中,更好地反映用戶信息需求,以此為基礎設計圖書協同過濾推薦算法。林曉霞等[3]根據圖書借閱記錄構建評分矩陣,結合用戶間的信任相似度改進了用戶相似性度量方法,并提出了對于新用戶和新書推薦的解決方法。宋楚平[4]在以圖書分類為項目生成用戶評價矩陣,并綜合考慮了借閱方式、借閱時間和圖書相似度對用戶興趣度的影響,同時將讀者特征和圖書特征引入到讀者相似性度量方法之中,提升了推薦效果。梁思怡等[5]設計包含讀者閱讀行為評分、時間上下文和內容興趣變遷3個要素的提出基于時間上下文優化協同過濾的推薦算法,該算法構建了基于用戶行為操作的興趣評分模型,以解決用戶評分缺失問題,同時提出一種非線性的時間衰減模型來對評價矩陣進行優化,以提高推薦效果。
通過對相關研究的分析可以發現,準確的實現推薦推薦服務的首要工作是使用相似性度量找到與目標用戶偏好相似的最近鄰用戶集合。相似性度量依賴于用戶對于借閱圖書的評分,不同于圖書銷售網站,圖書館往往并未提供用戶對于所借閱圖書的顯示評分,因此本文在對相關文獻研究的基礎上根據用戶類型、借閱時長等行為進行分析,對用戶的圖書借閱行為量化,形成對圖書的評分。此外,對于協同過濾推薦中的矩陣稀疏性問題,結合圖書屬性和用戶的圖書借閱行為量化模擬目標用戶最近鄰候選用戶對于未借閱圖書的評分,提升相似性度量的精確度,進而提高圖書推薦質量。
2“用戶-圖書-圖書屬性”關聯關系分析
2.1“用戶-圖書”借閱行為模型
電商圖書銷售網站中通常會提供用戶對于所購買圖書評分的渠道,但在圖書館圖書借閱的場景中,很難獲取到用戶對借閱圖書直觀量化的評分。因此就需要將用戶對于圖書借閱行為進行量化來模擬用戶對圖書的評分,具體從借閱類型、用戶類型及借閱時長三方面量化。
2.1.1用戶借閱行為數據模型
為了實現用戶圖書借閱行為量化,就需要保存用戶圖書借閱行為的相關信息,圖1設計用于保存用戶借閱行為相關信息的數據模型。
圖1“用戶-圖書”借閱情況數據模型
在該關系模型中,“圖書信息”用于表示圖書的基本信息,以圖書的ISBN作為唯一標識。在圖書館館藏書目集合中,相同ISBN的書目通常有多個副本,多個副本之間以圖書ID作為唯一標識,存儲在數據模型“館藏圖書”中,“館藏圖書”中以ISBN作為外鍵與“圖書基本信息”進行關聯。數據模型“用戶信息”記錄了用戶類型,“圖書借閱”用于保存用戶對于館藏圖書的借閱情況。
2.1.2圖書借閱類型量化
本文設定用戶對一本圖書從借入到歸還這一時間范圍定義為一個“借閱周期”,因此,本文對于用戶借閱行為量化分析是以單個“借閱周期”為單位進行的。如果某個用戶借閱某一本圖書進行規劃后再次借閱該圖書,則認為該用戶對此圖書的借閱行為是在兩個借閱周期進行的。此外,在同一個借閱周期內用戶對圖書還會發生“續借”行為,即在圖書未到歸還時限通過相應操作延長借閱期限的行為,因此,在一個借閱周期內,用戶u對圖書i進行單次借閱(包括直接借閱和預約借閱)和續借圖書這兩種借閱行為進行量化,記為bu,i,計算方法如公式(1)所示。
2.1.3用戶類型量化
圖書館特別是高校圖書館對于不同類型的用戶,即教職工、研究生、本科生等用戶類型分配不同的借閱時長,不同類型用戶的圖書借閱時長(天數),記為{dt},(t=1,2,…,n)。取圖書借閱時長最長的用戶類型dMAX=MAX{di}(i=1,2,…,n)。以d*t(t=1,2,…,n)表示不同類型用戶對應的圖書借閱時長因子,計算方法為d*t=ln(dt)/ln(dMAX)。
2.1.4借閱時長量化
用戶對于圖書的借閱時長能夠反映出用戶該圖書的興趣偏好,即借閱時長與興趣偏好成正比。用戶u對于圖書i在一個借閱周期內借閱天數記為ru,i,MINi{ru,i}和MAXi{ru,i}(i∈Iu)分別表示在一個借閱周期內,用戶對其所借閱圖書借閱天數的最大和最小值,將用戶u對于圖書i借閱天數歸一化如計算公式(2)所示。
公式(2)
2.1.5圖書借閱行為的綜合量化
綜合借閱類型、用戶類型及借閱時長,可以得到用戶u對于圖書i在所有借閱周期內借閱量化值,如公式(3)所示,其中,(bu,i×r’u,i)表示用戶u對于圖書i在所有借閱周期內的借閱類型和借閱時長乘積之和。
公式(3)
2.2“圖書-圖書屬性”關系模型
本文考慮圖書的書名、作者、出版社及圖書編目所錄入的該圖書主題詞這四類屬性,以表1所示內容舉例。
將這四類屬性分別記為at,其中t={1.作者;2.出版社;3.中圖分類;4.主題詞}。分別將這四種不同類型屬性所包含的屬性值進行保存,可以建立“圖書-圖書屬性”關系數據模型,如圖2所示。
圖2“圖書-圖書屬性”關系數據模型
根據“圖書-圖書屬性”關系數據模型,可以將每種圖書i在四種屬性類型情況下以向量的形式表示,記為at(其中t={1.作者;2.出版社;3.中圖分類;4.主題詞})。四種屬性類型分別對應一個向量,每個向量的元素(記為Ei(at(j)))表示某個屬性類型t下屬性內容at(j)是否存在于圖書i中,存在取值為1,反之為0,j={1,…,k}表示每種屬性類型所包含的屬性內容集合,如公式(4)所示。
公式(4)
這樣對于每種圖書可以通過四個不同的向量表示該圖書與四類不同類型屬性中屬性值的對應關系,圖書包含該屬性值對應取值為1,反之為0,以表1中《精準腫瘤學》為例。
《精準腫瘤學》
a1(1)=郝希山
a1(2)=詹啟敏
圖書-作者(a1)對應關系
0
1
a2(1)=人民衛生出版社
a2(2)=科學出版社
圖書-出版社(a2)對應關系
0
1
a3(1)=R73腫瘤學
圖書-中圖分類(a3)對應關系
1
a4(1)=腫瘤學
圖書-主題詞(a4)對應關系
2.3基于圖書借閱行為的“用戶-圖書屬性”偏好分析
2.3.1“用戶-圖書”借閱關系矩陣
由于用戶的興趣偏好隨著時間發生變化,最近借閱的圖書最能體現用戶當前的興趣,因此需要對公式(3)所示的圖書借閱行為的綜合量化添加時間因子,得到用戶對圖書的動態興趣偏好值,如公式(5)所示。
公式(5)
公式中Tnow表示當前時間,Tnow(u)表示用戶u借閱第一本圖書的時間,TLast(u,i)表示用戶u最后一次借閱圖書i的時間。在向目標用戶實施推薦時,構建“用戶-圖書”借閱關系矩陣,矩陣中的值為公式(5)所示的用戶對圖書的動態興趣偏好值。
2.3.2“用戶-圖書屬性”偏好量化值
根據圖2“圖書-圖書屬性”關系數據模型,每種圖書可以通過{作者,出版社,中圖分類號,主題詞}這四類屬性所對應的四個向量進行表示,將其與圖1所示的“用戶-圖書”借閱情況數據模型結合,可以建立“用戶-圖書屬性”偏好關系模型,如圖3所示。
圖3所示的數據模型中,需要根據用戶借閱圖書行為量化的角度計算每個用戶對于所借閱圖書中包含四個屬性類型中每個屬性值的興趣偏好程度,用戶u對于所借閱圖書(記為Iu)中第t類屬性at(其中t={1.作者;2.出版社;3.中圖分類;4.主題詞})中的某個屬性值at(k)偏好程度量化值的計算公式如公式(6)所示。
公式(6)
其中,Iu(at(k))表示用戶u所借閱的包含屬性at(k)的圖書集合,|Iu(a)|表示該集合中圖書的數量。
3自適應圖書推薦方法的設計
3.1用戶分類
在推薦系統中,可以將用戶分為新注冊用戶和老用戶兩類。對于新注冊用戶,往往對于資源項的使用記錄為0,即新注冊用戶未借閱過任何圖書導致圖書借閱記錄為0,會導致在實施推薦中造成“冷啟動”的問題。此外,當目標用戶u已借閱圖書記錄數量過少時,也無法實現有效的推薦。鑒于此,本文提出了一種自適應的圖書推薦方法(記為AR,AdaptiveRecommendation),按照目標用戶u圖書借閱記錄數量qu與訓練集中圖書借閱記錄數量Q的比值選擇不同的推薦算法,如公式(7)所示。
公式(7)
該公式中,當qu=0時表示目標用戶為新用戶,對應的自適應推薦算法ALgorithm(I)根據圖1所示的“用戶-圖書”借閱情況數據模型和圖2所示的“圖書-圖書屬性”關系數據模型保存有用戶的“所在院系”和“圖書分類號”信息,當目標用戶u已借閱圖書記錄數量很少時,在圖書借閱記錄中找出與目標用戶所在院系相同的用戶圖書借閱記錄,然后將該記錄中用戶所借閱圖書按照“圖書分類號”分組,形成向目標用戶u推薦圖書的候選集合記為Ic,找出各個分組中借閱數量最高的N個圖書推薦給目標用戶u。
同時設定閾值φ,當目標用戶u已借閱圖書記錄數量過少時,即qu/Q≤φ,采用ALgorithm(II),即基于圖書屬性的推薦方法實施推薦,當qu/Q>φ,時基于評分預測的推薦方法。閾值的取值通過在數據上進行的對比實驗進行確定。
3.2基于圖書屬性的推薦方法
該推薦方法對應公式(7)中的ALgorithm(II),即針對目標用戶u的圖書借閱記錄過少情況下實施的推薦。在實施推薦前需要建立向目標用戶u提供候選圖書集合記為Ic,采用ALgorithm(I)推薦圖書候選集合的建立方法。
在獲得Ic之后,根據“圖書-圖書屬性”關系模型中公式(4)所示,每種圖書可以通過{1.作者;2.出版社;3.中圖分類;4.主題詞}四種屬性類型情況下以向量的形式表示。因此可以將目標用戶u已借閱過的圖書i(i∈Iu)和候選圖書x(x∈Ic)分別在四種屬性類型向量下通過余弦相似性進行度量,計算方法如公式(8)所示。
公式(8)
在分別得到候選圖書x與已借閱圖書i在四個屬性類型向量下的余弦相似性度量結果之后,計算這四個結果的調和平均數,得到基于圖書屬性的綜合度量結果,計算方法如公式(9)所示。
公式(9)
該公式中考慮四種屬性類型向量所對應的相似性度量結果不為0的情況,公式中n表示不為0度量結果的數量。將相似性度量結果按照降序排列,最后將結果最高的N本候選圖書向目標用戶u實施推薦。
3.3基于評分預測的推薦方法
該推薦方法對應公式(7)中的ALgorithm(III),即針對目標用戶u的圖書借閱記錄數量qu與訓練集中圖書借閱記錄數量Q的比值高于閾值φ的情況。為了提高推薦質量,本文提出針對表2所示“用戶-圖書”興趣偏好矩陣的缺失項填充方法。
3.3.1“用戶-圖書”借閱關系矩陣缺失項填充方法
本文利用公式(6)“用戶-圖書屬性”偏好量化值計算方法對表2“用戶-圖書”興趣偏好矩陣中某些缺失項進行填充,在一定程度上解決矩陣“稀疏性”問題,提高推薦的精確度。首先借鑒TF-IDF的思想,計算用戶u對某種屬性類型t下的某個屬性值ai(k)的偏好權重,記為Wu,ai(k),計算方法如公式(10)所示。
公式(10)
其中,|I(u,at(k))|表示用戶u借閱包含屬性值at(k)的圖書數量,|Iu|表示用戶u借閱圖書數量。|U|表示系統中的用戶總數,|U(at(k))|表示系統中借閱過包含屬性值at(k)圖書的用戶數量,表示系統中圖書四種不同類型圖書屬性所包含屬性值總數,表示用戶u所借閱的圖書中所包含屬性值的總數。
從用戶借閱圖書行為量化及圖書借閱數量兩個角度得到用戶對于圖書所包含屬性值偏好程度的基礎上,可以得到矩陣缺失項填充的計算方法,如公式(11)所示。
公式(11)
根據公式(11)所示,評分矩陣中用戶u對于未借閱圖書ix的興趣偏好值填充方法分為三種情況:①待填充評分圖書i中包含的屬性值與用戶u已借閱圖書集合中所包含的屬性值完全相同,則填充值為該用戶所借閱圖書興趣偏好值的均值;②待填充興趣偏好值的圖書ix中包含的屬性值集合為用戶u已借閱圖書集合中所包含的屬性值的子集,則按照填充方法公式(II)結果;③待填充興趣偏好值的圖書ix中含有用戶u已借閱圖書中不存在的屬性值,則不進行填充。
3.3.2用戶相似性度量方法
對“用戶-圖書”偏好矩陣中的缺失項完成填充后,就需要對目標用戶u進行相似性度量,在用戶集合中找到與目標用戶u興趣偏好相似的最近鄰集合。當用戶u和v對于相同的圖書發生借閱的行為時,根據用戶對于圖書的偏好量化值采用Pearson相關系數進行度量,如公式(12)所示。
公式(12)
此外,對于兩個用戶u和v借閱圖書的偏好量化向量,使用歐式距離,以測量這兩個用戶在相同項目上所形成的偏好模式之間的距離,如公式(13)所示。
公式(13)
歐式距離的值范圍為[0,+∞)。如果歐式距離為0,這意味著兩個用戶對所有項目的行為偏好完全相同。如果歐式距離很大,這表明兩個用戶的行為偏好模式存在顯著差異。
公式(11)和(12)中,用戶v為目標用戶u最近鄰集合的候選用戶,當目標用戶u和候選用戶v均借閱過圖書i時,相似性度量計算時所使用到的用戶v對圖書i的偏好量化值為公式(5)計算所得的實際值,即R*v(i),當目標用戶u借閱過圖書i,而用戶v并未借閱過該圖書,此時相似性度量計算時,用戶v對圖書i的偏好量化值為公式(11)所示的評分填充值R’v(i),如公式(14)所示。
公式(14)
總之,對用戶u和v在借閱相同圖書時形成的行為偏好向量上計算得到Pearson相關系數和歐式距離,二者在取值范圍上存在著巨大差異。Pearson相關系數衡量的是兩個向量的線性相關性。特別是在[0,1]取值范圍內,值越大表示兩個用戶的行為模式越相似。因此需要將用戶u和v的圖書借閱偏好向量的歐式距離進行處理,使其取值范圍與Pearson相關系數范圍相同。標準化歐式距離的計算如公式(15)所示。
公式(15)
通過計算Pearson相關系數和標準化歐氏距離的調和平均數,可以同時考慮到評分的數值相似性和評分模式的相似性,獲得一個更全面的相似性度量,計算公式如公式(16)所示。
公式(16)
由于Pearson相關系數用于度量兩個向量之間的線性相關程度,而歐式距離衡量的是向量在多維空間中的實際距離。在本文中,通過計算兩者的調和平均數,能夠同時考慮用戶的行為偏好值差距(通過歐式距離)和行為偏好值趨勢(通過皮爾遜相關系數),使得相似性度量的結果更加準確。
3.3.3圖書偏好預測
在進行評分預測之前,需要根據相似性度量的結果,找到與目標用戶u相似的最近鄰。本文在最近鄰的建立方法上首先根據公式(16)計算目標用戶u與系統中其他用戶相似性度量結果的均值(記為λu)作為閾值,如公式(17)所示。
公式(17)
然后,將系統中其他用戶與目標用戶u相似性度量結果高于閾值λu的用戶組成目標用戶u的最近鄰集合記為N(u)。在得到目標用戶u最近鄰集合后,采用協同過濾的方法預測該用戶對未借閱圖書ix的偏好預測,計算方法如公式(18)所示。
公式(18)
最后,針對目標用戶未借閱圖書的預測評分進行降序排列,將預測評分最高的N種圖書推薦給目標用戶,實現對目標用戶的Top-N推薦。
4實驗分析
4.1數據準備
本文選擇2023年1月至2023年12月本校圖書館圖書借閱記錄作為實驗數據。實驗數據共涉及1852位用戶的28695條圖書借閱記錄,圖書借閱記錄中共涉及不同種類圖書3764本。本校圖書館的用戶分為三種類型,分別為本科生、研究生及教職工,對應的圖書借閱時間(天)為{30,45,60}。實驗將數據集分割為訓練集和測試集,訓練集數據為實驗數據中圖書借閱記錄80%數據,測試集數據為另外的20%圖書借閱記錄。
4.2實驗分析
由于本文所研究的圖書推薦方法不涉及用戶對所借閱圖書館具體的評分值,而是采用用戶對于圖書借閱行為進行量化模擬對圖書的評分值,并在此基礎上進行用戶相似性度量從而實施圖書推薦。該方法屬于Top-N推薦,即為目標用戶提供長度為N的圖書推薦列表,因此在對比實驗中采用精確率(Precision)、召回率(Recall)評價指標。準確率表示用戶對系統推薦資源感興趣的概率,召回率表明一個用戶喜歡的項目被推薦的概率,準確率和召回率越高,表示推薦效果越好[6-8]。
4.2.1確定閾值的取值
當訓練集數據中用戶借閱不同圖書的數量與借閱不同種類圖書數量的比值高于閾值時,使用本文介紹的推薦方法。使用該方法需要通過不同的閾值條件下Top-N推薦結果的準確率確定后續對比實驗的閾值。將φ取值設定為{0,0.1%,0.2%,0.3%,0.4%,0.5%,0.6%,0.7%,0.8%,0.9%,1%}這11種情況下,對比測試集目標用戶在推薦項目數量N為{5,10,15,20,25,30}的六種情況下,測試φ取值在何種情況下推薦準確率達到最高,實驗數據如下。
從表3所示的實驗結果可以發現隨著閾值φ的升高,在六種推薦項目數量條件下,推薦結果的精確度也隨之提高,當φ=0.6時,推薦精確度達到最高。這種情況表明,在目標用戶圖書借閱數量較少的情況下,隨著目標用戶圖書借閱記錄增多,其圖書借閱種類也不斷升高,使用本文設計的自適應推薦算法中基于圖書屬性的推薦方法,即ALgorithm(II)為目標用戶推薦的圖書與用戶已借閱圖書包含屬性的相似度較高。但隨著φ取值繼續升高,推薦結果的精確率提升效果不明顯,其原因在于當用戶自身借閱圖書數量增多時,其興趣偏好范圍更廣,用戶偏好的挖掘不能僅僅局限于對于所借閱圖書屬性的相似性分析之中,因此在后面的對比實驗中,閾值φ的取值為0.6。
4.2.2實驗比較
為了驗證本文提出方法的推薦質量,需要與其他的推薦方法以精確率、召回率作為評價指標在實驗數據上比較。對比方法采用傳統的基于用戶的協同過濾推薦方法,通過用戶評分進行相似性度量實施推薦,記為User-CF[9]。此外,另一種對比方法采用通過時間遞減函數反映用戶興趣動態特征實施推薦,該方法考慮到用戶的興趣偏好會隨著時間發生變化,記為Inst-CF[10]。由于這兩種對比實驗方法是采用用戶評分設計推薦方法的,因此,在本文的對比實驗中,同樣采用用戶對于圖書借閱行為進行量化模擬對圖書的評分值。由于實驗比較使用精確率和召回率作為評價指標,三種推薦方法計算得到目標用戶對未借閱圖書集合中每本圖書預測值后均以降序排列,實施Top-N推薦。
圖4三種方法的精確率、召回率實驗結果對比圖
從圖4所示的實驗結果可以發現,隨著推薦數量的增加,三種推薦方法的精確率都有所下降,而召回率都有所上升。從實驗對比結果可以看出,本文提出的方法的精確率和召回率均優于其他兩種方法,因此推薦效果最佳。三種方法中User-CF方法推薦效果最低,其原因在于該方法僅僅將借閱行為量化值作為相似性度量的衡量標準,沒有考慮時間因素對于用戶興趣偏好的影響。Inst-CF考慮到用戶興趣會隨著時間的推移會發生改變,能夠動態捕捉用戶興趣偏好發生的變化調整與目標用戶相似的候選最近鄰用戶集合,因此該方法的推薦效果優于User-CF方法,但由于根據借閱行為量化值所形成的“用戶-圖書”借閱關系矩陣中存在缺失值過多情況下影響推薦精度,使得其推薦效果低于本文所提出的方法。
5結語
本文針對協同過濾推薦中存在“冷啟動”及用戶對于項目的評分會存在矩陣稀疏性的情況,影響推薦質量的問題,提出了一種創新的自適應圖書推薦方法,即根據用戶對于圖書借閱數量設計不同的推薦方法。根據用戶類型、借閱時長等行為進行分析,對用戶的圖書借閱行為量化,形成對圖書的評分,同時圖書屬性和用戶的借閱行為相結合,在用戶相似性度量時模擬用戶對于未借閱圖書的評分在一定程度上解決矩陣稀疏性的問題,提高推薦質量。最后,將本文提出的推薦方法與其他兩種對比方法在圖書借閱實驗數據上進行比對,驗證本文提出的推薦方法能夠有效地提高推薦精度。
*本文系2021年度天津市教育科學規劃課題“基于用戶畫像的高校醫學生信息素養教育研究”(項目編號:HCE210338)系列研究成果。
①郭雪梅系本文通訊作者。
參考文獻:
王剛郭雪梅:融合圖書屬性和用戶借閱行為分析的自適應圖書推薦研究
黃賢金.智慧新學至真:世界一流大學圖書館
建設的思考[EB/OL].[2024-04-22].https://lib.nju.
edu.cn/info/1065/3131.htm.
董坤.基于協同過濾算法的高校圖書館圖書推
薦系統研究[J].現代圖書情報技術,2011(11):
44-47.
林曉霞,劉敏,楊曉東,等.融合信任相似度的高校圖書館個性化推薦研究[J].數字圖書館論壇,2018(8):14-19.
宋楚平.一種改進的協同過濾方法在高校圖書
館圖書推薦中的應用[J].圖書情報工作,2016,60(24):86-91.
梁思怡,彭星亮,秦斌,等.時間上下文優化的
協同過濾圖書推薦[J].圖書館論壇,2021,41(3):
113-121.
郭雪梅.基于社會化標簽的用戶標注行為和時
間因素的個性化推薦方法研究[J].情報科學,
2020,38(2):68-74.
蔡強,韓東梅,李海生,等.基于標簽和協同過
濾的個性化資源推薦[J].計算機科學,2014,41
(1):69-71,110.
張鵬飛,王宜貴,張志軍.融合標簽和多元信息的個性化推薦算法研究[J].計算機工程與應用,2019,55(5):159-165.
SUXY,KHOSHGOFTAARTM.Asurveyofcollaborativefilteringtechniques[J].AdvancesinArtificialIntelligence,2009,2009421425-1-421425
-19.DOI:10.1155/2009/421425.
CHENGJJ,LINGYB,ZHANGHT,etal.Anew
recommendationalgorithmbasedonuser’sdynamic
informationincomplexsocialnetwork[J].Mathematical
ProblemsinEngineering,2015(9):1-6.
WangGang,GuoXuemei:ResearchonAdaptiveBookRecommendationbyIntegratingBookAttributesandUserBorrowingBehaviorAnalysis
(收稿日期:2024-04-22編校:謝艷秋,陳安琪)