楊雪
(陜西國際商貿學院 圖書館, 陜西 咸陽 712046)
隨著人們生活水平的不斷提高,人們對精神生活的追求也日益提高,圖書館已經成為人們經常停留的地方。隨著無線移動網絡技術的成熟,許多電子圖書被保存于圖書館中,人們如何從大量的書籍中找到自己需要的圖書十分重要[1-3]。圖書館書目推薦系統(tǒng)可以幫助人們快速定位到需要的書籍,提高了圖書館資源利用率,因此設計性能良好的圖書館書目推薦系統(tǒng)已成為圖書館研究領域的一個重要方向[4-6]。
圖書館書目推薦系統(tǒng)解決了傳統(tǒng)圖書查找方式,具有一定的智能性,是圖書館管理的一個重要組成部分,當前存在許多有效的圖書館書目推薦系統(tǒng)[7-9]。最常用的圖書館書目推薦系統(tǒng)為:基于樸素貝葉斯算法的圖書館書目推薦系統(tǒng),基于人工智能技術的圖書館書目協(xié)同推薦系統(tǒng)等,它們根據一定的規(guī)則將圖書書目推薦給用戶,減少了用戶選擇圖書時間,但是這些系統(tǒng)存在一定的缺陷,如:無法滿足不同用戶對圖書館書籍的個性化需求,針對性不強,而且圖書館書目協(xié)同推薦精度低[10-11]。
為了解決圖書館書目推薦系統(tǒng)無法滿足用戶對書目的個性化要求的缺陷,提出了基于協(xié)同過濾的圖書館書目個性化推薦系統(tǒng)。首先建立了圖書館書目個性化推薦系統(tǒng)的總體結構,然后根據協(xié)同過濾算法計算圖書和用戶間的相似度,最后根據相似度對書目進行排序,并根據排序結果向用戶推薦真正需要的書目,測試結果表明,該系統(tǒng)充分考慮了每一個用戶的不同需求,降低了圖書館書目推薦誤差,圖書館書目推薦結果更加具有針對性,相對其他圖書館書目推薦系統(tǒng)具有十分顯著的優(yōu)越性。
結合用戶對圖書的實際要求,協(xié)同過濾的圖書館書目個性化推薦系統(tǒng)結構,如圖1所示。

圖1 圖書館書目個性化推薦系統(tǒng)的總體結構
從圖1可知,該系統(tǒng)主要包含圖書館書目、用戶數據庫、用戶需要書目推薦。數據庫主要保存圖書館書目的相關信息以及用戶信息,是系統(tǒng)最為重要的部分,便于協(xié)同過濾算法對圖書館書目進行個性化數據和推薦。書目推薦模塊是本文要重點研究的內容,主要包括:協(xié)同過濾算法,書目推薦規(guī)則,因此也是圖書館書目個性化推薦系統(tǒng)的核心部分。
基于協(xié)同過濾的圖書館書目個性化推薦系統(tǒng)工作流程如圖2所示。

圖2 圖書館書目個性化推薦系統(tǒng)的工作流程
對圖2的工作過程進行分析可以發(fā)現,首先對用戶個性需求進行分析,從數據庫中提取相關的圖書書目信息,并對信息進行一定分類預處理,將分類結果存儲于數據庫中,然后采用協(xié)同過濾計算用戶與圖書之間的相似度,并對兩者的關系進行挖掘,建立圖書館書目個性化推薦關聯(lián)規(guī)則,最后將圖書館書目推薦結果Web服務器發(fā)送給用戶。
現代圖書館包含海量圖書數據,不同的圖書具有不同的關鍵詞,因此可以根據關鍵詞區(qū)別相應的書籍[12]。首先抽取圖書的一些關鍵詞,然后計算關鍵詞的權重,并根據權重計算圖書相似度,最后根據圖書相似度進行書目推薦。
2.3.1 計算圖書關鍵詞的權重
當前計算圖書館書目的關鍵詞權值方法很多,相對其他方法,TF-IDF得到圖書館書籍關鍵詞的權重更加科學、合理,因此本文選擇其計算圖書關鍵詞的權重。TF表示圖書館書目的詞頻,用于描述關鍵詞對圖書的重要程度;而IDF表示圖書館書籍的反向詞頻,用于描述關鍵的普遍重要性。設圖書館書籍有F個關鍵詞,它們在圖書館書籍中出現的次數為K,那么TF可以表示為式(1)。
TF=K/F
(1)
設圖書總數量為N,包含某個關鍵詞的圖書數量為k,那么IDF可以表示為式(2)。
(2)
采用TF-IDF方法可以得到圖書館書籍的關鍵詞權重,具體可以表示為式(3)。
TF-IDF=TF×IDF
(3)
2.3.2 根據圖書關鍵詞權重計算圖書相似度
圖書Bi與Bj包含共同關鍵詞數量為t,對于圖書Bi和Bj,第k個關鍵詞的權重值分別為Wik和Wjk,那么圖書Bi與Bj的相似度為式(4)。
(4)
2.3.3 計算用戶相似度
(1) 計算用戶屬性相似度。用戶屬性包括數值型和本文型。設用戶Ui與Uj的數值型屬性的相似度為simnum(i,j),用戶Ui與Uj的文本型屬性的相似度為simt(i,j),用戶屬性相似度為式(5)。
simatt(i,j)=simnum(i,j)+simt(i,j)
(5)
(2) 計算用戶活躍相似度。用戶Ui與Uj包含共同動態(tài)信息的數量為m,第k個動態(tài)信息的權重值分別為Uik和Ujk,那用戶活躍相似度simact為式(6)。
(6)
(3) 用戶相似度包括兩部分:屬性相似度和活躍相似度,這樣可以得到用戶Ui與Uj的最終相似度為式(7)。
sim(Ui,Uj)=αsimatt(i,j)+βsimact(i,j)
(7)
2.3.4 計算用戶與圖書之間的關聯(lián)性
設用戶Ui與圖書Bj存在z個聯(lián)系,那么用戶Ui與圖書Bj的關聯(lián)性計算式為式(8)。
(8)
式中,Rik表示Ui與圖書Bj的第k個聯(lián)系值。
2.3.5 用戶的圖書館書止推薦規(guī)則
設圖書集合為:P={P1,P2,…,Pm},事務記錄集合為T={t1,t2,…,tn},根據匹配樹機制得到支持度和置信度為式(9)、式(10)。
采用K-Means聚類算法將圖書館圖書進行分析,劃分為K個類型,然后根據匹配樹機制建立各類圖書匹配規(guī)則,計算最小支持度和最小置信度,最后根據最小支持度和最小置信度給用戶推薦書目。
為分析協(xié)同過濾的圖書館書目個性化推薦系統(tǒng)推薦的有效性,采用某高校圖書館作為測試目標,該高校圖書館包含了大量的書籍,書籍類別眾多,大致可以劃分為20多類,面向的讀者主要是本校的老師和學生。當一個自動化專業(yè)學生進入基于協(xié)同過濾的圖書館書目個性化推薦系統(tǒng)后,系統(tǒng)會自動給他推薦相關的書目,具體結果如圖3所示。

圖3 本文系統(tǒng)的圖書館書目推薦結果
對圖3進行分析可以知道,系統(tǒng)給該學生推薦的書目與其專業(yè)十分相關,可以滿足用戶的個性需求,獲得了十分理想的書目推薦結果,實驗結果證明了本文設計的圖書館書目個性化推薦系統(tǒng)的有效性。
為了測試本文圖書館書目個性化推薦的優(yōu)越性,采用文獻[10]的超圖排序的圖書館書目個性化推薦系統(tǒng)和文獻[11]的SOM神經網絡的圖書館書目個性化推薦系統(tǒng)進行對比實驗,選擇8類圖書和相關用戶進行仿真對比實驗,采用推薦召回率、推薦覆蓋率、推薦準確度、推薦新穎度對實驗結果進行評價,它們分別描述如下。
(1) 推薦召回率指針對用戶所推薦圖書與圖書館內排除無關圖書外剩余圖書的比例,推薦召回率可有效體現系統(tǒng)的推薦性能;
(2) 推薦覆蓋率指推薦書目結果在圖書館內全部圖書中分布的廣泛程度,覆蓋率越高表明系統(tǒng)可挖掘圖書館內圖書范圍越廣,推薦性能越高;
(3) 推薦準確度指系統(tǒng)所推薦書目內圖書被用戶點擊次數占全部推薦書目比例;
(4) 推薦新穎度指推薦書目內出版年限為近三年的圖書占全部圖書館圖書數量百分比。
3種系統(tǒng)對于8類圖書推薦性能對比結果,如圖4所示。

(a) 召回率對比結果

(b) 覆蓋率對比結果

(c) 準確度對比結果

(d) 新穎度對比結果圖4 推薦性能對比結果
圖4(a)召回率對比結果可以看出,采用本文系統(tǒng)推薦8類圖書書目的推薦召回率在93%以上,明顯高于超圖排序系統(tǒng)和SOM神經網絡系統(tǒng)。本文系統(tǒng)采用協(xié)同過濾的書目推薦算法,可有效排除圖書館內無關圖書,有效驗證本文系統(tǒng)的推薦性能。
圖4(b)實驗結果可以看出,本文系統(tǒng)推薦圖書館書目的覆蓋率在95%以上,明顯高于超圖排序系統(tǒng)和SOM神經網絡系統(tǒng)。本文系統(tǒng)數據挖掘過程中可從圖書館全部圖書內搜尋適合用戶的書目,具有更大的挖掘范圍,有效驗證本文系統(tǒng)具有更高的推薦性能。
圖4(c)系統(tǒng)測試結果可以看出,本文系統(tǒng)推薦圖書館書目準確度在90%以上,明顯高于超圖排序系統(tǒng)和SOM神經網絡系統(tǒng)。系統(tǒng)測試結果說明本文系統(tǒng)所推薦書目被用戶接受概率明顯高于另外兩種系統(tǒng),本文系統(tǒng)所推薦書目具有更高的實用性。
圖4(d)系統(tǒng)測試結果可以看出,本文系統(tǒng)推薦圖書館書目新穎度在82%以上,明顯高于超圖排序系統(tǒng)和SOM神經網絡系統(tǒng)。本文系統(tǒng)推薦圖書館書目內新書比例明顯高于另兩種系統(tǒng),本文系統(tǒng)推薦過程中充分考慮圖書館內新書,令系統(tǒng)推薦結果更加新穎,提升了用戶興趣度,令所推薦書目結果更加具有個性化。
為進一步驗證本文推薦系統(tǒng)的有效性,利用匹配樹機制對5類圖書構建關聯(lián)分析,對各專業(yè)進行圖書類別匹配,匹配內容如表1所示。

表1 圖書匹配結果
從表1可以看出,本文系統(tǒng)采用匹配樹機制對5類圖書構建關聯(lián)結果十分合理。
以表1中的樣本為基礎,測試本文系統(tǒng)與超圖排序系統(tǒng)和SOM神經網絡系統(tǒng)在某地某高校圖書館學生以及教師中的推薦有效性,得到成功率對比結果如圖5所示。

圖5 不同系統(tǒng)的圖書館書目推薦成功率對比
由圖5的對比結果可知,本文系統(tǒng)采用的協(xié)同過濾算法可針對不同用戶充分考慮用戶需求,推薦用戶所需圖書,因此推薦成功率較高,在92%以上,比超圖排序系統(tǒng)和SOM神經網絡系統(tǒng)成功率更高,因此可以驗證本文系統(tǒng)推薦性能的有效性。
由于不同用戶喜歡不同的書籍,因此圖書館書目個體性要求具有一定的實際應用價值,當前圖書館書目推薦系統(tǒng)忽略用戶的個性需求,存在一定的缺陷,如:圖書館書目推薦偏差大等,為了提高圖書館書目推薦精度,提出了基于協(xié)同過濾的圖書館書目個性化推薦系統(tǒng),采用協(xié)同過濾算法計算用戶與書籍之間的關系,充分考慮用戶的個性化需求,改善用戶對圖書館書目推薦結果的滿意度,并通過具體的圖書館作為研究對象,與其他圖書館書目推薦系統(tǒng)進行了仿真對比測試,結果表明,本文系統(tǒng)解決了當前圖書館書目推薦系統(tǒng)存在的數據稀疏和冷啟動弊端,是一種精度高、用戶滿意的圖書館書目推薦系統(tǒng),實際應用價值較高。