999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合讀者、相似度和位置信息的圖書推薦系統模型研究*

2019-10-15 03:27:42郭苗苗吳了郭晨睿
科技與創新 2019年18期
關鍵詞:影響信息模型

郭苗苗,吳了,郭晨睿

融合讀者、相似度和位置信息的圖書推薦系統模型研究*

郭苗苗1,吳了1,郭晨睿2

(1.長沙學院,湖南 長沙 410022;2.洛陽師范學院,河南 洛陽 471934)

“新書推薦”“借閱排行榜”等圖書推薦簡單地將特定書目推薦給所有讀者,忽略了讀者之間的個體差異性。個性化圖書推薦采用大數據和數據挖掘技術,預測讀者的借閱行為,有針對性地向讀者推薦圖書,實現個性化服務。開發個性化圖書推薦系統需要對影響圖書推薦的各種因素進行數學建模。在現有技術的基礎上,結合圖書館的應用背景,提出了一種融合讀者、相似度和位置信息的圖書推薦系統模型,該模型的建立有助于新一代圖書推薦系統的開發。

圖書推薦;系統模型;讀者;位置信息

圖書館作為高校教學、科研的知識資源提供者,是在校大學生和教學科研人員獲取知識的主要途徑。但大多圖書管理系統(ILAS、金盤等)一般不具備圖書推薦功能,導致讀者在面對海量信息資源時,如果采用傳統的圖書查找方法很難精準找到所需的圖書;另一方面,當圖書館在新采購一批圖書或數字資源后,感興趣的讀者并不能及時獲取這一方面的信息,在一定程度上造成了圖書資源的浪費。因此,圖書館需要綜合考慮讀者特性,利用數據挖掘技術,通過收集和分析讀者的借閱習慣、喜好等信息,獲取讀者的閱讀偏好,精準地向讀者推薦圖書,實現個性化推薦,提高圖書的借閱率。個性化圖書推薦系統結構如圖1所示。

圖1 個性化圖書推薦系統結構框圖

在進行個性化圖書推薦時,需要在讀者基本數據和后臺知識的基礎上建立讀者模型,然后根據匹配規則對讀者模型和圖書館的館藏圖書進行匹配,利用數據挖掘技術形成個性化推薦結果。由圖1可以看出,在個性化圖書推薦系統中,建立讀者模型對推薦結果有較大的影響,因此,模型的建立至關重要。

1 常見的圖書推薦算法

模型的建立離不開圖書推薦算法。目前主要的圖書推薦算法有:①基于內容的推薦算法,即根據讀者過去的借閱習慣,為讀者推薦與他過去借閱的圖書內容相似的圖書;②基于關聯規則的推薦算法,即同一個讀者借閱的不同圖書可認為之間存在著某種關聯,可以從借閱歷史中搜索關聯度最高的圖書(圖書集合)作為推薦的主要參考;③基于協同過濾的算法,即通過尋找當前讀者借閱行為最相似的鄰近讀者,推薦鄰近讀者借閱的圖書給當前讀者[1-4]。

協同過濾算法是個性化推薦中較成熟的推薦算法之一。協同推薦算法一般分為基于用戶的協同過濾推薦、基于模型的協同過濾推薦和基于項目的協同過濾推薦[5],其中“以用戶為中心”的基于用戶的協同過濾算法在推薦系統中獲得了廣泛的應用。傳統的基于用戶的協同過濾算法將兩個用戶之間的影響當作對稱的影響,也就是說對于任意的兩個讀者,彼此的影響是相當量的。然而,在現實借閱中這種影響并不一定當量對稱,例如教師可能會對新生讀者產生較大的影響,但是新生讀者對教師的影響卻較小。因此,傳統協同過濾算法還有改進空間。

協同過濾的另一個好處是可以通過聚合類似讀者的行為來發現讀者的隱含偏好[6]。假設有個讀者和本圖書,讀者集合可以表示為={1,2,…,m},圖書集合可以表示為={1,2,…,n},ij=1為讀者i借閱過圖書j,否則ij=0,則在推薦系統中,讀者對圖書的歷史借閱數據就構成讀者圖書借閱矩陣∈mn。這樣計算任意兩位讀者之間的相似性,就可以采用余弦相似度、Jacarrd相似度和Pearson相似度等方法。在上述3種方法中,當數據僅僅為0或1時,余弦相似度計算效果最佳。采用余弦相似度來計算讀者之間的相似度,讀者i與讀者k之間的相似度ki計算如公式為:

傳統的基于用戶(讀者)的協同過濾算法計算讀者i對圖書j借閱的概率為:

圖書館的藏書數量很大,一個普通高校的藏書就有上百萬冊,由于學科分布廣泛,大量跨專業、跨學科以及新型學科和邊緣學科圖書的存在,造成傳統的圖書推薦系統模型的數據稀疏,降低了推薦質量。因此,本文綜合考慮讀者、相似度和位置信息,提出了一種改進的基于協同過濾算法的圖書推薦系統模型。

2 融合讀者、相似度和位置信息的圖書推薦模型

要想提高推薦的準確性,使得推薦的書目盡可能地滿足讀者的借閱傾向,不僅僅要考慮讀者的借閱歷史,還要考慮讀者的興趣愛好等個體信息,本文在前人已有工作的基礎上,給出一種融合讀者、相似度和位置信息的圖書推薦[7]。使用一種改進的基于讀者的協同過濾算法——讀者影響模型考慮并計算兩個讀者間的非對稱影響,利用PageRank算法生成讀者的全局影響因子;考慮讀者間的專業和興趣愛好等的相似度;利用圖書、閱覽桌等的位置信息,挖掘讀者的實際借閱的位置特征,生成位置模型;將改進的讀者影響、相似度影響和位置影響綜合以建立圖書推薦模型。

融合讀者、相似度和位置信息的圖書推薦系統結構如圖2所示。

圖2 融合讀者、相似度和位置信息的圖書推薦系統結構示意圖

圖2中最左邊虛線框中的內容為每位讀者錄入的數據來源,包括一卡通、教務系統、圖書管理系統的數據庫等,反映了讀者的專業、就業創業傾向、個人喜好、借閱歷史等信息。第二個虛線框對讀者間的非對稱影響、相似度、借閱歷史(閱覽歷史)的位置信息信息等進行分析,以提高圖書推薦的精準度。

2.1 非對稱讀者影響分析

給定讀者和圖書的借閱關系矩陣:

=[ul]mn(2)

式(2)中:矩陣的第行、第列的ul為讀者對圖書的借閱次數(含續借);為讀者的人數;為圖書的數量。因為讀者借閱圖書的時長有限,當讀者往往不能在一次借閱時間內完成圖書的閱讀與理解,會存在續借行為,在這里,圖書的逾期未還行為視為一次續借。借閱(續借)次數越高,表明讀者越喜歡圖書,如果讀者沒有借閱過圖書,則ul的值設置為0。

式(3)中:u為讀者借閱過的圖書的數量。

根據計算公式獲得的布爾矩陣′構建非對稱讀者影響矩陣:

=[uv]mn(4)

式(4)中:uv為讀者對讀者的影響因子。

傳統的基于讀者的協同過濾算法中的讀者關系矩陣是對稱的,而本文中的讀者影響矩陣是不對稱的。

假設讀者可以影響的其他讀者越多,則讀者在圖書推薦系統中讀者的全局重要性越高;如果有多個讀者可以對讀者產生影響,則讀者更容易受到讀者全局重要性越高的讀者的影響。

式(5)(6)中:()為一個函數,如果>0,則()=1;否則()=0。

使用隨機生成的值來初始化讀者的PageRank值,并使用迭代模型得到最終的每位讀者PageRank值。在每次迭代中,PageRank的值計算方法為:

式(7)中:∈[0,1]為阻尼系數,表示其他讀者對讀者的貢獻的縮放因子;()為可以影響讀者的所有讀者的集合。

在式(7)中,影響更多其他讀者的讀者,并受到更少其他讀者影響的讀者擁有更小的PageRank值,即具有越小PageRank值的讀者越重要。

式(8)中:vu為讀者對讀者的影響值。

2.2 讀者相似性的影響分析

讀者的借閱行為可能會受到有其他讀者的影響,例如共同考研、找工作的讀者等。本模型使用專業、共同興趣愛好、考研和創業就業傾向等來計算讀者間的相似性??梢圆捎胹igmoid函數將擁有相似專業、共同興趣愛好或創業就業傾向轉換為規范的相似性。同時,使用Jaccard相似度描述每對讀者之間的相似性。然后使用超參數來平衡上述兩種相似性。使用u表示與讀者有關系的讀者集,(,)表示讀者和讀者之間的相似度。讀者∈u,則讀者與讀者之間的相似性定義如下:

式(9)中:(,)為讀者和讀者之間的相似性;超參數∈[0,1]?;谏鲜鲎x者之間的相似性,可以通過傳統的基于讀者的協同過濾算法預測讀者借閱其未借閱過的圖書的概率,計算公式為:

2.3 圖書位置信息的影響分析

在圖書館讀者更愿意借閱自己附近的感興趣的圖書。因此,為了將讀者實時位置信息融入到圖書推薦系統中,本文使用冪律分布來模擬讀者從借閱一本圖書到借閱同一個書庫(書架)的另一本圖書的距離函數作為讀者可能借閱的概率,公式為:

式(11)中:(l)為讀者借閱不同于l的書架(書庫)的圖書的意愿;l為兩本圖書的距離;和為冪律函數的參數。

使用最大似然估計來計算兩個參數和。具體方法是:在式(11)的兩邊取對數,即ln[(l)]=ln()+ln(l)。通過最小二乘法獲得上的ln(l)線性函數。從而得到式(11)中的兩個參數和。

假設:讀者在借閱圖書i,圖書j是他將要借閱的候選圖書,圖書i與圖書j之間的距離為l(i,j)。對讀者的借閱概率進行建模,讀者借閱圖書j的概率與讀者借閱在距離l(i,j)處的圖書的意愿(l)成比例。

計算概率的公式為:

隨著兩本圖書之間距離的增加,讀者借閱的概率隨之降低,表明讀者不太可能借閱距離較遠的圖書。

2.4 圖書推薦模型建立

根據預測的借閱概率,可得到相應的分數,計算公式為:

式(13)(14)(15)中:為所有圖書集合;u為讀者借閱過的圖書集合。

在對讀者進行圖書推薦時,可以根據ij的值,向讀者推薦可能感興趣圖書,不同于單單基于讀者和單單基于內容的圖書推薦系統,本文模型綜合考慮了讀者借閱歷史、讀者之間的相似性以及讀者借閱產生的實時位置信息等,以向讀者推薦其可能更加感興趣的圖書。

3 結束語

在海量的圖書中,形成對讀者的個性化推薦,需要綜合考慮多種因素的影響,降低數據的稀疏性,本文綜合考慮讀者、相似度、位置信息等,提出了一種個性化圖書推薦模型,提高推薦的準確度。圖書館館員可以根據模型的推薦結果對藏書進行排架、倒架、下架等操作,為讀者提供更好的服務,提高圖書的利用率。

[1]黃立威,江碧濤,呂守業,等.基于深度學習的推薦系統研究綜述[J].計算機學報,2018,41(7):1619-1647.

[2]孫魯平,張麗君,汪平.網上個性化推薦研究述評與展望[J].外國經濟與管理,2016,38(6):82-99.

[3]冷亞軍,陸青,梁昌勇.協同過濾推薦技術綜述[J].模式識別與人工智能,2014,27(8):720-734.

[4]李默,梁永全.基于標簽和關聯規則挖掘的圖書組合推薦系統模型研究[J].計算機應用研究,2014,31(8):2390-2393.

[5]郭淑紅,劉釗,徐玉梅.基于用戶特征的高校圖書館個性化圖書推薦研究[J].無線互聯科技,2017(4):115-116.

[6]田磊,任國恒,王偉.基于聚類優化的協同過濾個性化圖書推薦[J].圖書館學研究,2017(8):75-80.

[7]郭晨睿,李平.基于社交和地理信息的興趣點推薦[J/OL].計算機工程與應用[2019-08-19].http://kns.cnki.net/ kcms/detail/11.2127.TP.20190705.1724.034.html.

TP391.3

A

10.15913/j.cnki.kjycx.2019.18.016

2095-6835(2019)18-0041-04

長沙學院人才引進項目和湖南省自然科學基金(編號:2019JJ50691)

郭苗苗(1987—),女,主要研究方向為圖書館現代化。吳了(1986—),男,主要研究方向為人工智能。郭晨睿(1992—),男,主要研究方向為數據挖掘。

〔編輯:張思楠〕

猜你喜歡
影響信息模型
一半模型
是什么影響了滑動摩擦力的大小
哪些顧慮影響擔當?
當代陜西(2021年2期)2021-03-29 07:41:24
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
3D打印中的模型分割與打包
擴鏈劑聯用對PETG擴鏈反應與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 福利片91| 欧美不卡二区| 亚洲VA中文字幕| 久久99久久无码毛片一区二区| 亚洲系列无码专区偷窥无码| 免费看a级毛片| 中文字幕66页| 91成人在线观看视频| 亚洲青涩在线| 国内精品91| 亚洲欧美国产视频| 日韩午夜片| 免费一级全黄少妇性色生活片| 欧美视频在线不卡| 日韩欧美国产中文| 999精品视频在线| 成年免费在线观看| 999精品色在线观看| 国产情侣一区二区三区| 久久久成年黄色视频| 四虎精品黑人视频| 欧美成人一区午夜福利在线| 国产一区二区三区精品久久呦| 一区二区日韩国产精久久| 三区在线视频| 日本欧美午夜| 国产H片无码不卡在线视频| 全免费a级毛片免费看不卡| 91国内外精品自在线播放| AV不卡在线永久免费观看| 露脸国产精品自产在线播| 日韩成人在线视频| 国产精品3p视频| 在线亚洲精品福利网址导航| 久久国产免费观看| 国产男女免费完整版视频| 欧美翘臀一区二区三区| 国产成人无码AV在线播放动漫| 色综合手机在线| 国产一区二区人大臿蕉香蕉| 国产在线视频导航| 很黄的网站在线观看| 亚洲中文字幕日产无码2021| 一级全黄毛片| 精品国产三级在线观看| 国产综合精品一区二区| 99热这里只有精品久久免费| 69国产精品视频免费| 亚洲国产中文欧美在线人成大黄瓜| 99re在线免费视频| 中文国产成人精品久久一| 精品亚洲国产成人AV| 人妖无码第一页| 国产熟女一级毛片| 国产成人精品男人的天堂下载| 久久黄色免费电影| 精品国产香蕉伊思人在线| 色欲色欲久久综合网| 18禁色诱爆乳网站| 国产视频大全| 国产亚洲精品资源在线26u| 19国产精品麻豆免费观看| 另类综合视频| 一级成人a做片免费| 国产免费福利网站| 美女视频黄频a免费高清不卡| 日本午夜在线视频| 亚洲综合在线网| 国产精品欧美日本韩免费一区二区三区不卡 | 色综合天天视频在线观看| 国产高清在线观看91精品| 国产精品成人不卡在线观看 | 色哟哟色院91精品网站 | 免费中文字幕一级毛片| 国产乱子伦手机在线| 国产精品久久久久婷婷五月| 国产精品免费p区| 欧美成人区| 国产性生大片免费观看性欧美| 久久午夜夜伦鲁鲁片无码免费| 欧美一级黄片一区2区| 91亚洲免费|