999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隱語義模型的協同過濾構建圖書推薦系統

2020-04-01 03:43:12楊杰中
科學咨詢 2020年10期
關鍵詞:語義用戶模型

楊杰中

(中國人民大學附屬中學 北京 100086)

前 言

隨著互聯網技術的快速發展,用戶和圖書的巨大增長為電子商務領域的推薦系統帶來了三大關鍵挑戰,即:如何提供高質量的推薦,如何在每秒為數百萬用戶和書籍實現多個推薦,并在面對數據稀疏性時實現高覆蓋率[1]。

為了應對以上面臨的挑戰,同時減小因數據冗余、復雜及歧義所帶來的問題,個性化推薦在科研中已經獲得許多成果,相關的系統被廣泛地應用于電子商務中。本文基于圖書爆炸性增長的問題,提出以個性化推薦的方式構建圖書推薦系統。其中,模型及方法的構建有利于快速、有效地為用戶推薦個性化及長尾部分的圖書;同時驗證了基于隱語義模型的協同過濾方法具有可行性及實用性。本文所設計的圖書推薦系統可為相關的工業設計提供研發思路,并促進相關領域的發展。

一、相關研究

在推薦系統領域,尤其是個性化推薦方法已經獲得眾多學者的認可。Jonathan等學者提出了一個用于提高協同過濾和新的算法元素準確性的框架[2]。Linden等學者通過比較相似項目而不是相似用戶,證明使用項目到項目的協同過濾可擴展到非常大的數據集并生成高質量的推薦[3]。本文基于隱語義模型實現協同過濾算法,并設計具備可行性、實用性的圖書推薦系統。此外,本文還根據數據稀疏、系統冷啟動等問題進行了優化,系統還可以根據用戶在閱讀書籍時在不同章節的停留時間來分析數據的經典部分,使推薦系統更好地與模型融合。

二、圖書推薦系統設計

本文在設計應用平臺時,使用對用戶行為模式進行評估來為用戶推薦其所感興趣的書籍并顯示于圖書推薦界面。同時,用戶的關注列表、搜索記錄也將為推薦系統提供用戶的潛在興趣及愛好。因此,本文設計圖書推薦系統平臺包含用戶端及服務器端,用戶端包含圖書搜索、用戶關注、圖書推薦等界面,服務器可對用戶的行為模型進行分析及做出推薦等行為,如圖1所示。

圖1 整個系統的研究思路

為了量化隱式信息,本文通過計算用戶已讀頁數與閱讀總時長之比來量化其對書的興趣程度。經驗表明,閱讀的開頭用戶翻看某頁的狀態最缺乏規律,因此要懲罰開頭頁數。然后,用戶本身閱讀的快慢有所不同,因此用該用戶平均閱讀速度懲罰被慢速閱讀的書。最后得到一個隱式信息指標:

T(i,A)是基于A用戶閱讀i書速度的隱式信息指標,其中i表示物體、A,B表示用戶、B(i)指組成i書的頁集合、u指書的頁碼、P(A)表示A用戶看過的所有書的總頁碼數、T(A)表示A用戶總閱讀時間、TAiu表示A用戶讀完i書u頁所花的時間。

三、模型的構建及優化

(一)DBSCAN聚類

為應對不知圖書該分成多少類的問題,K-Means算法將無法適用于本任務,而DBSCAN可不用指定簇,其可依據分組進行遍歷并自由生長。同時,DBSCAN可發現任何形狀的簇并排除噪聲點,這可應對圖書復雜的分類問題。故本文選用DBSCAN對圖書進行聚類。

(二)隱語義模型

隱語義模型是協同過濾中最常用的一種方法,其可獲得用戶對某項目的興趣度[5]。模型算法的原理是構建用戶—項目矩陣R,并計算兩個低秩矩陣P與Q,將其相乘以計算興趣度并彌補矩陣中的缺失值。

(三)相似度計算

本文采用余弦相似度[4]計算圖書間的相似程度,如公式2所示。為了判斷用戶是否會喜歡某圖書j,本文依據實驗設定某一閾值,當大于閾值時,算法便判斷j物品就可能是用戶喜愛的書籍

利用相似度計算,系統可以基于用戶已喜歡的圖書i來推薦與該圖書高度相關的圖書j,并根據相關評分來獲得用戶對圖書j的潛在得分以計算對該圖書的推薦系數,最終獲得基于圖書的推薦列表。算法在實際運算中,無法將所有的圖書都推薦給用戶,故會選擇推薦系統最高的N個圖書推薦給用戶。

四、數據集及模型評估方法

模型訓練所用到的數據為MovieLens中在1997年到1998年的100K數據,其包含943個用戶對1682個電影的評分,評分范圍為1~5之間。

為了評估模型的性能,本文采用RMSE(均方根誤差)和MAE(平均絕對誤差)測量模型的損失。其中,RMSE是預測值與真實值偏差的平方與觀測次數n比值的平方根。MAE是對同一物理量進行多次測量,并將各次測量的絕對誤差取絕對值后再求平均值。

五、結果分析

在假設建模中,我們通過算法計算了讀者觀看每一頁的時間,我們可以將這些時間再次利用于統計中,根據讀者在某書停留的所有時間的集合制成圖標,反映一本書的精彩程度,從而為觀眾展示這本書的高潮、低谷等部分。預想效果如圖2所示:

圖2 圖書高潮預想效果圖

如此可以看出,129頁到193頁比較精彩。

讓熱度排名較高的書籍,用出版時間和在訓練中得出的出版時間的權重融合為新的熱度系數,用Top-N算法排序后排出熱度前N個的書籍,推廣給群眾。這樣可以介入新用戶對熱門書籍的評價,部分解決新用戶問題。

基于內容的推薦是通過用戶給出的關鍵詞等信息內容,尋找到具有對應信息或內容的物品進行推薦。對于新用戶問題,首先采用調查問卷詢問用戶喜歡什么樣內容的書籍,然后進行75%的基于內容推薦和25%的熱門書籍推薦。這樣可以完全解決新用戶問題,將新用戶過渡為老用戶,再降低基于內容的推薦,增加協同過濾推薦。

六、總結與展望

本文通過基于隱語義模型的協同過濾算法構建圖書推薦系統,所實現的模型根據用戶閱讀的習慣進行多種隱含語義的挖掘,并綜合用戶評分、評論等計算圖書推薦系數,實驗結果表明,隱語義模型能有效地挖掘用戶對某物品的潛在興趣。本文所設計的圖書推薦系統可為工業界提供研究參考,并為相關研究提供實驗基礎。

在電子商務領域,用戶的興趣會隨著時間的變化而改變,本文在考慮了矩陣稀疏及冷啟動的問題基礎上進行模型優化,但未對時間序列進行額外的處理,未來的研究可以將時間序列等信息納入本文系統中,以提高推薦質量。此外,用戶的評價往往包含了其對圖書的看法及情感,往后可應用情感分析對用戶的評價進行綜合處理。基于神經網絡的推薦系統已越來越受研究者的喜愛,未來的研究還可嘗試使用神經網絡以增加系統的自動化程度。

猜你喜歡
語義用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
語言與語義
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
認知范疇模糊與語義模糊
主站蜘蛛池模板: 国产杨幂丝袜av在线播放| 色AV色 综合网站| 国产凹凸视频在线观看| 情侣午夜国产在线一区无码| 91色在线视频| 九色视频在线免费观看| 99热这里只有精品国产99| 国产精品无码翘臀在线看纯欲| 91丨九色丨首页在线播放| 国产女人爽到高潮的免费视频| 亚洲无码在线午夜电影| 国产无码精品在线| 亚洲中文久久精品无玛| 热九九精品| AV不卡在线永久免费观看| 永久免费无码成人网站| 国产传媒一区二区三区四区五区| 四虎成人免费毛片| 国产成年无码AⅤ片在线| 99热国产在线精品99| 欧洲成人免费视频| 天堂成人在线视频| 国产伦精品一区二区三区视频优播 | 中文无码日韩精品| 久久久久亚洲精品无码网站| 亚洲中文在线看视频一区| 无码精品福利一区二区三区| 国产精品极品美女自在线看免费一区二区| 香蕉网久久| 亚洲首页在线观看| 老司机午夜精品网站在线观看| 四虎AV麻豆| 亚洲综合二区| 五月婷婷亚洲综合| 99re热精品视频国产免费| 国产主播一区二区三区| 国产情侣一区| 中文字幕乱码二三区免费| 国产尤物jk自慰制服喷水| 鲁鲁鲁爽爽爽在线视频观看 | 99激情网| 91娇喘视频| 久久99蜜桃精品久久久久小说| 超碰精品无码一区二区| 国产综合另类小说色区色噜噜 | AV无码国产在线看岛国岛| 国产麻豆aⅴ精品无码| 伊人精品视频免费在线| 亚洲精品天堂在线观看| 亚洲国产欧美中日韩成人综合视频| 国产日本欧美在线观看| 精品一区二区三区无码视频无码| 亚洲国产成人无码AV在线影院L| 五月丁香伊人啪啪手机免费观看| 国产剧情伊人| 国产精品香蕉| 国产亚洲欧美日韩在线一区| 久久久久亚洲精品成人网| 99成人在线观看| 白浆免费视频国产精品视频| 亚洲成av人无码综合在线观看| 中文字幕人妻无码系列第三区| 國產尤物AV尤物在線觀看| 日韩无码精品人妻| 欧美激情第一欧美在线| 欧美午夜在线播放| 日本一区二区三区精品视频| 啦啦啦网站在线观看a毛片| 不卡无码h在线观看| 人妻丰满熟妇AV无码区| 亚洲日韩图片专区第1页| 亚洲国产精品日韩专区AV| 欧美人与动牲交a欧美精品| 国产丝袜第一页| 国产永久在线观看| 91啦中文字幕| 四虎精品国产AV二区| 成人福利在线视频免费观看| 免费观看成人久久网免费观看| 国产无码制服丝袜| 婷婷激情五月网| 凹凸国产分类在线观看|