999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多階段推薦算法在校園交易平臺中的應(yīng)用研究

2021-05-12 07:08:56張若萱馬嘉駿張釗銘吳夢歌潘韻竹劉海龍
信息記錄材料 2021年3期
關(guān)鍵詞:文本用戶

張若萱,董 晨,馬嘉駿,張釗銘,吳夢歌,潘韻竹,劉海龍

(天津理工大學(xué)計算機科學(xué)與工程學(xué)院 天津 300384)

1 引言

大學(xué)校園交易平臺為學(xué)生學(xué)習(xí)、生活帶來便利,建立大學(xué)校園交易平臺成為新的應(yīng)用需求,但面對海量商品,如何快速、精準(zhǔn)的為買家匹配到心儀商品,推薦算法成為關(guān)鍵。本文針對校園交易不同階段使用多階段推薦算法,實現(xiàn)個性化商品推薦。第一階段用戶和商品數(shù)量少,基于用戶注冊信息,使用XGBoost算法實現(xiàn)商品推薦。第二階段用戶和商品數(shù)量較大,采用基于物品和用戶的協(xié)同過濾實現(xiàn)個性化商品推薦。第三階段隨著交易增多和交流圈建立,信息與數(shù)據(jù)變得更為龐大,文本型數(shù)據(jù)較多,加入自然語言處理算法,使商品推薦更加精確高效。

2 多階段推薦算法設(shè)計

多階段推薦算法流程見圖1。

圖1 多階段推薦算法流程

2.1 第一階段推薦算法設(shè)計

這一階段處于交易平臺的起步,用戶和商品數(shù)據(jù)較少,需要解決用戶冷啟動,物品冷啟動,系統(tǒng)冷啟動問題[1]。為了提高商品推薦的準(zhǔn)確度,基于注冊用戶的信息和興趣標(biāo)簽訓(xùn)練決策樹模型,設(shè)計初步的用戶畫像。使用XGBoost算法對數(shù)據(jù)集進行預(yù)測,Boosting是一種非常有效的集成學(xué)習(xí)算法,采用Boosting算法將弱分類器轉(zhuǎn)化為強分類器,解決各類冷啟動問題,流程如下。

(1)初始化模型為常數(shù)

(2)計算錯誤率

(3)計算αm= log((1-errm) /errm)

根據(jù)迭代結(jié)果,輸出用戶和商品關(guān)系矩陣,矩陣元素(用0,1表示)表示此用戶是否會對該產(chǎn)品感興趣。

2.2 第二階段推薦算法設(shè)計

第二階段交易平臺中用戶和商品數(shù)據(jù)量較大,采用基于物品的協(xié)同過濾和基于用戶的協(xié)同過濾算法實現(xiàn)商品推薦。

2.2.1 基于物品的協(xié)同過濾算法

在交易平臺中,很多學(xué)生會多次購買具有相似特征的商品,根據(jù)這一特點,采用基于物品的協(xié)同過濾算法進行推薦[2]。

(1)相似度計算

為了減小活躍用戶對結(jié)果的影響,考慮IUF(即用戶活躍度對數(shù)的倒數(shù)),這時認(rèn)為活躍用戶對物品相似度的貢獻應(yīng)該小于不活躍用戶。

為方便計算和訓(xùn)練,進一步將相似度矩陣歸一化:

(2)根據(jù)預(yù)測值計算

根據(jù)以下公式:

pu,j表示u對物品j的興趣,N(u)表示用戶喜歡的物品集合,S(j,k)表示和物品j最相似的K個物品集合(j是這個集合中的某一個物品),Wji表示物品j和物品i的相似度,rui表示用戶u對物品i的興趣(對于隱反饋數(shù)據(jù)集,如果用戶u對物品i有過行為,rui都等于1。

2.2.2 基于用戶的協(xié)同過濾算法

大學(xué)校園中很多學(xué)生偏好相同,會出現(xiàn)購買商品相似度較高的情況。基于這一特點,采用基于用戶的協(xié)同過濾算法能夠較好地實現(xiàn)精準(zhǔn)推薦。

(1)發(fā)現(xiàn)興趣相似的用戶

通常用Jaccard公式或者余弦相似度計算兩個用戶之間的相似度。設(shè)N(u)為用戶u喜歡的物品集合,N(v)為用戶v喜歡的物品集合,Jaccard公式:

余弦相似度:

通過建立“物品-用戶”倒排表,可計算出兩個用戶之間的相似度。

(2)推薦商品

(3)輸出推薦結(jié)果

將以上兩個推薦算法結(jié)果進行加權(quán)評分,得到用戶偏好的商品列表并排名,直接進行推薦。

2.3 第三階段推薦算法設(shè)計

隨著交易圈的擴大,平臺用戶數(shù)量和商品信息量驟增,文本數(shù)據(jù)較多,為發(fā)揮文本數(shù)據(jù)作用,使預(yù)測更加準(zhǔn)確,引入自然語言處理詞袋模型和TF-IDF算法。

(1)詞袋模型

使用詞袋模型表示文本,將文本轉(zhuǎn)化為文檔中單詞出現(xiàn)次數(shù)的矩陣,主要步驟如下:

1)文本分詞:使用jieba分詞器將文本數(shù)據(jù)分詞。

2)構(gòu)建詞匯表:將文本語料庫中的所有單詞進行標(biāo)號,存儲在本地數(shù)據(jù)庫中,并建立索引加快查找速度。

3)詞向量表示:每個單詞都表示為一個n維向量,在詞匯索引位置為1,其他為0。

4)統(tǒng)計頻次:統(tǒng)計每個文本中單詞出現(xiàn)的頻次,用向量的形式表示文本關(guān)鍵字。

(2)運用TF-IDF算法評估關(guān)鍵字

在得到文本的向量表示后,希望將文檔中出現(xiàn)頻繁卻不是關(guān)鍵字的詞語權(quán)重降低,采用TF-IDF算法,即:

(3)訓(xùn)練模型

此時可以采用第二階段設(shè)計方法,在訓(xùn)練數(shù)據(jù)集中加入處理后的文本關(guān)鍵字,比如用戶評論,交友圈的文本內(nèi)容,得到更為準(zhǔn)確的商品推薦結(jié)果。

3 結(jié)論

本實驗主要基于交易平臺中的3000名用戶數(shù)據(jù)進行測試,分別使用協(xié)同過濾算法和多階段推薦算法進行商品推薦,如果用戶對推薦結(jié)果滿意則打分1,不滿意打分0,將打分總數(shù)/打分人數(shù)計算準(zhǔn)確率,圖2為推薦結(jié)果準(zhǔn)確率比較。

圖2 推薦算法準(zhǔn)確率比較

從圖2可以看出,在平臺交易的不同階段,使用多階段推薦算法,準(zhǔn)確率都比僅使用協(xié)同過濾算法高,表明多階段推薦算法更適合校園交易流程。

猜你喜歡
文本用戶
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
論《柳毅傳》對前代文本的繼承與轉(zhuǎn)化
人間(2015年20期)2016-01-04 12:47:10
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 91久久精品国产| 综合网久久| 亚洲码在线中文在线观看| 欧美色视频在线| 国产二级毛片| 亚洲人在线| 国产欧美日韩va| 亚洲天堂伊人| 亚洲视屏在线观看| www.youjizz.com久久| 午夜视频www| 8090午夜无码专区| 国产成人a在线观看视频| 精品精品国产高清A毛片| 日韩精品亚洲精品第一页| 2020最新国产精品视频| 潮喷在线无码白浆| 欧美精品成人| 国产精品免费久久久久影院无码| 日韩精品毛片| 欧美国产三级| 直接黄91麻豆网站| 天天躁日日躁狠狠躁中文字幕| 成人a免费α片在线视频网站| 亚洲精品国产日韩无码AV永久免费网| 亚洲成人网在线观看| 99久久精品国产精品亚洲| 国产黄色片在线看| 久久99国产综合精品1| 四虎精品国产永久在线观看| 99热这里只有精品2| 无码中文字幕精品推荐| 在线无码九区| 成人午夜在线播放| 中文字幕不卡免费高清视频| 思思热在线视频精品| 久久久久亚洲精品无码网站| 无码网站免费观看| 9cao视频精品| 国产乱人伦AV在线A| 71pao成人国产永久免费视频| 国产精品第页| a毛片在线免费观看| 又粗又硬又大又爽免费视频播放| 欧美中文一区| 大学生久久香蕉国产线观看| 四虎AV麻豆| 日韩小视频在线观看| 免费看久久精品99| 亚国产欧美在线人成| 青青久视频| 91在线播放国产| 亚洲人成在线免费观看| 日本三级精品| 亚洲色精品国产一区二区三区| 精品视频一区在线观看| 国产尤物jk自慰制服喷水| 人妻21p大胆| 成人福利在线观看| 亚洲欧美在线综合一区二区三区| 欧美亚洲一二三区| 国产精品成人一区二区不卡| 国产在线第二页| 免费高清a毛片| 国产女人水多毛片18| 日韩东京热无码人妻| 国产菊爆视频在线观看| 2048国产精品原创综合在线| 欧美午夜网| 国产精品久久自在自线观看| 91无码网站| 中文国产成人久久精品小说| 久久久久久久久亚洲精品| 日韩午夜福利在线观看| 亚洲色图欧美在线| 91色国产在线| 97久久人人超碰国产精品| 欧美成人免费| 怡红院美国分院一区二区| 黄色网在线| 国产黄色视频综合| 日韩在线第三页|