王龍葛 王敏



摘要:用戶的情感傾向在推薦算法中起到非常重要的作用,本文利用設計的情感模型對用戶評論進行量化計算,并利用一定的公式計算用戶情感值和用戶評分所占的比例,構建最終用戶評分矩陣模型。經過實驗證明,該模型比單純的用戶評分更能反映出用戶的情感傾向。
關鍵詞:情感模型;用戶評論;評分矩陣
中圖分類號:TP277 文獻標識碼:A 文章編號:1007-9416(2019)06-0071-02
0 引言
互聯網的飛速發展促使了推薦算法的快速發展[1]。然而,現有的推薦系統大多不考慮用戶的真實情感,研究結果表明,情感對用戶行為和喜好的決定有著至關重要的作用,在信息推薦過程中充分考慮用戶的情感傾向和情感狀態可以更好地適應用戶的個性化需求,以更好地實現個性化推薦服務[2]。
1 國內外研究現狀
電子商務的發展促使了推薦系統的快速發展,從本世紀初,不少的學者開始將情感分析和推薦算法結合起來取得不少成果。
Huettner等人[3]在2001年手工建立有極性標注的情感詞典;Shanahan[4]等人通過詞語間的搭配規則,利用情感標注語料庫,找到文本中存在的情感詞以及它們之間的規則關系。婁德成和姚天防[5]提出了聯系全文,分析全文主題和各詞語之間的關系,進行詞語極性的計算從而從整體考慮全文傾向;王丙坤[6]為提高網絡文本的在線分類效率,提出利用多粒度計算和多準則融合無監督的方法進行了情感分類。
本文在前人工作的基礎上做了如下工作:(1)將深度學習的模型應用用戶評論的切詞中,提高了切詞的準確率;(2)提出了情感計算的量化模型,并計算了用戶評論和評分的權值比例,構建了最終的用戶評分矩陣。
2 用戶評論情感量化模型
2.1 情感詞典的建立
文本情感分析必須以情感詞典為基礎,本文將對餐飲領域的用戶評論進行分析,在傳統的LSTM模型上,引入趙淑芳[7]等的方法,將輸入門和遺忘門合成一個單一的更新門,延長LSTM的記憶時間;同時引入許寧[8]等的方法,在LSTM模型前加入多層神經網絡,提高LSTM模型的特征提取能力。最終將改進得到的LSTM模型運用與中文切詞技術中,提高中文切詞的準確率。
2.2 用戶評論情感評價量化模型
在對用戶評論進行情感量化時,評論語句中往往還有其他的詞語,這些詞的出現會在很大程度上影響情感的傾向和傾向程度。在進行情感量化的過程中加入了否定詞和程度副詞的考慮。用戶評論中的情感詞分為兩類:褒義詞和貶義詞。褒義設值為1,貶義設值為-1。利用已經獲取的6個級別的程度副詞和否定詞表,進行情感值的計算。
在計算中發現,評論語句復雜難以控制,所以數值會出現很大的差值,最終要與評分進行結合時,會出現計算結果不和諧的情況。需要進行歸一化處理,計算公式如式子(1)所示。
degree(pi)=*5? ? ? ? ? ? (1)
其中i指的是第i條評論,j表示第i條評論中的第j個情感詞,褒義詞設值為1,貶義詞設值為-1。 K為否定詞的個數,sj表示情感詞的量化值,wj表示第j個情感詞前程度副詞的量化值,pmax,pmin表示單條用戶評論的最大值和最小值。
3 基于評論和評分的最終評分模型
基于用戶評論的評分模型是結合了用戶評分和用戶評論而得到的最終評分,最終評分的計算公式如式子(2)所示。
Score(i)=w1*scorei+w2*degree(pi)? ? ? ? ? ? ? ? ? ? ?(2)
其中,Score(i)為用戶對第i個門店的最終評分,w1評分的權重值,scorei為用戶對該門店的評分,w2為用戶評論的權重值,degree(pi)為式子(1)計算的結果。
接下來,利用式子(3)和式子(4)來計算w1和w2的值。
=n? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)
degree(pi)+scorei=1? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (4)
其中score(i)表示用戶第i個用戶的最終評分,scorei表示的是用戶對第i個用戶的五分制打分情況,degree(pi)表示的是用戶對第i個用戶的評論情感的份情況。利用抓取的美團數據進行驗證,可計算出當評分的權重為0.242,用戶評論的權重為0.758。美團數據的準確率最高,如圖1所示。
在圖2的基礎上,可計算出用戶評分的權重為0.242,用戶評論的權重為0.758,得到基于美團抓取數據的最終的評分模型如式子(5)所示。
score(i)=0.242*scorei+0.758*degree(pi)? ? ? ? ? ? ? ? ?(5)
利用美團外賣數據集來展示在將用戶評論和用戶評分進行結合后的推薦效果,如圖2所示。
從圖2中看到,在相同的數據集中,利用計算權重的建模公式進行權重設置后,將用戶評論和用戶評分結合后,再利用推薦算法推薦,結果比只單純的使用評分和評論進行推薦的準確率要用明顯的提升。
4 結語
本文以美團外賣數據為基礎,對基于用戶評論情感量化的評分模型進行了研究,其中,在情感詞典的建立、情感值的計算以及最終用戶評分矩陣等方面,本文都進行了改進和創新,通過實驗驗證,將用戶評論和用戶評分結合起來建立的基于評論的用戶最終評分矩陣在實際的推薦算法中可以將推薦結果的準確率有一定的提高。
參考文獻
[1] Andrew Y N.Feature selection l1 vs.l2 regularization,and rotationalinvariance[C]Proc of the 21st International Conference on MachineLearning,2004:78-85.
[2] Jain A K,Duin RPW,Mao Jianchang.Statistical pattern recognition:a review[J].IEEE Trans on Pattern Analysis and Machine Intel-ligence,2000,22(1):4-37.
[3] Subasic P ,Huettner A .Affect analysis of text using fuzzy semantic typing[J]. IEEE Transactions on Fuzzy Systems,2001,2(4):483-496.
[4] Shanahan JG, QuY,Wiebe J.Computing Attitude and Affect in Text:Theory and Applications[M].Springer Netherlands,2006.
[5] 婁德成,姚天昉.漢語句子語義極性分析和觀點抽取方法的研究[J].計算機應用,2006, 26(11):2622-2625.
[6] 王丙坤,黃永峰,李星.基于多粒度計算和多準則融合的情感分類[J].清華大學學報(自然科學版),2015,55(5):497-502.
[7] 趙淑芳,董小雨.基于改進的LSTM深度神經網絡語音識別研究[J].鄭州大學學報(工學版),2018,05(6):48-51.
[8] 許寧,徐昌榮.改進型LSTM變形預測模型研究[J].江西理工大學報,2018,39(05):48-54.
Research on Emotional Quantization Scoring Model Based on User Comments
WANG Long-ge,WANG Min
(School of Software Henan University, Kaifeng Henan? 475000)
Abstract:The user's emotional tendency plays a very important role in the recommendation algorithm. This paper uses the designed emotional model to quantify the user's comments, and uses a certain formula to calculate the proportion of user's emotional value and user's score, and build the end user. The scoring matrix model. Experiments show that the model can reflect the user's emotional tendency more than the simple user score.
Key words:emotion model;user review;scoring matrix