孫禮輝
(安徽商貿職業技術學院經濟貿易系,安徽蕪湖 241002)
隨著電子商務的爆發式發展,網絡商品種類和數量快速暴增。這導致用戶在眾多商品中難以準確選擇到自己感興趣的商品,因而產生了“信息過載”的問題。推薦系統則是目前解決信息過載問題的重要手段,其中協同過濾推薦是目前主流的推薦算法。用戶評分是協同過濾推薦算法中的一個重要變量。而受消費習慣、平臺規則等因素的影響,目前電商網站的用戶評分經常不能反映用戶的真實想法,這使得協同過濾推薦的精確度大打折扣,影響了電商網站的用戶體驗。修正用戶評分,使評分能更加客觀地反映用戶的真實想法,這是提高推薦準確度的重要途徑。
用戶在網購產品后,一般會給產品評分并寫上評論。相比評分而言,評論內容更能反映用戶的真實想法。本文嘗試對用戶評論內容進行情感分析,使評論內容量化,進而對用戶原始評分進行修正,得出更能反映用戶真實想法的評分,為后續進行協同過濾推薦奠定基礎。
產品評論挖掘是近年來推薦算法的一個熱點研究方向。Goldberg 等〔1〕使用人工方式從評論中提取特征信息,但這需要花費大量的人工。Ganu 等〔2〕提出了一種基于支持向量機的文本分類器,對評論進行分類并計算出評分,但該方法同樣也需要大量人工進行分類。王偉軍等〔3〕引入語言學的話語標記理論,構建商品評論話語標記語庫,設計出評分體系,并借助層次分析法得出各指標權重,最后提出了評分修正方法。但該方法在指標選取上存在不夠精確的問題。扈中凱等〔4〕基于用戶評論挖掘產品特征,建立用戶興趣偏好模型,結合用戶歷史評分改善推薦準確率。但該方法直接使用原始評分,沒有對評分進行修正。
針對目前推薦算法中評分修正相關研究相對缺乏的情況,本文試圖提出一種基于評論情感分析的用戶評分修正方法,以豐富相關研究。
評分既是用戶購物決策的重要參考因素,同時也是推薦系統的重要變量。而目前國內幾大主要電子商務網站的用戶評分數據較為集中且均為整數值,這種評分數據區分度不高,可靠性不高,不利于推薦系統的推薦。以京東商城為例,商品評分規則是1~5 分,而絕大多數商品評分集中在5 分,區分度不高。同時,因為多種原因,評分并不能真實反映用戶真實想法。第一,因為只有1~5 分整數的選項,沒有精確到小數點后其他選項,用戶只能選擇接近用戶想法的整數,導致評分不夠精確,不能反映用戶真實想法;第二,因為商家各種好評返現的誘導,即使對商品或服務不滿意,部分用戶也會為了獲得返現而打5 分,這沒有真正反映出用戶真實想法。第三,因為用戶習慣性好評、從眾心理、避免騷擾等原因而打5 分,也使得評分不能真實反映用戶想法。由于上述多種原因,電商網站用戶評分并不是非常可靠的。因而,直接采用原始用戶評分的協同過濾推薦算法精確度是無法保證的,需要對原始用戶評分進行重新修正,以提高推薦系統的精確度。
3.1 算法框架與用戶評分相對應的是用戶評論。相比用戶評分而言,用戶評論更加客觀地真實反映了用戶想法。因此,借助對用戶評論的情感分析,對用戶評分進行修正,可以提高評分的區分度和可信度,進而為提高推薦系統的推薦精度提供條件。
基于評論情感分析的用戶評分修正方法框架如圖1所示。

圖1 基于評論情感分析的用戶評分修正方法
3.2 數據預處理對抓取的評論數據進行清洗過濾,去除默認評論、廣告評論、特征詞較少或沒有的評論,以及大量由標點符號或表情組成的評論等無效評論數據,然后使用分詞系統進行分詞。目前,常用的分詞系統有ICTCLAS、THULAC、PKUSeg、FudanNLP等。本文使用目前使用較廣泛的ICTCLAS漢語分詞系統,對評論數據進行分詞。
3.3 提取產品特征詞和情感詞在分詞的基礎上提取評論中的產品特征詞和情感詞。提取特征詞和情感詞的主要方法有LDA(latent dirichlet allocation)、機器學習、PMI(point mutual information)等方法。本文采用扈中凱等〔4〕提出的詞性路徑模板方法來提取產品特征詞p 和情感詞f,并組成特征情感詞對,以d=(p,f)表示。
3.4 情感分析在提取產品特征詞和情感詞的基礎上,需要對評論的情感進行量化分析。具體步驟如下:
步驟1:建立特征偏好向量。采用王紅霞等〔5〕提出的建立特征偏好向量的方法,借助TF-IDF(term frequency-inverse document frequency)算法建立用戶偏好,進而建立評論特征偏好向量。
對任一條評論c,其中出現的特征詞記為p1,p2,…,pn,相應的評論特征偏好向量記為

其中,i=1,2,…,n,j=1,2,…,n,Pu,j為用戶u 的特征詞pi的TF-IDF值。
步驟2:情感詞量化。在任一評論c 中,特征詞pi所對應的情感詞記為fi。本文采用目前使用較廣泛的臺灣大學NTUSD 簡體中文情感詞典來量化情感詞。積極情感詞賦值為5 分,中性情感詞賦值為3 分,消極情感詞賦值為1 分。基于上述標準將評論c中情感詞f1,f2,…,fn進行量化,對應分值記為m(f1),m(f2),…,m(fn),并組成向量Mc={m(f1),m(f2),…,m(fn)}。
步驟3:計算評論的情感傾向。在評論特征偏好向量和情感詞量化的基礎上,計算出每一條評論的情感傾向。以Sc表示用戶評論c 所表達的情感傾向,Sc計算公式為:

Sc數值區間范圍為1~5。
3.5 修正評分綜合考慮用戶原始評分和評論的情感傾向,在原始評分和評論情感傾向分值的基礎上取平均值,得出評分的修正值。
以Rc表示評論c 的原始評分,以R′c表示修正后的評分,則得出:

修正后的評分數值區間范圍仍為1~5,但與原始評分不同,修正評分含小數點。從而使評分分布更離散,區分度更高。同時,修正評分也體現了評論的情感傾向,更客觀地反映了用戶的真實想法。
4.1 實驗數據通過爬蟲程序在京東網站抓取筆記本電腦類目的評論數據,包括用戶名、評論、評分、評價時間等。數據涵蓋了聯想、華為、惠普、戴爾等筆記本電腦品牌,評論時間從2018 年11 月到2019 年11 月,共計15 萬條評論數據。對這些數據進行清洗,去除默認評論、廣告評論、特征詞較少或沒有的評論,以及大量由標點符號或表情組成的評論等無效評論數據。處理后得到8 971 個用戶對263 款筆記本電腦的9 881 條評論數據。統計分析顯示,92.5%的用戶都是5 分評價,評價相對比較集中,區分度不夠。
4.2 實驗結果分析利用上述算法對評分進行修正。修正后的評分為介于1~5 之間的數值,多為非整數,分布相比原始評分較離散,有較高的區分度,能更真實地體現出用戶想法。以占比最高的5分評分為例,修正后的評分在3~5 分之間,分布如圖2 所示。
部分評論數據修正前后對比如表1 所示。表1所示數據顯示,修正后的評分相比原始評分而言,能更準確地體現出用戶的真實想法。

圖2 修正評分分布圖

表1 部分評論數據修正對比
上述實驗結果顯示,修正后的評分分布較離散,區分度較高,比原始評分計算更精確,具有較高的可信度,更適合作為推薦系統的計算參數。
本文針對當前電商網站用戶評分系統存在的不足,基于評論內容情感分析,將評論情感量化,在此基礎上對原始評分進行修正,使修正后的評分更準確地反映用戶的真實想法,以使在此基礎上進行協同過濾推薦的推薦結果更加精準。本文在特征詞和情感詞提取方法上還存在不足,需要在效率和精確度等方面進行優化;另外,修正評分計算公式還不夠精確,有待繼續優化,以使評分修正更加精準。后續研究將在這些方面進行改進。