◇樂山師范學院數理學院 李佳星 王新藝 曾琳 劉靜 江鐵林
隨著線上銷售的發展,各電商平臺產生了大量的用戶對商品的在線評論數據。如何利用這些評論數據獲取有價值的信息,不論是對消費者還是對銷售商而言都具有重要意義。本文利用八爪魚采集器收集京東和淘寶這兩大平臺的在線評論數據,然后對這些數據進行Rost情感分析,從而得到數據的情緒分析,并結合MATLAB建立基于情緒分析的購買預測模型,從而從數學的角度分析商品在線評論數據對消費者的購買影響,并依據相應的結論分別給消費者和經營者提出建議。
近年來,隨著電子商務的飛速發展,越來越多的用戶選擇從網上購物,截止到2019年6月,我國網絡購物用戶規模達到6.39億。在使用商品后,部分網購用戶會在購物網站上發表評論信息,因而在淘寶和京東上也隨之產生了海量的在線評論;所謂在線評論,又被稱作在線客戶評論,即是以文本形式為主對產品進行評價,是消費者通過互聯網提交的對產品或者店鋪的評論信息,評論信息會涉及物流服務,商家的服務態度,產品的質量等描述。因此,這些評論數據更能反映商品的真實性,因為對于所售商品,商家為了提高銷量會選擇各種各樣的方式吸引消費者,諸如,美化商品圖片、夸大商品實際效用等等,而圖片和實物往往存在一定的差距,只通過商品的詳細介紹并不能真正認識到商品的優劣,而通過已購買消費者的評論數據有利于消費者對于商品更為詳盡、真實的了解,已購買者的實際使用效果也更具參考作用,也會極大影響著消費者對于商品的購買意愿。
在線評論為消費者提供了其他購物者的購物體驗以及對有關產品和服務的信息,通過閱讀在線評論,可以讓用戶更加全面的了解產品。依據在線口碑理論,傳統口碑通過口頭的形式進行傳播,其口碑效力持久性較差,隨著時間的推移,對未來顧客的影響力也越來越小。在線評論則相反,其效力隨著時間的延長而產生“蓄水池”效應。顧客在網購過程中,更傾向于關注評論數量較多的商品,并將其視為流行或熱銷的產品,從而降低顧客的選擇成本和風險[1]。因此,對于消費者在線評論數據的研究具有重要意義。
消費者的在線評論也反映了消費者對所購買商品的一些基本情況描述及服務的情感態度,這些情感態度對于研究消費者行為提供了重要數據,還反應了消費者對此次購物是否滿意。評論者對所評價商品所表達的“情感”,隱含著大量的消費者心理信息,這些信息有其重要的價值,然而在線評論的文本數據是海量的,而且其中很多語句不知所云、語句不通、雜亂無章等[2]。鑒于此,本文將通過Rost軟件對在線評論進行社會情感分析,從而得到已購消費者對產品的情感傾向。
八爪魚采集器是一款全網通用的互聯網數據采集器,模擬人瀏覽網頁的行為,通過簡單的頁面點選,生成自動化的采集流程,從而將網頁數據轉化為結構化數據,存儲于EXCEL或數據庫等多種形式;其功能之一是能夠高速大規模的采集數據,鑒于此,本文選用此軟件進行數據采集。
本文在淘寶和京東這兩大平臺上分別選取了價格相近的兩家螺螄粉店鋪和電腦桌店鋪,并利用八爪魚采集器對其數據進行采集,采集內容包含評論時間、評論者ID、評論內容以及商家回復,此結果以EXCEL的形式呈現出來,部分采集信息見表1。

表1 采集內容
以塞瓊筆記本電腦桌為例,本文將從在線評論數據中提取電商網站的相關評論數據,再利用Rost進行詞頻分析,緊接著進行相關的社會情感分析,分析結果包含近11個月的積極情緒、中性情緒、消極情緒的占比,將此結果繪制成折線圖,可以很明顯的看出近幾個月的情緒波動情況,結果見圖1。

圖1 塞瓊筆記本電腦桌評論數據情緒分析圖
圖中橫坐標代表月份,縱坐標代表情緒所占比率,從這個折線圖中可以直接看出積極情緒占比在80%左右波動,而中性情緒與消極情緒占比較低并且情緒波動較為緩慢。從這結果可以看出,消費者購買商品時更傾向于積極情緒比重高的商品。
(1)模型簡介。本模型主要通過對每條文本中關鍵詞的提取,頻率統計等方法,使評論數字化。以淘寶筆記本電腦為例,將頻率與關鍵詞繪成詞云,并通過提取得到的每種關鍵詞的頻率,與Matlab中內置的vaderSentimentLex icon庫進行比對,從而得到其情感傾向。將其通過vaderSentimentScores函數進行計算,可以得到一個情感傾向的數值。這個數值介于(-1,1),其中越接近1,就說明這個評論越積極,越接近-1,則說明越消極,同理,如果接近0則說明情感傾向比較中立。
對評論數據的文本進行分析后,部分結果如下:我們發現,文本中大部分的評論都是比較積極的,只有少部分消極評論,這與之前的統計結果一致。而后我們需通過此結果計算出顧客購買此商品的意愿概率。眾所周知,一個人買一個商品的概率應該介于(0,1),而評論的情感分析分數則是介于(-1,1)。基于此,我們可以建立購買概率與情感分數的線性對應關系:當情感分數趨近于-1時,評論傾向為非常強烈的差評,此時顧客購買商品的概率應趨于0;當情感分數趨于1時,評論傾向為強烈好評,此時顧客購買商品的概率應趨于100%;當情感分數趨于0時,評論傾向較為中立,不好也不壞,此時顧客購買商品的概率應趨于50%。
為了使得結果較為明晰,故而應該選取差評和好評都有的部分評論做結果展示,結果見表2。

表2 評價的情感分析表
圖中第一列是情感分數,第二列則是通過映射關系得到的顧客購買概率,映射關系為,其中g指的是情感分數。從模型結果可以看出當情感分數趨于-1時,評論越消極,導致顧客的購買欲大大降低,而越接近1時則消費者的購買欲則表現強烈。
(2)模型檢驗。以塞瓊筆記本電腦桌為例,本文根據模型,首先得到每條評論的情感分數,然后取平均值為0.4558,隨后利用該平均數,計算得到筆記本電腦桌的購買概率為0.7279。這是通過模型計算得到的購買概率。
針對實際情況而言,本文采取10人進行調查,看是否購買,可認為購買率為購買人數比上被調查人數,通過調查后,有7人購買,則購買率為0.7。最終結果與我們預測的基本一致,所以此模型可行。
(1)用戶的評價是消費者重要的購物參考。因此,商家可以采用營銷手段來促使消費者在購買產品之后,積極主動地填寫評價,來增加此商品的評論量,比如:評價之后給消費者一定的積分或者在消費者進行下一次購物時進行一定幅度的優惠。
(2)線上銷售最重要的是誠信經營。對于消費者來說,無論購物平臺采用的是那種評價體系,只要能夠提供商品最真實的評價,才是真正有意義的。因此經營者不要搞虛假宣傳,以次充好。商家也不要為了提高自己產品的銷售量以及好評量,用以假亂真的手段來吸引客戶,比如店家付款請人購買商品來增加產品銷售以及填寫好評來增加好評數量,這種方式也是不可取的。
(3)經營者可采取多種宣傳措施:建立多個聊天群,比如:微信群、淘寶群等,經營者可與抖音、快手等平臺進行合作以及簽約有影響力的網紅進行直播帶貨等手段,以便于在推出新品時,可以及時向消費者進行宣傳,從而提高銷售量。
(4)在店鋪不同,產品幾乎一致的情況下,消費者更傾向于選擇服務態度良好的商家,比如物流服務,因此經營方可同時與多個快遞公司合作,比如:圓通、中通等,以便于消費者在選擇商品時,可自行選擇最方便于自己的或者最想要的快遞運輸方式,從而帶給消費者良好的購物體驗。
(1)在購物時,消費者應保持理性的心態進行購物。首先要根據自身需求購物,不要盲目跟風瘋狂購物。其次在選擇產品時,要理智看待購物評價,不要因為某個消極評價就全盤否定此產品。
(2)有明確需求才能有更好的選擇。網購的東西即使在某一個類別來說也是千篇一律的,比如說我們調查的電腦桌,它還能分為好幾種,有床上款、可移動款、臺式款、轉角式款等等,如果需求不明確,各大網站彈出的商品也就更多,對于消費者來說選擇一個電腦桌可謂是一個耗時巨大的工程,越明確的需求,網站所彈出的商品更符合心中所想。所以明確需求是消費者網購的一個必要因素,在線評論在其中起輔助作用,在眾多的商品里讓我們可以挑選出自己覺得最合適的。