(武漢大學經濟與管理學院 湖北 武漢 430072)
信息過載已經成為影響消費體驗的一個重要因素。如何從用戶生成的紛繁復雜的在線評論中篩選出高質量評論,用以幫助消費者做出更好的購買決定?基于此,眾多的學者和電商平臺針對評論的有效性做出了很多的研究。例如,崔楠,張建,王菊卿(2014)基于淘寶數據的研究,認為極端負面評論比極端正面評論更能影響。Salehan和Kim(2016)基于亞馬遜網上數據的研究結果就表明持有中性情感傾向的評論被認為更有用。在這些關于評論文本的研究基礎上,本文更關注的是評論者特征。現有的文獻一般比較關注于評論者的評分、評論者的等級、評論者的信譽、評論者是否為意見領袖和評論者獲得的某種“勛章”數量等因素對評論效用的影響。但是,研究者關注的大多數是這些最直觀的評論者特征,而忽略了評論者的評論經驗對評論效用的隱性影響。為了排除干擾,本文結合前人對評論效用的研究把文本特征:時效性、文本長度、評分的極端性和情感傾向性作為控制變量,結果表明,隨著評論經驗的增加,評論的效用在增加。
在電商社區的發展中,關于評論的有用性一直是很多研究的關注點。研究的方向主要集中于評論文本內容和評論者本身特征上。Ngo-Ye和Sinha(2014)分析了評論者所攜帶的特征(比如信譽、承諾、即時活動、在線評論的有用性等)的影響;他們發現評論者的屬性比評論文本本身更能加強評論的效價。
除此之外,評論的情感傾向、評分極性、文本長度和時效同樣獲得很多學者的重視。Baek、Lee、Oh和Ahn(2015)研究了評分極端性與評論效價之間的關系,表明評分越接近于評論對象平均評分越是有用。在此基礎上,Yin、Mitra、和Zhang(2016)提供了更進一步的研究,他們覺得消費者在看到評論時傾向于認為能證實自己原本看法的評論更有用即存在證實性偏見。崔楠,張建,王菊卿(2014)將文本分為以情感和以信息為中心,認為極端負面評論比極端正面評論更能影響評論效用,而以信息為中心的文本與評論的效用呈顯著正相關。
雖然無論是評論者本身特征還是評論文本都有前人研究過,但是本文更關注的是評論者屬性的隱性因素即評論者的評論經驗。那些購物較頻繁、熱衷于寫評論的人是否比其他人所留下的評論更具有用性?本文把評論者的評論經驗作為評論有用性重要的影響因素,結合時效、文本長度、情感傾向性、評分的差異性等直觀的文本特征因素作為控制變量,探討它們與評論有用性之間的關系。
由于不同原因而導致的評論經驗的差別性,是評論者屬性的重要判別因素。而在前人的研究中,更多的關注于評論者的信譽度、”勛章”數量、好友數量、是否為意見領袖等,例如Ngo-Ye和Sinha(2014)認為評論者的信譽度、承諾性等比評論文本更能加強評論效用。這些屬性可能在如豆瓣、知乎這樣的社區性網站中,由于話題的集中性更容易形成意見領袖或者積累一些外在榮譽,從而影響評論的效用。所以,本文關注于評論者更加本質的屬性即評論者的評論經驗,想要研究隨著評論者評論經驗的增加是否會有一個自我學習、完善的過程,從而使評論經驗豐富的評論者所寫的評論的有用性與其他人有著顯著差異。在此基礎上我們可以做出如下假設:
H1:評論者的評論經驗對評論的效用存在顯著影響。
針對假設,我們建立以下回歸模型:
ratio=β0+β1numb+β2Abs_Score+β3LnTime+β4Text_length+β5Sentiment
(1)
因變量為在線評論中認為”有用”的人與所有做出”有用”、”沒用”選擇的人總數的比率(ratio),我們用它來衡量一條評論的效用。如果一條評論的有用比率越高,我們認為它的效用越大。模型的解釋變量為評論經驗(numb),我們通過評論者發表過的評論數量來衡量他的評論經驗。在控制變量方面,用當前評論的評分距商品平均評分的絕對值(Abs_Score)來表示評分的極端性。我們用評論發表的時間與我們拿到數據的時間差(Time)的來表示時效性。在前面我們提到過評論文本的長度對評論的效用有正向促進作用,所以我們通過分詞手段計算出一個評論的詞數作為文本長度(Text_length)的衡量標準,評論的詞數越多,文本越長。情感傾向性一直是眾多學者研究評論有用性的一個重要影響因素。本文把情感傾向性非為正面情感傾向和負面情感傾向,Sentiment=1表示評論具有正面情感傾向;Sentiment=-1表示評論具有負面情感傾向。
本文的數據來源于斯坦福大學復雜網絡分析平臺上公開的數據集,該數據集是關于Amazon上FineFood長達13年的評論信息。不像天貓商城上只能看到評論者的會員等級,亞馬遜會給出給家詳細的信息,不僅包括當前評論的“有用”投票數,還包括了評論者之前獲得的總投票數、評論者排名等信息,這為我們的研究提供了更好的數據支撐。本文選取的數據集共有57萬條評論,涵蓋了25.6萬用戶,7.4萬種商品。但是里面的數據不一定全部符合我們的研究要求,需要對其進行一些篩選、清洗等處理。
我們對評論時間差取對數變換,以此來作為測量依據。情感傾向性(Sentiment)是評論比較直觀的測度,我們直接根據評論者對商品的評分(即網站上的星級評價)來進行情感傾向性的人工標記。我們認為當評論者的評分大于3時,他對購買的商品是持積極態度的;而當評論者的評分小于等于3時,我們認為他對購買的商品持消極態度。在確認文本長度方面,英文的文本相對于中文來說更易處理,我們通過簡單的分詞手段計算出評論文本的單詞個數作為文本長度的測度。最后,我們對數據中的一些缺失值、不規整數據予以剔除。

表1 描述性統計
從表1我們可以看到,投“有用”票數的人占總投票數的比率的均值為0.78。這說明從整體上考慮消費者在看到評論時更加傾向于選擇投“有用”票。評論者給予商品的評分據商品的平均分1.19。這顯示了評論者之間的評分一般在商品平均評分的上下1.19分左右波動,差異性還是比較大的。我們獲取數據時距評論發表的時間差的均值為20.97,這是取過對數后的結果,從標準差上看取對數后的時間的離散程度大大減小。評論的文本長度之間存在很大的差異。在前文中,我們曾經提到過文本的長度對評論的有用有著積極的影響,在其他條件不變的情況下文本長度越長評論的有用性越強。所以,文本的長度是我們必須要控制的因素。評論者的情感傾向性的平均值為0.44,這顯示了大多數的評論者都傾向于留下比較正面的評論。

表3 多元回歸結果
從表3中可以看到模型(1)的回歸結果。模型的主要解釋變量numb,即評論者發表評論次數的系數顯著為負,這就說明評論者發表評論的次數與評論的有效性有著顯著負相關。這樣H1就得到了驗證,說明在線評論中評論者的評論評論經驗對評論的有用性有著負面影響。
對于其他控制變量,Abs_Score所表示的評分的極端性、LnTime所表示的時間差的對數、Text_length所表示的評論文本的長度的相關系數都符合我們的預期。評分的極端性越小,評論的有用性越高,這正好驗證了消費者證實性偏見的存在即評論的評分越接近商品平均評分消費者認為這條評論越有用。評論的時效性的回歸結果顯示了評論越新,有用性越高。這可能有兩種原因:第一,消費者瀏覽評論信息都是從前往后的,在前面的評論中消費者就已經可以從無到有獲得一定的關于商品的信息量,讓他們下意識的對新的評論給予較高的有用性評價,而后面的舊評論所展現的內容可能都在前面評論中出現過了,從而導致消費者對其的有用性感知下降。文本長度對評論有用性的正向作用在前人的很多研究中都有發現。這很容易理解,文本越長,能夠包含的信息越多,越是能加深瀏覽者對商品的了解。
本文選取亞馬遜網上關于FineFood的大量評論信息作為研究數據,通過控制評論的文本因素(評論評分極端性、時效性、文本長度、情感傾向性),采用實證分析的方式來探究評論者的評論經驗與評論效用之間的關系。研究結果表明,評論經驗在整體上與評論的效用成顯著負相關。這可以為電商平臺篩選評論,提高評論區域評論的質量,幫助瀏覽者做出更好的購買決策提供重要的借鑒意義。在研究評論效用方面,本文雖然做出了一些創新和拓展,但還是存在著一些局限性。可以進一步挖掘更多的文本特征比如主客觀情感、主題關聯度等,從而提高模型的預測準確率。