孫長偉 任宗來 楊俊杰 龐坤亮
(國網(wǎng)中興有限公司 北京 100083)
目前,在電商服務(wù)網(wǎng)站上存在大量客戶生成的數(shù)據(jù),主要是評論數(shù)據(jù),這些用戶生成的評論數(shù)據(jù)已經(jīng)成為消費者對商家的服務(wù)和商品進行隱式反饋的主要形式。針對商品的評論數(shù)據(jù),不僅能幫助潛在消費者進行購買分析,還能幫助商家分析其提供的商品和服務(wù)的優(yōu)缺點,進行優(yōu)化決策,以便進一步提高其產(chǎn)品或服務(wù)的質(zhì)量。在這方面,已經(jīng)有大量研究得出結(jié)論:在線評論數(shù)據(jù)能顯著地決定商品的銷售情況和用戶的購買意愿[1-2]。例如:研究表明網(wǎng)上關(guān)于書籍的評論能夠?qū)匿N售情況產(chǎn)生較大影響。在線評論具有多種形式,不僅有如“投票數(shù)量”、“打分”和“用戶參與評論的數(shù)量”等數(shù)值屬性[3-4],還有如“用戶可讀程度”和“文字量”等文本屬性[5],所有這些影響因子都有可能影響用戶的購買決策。目前,研究人員都較多地關(guān)注在如何更好地利用在線評論的數(shù)值評分[6-7],而研究如何更好地利用評論文本內(nèi)容的工作相對較少[8-9]。
酒店作為一種特殊的商品,更多的是一種服務(wù),可以通過問卷調(diào)查來獲取用戶的體驗反饋。與傳統(tǒng)商品不同的是,傳統(tǒng)商品壞了可以有售后或維修服務(wù),商家也能及時獲得產(chǎn)品優(yōu)缺點的反饋。然而,酒店這種特殊商品其獲得用戶反饋特別困難,周期特別長。幸運的是,由于電子商務(wù)的發(fā)展,目前絕大多數(shù)的酒店都已經(jīng)上線,且具有大量的用戶評論,依據(jù)這些評論,可以及時地對酒店服務(wù)進行分析,這有利于用戶決策和幫助酒店及時提升自身服務(wù)質(zhì)量。目前,已經(jīng)有部分研究開始通過酒店評論數(shù)據(jù)去評價酒店服務(wù)質(zhì)量,但已有工作粒度較粗,很難分析出酒店的細分服務(wù)質(zhì)量好與不好。
本文將通過細粒度的情感分析方法,對酒店的各個細分服務(wù)進行評價,從而使得用戶或酒店清晰知道細分服務(wù)的質(zhì)量,為決策提供堅實的論據(jù)。
基于在線用戶生成的評論數(shù)據(jù)去研究酒店特征對客戶滿意度的影響,主要有基于領(lǐng)域?qū)<乙庖姷难芯糠椒ā⒒谡Z法的研究方法和基于模型分析的研究方法等三種研究方法。
(1) 基于領(lǐng)域?qū)<乙庖姷难芯糠椒ǎ褐饕鶕?jù)酒店領(lǐng)域?qū)<业囊庖妼频晏卣鬟M行篩選和評價。這類方法的缺點是專家意見難以全面反映消費者的真實體驗,同時,專家意見帶有較強的主觀性色彩,存在偏見[8-9]。
(2) 基于語法的研究方法:主要假設(shè)擁有越多形容詞修飾的特征詞,這些特征就越重要。因此,該類方法主要依賴句法依存關(guān)系去識別出特征詞的起到修飾作用的形容詞個數(shù),然后通過形容詞的聚類,統(tǒng)計計算出判別特征的重要度[10-11]。由于方法依賴于形容詞個數(shù),因此應(yīng)用范圍受限。
(3) 基于模型分析的研究方法:主要通過機器學(xué)習(xí)模型從大量數(shù)據(jù)中統(tǒng)計學(xué)習(xí)出特征與目標之間的關(guān)系。這類方法由于在大量數(shù)據(jù)上進行學(xué)習(xí),因此避免了主觀因素干擾,同時具有較強的普遍適用性[12-16]。例如,文獻[13]通過模型探索了情感極性對用戶消費意愿的影響,該方法由于僅僅考慮情感極性而沒有考慮情感的強度,導(dǎo)致結(jié)果并不令人滿意。文獻[14]提出首先識別出最頻繁出現(xiàn)的名詞,然后通過自然語言處理技術(shù)自動識別出產(chǎn)品的特征屬性,同時采用近義詞擴充特征屬性進而提升了效果。文獻[15]通過把亞馬遜的相機產(chǎn)品對應(yīng)的評論數(shù)據(jù)作為研究對象,采用計量模型的方法分析了消費者的購買意愿與產(chǎn)品特征評價的關(guān)系。
本文借鑒文獻[15]的研究思路,結(jié)合酒店特征情感和分類模型,細粒度地分析了酒店服務(wù)類型,從而可以知道消費者的滿意度與酒店特征評價之間關(guān)系。
情感分析是指對文本數(shù)據(jù)進行情感極性分析,判斷其情感極性是屬于“積極、消極或中立”中的哪一種,或判斷用戶的觀點是“贊同”或“反對”。這是目前NLP領(lǐng)域非常重要的研究方向之一[17]。情感分析技術(shù)已經(jīng)大量地在很多領(lǐng)域或場景中使用[18-21]。例如:在2010年,文獻[18]就開始運用情感分析技術(shù)對評論數(shù)據(jù)進行分析從而可以進行商品的排序;Tumasjan等[19]在2011年在推特數(shù)據(jù)上進行情感分析用于對政治選舉的預(yù)計,也有研究在評論(Movie reviews)及Blog文本數(shù)據(jù)上進行情感分析以便預(yù)測電影銷售情況[20-21]。為了對特征的情感進行預(yù)測,Liu等[15]提出的特征情感預(yù)測模型先辨別出評論數(shù)據(jù)中商品的特有特征,然后為各個特征識別出數(shù)據(jù)的情感極性。還有研究通過頻繁名詞挖掘方法識別出相關(guān)的特征,然后為每個特征計算得到情感分數(shù),可以為城市的各個服務(wù)行業(yè)構(gòu)建出觀點挖掘系統(tǒng),從而為商家提供決策依據(jù)[22-23]。本文將采用基于詞典的情感分析方法[24-27],計算得到酒店細粒度服務(wù)特征的情感分數(shù),為后面細粒度服務(wù)分析提供基礎(chǔ)。
Word Embedding作為一種語義表示新方法,能把詞通過低緯向量進行表示,從而使得詞之間的相似性可以通過向量操作很簡單地計算出來。本文利用開源的向量生成工具(Word2Vec)將各個詞全部映射到一個低維向量空間,通常為150或300維度,從而通過計算兩個向量的相似度能夠表示所對應(yīng)文本的語義相似程度[28]。具體來說,先根據(jù)Word2Vec工具獲得評論數(shù)據(jù)所對應(yīng)3大類各自的特征維度,然后識別出有效特征,通過情感分析方法去獲得對應(yīng)的情感分數(shù)。為了識別出特征,本文主要通過人工去標記特征詞,再結(jié)合酒店領(lǐng)域的背景知識去決定所屬大類,例如:酒店評論“酒店很干凈”,通過各個類別所出現(xiàn)的特征詞,可將其標為“酒店設(shè)施”類別;又如評論“酒店在市區(qū),交通很方便”,通過領(lǐng)域背景知識可將其歸為“交通情況”類別。為了實現(xiàn)上述設(shè)想,本文通過圖1所示的框架進行研究。

圖1 研究框架
為了針對酒店評論數(shù)據(jù)進行細粒度挖掘,我們對評論中可能針對的酒店服務(wù)進行了細粒度的分析,如表1所示。主要從酒店設(shè)施、服務(wù)和周遭環(huán)境三個方面分別進行細分,體現(xiàn)了一家酒店的主要服務(wù)細類。

表1 酒店服務(wù)的細粒度分類
對于酒店評論數(shù)據(jù),按句子進行分詞和去除停用詞,包括連詞、介詞以及人稱代詞等。這里保留按照句子進行索引和存儲,即以句子為后續(xù)分類和情感分析處理方法的基本單元。
為了對數(shù)據(jù)進行細粒度分類,需要標注數(shù)據(jù)、選擇合適的特征和分類算法,下面分別對這三方面進行論述:
(1) 數(shù)據(jù)標注 為了將酒店評論數(shù)據(jù)分成句子,然后運用分類算法將句子進行分類。本文首先不僅根據(jù)標點符號“,、.、!、”等來區(qū)分,還按照名詞實體作為區(qū)分點,例如“… 熱水充足,空調(diào)給力,但wifi一般,甚至是不夠好,門口就是58路…”將被分為“熱水充足”“空調(diào)給力”“但wifi一般,甚至是不夠好”“門口就是58路”等短句子。然后,去掉完全沒有出現(xiàn)積極或消極情感詞的客觀句,如“兩個大人一個小孩”,接著去掉未包含酒店特征詞的句子,如“四合軒老北京菜 味道正宗 一個人干掉半只烤鴨很過癮”。通過對10 000條評論數(shù)據(jù)進行人工標注,平均評論數(shù)據(jù)有11個句子,共產(chǎn)生了110 326的標注句子。標注的時候?qū)⑦M行兩個層次標注,首先是針對大類進行標注,主要區(qū)分評論句子是酒店設(shè)施、服務(wù)、周遭環(huán)境和其他四大類中的哪一類,“其他”類別指與酒店服務(wù)類別無關(guān)的句子;其次,對句子進行細粒度標注,標明是否是各個大類中的一個細類。
(2) 特征選擇 為了準確地對酒店評論中的句子進行細粒度分類,本文擬采用如下特征去表示數(shù)據(jù):
? 詞是否出現(xiàn),0/1特征。
? 詞的tf-idf特征:詞的詞頻(tf)和在數(shù)據(jù)集合中的頻率(df)是衡量詞重要性的重要方式,tf×idf(tf-idf)綜合衡量了詞的重要性。
? 利用Word2Vec工具對本文爬取的 7 183 763條酒店評論數(shù)據(jù)進行訓(xùn)練(參數(shù)向量維度是150,訓(xùn)練窗口為10),得到所有詞的詞向量。通過該訓(xùn)練好的詞向量庫,采用取平均值的方式計算每條數(shù)據(jù)記錄的向量表示,計算該向量與所要分類的類別的距離,形成距離向量,維度為所要分類的類別個數(shù)。
? 從酒店評論標注數(shù)據(jù)中依據(jù)詞頻為每個類別抽取出相關(guān)詞,構(gòu)建了關(guān)聯(lián)字典;對評論數(shù)據(jù)進行分詞,判斷是否有詞匯屬于某個類別對應(yīng)的集合,形成判斷向量,向量的維度為所要分類的類別個數(shù)。
(3) 分類算法 為了選擇合適的分類算法,本文擬選擇樸素貝葉斯和支持向量機兩種分類器進行分類。
① 樸素貝葉斯:
假設(shè)有K個類別的數(shù)據(jù),樸素貝葉斯根據(jù)下式去判斷一個數(shù)據(jù)x=(x1,x2,…,xn)所屬的類別:
(1)
② 支持向量機:
給定訓(xùn)練數(shù)據(jù)集合{(xi,yi);i=1,2,…,N},支持向量機的核心思想是認為選擇最大化邊白的曲面可以最大可能地區(qū)分開數(shù)據(jù)點,如圖2所示。

圖2 支持向量機算法的核心原理
為了求取最大邊白(Margin),可以歸結(jié)為下述的優(yōu)化問題:
(2)
s.t.yi(ωTxi+b)≥1i=1,2,…,m
通過求取該優(yōu)化問題,可以把最大邊白曲面的參數(shù)求取出來,從而實現(xiàn)分類功能。
由于我們的分類是二級分類,本文將首先對大類進行分類,然后再對細分類別進行分類,在實驗部分將詳細展示分類效果。

(3)
(4)
(5)
式中:WCi是句子Si的詞個數(shù)。而對某個類別的情感分析通過下式來計算:
Ci=∑Si
(6)
式(6)計算之后所得的情感分數(shù)就是消費者群體對相應(yīng)酒店某個類別的細粒度服務(wù)的情感評價。因此,通過匯總酒店的各個類別的情感分數(shù),得到酒店細粒度服務(wù)的情感矩陣,由此可知消費者對于特定酒店三大類及其22個細粒度服務(wù)的情感分數(shù)。
從2018年1月至2月,通過對攜程和去哪兒網(wǎng)站的酒店目錄進行數(shù)據(jù)爬取,抓取了包括酒店名字和對應(yīng)的評論數(shù)據(jù),評論數(shù)據(jù)包括用戶評分、評論編號、標題和評論正文。經(jīng)過去除噪音、刪除無效數(shù)據(jù)等數(shù)據(jù)清洗操作最終整理得到632家酒店和總共7 183 763條酒店評論數(shù)據(jù)。同時,針對所有酒店評論數(shù)據(jù)通過Word2Vec工具進行訓(xùn)練(150維,窗口大小設(shè)置為10),得到每個詞對應(yīng)的向量用于后續(xù)分類等分析模塊中。最后,還在7 183 763條酒店評論數(shù)據(jù)集中隨機選取,然后人工標注了10 000條評論數(shù)據(jù)。通過統(tǒng)計,評論數(shù)據(jù)平均有11個句子,因此共產(chǎn)生了110 326的標注句子,具體的標注過程見3.3節(jié)。
對大類別和小類別分別采用兩個分類算法進行分類,每次分類都將數(shù)據(jù)集合按照80%~20%進行劃分,80%的部分作為訓(xùn)練數(shù)據(jù),而20%的部分作為測試數(shù)據(jù),實驗結(jié)果如表2所示。表中所有結(jié)果均是采用10倍交叉驗證所獲得的平均值。

表2 基于機器學(xué)習(xí)的特征分類效果比較

續(xù)表2
從表2中可以看出,支持向量機比樸素貝葉斯取得了更好的實驗結(jié)果,后續(xù)將以支持向量機訓(xùn)練得到的分類模型作為后續(xù)模塊的支撐。
為了分析所選特征所起到的作用,本文逐個減去某特征然后進行實驗,采用Precision評價指標,限于篇幅,圖3中只展示了一個大類和一個小類的實驗結(jié)果,在其他類別上的實驗結(jié)果的趨勢類似。

圖3 大類“酒店設(shè)施”和小類“前臺服務(wù)”在不同特征上的Precision值
該實驗結(jié)果表明,tf-idf特征幾乎沒用,經(jīng)過分析,這很可能是由于句子太短,詞頻幾乎沒有差別;最有用的特征是“詞是否出現(xiàn)”這個特征;同時,可以看到,本文提出的兩個新特征——詞向量距離和詞典距離特征也起到了重要作用。
為了識別出消費者對酒店的服務(wù)的在意程度,本文分別對各個服務(wù)類別的評論極性進行了統(tǒng)計分析,結(jié)果如表3所示。可以看出,顧客對每個類別的情感表達有正有負,其中:客房服務(wù)的最小值為-4.02,最大值為12.42,不管是從消極情感的強度還是積極情感的強度,其絕對值均是所有服務(wù)中最大的,表明情感最強烈;前臺服務(wù)的最小值為-4.82,最大值為14.37,情感強烈程度僅次于客房服務(wù)。在大類中,消費者首先重視的是酒店設(shè)施,然后是周遭環(huán)境,再次是服務(wù),這和一般人的直覺有些不一致。通常會認為服務(wù)應(yīng)該是最受顧客關(guān)心的,經(jīng)過仔細思考,其實這個結(jié)果是合理的,設(shè)想顧客到了酒店之后如果酒店設(shè)施完備,體驗極佳,其實顧客較少需要酒店人員的服務(wù);反之,如果酒店設(shè)施問題很大,再好的服務(wù)都不會使得顧客滿意。

表3 細粒度情感分析結(jié)果
從本文的情感分數(shù)計算方法(式(3)-式(6))可知,所計算出的情感分數(shù)理論上范圍在(-∞,+∞),但是一個句子的詞總數(shù)是有限的,因此,情感分數(shù)一般不會太大和太小。另外,情感分數(shù)的絕對值只表明用戶對于該項的情感強烈程度,絕對值越大表明用戶正面或負面的情感越強烈,反之越弱。
本節(jié)將展示一些分析案例來表明所提出的細粒度情感分析對于酒店的評估能起到重要支撐作用。從表4中的案例可以看出,該酒店部分服務(wù)沒有停車場、接機和租車等服務(wù),因此表格中這些服務(wù)的評價和情感分數(shù)為空。同時,也可以看出該酒店在衛(wèi)生狀況、前臺服務(wù)和環(huán)境噪音情況等服務(wù)類別的情感分數(shù)分別是6.32、9.23和7.92,表明該酒店前臺服務(wù)比較好,衛(wèi)生情況也比較良好,同時整個酒店外界噪音較小。而該酒店在客房內(nèi)設(shè)施的情感分數(shù)只有1.73,仔細查看評論“就是洗衣機用不了;電動的窗簾一個是壞了,關(guān)不上;就是衛(wèi)生間的潔具相對來說感覺有點舊了,用起來不是很方便”,可知該酒店的哪些設(shè)施讓用戶感覺不好,有待提升。在房間隔音效果只取得了3.2的分數(shù),仔細查看評論“房間隔音不好;環(huán)境一般,有吵聲,很影響休息”,這表明該酒店隔音效果不好,有待提升。通過該案例的分析,表明本文提出的方法可以為酒店管理層提供一種快速的細粒度酒店質(zhì)量評估,提升酒店服務(wù)水平。

表4 案例分析(犀客空間(北京國貿(mào)和喬麗致店))

續(xù)表4
本文針對目前酒店評論數(shù)據(jù)分析方法粒度較粗、缺乏細粒度情感分析的問題,首先對評論數(shù)據(jù)進行了細粒度分類,然后通過基于詞典的情感分析方法對酒店評論進行極性判斷,從而獲得用戶對酒店服務(wù)的細粒度情感評價。本文方法能讓酒店管理層快速全面了解酒店服務(wù)質(zhì)量情況,有效提升了酒店管理效率和服務(wù)水平,推動了酒店管理水平的提升。