張道海,楊 晨(江蘇大學 管理學院,江蘇 鎮江 212013)
自新冠疫情爆發以來,網絡購物發展愈加迅猛。據第49 次《中國互聯網絡發展狀況統計報告》顯示,截至2021 年12 月,我國網民規模達10.32 億,互聯網普及率達73.0%。其中,網絡支付用戶規模達9.04 億,較2020 年12 月增長4 929 萬,占網民整體人數的87.6%[1]。與此同時,網絡購物投訴占比也迅速增長,據“電數寶”數據顯示,2021 全年,國內網購投訴占全部投訴52.55%,比例最高。電商平臺物流作為網絡購物環節中的重要部分,其服務質量的高低直接影響了消費者網絡購物滿意度。在線評論信息作為消費者購物體驗的反饋,反映了其對網絡購物的具體需求。通過電商平臺物流服務在線評論信息,挖掘消費者的真實需求有助于電商平臺完善物流服務質量,提高消費者滿意度。
物流服務在促進在線購買[2]和消費者滿意度[3]方面發揮著關鍵作用,網絡購物物流服務質量同時需要跟上電商環境的發展[4]。易祎晨等[5]基于SERVQUAL 模型確定了專業性、可靠性、響應性、便利性和安全性五個維度,為生鮮物流服務質量的評價與優化起到一定借鑒作用。Xiaomei Tao 等[6]基于李克特5 級量表和主成分分析法確立了5 維21 個指標的服務質量評價體系。翟小可等[7]運用AHP-模糊綜合評價法建立農村電商物流服務質量評價模型,并進行實證研究。張寶友等[8]指出將客戶“聲音”轉化為質量屬性的文本挖掘方法是物流服務質量提升的重要方法之一。Wei Hong 等[9]通過卷積神經網絡技術分析消費者滿意度與生鮮電商物流服務的關系,結果證實便利性、溝通、可靠性和響應性對客戶滿意度有顯著影響。Singh S P 等[10]通過情感分析與主題建模,驗證電商物流服務質量與第三方物流服務提供商的運營和財務績效呈正相關關系。
上述文獻提供了重要的理論基礎和方法論指導,但實際應用中結合當前新冠疫情背景進行電商平臺物流服務質量提升的研究尚比較欠缺。因此,基于電商平臺中受疫情影響較大的多種類別商品評論文本,進行特征提取、情感分析、主題挖掘與事件構建,研究消費者滿意度機理,探尋電商平臺物流服務質量提升,具有重要的現實意義。
本文總體框架如圖1 所示,基于特征挖掘方法構建電商平臺物流服務詞典,篩選物流服務評論文本;然后建立情感分析模型判斷在線評論中隱含的消費者情緒,識別消費者情感;進一步基于LDA 挖掘消費者的需求主題,明確電商平臺物流服務質量提升方向;最后基于語義方法還原主題事件,研究消費者滿意度機理。

圖1 研究總體框架
依據產品分類,從京東平臺搜索評論數較多的50 家店鋪,獲取2020 年11 月10 日至2022 年3 月28 日商品在線評論74 000 條評論。將獲取的評論文本進行去停用詞等處理后進行分詞,共獲取詞匯數據50 萬條。對詞匯進行詞性分析,在特征提取中根據詞性對名詞和動詞進行有監督的特征提取能得到較好效果[11]。對名詞和動詞進行詞頻統計,選取20 個高頻詞匯作為電商平臺在線評論特征主題詞,得到結果如表1 所示。

表1 在線評論特征主題詞
在表1 中,20 個特征詞匯詞頻(TF)、逆文檔頻率(IDF)、TF-IDF 排序結果基本一致,說明特征詞均在文檔中有足夠重要性,且對評論的主題有較好的覆蓋[12],因此選取這20 個詞匯作為電商平臺用戶評論特征主題詞。通過Word2vec 將詞匯轉化為詞向量,采用主成分分析法對特征指標進行降維,計算各主成分累計方差貢獻率,結果如圖2 所示。根據主成分累計方差貢獻率,選取5 個主成分為最終降維結果,得到如圖3 所示的特征詞分布。

圖2 主成分累計方差貢獻率

圖3 特征詞分布
根據特征詞分布圖,構建如表2 所示的在線評論特征分類表,如類別2 所示,與物流服務強相關共有7 個特征詞匯。

表2 在線評論特征分類表
依據物流服務特征詞匯,使用Word2vec 獲取與特征詞相似度較高的詞語構建電商平臺物流服務詞典,從在線評論中遍歷含有詞典詞匯的評論,共獲得21 620 條電商平臺物流服務在線評論文本數據。
從物流服務文本中隨機選取5 000 條評論,對其情感極性進行人工標注。其中4 000 條評論文本作為訓練集,1 000 條評論作為測試集進行情感分析效果評估。通過樸素貝葉斯、支持向量機與卷積神經網絡模型分別在訓練集上構建情感分類模型,在測試集上進行情感預測性能評估,從平均精度、Ⅰ型誤差、Ⅱ性誤差、F-Measure 四個指標評估預測模型,結果如表3 所示。
從表3 可知,基于CNN 的情感分析模型擁有最優的平均精度、Ⅱ型誤差和F 值,因此采用CNN 對物流服務評論文本進行情感分析,得到結果如表4 所示。

表3 情感分析預測性能評估

表4 情感分析結果
分別從正面情感與負面情感兩個角度對評論文本進行LDA 主題建模,根據計算主題一致性得分[13],確定最優主題數目,結果如圖4 所示。

圖4 正負主題一致性
根據圖4 計算結果,確定正面主題數目8 個,負面主題數目7 個。對主題內容構建主題分布圖,如圖5 所示。序號代表主題編號,圓圈大小代表主題特征的顯著水平,圓圈間隔代表不同主題間距離。

圖5 主題分布圖
由圖5 知:在正面主題中,主題5 與主題8 的距離過近,重合度過高,合并為一個主題;主題7 的特征不顯著,作為噪聲進行刪除。負面主題中,主題4 與主題5 合并為一個主題,主題7 特征不顯著,同樣作為噪聲刪除。最終確定6 個正面主題,5 個負面主題為最終分類結果。根據LDA 主題內主題詞所表達的含義,對主題進行命名,結果如表5 所示。

表5 LDA 主題模型
對表5 進行分析,“商品狀態”主題內主題詞涉及商品本身質量問題,與物流服務質量無關。“顧客情感”主題包括消費者對于物流服務好壞的情感反饋,可以歸類入“服務態度”主題。最終確定電商平臺物流服務主要包括“電商平臺”、“物流時效”、“物流包裝”、“服務態度”四個主題。
根據物流服務主題評論,如圖6 所示流程構建事件模型,對主題下關鍵詞進行遍歷篩選獲取主題評論內容,通過還原評論事件主題研究消費者電商平臺物流服務的滿意度機理。

圖6 語義分析流程
句法分析主要任務是確定句法結構,以及句子中的詞匯之間的依存關系。利用哈工大LTP 平臺構建SVO 三元組,還原主題中隱含的事件主題。本文共獲取正面事件三元組15 254 條,負面事件三元組3 295 條,通過同義詞轉換選取出現頻率較高的事件,對正面主題與負面主題兩個方面構建如表6 與表7 所示的高頻事件表。

表6 正面主題高頻事件

表7 負面主題高頻事件
依據正面高頻事件表,對主題事件分析如下:
(1)在電商平臺方面,平臺的企業形象、保障措施、責任態度以及消費者以往的良好購物體驗,對平臺的選擇意愿有積極的影響。消費者更愿意選擇平臺自營物流服務。
(2)在物流時效方面,消費者注重于運輸與發貨速度,且對于空運這一運輸方式有著足夠的好感與信任。在新冠疫情或節假日等特殊環境下保證時效性的舉措使得消費者滿意度提高。
(3)在物流包裝方面,消費者關注包裝的完整度、整潔度和保護性能三個方面,即完好、干凈且對商品能夠起到保護作用的包裝給消費者帶來較高的購物體驗。
(4)在服務態度方面,快遞小哥與平臺客服對消費者的幫助行為與耐心熱情的服務態度對消費者情緒具有積極的作用。
依據負面高頻事件表,對主題事件分析如下:
(1)在電商平臺方面,電商平臺對消費者的“殺熟”操作降低消費者購物體驗,電商平臺對消費者不可靠承諾與責任推卸影響消費者對于平臺的滿意度。
(2)在物流包裝方面,包裝的密封性、完整性、環保性、材質與氣味等問題都會影響消費者的購物體驗。消費者對于物流包裝環保、安全、保質關注度高。
(3)在時效性方面,運輸時間和發貨時間長是消費者負面評論中提及最主要的問題。其中,若電商平臺未對物流時效做出有效預估或與消費者存在物流時效承諾而未履行,將帶來消費者負面情緒。
(4)在服務態度方面,電商平臺物流或商家的誠信問題或對于消費者敷衍或惡劣的態度會導致消費者負面情緒的產生,導致消費者滿意度下降。
本文使用TF-IDF 結合PCA 主成分分析對物流服務特征進行提取,接著基于卷積神經網絡進行物流服務的情感分析,然后基于LDA 進行主題建模,最后通過SVO 三元組還原事件主題,進行影響因素機理分析。結果表明,消費者網購滿意度與“電商平臺”、“物流時效”、“物流包裝”、“服務態度”四個方面密切相關,平臺的企業形象、保障措施、服務承諾等直接影響消費者對平臺的選擇意愿,發貨和運輸速度、包裝的安全、服務態度等直接影響消費者情緒。
本文選取了京東物流平臺下受新冠疫情影響較大的生鮮產品、農副產品和農產品三類商品進行分析,在未來的研究中,應充分考慮多平臺更多品類商品進行研究,使得研究結果更加準確有效。同時,文本挖掘過程中仍存在部分無法篩除的噪音,如機器人評論與無法進行語義分析的網絡用語等,這些因素會影響分析的結果,有待進一步優化改進。