楊佳明 張甜


摘要:隨著互聯網的飛速發展,電商帶貨逐漸興起,但億萬銷售額的背后商品質量不能得到有效保障。本文利用機器學習的相關算法和基于詞典的文本情感分析模型,對電商直播銷售產品過程進行分析,通過合理的可視化分析結果來給消費者更加透明的消費選擇,從而選擇性價比更高的產品。
關鍵詞:電商直播帶貨;彈幕;評論;機器學習;情感分析
0引言
在互聯網時代的今天,電商帶貨逐漸興起,其銷售額常一夜億萬,商品質量卻不能得到有效保障。據統計[1],截止2020年12月,我國電商直播用戶規模達到3.88億,占網民總體的39.2%。為保證電商產品的質量問題,急需對直播產品進行合理性分析。本研究基于支持向量機算法(SVM)和詞典的文本情感分析模型,對用戶評價進行展示和分析,給消費者更加透明直觀的消費選擇。
1支持向量機算法(SVM)介紹[2]
2系統的總體結構(圖2.1)
3基于支持向量機的文本彈幕處理步驟
3.1訓練集和測試集劃分
按照正類負類分層采樣,正:負=3:1;
3.2模型訓練和結果
基于python語言和sklearn的svm庫,運用機器學習的支持向量機算法進行訓練;并運用模型進行預測,正類為1,負類為0。
4基于詞典的文本情感分析模型
4.1詞典類型
正/負類詞典、程度副詞詞典、停用詞詞典、否定詞詞典。
4.2基于詞典的情感值計算規則
先判斷分詞結果;再看否定詞;隨后看程度副詞,根據程度高低依次分配權重1.75、1.5、0.75、0.5;感嘆號給1.5權重。
5系統分析結果
5.1主界面展示:
5.2單文本情感分析展示:
單文本情感分析主要是使用戶輸入評論文本來判斷文本的情感傾向是正面、中性、還是負面,了解情感計算模型的標準,增強系統的交互性和趣味性。
5.3情感片段分析展示
情感片段分析展示主要是利用echarts技術,對機器學習模型和基于詞典的情感值計算模型結果進行分析展示,給觀眾更直觀的結果展示。
6研究創新特色概述
(1)基于網絡爬蟲技術,爬取有效的彈幕、評價、評論、評分等相關信息,進行數據分析、數據挖掘,將商品質量可視化呈現,實時給予用戶優質的購物體驗。
(2)運用機器學習算法和基于詞典模型相結合的分析模式,能夠更加準確合理地進行情感挖掘。
(3)運用echarts技術進行可視化展示,更形象具體,給消費者更直觀的購物選擇。
(4)項目致力于優化直播電商的營商環境和消費者的消費體驗,進而實現雙贏,帶動經濟的發展。
7結語
本研究采用支持向量機算法(SVM)對文本數據進行二分類,基于詞典的情感值計算模型對每個時間段的觀眾情感值進行計算,并進行可視化分析,給消費者更加透明的購物選擇,對推動電商行業的健康持續發展具有重要意義。
參考文獻
[1]張佰尚,陳偉.直播電商監管的挑戰與對策研究,市場監管總局發展研究中心,2021
[2]周云峰,劉關宇.基于支持向量機算法的光伏陣列故障智能檢測方法,杭州電子科技大學,2021
[3]陸霞,武善鋒.基于神經網絡的在線課堂彈幕評論的情感分析與研究,南京師范大學泰州學院,2021