999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LDA的電商平臺用戶評論挖掘與情感分析研究

2024-06-29 13:49:56杜利明郭文艷崔蕾王鳳英
江蘇科技信息 2024年12期
關鍵詞:文本挖掘

杜利明 郭文艷 崔蕾 王鳳英

摘要:用戶評論文本挖掘與分析在多個領域具有重要實際應用價值。文章選取京東商城用戶評論數據集作為研究對象,運用多種方法對其進行深入的數據挖掘與分析。首先,通過TF-IDF提取關鍵詞揭示評論的核心主題,進而通過分析高頻詞了解用戶對京東商城服務的關注點和整體評價。其次,采用情感分析技術對評論文本進行情感傾向性分類,旨在判斷評論的情緒色彩,為京東商城的產品改進和市場定位提供有益參考。最后,借助LDA主題模型對評論文本進行主題剖析,挖掘出評論中的隱性主題和話題分布,進一步揭示用戶對產品或服務的不同觀點和需求,從而為京東商城提供針對性的改進策略和意見。

關鍵詞:LDA;用戶評論;文本挖掘;情感分析

中圖分類號: F724.6;F426.8 文獻標志碼: A

0 引言

中國互聯網絡信息中心第53次《中國互聯網絡發展狀況統計報告》顯示,截至2023年12月,我國網民規模已達到10.92億,互聯網普及率達77.5%[1]。互聯網時代下,隨著在線購物的普及,產品和服務的評論成了網民做出購買決策的重要參考依據。海量用戶評論中蘊含著消費者對產品的觀點、意見和情感態度,對這些評論進行深入挖掘和情感分析,對于企業改進產品質量、提升用戶滿意度和制定精確的市場策略至關重要。但用戶評論通常以非結構化的文本形式存在且數量極為龐大,為進一步從評論中提煉有價值的信息,本文借助LDA主題模型,探究人們在利電商平臺進行網購時的情感傾向及關注點,幫助電商平臺商家準確快速把握消費者的情感與需求,及時制定更優銷售方案,改善服務,緩解平臺競爭壓力。

1 相關研究

1.1 在線評論特征詞抽取研究

在線評論挖掘旨在從大量網絡評論數據中自動識別能夠表征評論主要內容的關鍵詞或短語,目前多應用于電子商務、社交媒體分析、旅游與酒店業等多個領域的多個層面。谷瑩等[2]利用Word2vec技術構建產品特征詞集合,識別用戶評論主題特征,提出一種基于在線產品評論的競爭情報挖掘框架。彭云等[3]利用句法分析和詞義理解獲取語義關系,提出SRC-LDA主題模型,挖掘特征詞與情感詞語義相關性,實現語義約束下的細粒度主題特征抽取。Quan等[4]在產品特征提取研究中,創新性地將互信息概念引入TF-IDF(Term Frequency-Inverse Document Frequency)權重算法中,提出了新型相似性度量標準,用于評價候選對象與特定領域實體間的關聯強度,開發出了一種無須人工干預的自動特征抽取技術。黃昌莉等[5]利用LDA主題模型和扎根理論相分析了旅游城市形象感知的構成要素及其相互影響的作用過程。

1.2 情感分析研究

Kim等[6]在對獲取的評論數據進行回歸分析的基礎上,運用情感分析研究影響消費者對酒店滿意程度的因素。Rudy等[7]將規則的分類、監督學習和機器學習結合在一起提出解決情感分類問題的方法,并采用實證研究進行結果測試。高佳希等[8]提出了基于TF-IDF和多頭注意力Transformer模型的文本情感分析模型,旨在提高模型對語義的分析和泛化能力。趙宏等[9]提出了基于特征融合的中文文本情感分析方法,旨在將全局特征和局部語義特征進行融合,并使用Softmax實現文本情感分類。

傳統實證研究方法受多種因素的影響,導致其分析結果可能存在偏差。為深入剖析消費者在網購中的關注點及影響其評價行為的具體因素,本文以京東電商平臺為例,抓取部分用戶評論數據分析消費者網購時的需求,探究哪些客觀因素會對消費者的評價行為與意愿造成影響,進而幫助電商平臺進行產品改進和市場定位。

2 數據獲取與預處理

2.1 數據來源

京東商城App的用戶在線評論數據從七麥數據平臺獲取,抓取的評論時間從2023年1月1日—12月31日。共計獲取數據4121條,經數據處理清洗后得到有效數據3596條。

2.2 數據預處理

由于網絡平臺是開放的,京東商城的相關評論不會受到時間、地點、人員等的限制,收集的網絡評論數據可能包含重復、與主題不相關的信息以及空白等無效評論,可能會對實驗結果產生較大影響。因此,在分析數據之前,需要預先處理數據集,對文本進行去重、剔除不完整數據、刪除特殊符號和表情、排除低質量的數據,以提高實驗結果的準確性[10]。

3 基于TF-IDF評論文本關鍵詞提取

TF-IDF是用于評估某個詞(Term)在文檔集合中重要程度的統計方法。如果一個詞在整個文檔集合中出現的次數較多,意味著它在描述文檔特點上沒有那么重要,IDF值也就較低,相反IDF值則較高[11]。本文在對文本進行分詞與去停用詞的基礎上,通過計算每個詞的TF-IDF值,對京東商城上用戶在線評論分詞進行統計和排序,識別出TOP20高頻詞及其權重,部分內容如表1所示。

由表2中的高頻詞可以看出,“客服”“商品”“商家”“物流”“服務”是用戶比較關注的問題和評論焦點,反映出京東商城App的用戶在購物過程中,特別關注快遞的配送速度、商品的整體質量以及商家的服務態度等。

4 在線評論情感傾向分析

為監測用戶網絡評論的情感,本文將情感詞典與文本中的單詞匹配,計算對比單詞的情感傾向[12]。利用R軟件讀入臺灣大學簡體中文情感詞典(NTUSD)對上述預處理的評論數據進行情感詞典匹配分析,確定用戶評論文本的情感傾向,計算具體的情感值及情感方向,并對評論情感傾向進行統計分析。

4.1 情感分析結果

基于上述工作,將調用擴展后的詞典對評論數據進行情感值計算,部分評論內容計算結果如表2所示。

從表3評論情感傾向統計結果來看,負向與偏負向評論占比達66.54%,而正向與偏正向評論僅占33.46%,負面評價占比較高。其主要原因在于消費者缺乏評價動機,當購買到的產品未達到預期時,消費者傾向于通過差評表達不滿和警示其他潛在買家。相反,當消費者對購買的產品感到滿意時,他們可能不會對此做出評價。但既然存在差評,平臺就應該對此引起高度重視,應積極采取措施,從差評中總結經驗,改進服務流程,提升消費者體驗。同時,鼓勵消費者做出正面評價,平衡評價體系,使評價系統更公正客觀,促進平臺內商家和消費者的良性互動。

4.2 基于LDA模型的主題挖掘分析

4.2.1 LDA分析量化結果

為避免正面評價和負面評價混淆,且在分詞粒度的影響下會存在一個主題下產生一些無意義的詞[13],本文將京東電商評論分為正面評價和負面評價2個文本,分別進行LDA主題分析。經過分析后,將文本聚類成3個主題,每個主題下生成10個最有可能出現的詞語,如表4—5所示。

4.2.2 LDA結果分析

表4主題詞中出現了“電器”“喜歡”“質量”“支持”等詞,揭示了消費者對京東商城的高度評價與產品的質量及配送服務緊密相關。消費者普遍認同京東商城在電器類產品的質量上表現出色,認為其是高品質電器的可靠來源,因此將其作為購買首選地。此外,消費者也比較認同京東商城的產品質量優和物流服務好,同時反映出京東商城在消費者心中具有良好的品牌形象和信任度,這是其持續獲得消費者支持和市場成功的關鍵因素。表5展示了負面評價文本3個潛在主題的主要關鍵詞,表5主題詞中有“橫屏”“適配”“退款”“殺熟”等詞,側面表明軟件與iPad的兼容性存在問題,適配度較低;軟件頁面加載時可能出現卡頓,甚至出現閃退的情況。在售后服務方面,消費者在與客服的互動中存在障礙,問題解決不夠順暢;商家的退款和退貨處理也顯得不夠及時,服務響應不周全。

5 結論與建議

綜上所述,用戶評價的情感傾向與電商平臺商品質量及其售后服務有密切的聯系。電商平臺如果能通過評論準確捕捉到用戶對其平臺的看法與希望,就能進一步有效提升用戶的滿意程度,降低其負面情緒,從而增加客戶黏性。本文基于評論文本得到的結果,提出以下幾點建議。

(1)加強商品質量管理和控制。設立多重審查機制,對準備上架的商品進行詳盡的資質審核,包括檢測報告、品牌授權、工廠生產資質等,確保每一件商品都符合國家相關法規和京東自身的質量標準;引入智能化審核系統,通過大數據分析和機器學習算法,提高審核效率和精準度,力圖在商品上架前就能識別并過濾潛在的質量問題;建設售后服務體系;推出具有辨識度的“品質保證”標識,為那些通過嚴格審核、用戶評價優秀的商品提供認證。

(2)建立完善的售后服務機制與團隊。京東電商平臺主要依賴智能客服系統處理客戶咨詢,但在某些情況下,這種系統可能無法完全滿足客戶的需求,可能會給消費者造成不便。因此,京東還需要打造一支專業的售后服務團隊,確保能夠及時、有效地響應客戶的問題。特別是對于那些具有參考性的客戶反饋,應通過人工客服進行快速回復和處理,以展現平臺對客戶意見的重視,從而提升客戶對平臺的信任和滿意度,提升客戶對京東平臺的忠誠度。

(3)加強與用戶的溝通和互動,提升用戶滿意度和忠誠度。優化用戶反饋機制,鼓勵消費者提出意見和建議,并對消費者的每一條反饋給予重視和回應,定期分析用戶反饋,從中提取關鍵信息,作為改進產品和服務的重要依據;策劃互動活動,定期舉辦促銷活動、用戶調研、線上問答等形式多樣的互動活動,提高用戶的參與度和平臺的活躍度。此外,通過個性化推薦、專屬優惠等措施,使用戶感受到平臺的關懷和重視,增強用戶對品牌的情感聯系。

參考文獻

[1]中國互聯網絡信息中心.第45次中國互聯網絡發展狀況統計報告[EB/OL].(2020-04-28)[2024-03-20].https://www.cnnic.net.cn/NMediaFile/2024/0325/MAIN1711355296414FIQ9XKZV63.pdf.

[2]谷瑩,李賀,李葉葉,等.基于在線評論的企業競爭情報需求挖掘研究[J].現代情報,2021(1):24-31.

[3]彭云,萬常選,江騰蛟,等.一種詞聚類LDA的商品特征提取算法[J].小型微型計算機系統,2015(7):1458-1463.

[4]QUAN C Q, REN F J. Unsupervised product feature extraction for feature-oriented opinion determination[J]. Information Sciences, 2014(272): 16-28.

[5]黃昌莉,黃燕玲,于海濤,等.基于LDA和扎根理論的桂林旅游地感知形象研究[J].地域研究與開發,2022(5):91-97.

[6]KIM Y J, KIM H S. The impact of hotel customer experience on customer satisfaction through online reviews[J]. Sustainability, 2022(2): 848.

[7]RUDY P, MIKE T. Sentiment analysis: a combined approach[J]. Journal of Informetrics, 2009(2): 143-157.

[8]高佳希,黃海燕.基于TF-IDF和多頭注意力Transformer模型的文本情感分析[J].華東理工大學學報(自然科學版),2024(1):129-136.

[9]趙宏,傅兆陽,王樂.基于特征融合的中文文本情感分析方法[J].蘭州理工大學學報,2022(3):94-102.

[10]劉佳鍇,李敏.基于文本挖掘的蠶絲被在線評論分析:以京東商城為例[J].絲綢,2023(8):11-20.

[11]MUHAMMAD A A, MUHAMMAD F M, UROOJ A. Comparative analysis of TF-IDF and loglikelihood method for keywords extraction of twitter data[J]. Mehran University Research Journal of Engineering Technology, 2023(1): 88-94.

[12]馮建英,吳丹丹,王博,等.中文在線評論文本分析對生鮮農產品電商影響研究綜述[J].農業機械學報,2021(S1):504-512.

[13]GRASER S, NIELSEN L H, BHM S. Factors influencing the user experience of mobile augmented reality apps: an analysis of user feedback based on app store user reviews[M]//GODULLA A, BHM S. Digital Disruption and Media Transformation. Cham: Springer, 2023.

(編輯 李春燕編輯)

Research on user review mining and sentiment analysis of E-commerce platform based on LDA: taking Jingdong Mall App as an example

DU? Liming1,2, GUO? Wenyan2, CUI? Lei2, WANG? Fengying1,2*

(1.School of Information Engineering, Suqian University, Suqian 223800, China; 2.School of Computer

Science and Engineering, Shenyang Jianzhu University, Shenyang 110000, China)

Abstract:? User comment text mining and analysis have important practical application value in multiple fields. The article selects the user comment dataset of Jingdong Mall as the research object, and uses various methods to conduct in-depth data mining and analysis on it. Firstly, extract keywords through TF-IDF to reveal the core theme of the comment, and then analyze high-frequency words to understand the users focus and overall evaluation of Jingdong Malls services. Secondly, sentiment analysis technology is used to classify the emotional tendencies of comment texts, aiming to determine the emotional color of comments and provide useful references for product improvement and market positioning of Jingdong Mall. Finally, using the LDA topic model to analyze the theme of the comment text, the implicit themes and topic distribution in the comment are excavated, further revealing the different views and needs of users on the product or service, and providing targeted improvement strategies and opinions for Jingdong Mall.

Key words: LDA; user comment; text mining; sentiment analysis

基金項目:宿遷學院京東學院開放基金項目;項目名稱:基于京東用戶評論挖掘的市場情報分析模型研究;項目編號:2022JDXM13。

作者簡介:杜利明(1976— ),男,副教授,博士;研究方向:圖書情報分析與應用,機器學習。

*通信作者:王鳳英(1976— ),女,副教授,碩士;研究方向:圖書情報分析與應用,機器學習。

猜你喜歡
文本挖掘
基于貝葉斯分類器的中文垃圾短信辨識
科技資訊(2017年5期)2017-04-12 15:18:52
基于潛在特征的汽車評論要素挖掘
基于評論信息的淘寶服裝類評分體系優化
商情(2016年32期)2017-03-04 00:27:28
數據挖掘技術在電站設備故障分析中的應用
軟件導刊(2016年12期)2017-01-21 15:55:21
基于LDA模型的95598熱點業務工單挖掘分析
文本數據挖掘在電子商務網站個性化推薦中的應用
商(2016年34期)2016-11-24 16:28:51
從《遠程教育》35年載文看遠程教育研究趨勢
基于文獻的中西醫結合治療腦梗死藥物使用情況分析
基于改進Hadoop云平臺的海量文本數據挖掘
慧眼識璞玉,妙手煉渾金
主站蜘蛛池模板: 国产乱人伦AV在线A| 天天干天天色综合网| 国产黄色爱视频| 被公侵犯人妻少妇一区二区三区| 久久久久青草线综合超碰| 99福利视频导航| 国产综合日韩另类一区二区| 久久久精品国产SM调教网站| 在线精品欧美日韩| 动漫精品中文字幕无码| 72种姿势欧美久久久大黄蕉| 农村乱人伦一区二区| 久久99国产综合精品女同| 99re在线观看视频| 在线观看av永久| 国产精品无码作爱| 久久国产精品影院| 亚洲bt欧美bt精品| 国产正在播放| 国产乱人伦精品一区二区| 久久77777| 五月婷婷综合在线视频| 性网站在线观看| av色爱 天堂网| 亚洲人成网站18禁动漫无码 | 中文字幕 91| 亚洲精选无码久久久| 美女无遮挡免费视频网站| 欧美人人干| 亚洲国产精品成人久久综合影院| 91网址在线播放| 亚洲色图欧美一区| 国产v欧美v日韩v综合精品| 国产精品毛片一区| 色噜噜久久| h网站在线播放| 久久久久国产精品嫩草影院| 99久久精品国产自免费| 91无码人妻精品一区二区蜜桃| 欧美黄网站免费观看| 国产主播一区二区三区| 香蕉视频在线观看www| 免费激情网站| 日韩a在线观看免费观看| 美女视频黄频a免费高清不卡| 91精品专区| 波多野结衣视频一区二区| 欧美亚洲一二三区| www成人国产在线观看网站| 国产成人精品亚洲日本对白优播| 亚洲资源站av无码网址| 免费毛片视频| 国产成人乱码一区二区三区在线| 亚洲黄网在线| 欧美五月婷婷| 国产啪在线91| 亚洲成综合人影院在院播放| 欧美在线综合视频| 欧美日韩一区二区在线播放| AV在线天堂进入| 国产成人无码AV在线播放动漫| 色综合手机在线| 91久久精品国产| 无码日韩视频| 九一九色国产| 成人精品视频一区二区在线 | 日韩高清一区 | 日韩在线第三页| 亚洲国产欧洲精品路线久久| 中文字幕在线看视频一区二区三区| 自偷自拍三级全三级视频| 国产色婷婷| 欧洲高清无码在线| 高清亚洲欧美在线看| 国产v精品成人免费视频71pao | 久久久久久国产精品mv| 在线精品亚洲国产| 久久精品无码专区免费| 中字无码精油按摩中出视频| 日韩欧美国产另类| 丁香六月激情婷婷| 92午夜福利影院一区二区三区|