
摘要:在數字經濟發展的背景下,電商直播為農產品銷售模式帶來了創新變革,成為促進農產品流通和鄉村振興的關鍵途徑。利用消費者在線評論數據,采用文本挖掘和機器學習技術深入分析影響消費者滿意度的主要因素。結果表明,農產品的品種、口味、價格、產地及直播間氛圍等因素對消費者滿意度有顯著影響,其中口味、商品品質、價格和直播環境是提升滿意度的關鍵。對此,為直播電商平臺和從業者提供策略指導,以增強農產品市場競爭力、推動鄉村振興。
關鍵詞:助農直播; 消費者滿意度; 影響因素; 文本挖掘; 機器學習技術
中圖分類號:F323.7;F724.6 文獻標識碼: 文章編號:1674-1161(2024)04-0128-03
近年來我國數字經濟快速崛起,互聯網技術不斷進步。第53次《中國互聯網絡發展狀況統計報告》指出,截至2023 年12 月,中國網民數量已超10.92億,互聯網普及率達77.5%。這為電商直播行業尤其是農產品銷售領域,帶來了新的發展機會。在國家層面,“三農”問題受到高度重視,黨和政府文件中多次強調要實施鄉村振興戰略,推動農業和農村現代化。在此背景下,“農產品+電商直播”的銷售模式迅速興起,吸引了大量關注,顯著提升了銷量。
研究深入分析助農直播成功的多個關鍵因素,包括主播素養、消費者數字素養、人才支持、品牌形象、產品質量、技術支持、物流配送、政府支持和社會環境等。通過文本挖掘技術,構建LDA主題模型,探討消費者在線評論與滿意度之間的關系來揭示購買行為背后的驅動因素。結果表明,產品質量、價格合理性、主播魅力、推薦度和客戶服務是影響消費者滿意度和再購意愿的主要因素。此外,討論文本挖掘在消費者行為研究中的應用前景,強調其在分析大規模數據中的重要作用。通過結合機器學習和大數據分析,能夠更準確地預測消費者行為趨勢,為直播助農平臺的運營和管理提供支持[1-2]。
1 數據來源與研究內容
1.1 研究對象與數據來源
農業是國家經濟的重要支柱,對民眾生活水平有著直接影響。隨著互聯網技術進步,直播帶貨成為農產品銷售的革新方式,成為促進農民增收的有效手段。消費者評論映射了他們的真實感受與需求,分析這些數據能深入挖掘消費者心理。
抖音作為全球性短視頻平臺,為研究提供了豐富的數據源。為確保數據的全面性,選取多個高人氣直播視頻的評論作為樣本。利用Python自動化采集工具,能夠迅速獲取大量數據,并自動整理進Excel以便初步處理。采集抖音數據時,需定位目標視頻地址和用戶Cookie信息,再嵌入代碼請求頭中,以實現模擬登錄等操作。此次采集涉及IP歸屬地、評論詳情、ID、時間、用戶昵稱和主頁鏈接等關鍵信息。
1.2 研究方法
采用文獻資料法、數據挖掘法和機器學習文本挖掘法3種研究方法。1) 文獻資料法。主要通過中國知網、萬方數據庫、百度學術等學術網站檢索關鍵詞“助農電商直播”“評論”“滿意度”等,總結之前學者的研究成果,作為研究的理論基礎和參考,并確定研究方向和創新點。2) 數據挖掘法。利用Python爬蟲軟件收集抖音等助農電商直播消費者評論數據,采用統計分析、機器學習等方法分析影響消費者滿意度的因素。大量真實的用戶評價數據提升了研究的可信度。3) 機器學習文本挖掘法。利用算法和統計模型在無明確編程指導下執行任務的研究領域。結合信息技術、統計學、模式識別等多學科技術,從非結構化文本數據中提取有價值的信息[3]。這一過程有助于挖掘出用戶可能認為新穎且有價值的未知知識。文本挖掘的核心目標是處理模糊和非結構化的文本數據,并要求綜合運用多種技術和方法進行數據處理和分析。主要流程包括文本數據采集、預處理、建模和評估。
1.3 數據預處理
共處理28 429條評論數據。具體步驟為:一是清洗數據,剔除無效評論,標準化語言并去除特殊字符;二是分詞簡化文本復雜性;三是剔除低意義停用詞;四是進行語言潤色,提高表達清晰度。這樣可確保后續自然語言處理任務的準確性和深度。
2 研究結果與分析
2.1 高頻詞提取結果
高頻詞分析揭示了消費者對直播助農項目的看法,有助于理解其滿意度和偏好。采用TF-IDF法提取高頻詞,可為優化產品、服務及市場策略提供信息。TF-IDF 由詞頻(Inverse Document Frequency,IDF)和逆文檔頻率(IDF)組成。TF衡量詞在文檔中的頻率,而IDF 反映詞在整個文檔集合中的稀有程度。兩者相乘得到的權重值越大,詞在文檔中的重要性就越高。
利用jieba分詞的analyse.extract_tags函數計算詞語的TF-IDF值,從而提取關鍵詞。通過分析發現,值低于0.003 2的詞匯代表性較弱。因此,設定這一閾值,篩選出64個高頻關鍵詞。在去除與主題不緊密相關的詞匯后,結合研究進展,對剩余高頻詞進行解讀。
高頻詞提取結果顯示,“土豆”“洋芋”“玉米”“品種”等反映農產品多樣性;“好吃”“不好吃”“喜歡”等揭示消費者對口味的感受;“農產品”“便宜”“價格”等指向消費者對定價的關注;“網紅”“直播”“助農”等反映活動氛圍;“貴州”“湖南”等地名顯示產品地理來源。
綜合分析這些關鍵詞,能夠更清晰地理解消費者對助農直播的滿意度。這些關鍵詞提供了關于消費者偏好和關注點的重要線索。
2.2 LDA 主題模型語義挖掘結果
為了深入探索影響助農直播消費者滿意度的因素,對相關評論的主題語義進行挖掘、分類。經過相關信息檢索可知當下的主題語義模型有隱性語義分析(LSI)、概率隱性語義分析(PLSI)、潛在狄利克雷分布(LDA)等。研究所應用的LDA模型是一種典型的概率生成性模型。LDA假設每個文檔由一組主題組成,每個主題又由一組詞語組成。LDA通過統計和概率推斷的方法進行文檔主題生成,是一種常見的無監督機器學習技術,主要應用于識別在文檔中隱藏的主題信息。LDA主題模型中,多個詞匯按照一定規律混合成為一個主題,若干個主題共同構成了整個文檔。LDA模型的基本思想是將文檔集中的每篇文檔視為一個詞頻向量,這些詞頻向量是由一組詞匯構成的,而LDA的目標就是找到這組詞匯背后的主題結構。具體來說,LDA假設文檔集中的每篇文檔都是由一定數量的主題按照一定比例混合而成的,而每個主題又是由一定數量的詞匯按照一定比例混合而成的。通過訓練LDA模型,可以得到文檔—主題—詞匯分布,進而可以推斷出每篇文檔的主題分布及每個主題下的詞匯分布[4]。
利用Python中gensim庫等可以進行LDA主題模型分類。LDA主題模型結果見表1。
由表1可知,從助農直播消費者評論的LDA分析中,得出5個影響滿意度的主題:品種、口味、價格、直播氛圍和產地。這與高頻詞結果一致,直觀展示了消費者滿意度因素。
2.3 助農直播消費者滿意度影響因素分析
市場趨勢和消費者偏好對于農產品品種的選擇至關重要。分析顯示,“土豆”和“洋芋”這兩種受歡迎的蔬菜,因其在品種類別中占據高權重位置,體現了其在市場上的重要性。口味是決定農產品受歡迎度的關鍵,“洋芋”和“土豆”在口味類別中的重要地位,顯示了其在消費者心中的重要性。電商平臺必須保證這些產品的口感和品質,并定期收集反饋以優化產品。價格敏感的消費者會尋求經濟實惠且質量上乘的產品。電商平臺應采取合理的定價策略,提供透明的價格和真實的評價以建立信任。直播銷售已成為強大的營銷工具,電商平臺應與有影響力的“網紅”合作,通過直播推廣產品,以增強購物樂趣和緊迫性,提高品牌曝光率和銷售量。農產品產地是消費者選擇的關鍵因素。電商平臺應強化農產品地理標識的展示和宣傳,明確標示產品產地,傳遞新鮮度和品質保證。采用故事化營銷,講述農產品的起源、生長歷程和生產者付出,以增加產品吸引力和情感價值。
3 結語
消費者購買決策受多方面因素影響,如追求性價比、口感決定購買行為、關注原產地、個性化需求增強、購物便捷性和效率受重視等,而直播營銷為消費者提供了新的購物體驗。今后直播助農重點研究方向為:制定競爭性定價策略,提高產品性價比;重視產品品質與多樣性,優化購物體驗;突出產地特色與產品故事,加強品牌影響力。
參考文獻
[1] 陳智.大數據背景下農產品可追溯信息對顧客滿意度的影響——產品知識的多群組分析[J].商業經濟研究,2022(1):131-134.
[2] 劉子寒,符少玲.消費者滿意度綜述[J].商業經濟研究,2023(23):61-64.
[3] 鄭霞忠,劉奕成,邵波,等.基于文本挖掘的水電工程施工物體打擊事故致因分析[J].中國安全科學學報,2024,34(4):50-57.
[4] 宋軍,肖超.上市公司年報風險信息披露與市場風險——基于LDA主題模型的文本研究[J].復旦學報:社會科學版,2024,66(2):165-176.