李思荃 劉新全
【摘? 要】 為了了解我國目前電子商務領域數據挖掘技術的應用研究現狀與前沿,文章運用文獻計量分析法和社會網絡分析法,對 Web of Science 和 CNKI 期刊論文中2000-2021年的相關文獻進行研究,對近二十年國內外數據挖掘技術在電子商務領域的應用研究的現狀、熱點及前沿進行了客觀的呈現和分析。研究發現,國內外學者關于電子商務領域數據挖掘技術應用研究熱點基本相同;但是在研究數量方面國外高于國內,但研究廣度上國內與國外差別不大。國內外的研究將會不斷深入,最終相互融合,共同致力于將成熟的數據挖掘技術結合實際企業銷售、服務環節,實現最高的企業服務質量,最佳的企業效益水平。
【關鍵詞】 數據挖掘;電子商務;文獻統計法
隨著世界信息化水平的整體上升,計算機技術與網絡技術不斷普及,用戶數據量在不斷增加。據IDC預測,到2025年全球數據圈將擴展至163ZB9(1ZB等于1萬億GB),這相當于2016年所產生16.1ZB數據的10倍。面對每日高速增長的數據量,采用普通的統計分析方法進行分析已經無法滿足企業要求,因此,數據挖掘技術應運而生。電商企業中應用數據挖掘技術的案例有很多,如分析挖掘網站內容,進行網站設計、收集用戶數據,進行客戶管理、分析廣告有效性,進行網絡廣告的精準投放等。在大數據時代,電子商務業務日益增多,數據挖掘技術在電商企業市場發展空間巨大。由于各個電子商務網站在交易狀態下產生大量數據記錄,為了實現企業核心發展優勢的快速提高,可以根據數據分析處理的結果為客戶提供全方位服務。企業必須不斷完善優化,才能獲得更大的進步。
基于此,文章對近二十年的國內外數據挖掘在電子商務領域應用的相關文獻進行梳理、歸納和分析,助力我國學者明確未來的研究方向與研究視角,進而豐富我國數據挖掘技術在電子商務領域中的應用研究成果。
一、數據獲取與研究方法
為了更好地把握大數據在制造業領域應用研究的發展現狀與熱點問題,保證研究的客觀真實,將中國知網CNKI和WOS核心數據庫分別作為國內外數據來源,并采取關鍵詞組合的方式進行檢索。中文文獻的檢索詞為主題→大數據且主題→制造,文獻類別為期刊,來源類別選擇為SCI、EI、CSSCI、CSCD以及核心期刊,限定時間范圍是2000—2022年。英文檢索策略與中文檢索策略一致。為保證研究的可靠新和典型性,剔除會議、論壇等與研究主題關系不密切的文章,最終得到有效文獻共753篇,其中中文文獻為333篇,外文文獻為420篇。
本研究采用文獻計量分析、社會網絡分析等方法,對國內外數據挖掘技術在電子商務領域的應用研究的現狀、熱點以及前沿進行研究分析,在分析過程中運用的對應軟件分別為基于Java語言開發的文獻計量軟件CiteSpace。文獻題錄信息統計分析工具 SATI 以及社會網絡分析軟件Ucinet。
二、國內外研究熱點分析
從CNKI檢索到的論文條目來看,國內數據挖掘在電子商務領域應用研究出現頻率較高的關鍵詞推薦系統、營銷、客戶關系管理、數據處理、協同過濾、商務智能、web數據挖掘等,國內學者對數據挖掘技術在電子商務領域中的研究熱點側重于圍繞電商平臺商品銷售展開探討。在大數據時代,電子商務應用數據挖掘技術的場景在不斷地增加。
從Web of Science數據庫中檢索到的論文條目來看,國外學者對以下問題較為關心,如data warehouse、big data、web mininng、cloud computing、business intelligence、customer management、recommendation等。由此可見,近二十年來,國外的研究學者所關注的研究熱點與國內學者基本相同。
三、國內外研究前沿分析
從CNKI數據庫中檢索到的文獻條目可知,國內從2004年逐漸開始數據挖掘的相關研究,從2004年到2021年出現的高頻關鍵詞有genetic algorithm、cloud computing、utility evaluation、clustering analysis、information management、web data mining等。近年來,電子商務得到了快速發展,同時也出現了許多問題,如孫桂鴻等人(2022) 為了解決生鮮電商中供需不平衡問題,基于數據挖掘,通過問卷調查法和實地調研法,構建了營銷策略與消費者購買意愿的Logistics回歸模型。電商營銷、電商物流配送以及物流配送站點的選擇三者是相輔相成的,缺一不可。Fonseca-Galindo Juan Camilo等人(2022) 以電商物流配送作為研究切入點展開研究針對現實中電子商務物流問題,使用軌跡數據挖掘改善了最后一公里配送路線。董紹斌(2021)則以菜鳥驛站網點選址為研究重點,探究淮安區菜鳥驛站選址空間分布格局及優化方案。雖然網購極大地便利了人們的生活,但是在線購買產品時,商家與客戶的信任關系以及電子商務交易風險問題都需要考慮。因此Tahmid Hasan Pranto等人(2022)提出了一種基于區塊鏈的架構,并使用數據挖掘技術用于檢測欺詐性用戶。Haohua Qing等人(2021)基于數據挖掘進行了跨境電商交易風險分析研究,并經過實證研究表明數據挖掘在預測和掌握跨境電商交易風險數據方面可以發揮理想作用。
電商平臺為了實現點對點精準營銷,需要在大量的數據中尋找到最大客戶價值。王越、鄭奇(2019)通過研究模糊C均值聚類,處理龐大的電子商務用戶數據,挖掘電商核心資源商業價值,從而實現精準營銷。陳娥祥(2022)介紹了如何利用RFM模型進行客戶價值分析。然而進行客戶價值分析的最終目標是使在線商家普遍向其現有和潛在客戶提供強化和差異化的營銷服務,并告訴客戶感興趣的項目(Ehikioya Sylvanus A, Zeng Jinbo(2021),所以宋倩(2022)基于關聯規則算法設計一種電子商務商品推薦系統,并經過測試驗證其實際命中率較高。電商企業不僅要關注當下消費者偏好,還要對未來的消費趨勢進行預測才能提供滿足消費者需求的商品。Zhang Qing等人(2022)經研究表明數據挖掘技術和神經網絡在預測未來消費者購買力信息方面具有較高的準確性。
從Web of Science數據庫中檢索到的論文條目可知,國外數據挖掘在電子商務領域應用研究高頻詞主要集中出現在2013年到2016年,其中包括data mining system、product data management、customer relationship、data warehouse、clickstream history、digital marketing information retrieval等。網購產品使用體驗分享以及在線客戶評論影響著店鋪發展以及客戶的購買決策。Madhumita Guha Majumder等人(2022)使用機器學習和探索性數據分析的評論挖掘方法探討了影響在線評論的主要和次要影響因素。因此良好的客戶關系管理有助于加強優質客戶的培養,提高客戶滿意度與忠誠度(Xiaowei Huang(2021))。為了對客戶進行有效管理,獲取最大企業效益,就需要分析客戶價值,Hui Yang等人(2022)設計并開發了一種基于數據挖掘和電子商務農產品價值特征的電子商務領域客戶價值評價模型。而且為了提升客戶體驗,為不同的客戶提供符合其消費偏好的差異化營銷服務也是必要的。Dilip KumarSharma等人(2022)構建電子商務門戶對產品購買行為進行分類和區分,并根據用戶偏好為其提供產品。而Klas Hjort等人(2013)研究分析了線上購物行為模式,并確定在銷售和退貨模式的基礎上對客戶進行細分可以促進差異化的服務交付方法。更為重要的是,為客戶提供合適的物流配送服務也被視為必要的,但是平衡物流配送速度與配送成本之間的矛盾,已成為電商企業之間競爭的關鍵(Kai Guo(2020))。為了解決這個問題,Chen Chao(2017)等人研究了一個帶有時間窗(2S-LRITW)的食品位置-路由-庫存兩階段問題。但是電商平臺運營過程中也應該注意規范化管理問題。崔慧敏(2021)就云電子商務的安全審計問題進行了探討研究,并提出了在審計實施過程中的難點與痛點。從前人研究可以看出,數據挖掘技術在電商領域得到了廣泛的應用,而Xiaojing Tang(2021)提出電子商務平臺必須不斷完善和簡化,才能更好地開展其業務。
國內外學者的研究內容一直隨著學科的發展深入而變化,但是國內外的研究前沿基本相同。從根本上說,國內外的學者關于數據挖掘在電子商務領域中的應用研究都是圍繞如何為客戶提供優質的服務而展開的。國內學者對于數據挖掘在電子商務領域中的應用研究雖晚于國外學者,但是國內學者卻不甘示弱,用吃苦耐勞的科研精神做出了許多研究成果,為我國的電子商務發展提供了極大的助力。數據挖掘技術在電子商務領域中的建模和優化研究將會不斷深化,數據挖掘技術也將用于解決更加具體、全面的電子商務發展問題。國內外的研究內容終將趨于同化,共同致力于數據挖掘在電子商務領域的應用研究,以提升企業服務質量,增加企業經濟效益。
四、結論與展望
隨著信息技術的發展,數據挖掘技術在電子商務領域的應用受到研究人員和企業的高度關注,為了解國內外數據挖掘技術在電商平臺應用研究的不同,本研究運用文獻計量軟件和社會網絡分析軟件,對國內外期刊數據挖掘技術在電子商務領域中的應用研究進行了整理分析,具體結論如下:
第一,在發文量和重要作者方面,國外的文獻量始終高于國內;國外對數據挖掘技術在電子商務的應用研究早于國內;國內數據挖掘技術的應用研究還處于初級階段,但國外核心作者隊伍已經達到一定規模,科研具有一定的延展性和深入性。
第二,在研究熱點與前沿方面,國內外學者均一直致力于探索電子商務領域的數據挖掘技術的各種可能性。
第三,在未來發展趨勢方面,國內外的研究將會不斷深入,最終相互融合,共同致力于將成熟的數據挖掘技術結合實際的企業銷售、服務環節,實現最高的企業服務質量,最佳的企業效益水平。
本研究通過對比分析國內外期刊關于數據挖掘技術應用在電子商務領域中的現有研究狀況和未來研究趨勢,為未來的研究者提供了可參考的知識范圍并指明了研究方向。不過,本研究對于文章之間的引用與被引用關系并未進行探討,在未來的研究中,將考慮結合文獻的引文分析和共被引分析,更好地把握電子商務數據挖掘技術應用的研究進展與趨勢。
參考文獻:
[1] 孫桂鴻,林麗珠,余玉娥,等. 基于數據挖掘的生鮮電子商務營銷策略研究——以疫情影響的生鮮電商為例[J]. 新經濟,2022(01):114-119.
[2] Fonseca-Galindo J C,Surita G D C,Neto J M,et al. A multi-agent system for solving the dynamic capacitated vehicle routing problem with stochastic customers using trajectory data mining[J/OL]. 2022,https://xueshu.baidu.com/usercenter/paper/show?paperid=1a7m0ta0eq7h0070b1220e90dy068913&site=xueshu_se.
[3] 董紹斌. 電子商務趨勢下基于數據挖掘技術的淮安區菜鳥驛站選址分析[J]. 營銷界,2021(20):40-41.
[4] Pranto T H,Noman A A,Rahaman M,et al. A blockchain,smart contract and data mining based approach toward the betterment of E-Commerce[J/OL]. [2023-09-25]. https://xueshu.baidu.com/usercenter/paper/show?paperid=1m3c0cb0n f000mx08p430a00qr417785.
[5] Haohua Qing,Guokai Zheng,sDie Fu. Risk data analysis of cross border E-commerce transactions based on data mining[J/OL]. [2023-09-25]. https://xueshu.baidu.com/usercenter/paper/show?paperid=1k460jh02u4a0t60bh3m0rq0uf117711&site =xueshu_se.
[6] 王越,鄭奇. 基于模糊聚類的電子商務用戶數據挖掘研究[J]. 計算機產品與流通,2019(03):49.
[7] 陳娥祥. 電子商務數據分析中基于RFM模型的客戶價值分析研究[J]. 特區經濟,2022(02):148-152.
[8] Ehikioya S A,Zeng J. Mining web content usage patterns of electronic commerce transactions for enhanced customer se rvices[J/OL]. 2021,3(11). https://xueshu.baidu.com/usercenter/paper/show?paperid=112h02v0pb7b0vv0980c0tj0yy487201&si te=xueshu_se.