余偉 劉蓮 陶云杰
摘要:如何幫助電子商務企業有效地從海量數據中提取其所需要的信息,關鍵在于挖掘出客戶最喜愛購買的產品關鍵詞組合,使之能夠提供精準的營銷信息。本文根據電子商務平臺提供的數據,對某家具企業的熱銷關鍵詞進行數據挖掘,通過聚類分析法,揭示出這些關鍵詞之間的親疏關系,為精準營銷提供有益參考。
關鍵詞:共詞聚類;家具;電子商務;數據挖掘
引言
許多家具品牌依賴于家居或者建材大賣場的活動來進行推廣,家具的銷售渠道依然是傳統的經銷商渠道。但是市場競爭已經變得越來越猛烈,只會堅守傳統,不做任何創新的家具廠商必然會遭到社會的淘汰,家具電子商務其實就是銷售渠道的創新。飛速壯大的電商市場給家具行業帶來了新的發展契機,家具電商利用便捷的線上支付,聯合線上個性化定制為消費者提供了更多的可靠選擇。
數據挖掘在各行各業的使用效益已經越來越突出,而在競爭激烈的傳統家具行業,若誰能率先挖掘出大數據下隱藏的秘密,通過不斷地創新和利用來窺探規律,誰就更有把握引領一個行業的未來。如果家具電商能利用數據挖掘掘取用戶最需要的產品,結合互聯網營銷手段,通過產品的不斷迭代和快速的線下配送服務,將能為消費者帶來更便捷和更貼心的消費體驗。
1、關鍵詞聚類分析流程
共詞分析法在20多年的發展中,被廣泛運用到了科學計量學、人工智能、信息系統、信息科學和信息檢索等多個領域。聚類分析是共詞分析法中最常用的一種方法,在統計的基礎上對這些詞進行分層聚類,揭示這些詞之間的親緣關系,進而分析它們所在類團的結構變化。其分析流程如下。
(1)收集相關數據:數據挖掘要選取要能確保數據的真實性和準確性。本文所需要的數據則直接來源于淘寶指數和天貓旗艦店的實際銷售記錄。
(2)轉換為計量軟件可以識別的數據格式:不同的行業有不同的數據記錄方式,需要將這些格式轉換為對應軟件系統特有的分析格式,用以統一處理。
(3)數據預處理:對收集數據中存在的問題進行預處理,例如數據的格式不統一、近義詞重復等。如關鍵詞中的“成套家具”和“整套家具”代表同一個含義,應視為同一個關鍵詞,諸如此類的進行預處理。
(4)利用軟件進行分析:借助MATLAB和UCINET軟件,得到直觀的的共詞矩陣和聚類圖,分析這些數據之間的相互關系,找出聚類關鍵詞,為精準營銷提供依據。
2、熱銷關鍵詞的提取與分析
以林氏木業為例,其于2007年建立,是與阿里巴巴共同成長的家具電商企業,在2014年八月首次創造出線上線下電子商務模式,全面安排線下渠道,更注重體驗式的銷售模式。本文參考的淘寶指數于2011年年底上線,是淘寶官方提供的免費的數據分享平臺,用戶可以通過它來窺探消費者在淘寶的購物數據,并能了解消費者的購物趨勢。通過淘寶指數的真實記錄可獲取消費者的消費意向、年齡統計、地區分布、工作層次情況等。
結合林氏木業天貓官方旗艦店的總銷量和淘寶指數,選取所展出的前50的熱銷產品,并結合不同季度賣出的不同產品做出統計和搜集,共整理出其中最熱銷產品的一百組關鍵詞。利用MATLAB軟件建對一百組關鍵詞進行統計并按照拼音排序,共計有158個不重復關鍵詞。
統計158個關鍵詞出現的不同頻數,排名前三的關鍵詞分別共出現了45次、 36次、29次,即關鍵詞“簡約、小戶型、現代”,為客戶選擇的首要考慮性能。其中出現頻次排名前20的關鍵詞可作為研究林氏木業客戶的最大需求,為“簡約、小戶型、現代、環保、白色、真皮、儲物床、布藝、轉角沙發、梳妝臺、雙人床、韓式、多功能、歐式、創意、儲物柜、田園風、鋼化玻璃、組合、電視柜。”
3、家具熱銷關鍵詞的網絡中心性分析
UCINET網絡分析軟件有很強的矩陣分析功能,是目前深受歡迎的、便于使用的的社會網絡分析軟件。其程序本身不包括圖形可視化程序,但數據可以被處理,并發出至相關繪圖軟件繪制圖表。UCINET可進行中心性、子群的網絡結構分析。
從圖1可以看出,有很多不同大小的方塊色點,色點的面積越大表示其與其他的存在關系越密切。如面積最大的點代表的關鍵詞“小戶型”,在所有158個熱銷關鍵詞中擁有最大的中心性。可選取其中心權力排名前20的關鍵詞作為營銷參考:“小戶型、簡約、床墊、現代、雙人床、真皮、儲物床、歐式、梳妝臺、韓式、板式床、多功能、中式、環保、布藝、床邊柜、轉角沙發、組合、創意。”
4、家具熱銷關鍵詞的派系分析
多數網絡研究者都堅持如下結構觀,即社會結構是一種存在于社會行為者之間的關系模式。網絡分析者給出一系列算法,用來分析網絡的整體結構如何由小群體結構(如n-派系、n-宗派、k-叢)組成。社會網絡分析者的任務之一是對“社會群體”概念進行形式化處理。在他們看來,能夠通過網絡里行為者子群的相關特征來刻畫、研究社會群體。
從圖2可以看出不同派系的頻數統計,共有274個派系,其中序號1,2,4,6,10,12,14等63個關鍵詞不隸屬于任何派系。群體共享成員(group co-membership method)方法產生一個包含如下的大群體{2,27,45,50,59,61,123,132,150…}以及其他分立成員。舉例來說,從網絡{3,27,45,61,132,150}、{27,45,61,109,132,150}、{8,27,61,132,150}、{50,59,61, 132,150}等可以看出,61、132和150的這個子派系處于重要地位。這與之前的數據分析的結果顯然是一致的。
通過以上的數據分析,我們從中可以看出客戶在選擇電商平臺購買林氏木業的家具時的一些需求。客戶多在考慮小戶型家具的條件下,會傾向于選擇簡約、現代和環保的家具,其中多以白色為主,且消費者對床和沙發的需求量比較大,在選擇這些產品的時候,多會考慮真皮或者布藝材質的。
消費者在考慮美觀的同時也會注重家具的實用性,比如多功能性、可拆洗性、儲物性。事實上,林氏木業的主打產品便一直是小戶型布藝轉角沙發,其余的熱銷產品包括環保鋼化玻璃茶幾和白色簡約儲物雙人床。該研究可以為林氏木業電商家具產品提供針對性的生產和營銷優化對策。
5、結論
大數據以及電子商務給人類生活帶來了創新性變革,本文以家具行業為例,采集網絡銷售數據,結合淘寶指數,用共詞聚類法對消費者網上購買家具的行為進行了研究,通過聚類分析出消費者的購買傾向,研究這些家具關鍵詞的中心性和派系等。家具行業企業應以消費者的主要的購買需求為依據,大力推廣其最理想的家具關鍵詞組合,在質量保障的前提下做好售后,并結合線上和線下,抓住客戶的深層欲望,同時提高企業的個性化定制能力,從而提升企業品牌的產品影響力,為企業獲取更大的利益。
參考文獻:
[1] 趙穎穎,張晗,趙玉虹.基于共詞分析的國外轉化醫學研究熱點[J].醫學信息學雜志,2015,36(2):51-55.
[2] 曹玲,楊靜,夏嚴.國內競爭情報領域研究論文的共詞聚類分析[J].情報科學,2010(6):923-925.
[3] 李曉宇.基于共詞聚類的國內物流研究現狀分析[J].物流科技, 2016,39(11):13-15.
[4] 柴彥.基于共詞聚類分析的科技查新研究述評[J].情報探索, 2017(2):123-128.
[5] 溫菊屏,鐘勇.圖聚類的算法及其在社會關系網絡中的應用[J].計算機應用與軟件,2012,29(02):161-163+178.
作者簡介:
余偉,博士,講師,現就職于南京林業大學汽車與交通工程學院,主要研究方向為電子商務、物流工程;
劉蓮,本科生,南京林業大學汽車與交通工程學院;
陶云杰,本科生,南京林業大學汽車與交通工程學院。