劉 海,盧 慧,阮金花,田丙強,胡守忠
(上海工程技術大學 服裝學院,上海 201620)
研究與技術
基于“用戶畫像”挖掘的精準營銷細分模型研究
劉 海,盧 慧,阮金花,田丙強,胡守忠
(上海工程技術大學 服裝學院,上海 201620)
針對大數據時代服裝企業不知道怎樣利用大數據進行營銷的問題,基于4C理論構建了“用戶畫像”數據庫,通過對數據庫的挖掘來進行消費者群體細分。在此基礎上,從營銷的角度構建了精準營銷細分模型,并以三槍集團的營銷數據為對象,利用SPSS工具對身高這一細分因素進行了挖掘。研究表明:大數據時代,以“用戶畫像”數據庫挖掘為基礎的精準營銷細分模型,能夠重構消費者的需求、精準定位消費者群體,并能為企業實施精準營銷提供科學的決策依據。
大數據;用戶畫像;消費者細分;數據挖掘;精準營銷
隨著網絡與信息技術的快速發展,企業之間、企業與消費者之間都習慣了通過互聯網進行交易,由此帶來了電子商務的蓬勃發展,并產生了大量的消費數據。黃升民等[1]通過對大數據背景下營銷體系的解構與重構,認為數據的使用貫穿在整個營銷過程的始末,對于營銷的效果起著至關重要的作用。
大數據時代,消費者在網上的瀏覽、點擊、留言、評論等碎片化的行為軌跡被整理搜集并存儲起來,這些行為軌跡直接或間接反映了消費者的性格、習慣、態度等信息,能被用來為企業實施營銷提供決策依據。而這些碎片化的、整理存儲在數據庫中的數據,能被企業用來完整地重構消費者的需求。這些從全方位、立體性的記錄消費者的數據,被稱之為“用戶畫像”[2-3]。
《大數據時代》的作者維克托·邁爾-舍恩伯格[4]認為,大數據的簡單算法比小數據的復雜算法更有效,大數據讓人們不再期待精準性,而是混雜性。怎樣從混雜性的大數據中挖掘有價值的相關信息,成為企業必須思考的問題。因此,由這些數據組成的“用戶畫像”,不僅再現了消費者的全貌,反映了消費者的需求,而且是企業挖掘消費者需求與價值、進行消費者細分、實施精準營銷及其他活動的基礎。
傳統營銷模式下,筆者通過訪談、調研的方式來探知消費者,做出假設,并根據這些數據構建模型,用科學化的方法對消費需求進行驗證并做出預測。大數據時代,當人們有能力解讀“全樣本”,從更多角度精細地描述消費者,并且數據可以實時、動態獲得的時候,消費需求的挖掘方式也要隨之改變。
1.1 “用戶畫像”數據庫的構建
傳統營銷模式下,數據來源于企業的營銷記錄,隨著網絡及電子商務的發展,消費者的網上痕跡也化為數據,成為企業營銷數據的來源之一。構建“用戶畫像”所需要的數據,除了傳統上從數據庫中獲得的數據、營銷平臺搜集的數據、歷史數據[5]之外,還要盡可能獲取消費者在互聯網社區上的一些視頻、圖片等信息(比如新浪微博)及地理空間信息等數據[6],這些數據能夠從側面反映消費者的態度、偏好等,使營銷更精確。
對于用來存儲“用戶畫像”所需要數據的數據庫有很多,本文選擇SQL Server數據庫。它是一款能用于大型聯機事務處理、數據倉庫和電子商務等方面應用的數據庫平臺,它不僅能在企業內部共享服務器,查詢各種數據,還能夠為企業降低管理、生產等各方面的成本[7]。
本文的“用戶畫像”是在“4C”理論的基礎上,結合消費者的需求特點,通過查閱文獻、調研、訪談并在專家的建議下構建起來的(圖1)。

圖1 用戶畫像Fig.1 Persona
“4C”理論包括消費者、成本、便利和溝通[8]。其中,消費者就是充分了解、研究、分析消費者的需求,可以從消費者的年齡、性別、職業等基本信息角度理解;而成本不僅指消費者愿意支付的價格成本,還包括時間、體力和精神成本;便利則主要指的是方便消費者購買及使用,這兩個因素可以從消費行為角度理解,包括網頁瀏覽時間、點擊記錄等購買前的信息搜集行為及購買記錄等行為;溝通則是通過互動的方式將消費者與企業結合在一起,這樣企業就能知道消費者的忠誠度、滿意度等,可以從購買后的評價及溝通平臺等角度理解。
由于“用戶畫像”屬于信息層面,因此需要用數據庫的語言進行設計,也就是需要用實體-聯系圖(entity-relation diagram,E-R圖)來完成。E-R圖提供了表示實體(即數據對象)、屬性和聯系的方法,用來描述現實世界的概念模型。用來描述“用戶畫像”的E-R圖如圖2所示。
1.2 市場營銷中的數據挖掘方法
“用戶畫像”構建完之后,需要對數據進行挖掘,這也是大數據時代數據分析最重要的一步,大數據分析,最關鍵的就是從不相關的數據到相關的關系。如何從大量不相關的數據發生聯系成為相關的關系,這就需要進行數據挖掘。
數據挖掘方法有很多,對于營銷來說,主要有聚類、分類、關聯規則、決策樹和協同過濾等。其中,分類主要用來對銷售數據分析,其目的是通過構建分類模型,以此來確定顧客的興趣和消費傾向,然后將數據分成給定的類別,從而推斷消費者下一步的消費行為;關聯規則主要是利用產品相似性進行推薦營銷,比如經典的啤酒與尿布的故事,就是利用關聯規則成功營銷的案例;決策樹主要用來保留顧客分析和顧客流失率分析,而聚類則是根據“物以類聚,人以群分”的思路,根據產品的相似性、顧客的群特征,對消費者進行分類。聚類方法包括許多,像基于層次的聚類、基于密度的聚類、基于網格的聚類,聚類可以用來對客戶群體進行分類、對客戶背景分析、對客戶購買趨勢預測等。

圖2 “用戶畫像”數據庫E-R圖Fig.2 E-R diagram of “persona” database
1.3 消費者細分因素的確定
消費者細分是一個陳舊的話題,但是在大數據時代,在人們擁有了更多的數據之后,借助更好的挖掘工具、分析工具,就能夠幫助企業對網上消費者進行全面的追蹤及精細的劃分,在準確地劃分群體之后,通過挖掘消費需求又可以進行個性化的精準營銷。大數據時代,消費者細分因素的確定是以“用戶畫像”為基礎的。傳統細分主要基于兩個角度,消費者角度和產品角度[9]。消費者角度就是以消費者為研究重點,主要從消費者的不同側面來細分消費群體;產品角度就是以產品為導向的市場細分,為企業制定營銷決策用。因此,細分的標準不同就會有不同的市場適用性[10]。
總之,從消費者角度來說,市場細分的依據主要有三方面:人口特征、行為特征和心理特征[11]。
人口特征因素主要包括性別、年齡、職業、地區及婚姻狀況[12]。通過以往的文獻可知,性別、年齡不同,消費需求也不同;消費者的教育程度、收入越高,購買新產品的可能性越高[13];而婚姻狀況對消費者的消費習慣也會產生影響[14]。
行為特征因素的選取主要參照消費者購買決策及專家意見來獲取并確定的。消費者在購買決策過程中大致經歷需求誘發、信息搜集、比較選擇、購買決策、購后評價五個階段[15]。
心理特征因素主要包括偏好、態度和價值三個主要方面。偏好方面不僅包括消費者對顏色、價格等與產品有關的偏好,還包括消費者的一些行為偏好,態度指的是消費者的滿意度與忠誠度。而價值則主要指的是消費者的感知價值[16],消費者所感覺到的、一些與心理有關的利益[17]、價值等方面。
綜上所述,構建消費者細分因素模型如表1所示。

表1 消費者細分因素模型Tab.1 Consumer segmentation factors model
2.1 精準營銷細分模型的構建
大數據時代,構建精準營銷體系模型如圖3所示。
精準營銷的核心是以消費者為中心,精確和準確地滿足消費者的需求。大數據時代下,構建“用戶畫像”數據庫的目的就是為了全面、準確地描述消費者,用數據重構消費者的全貌,消費者的一切需求、偏好、動機都能利用數據挖掘技術從“用戶畫像”數據庫中提取出來,再通過消費者群體細分形成對營銷有價值的信息,從而為企業實施精準營銷提供有效的建議。精準營銷策略實施之后或者在實施過程之中,企業也可以通過與消費者互動溝通、消費者購買后的評價等數據查看營銷的效果,并將這些效果反饋到“用戶畫像”數據庫中,以便隨時改進營銷策略。
在整個精準營銷體系中,精準營銷策略的實施是以精準營銷細分模型為基礎的,精準細分模型的構建是整個精準營銷體系中最重要的一步。
傳統營銷模式下,人們是以“4P”理論(產品、渠道、價格、促銷)進行營銷的,大數據時代,營銷的理論基礎也不會脫離“4P”理論。基于數據挖掘及消費者細分模型的基礎上,本文從消費者、產品、購買行為、服務4個營銷的角度,重新細分影響因素,構建精準營銷細分模型進行營銷。精準營銷細分模型如表2所示。

表2 精準營銷細分模型Tab.2 Precision marketing segmentation model
2.2 基于兒童身高的精準營銷細分群體驗證
因為企業的營銷數據屬于商業機密,企業一般不會輕易給外人使用,因此憑借筆者所在學院與上海三槍集團的合作關系,采用三槍集團旗下迪士尼網上品牌的銷售數據做驗證分析。
限于時間與能力的原因,取上海三槍迪士尼品牌2014年全年的網上營銷數據作為全樣本進行分析,并以身高(服裝號型中的“號”表示人體的身高,“型”表示人體的圍度)這一細分因素為例,對數據進行處理并驗證。
對獲得的數據進行簡單處理之后,導入到SQL Server2012 數據庫中,其各個結構如表3所示。
根據GB/T 1335.3—2009《服裝號型 兒童》的規定,將兒童身高分為三檔,身高52~80 cm為嬰兒,身高以7 cm分檔;身高80~130 cm為兒童,身高以10 cm分檔;身高135~155 cm為女童及身135~160 cm為男童,身高以5 cm分檔。
第三檔分男女,主要在于胸圍出現了變化,考慮到本文做的主要是身高因素的細分,以及在兒童時期性別對于身高無明顯影響的情況下,結合三槍集團以10 cm作為分檔的情況,現將數據做統一處理:調取SQL Server數據庫中號型表中的數據,導出到Excel表中,剔除身高號小于60 cm的(包括空值)數據,剔除身高高于170 cm的數據,得到165 391條記錄數據,然后將處理好的Excel表中的數據導入到SPSS中,并設置變量名為身高,度量標準為度量。

表3 數據庫中的“號”型表結構Tab.3 Table structure of size designation in database
首先,對這些數據進行二階聚類,因為二階聚類是一個探索性的分析工具,除了能夠高效率地分析大數據集及分類變量和連續變量都可以參與二階聚類分析等優點之外,它還可以自動確定分類數。所以,先運用二階聚類的方法確定最優的分類數。結果如圖4所示。

圖4 二階聚類結果Fig.4 Result of two-order clustering
從圖4可知,數據被自動分成6類,聚類的平均輪廓值約為0.9(其范圍值為-1.0~1.0,值越大越好),說明聚類效果非常好。
如果只是從數據的角度看,效果是非常好的。但是如果結合服裝尺碼的背景來看,效果是不理想的。企業原來的劃分是以10 cm為單位,共有12組尺寸。精準營銷的理想情況是,以1 cm,甚至0.5 cm為分檔做分類,但是考慮到企業的實際成本及定位(不是高級定制)問題,這是不可能實現的,因此希望盡可能在盈利的情況下細分群體。如果只是按照6組來劃分,非但沒有精細劃分,而且更“粗糙”了,因此需要根據結果重新劃分。考慮到企業原來的12類分類,以及二階聚類方法分出的6類中100 cm以下訂單數較少并只分出一類的情況(圖5),暫時按照10類進行聚類。

圖5 二階聚類單元分布Fig.5 Distribution of two-order clustering unit
選用K-均值聚類法,運用SPSS對數據重新進行聚類。設置聚類數為10,進行聚類。結果如表4所示。
根據表4可知,2、4、6、9這四類,明顯案例數較少,而且這四類屬于身高100 cm以下、大約2歲以下的兒童,這部分兒童顯然不是三槍迪士尼品牌定位的主要消費群體。3、5、7、8、10這五類,身高在110~160 cm,年齡在4~14歲,這五類身高群體是主要的訂單來源,也是三槍迪士尼品牌主要的客戶群。
參照其他童裝品牌的分類情況,H&M品牌童裝以身高128 cm(約8歲)為分界點,128 cm以前以10 cm分檔,128 cm以后以5 cm分檔;ZARA品牌童裝以身高150 cm(約11歲)為分界點,150 cm以前以10 cm分檔,150 cm以后以5 cm分檔,再結合GB/T 1335.3—2009《服裝號型 兒童》分類標準及三槍迪士尼品牌的定位,建議:以130 cm為分界點,130 cm以前以10 cm分檔,130 cm以后以5 cm分檔。這樣,三槍迪士尼童裝品牌的分檔,身高110 cm以后,分為11類,110 cm以前可以根據企業的定位,保持不變繼續分為5類或是更少。

表4 最終聚類中心Tab.4 The final clustering center
因此,通過挖掘三槍集團迪士尼童裝的號型數據證明,運用聚類的方法,能夠將童裝的號型根據消費者的需求重新細分,并且重新細分的消費者人群,企業不僅可以比較精準的滿足其需求,還能夠節約企業的營銷成本,方便生產。
大數據時代,基于“用戶畫像”數據庫基礎上的精準營銷,不是對經典營銷理論和方法的顛覆,而是在對數據深入理解的基礎上,重新理解消費者,精細劃分,挖掘消費需求。本文通過構建“用戶畫像”數據庫挖掘消費需求,并在整理消費者細分因素的基礎上,構建了大數據時代精準營銷細分模型,不僅為企業實施精準營銷策略提供了借鑒,同時也為大數據時代研究精準營銷提供了一點思路。
雖然本文精準營銷細分模型的構建不是很全面,有關模型的驗證只是以身高為例進行驗證,并且研究不是很深入,但是后續的有關其他因素的驗證也會繼續做下去。企業可根據自身的情況選擇某一細分因素或某幾個細分因素進行應用,比如性別與地區的關系,地區與顏色、款式的關系等。當企業利用已有的數據挖掘出某一地區的人們偏愛某一顏色時,對企業而言,不管是營銷策略的制定還是庫存的管理,企業都可以處理得游刃有余。同時,關于在數據挖掘基礎上的精準營銷細分研究,其余學者也可以繼續研究下去。
[1]黃升民,劉珊.大數據背景下營銷體系的解構與重構[J].現代傳播,2012(11):13-20. HUANG Shengmin, LIU Shan. Deconstruction and reconstruction of the marketing system under the background of big data[J]. Modern Communcation,2012(11):13-20.
[2]謝然.從五大行業案例看大數據的應用邏輯[J].互聯網周刊,2015(2):30-35. XIE Ran. Seeing the application logic from the five sectors of large data case[J]. China Internet Weekly,2015(2):30-35.
[3]張鵬,劉譯璟.為消費者畫像[J].銷售與市場:渠道版,2013(9):30-32. ZHANG Peng, LIU Yijing. Consumer map[J]. China Market: Channel Edition,2013(9):30-32.
[4]維克托·邁爾-舍恩伯格,肯尼斯·庫克耶.大數據時代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013:7-30. MAYER-SCH?NBERGER V, CUKIER K. Big Data: a Revolution That Will Transform How We Live, Work, and Think[M]. Hangzhou: Zhejiang People Press,2013:7-30.
[5]段云峰,吳唯寧,李劍威,等.數據倉庫及其在電信領域中的應用[M].北京:電子工業出版社,2003:9-14. DUAN Yunfeng, WU Weining, LI Jianwei, et al. Data Warehouse and Its Application in the Field of Telecommunications[M]. Beijing: Electronic Industry Press,2003:9-14.
[6]史忠植.知識發現[M].北京:清華大學出版社,2011:13-15. SHI Zhongzhi, Knowledge Discovery[M]. Beijing: Tsinghua University Press,2011:13-15.
[7]廖夢怡,王金柱.SQL Server 2012寶典[M].北京:電子工業出版社,2014:2-8. LIAO Mengyi, WANG Jinzhu, Book of SQL Server 2012[M]. Beijing: Electronic Industry Press,2014:2-8.
[8]劉向暉,網絡營銷導論[M].北京:清華大學出版社,2005:40-46. LIU Xianghui, Introduction of Network Marketing[M]. Beijing: Tsinghua University Press,2005:40-46.
[9]WORCESTER R M, JOHN D H. Consumer market research handbook, third revised and enlarged edition[C]∥Elsevier Science Publishers, BV.1986:387-423.
[10]何宜軍.基于4C理論的網絡營銷策略研究[J].企業研究,2014(16):35-36. HE Yijun. Research of network marketing strategy based on the theory of 4C[J]. Business Research,2014(16):35-36.
[11]齊麗云,汪克夷,陸英賢,等.基于消費行為的市場細分模型構建與驗證:以移動通信行業為例[J].管理學報,2009,6(6):805-811. QI Liyun, WANG Keyi, LU Yingxian, et al. Model of market segmentation based on consumer behavior: the mobile communication industry perspective[J]. Chinese Journal of Management,2009,6(6):805-811.
[12]劉英姿,吳昊.客戶細分方法研究綜述[J].管理工程學報,2006,20(1):53-57. LIU Yingzi, WU Hao. A summarization of customer segmentation methods[J]. Journal of Industrial Engineering and Engineering Management,2006,20(1):53-57.
[13]WIND Y. Issues and advances in segmentation research[J]. Journal of Marketing Research,1978(8):317-337.
[14]雪鷹傳奇.電商大數據:用數據驅動電商和商業案例解析[M].北京:電子工業出版社,2014:19-20. Xueying Chuanqi. The Big Data of E-commence, Data Driven Business and Business Case Analysis[M]. Beijing: Electronic Industry Press,2014:19-20.
[15]劉業政,姜元春,張結魁,等.網絡消費者行為:理論方法及應用[M].北京:科學出版社,2011:20-30. LIU Yezheng, JIANG Yuanchun, ZHANG Jiekui, et al. Network Consumer Behavior: Theory and Application[M]. Beijing: Science Press,2011:20-30.
[16]呂紅艷.基于顧客價值的市場細分研究[D].天津:天津大學,2007:5-8. Lü Hongyan. Research of Market Ssegmentation Based on the Customer Value[D]. Tianjin: Tianjin University,2007:5-8.
[17]武新麗,基于利益的網絡市場細分研究[D].南寧:廣西大學,2006:6-11. WU Xinli. Research of Network Market Segmentation Based on the Profit[D]. Nanning: Guangxi University, 2006:6-11.
Research on Precision Marketing Segmentation Model Based on Mining “Persona”
LIU Hai, LU Hui, RUAN Jinhua, TIAN Bingqiang, HU Shouzhong
(College of Fashion, Shanghai University of Engineering Science, Shanghai 201620, China)
For the issue that clothing companies do not know how to use big data for marketing in the era of big data, this paper builds “persona” database based on the theory of 4C, and segments consumers through mining the database. On this basis, a precision marketing segmentation model is established from marketing perspective. Besides, this paper takes marketing date of Three Gun Group as the object and utilizes SPSS tool to mine height. The researches show in the era of big data, the precision marketing segmentation model based on the data mining of “persona” can reconstruct the demands of consumers, precisely position the consumer groups and provide scientific basis for enterprises to implement the strategy of precision marketing.
big data; persona; consumer segmentation; data mining; precision marketing
2015-05-21;
2015-11-04
上海市科委公共服務平臺項目(13DZ2294300);上海市教委科研創新項目(13ZS173);上海教育科學研究項目(B14035);上海教委優青項目(ZZGJD12017)

doi.org/10.3969/j.issn.1001-7003.2015.12.008
TS941.1
A
1001-7003(2015)12-0037-06 引用頁碼: 121108