高旭 王聯國 代永強



摘 要:以神經網絡組合模型和K-means的應用對客戶分類和潛在性價值等問題的解決為目的,以CRM理論為前提,對客戶潛在價值指標中更具有針對性的指標進行選擇,行為習慣和屬性兩個方面的指標都涵蓋在內。完成組合模型的建立,對某個數碼網點客戶信息及數據進行研究,對于客觀屬性的分析通過k-means法完成最初的聚類,得到的初類在其內部完成自組織競爭神經網絡預測及訓練,這樣細分聚類就得以完成,然后對聚類結果的特點進行評價,結合具體情況為數碼電子商務客戶關系管理提出更高效合理的措施與建議。
關鍵詞:“互聯網+”;農村電商;客戶價值;k-means;神經網絡
中圖分類號:TP391. 41 文獻標識碼:A DOI:10.3969/j.issn.1003-6970.2021.02.002
本文著錄格式:高旭,王聯國,代永強.“互聯網+”環境下洛陽市農村電商客戶潛在價值研究[J].軟件,2021,42(02):006-010
Research on the Potential Value of Rural E-commerce Customers in Luoyang under the Internet + Environment
GAO Xu, WANG Lianguo, DAI Yongqiang
(College of Information Science and Technology, Gansu Agricultural University, Lanzhou? Gansu? 730070)
【Abstract】:Aiming to use the combination model of k-means and neural network to solve the problem of potential customer value and customer classification. On the basis of the existing CRM theory, select targeted customer potential value indicators, including objective attribute indicators and behavioral habits indicators. Constructing a combined model to analyze the customer data of a digital online store, using the k-means method to perform preliminary clustering of objective attributes, and conducting self-organizing competitive neural network training and prediction within each primary category to subdivide the clustering results. Finally, the characteristics of the clustering results are evaluated and suggestions are made for digital e-commerce customer relationship management.
【Key words】:Internet+;rural e-commerce;value of customer;k-means;Neural Networks
0 引言
2008年起,“互聯網+”成為各行各業的關注焦點和重要發展趨勢。利用互聯網帶來的信息化、現代化特征,傳統行業趁勢謀求打破地域和空間域限制,擴大市場和用戶規模,進一步發展[1]。在傳統農村商貿環境中,農村電子商務在“互聯網+”的背景下孕育發展,成為改善“三農”問題,加快推進城鎮化進程新的解決方案,是農村經濟發展的必然趨勢。
農村電子商務發展對促進鄉村振興,幫助農村脫貧脫困具有重要意義。與其他電子商務領域一樣,在農村電子商務的發展中,電子商務客戶管理是企業發展、獲客和盈利的重要基礎。從商家的角度來分析,為了對價值高的客戶進行辨別、篩選、獲得與維護,保持良好的客戶關系,實現客戶差異性管理,最基礎的工作就是對客戶潛在價值的有效量化。
在電子商務客戶關系管理過程中,數據挖掘通常是以機器學習和計算應用來實現的,不同類型的聚類算法以及神經網絡組合都被引入數據分析模型的提速優化[2]。不過,聚類-神經網絡組織模型在客戶分類以及潛在價值方面的應用并未進行深入和全面的探究。本課題以洛陽市數碼產品電子商務產業為研究對象,對于客戶分類及潛在價值對應的組合模型的建立是通過K-means聚類和自組織競爭人工神經網絡來實現的,同時展開客戶分類和價值分析等深入研究,完成客戶分類與價值分析組合模型的建立,使客戶分類與價值探究能夠有效開展。
1洛陽農村電子商務發展現狀
在網絡信息技術迅速發展和普及的大背景下,電子商務迅速發展,電商規模迅速擴大。但由于通訊覆蓋時間早晚差異、電子產品消費能力、管理能力和信息鴻溝等因素,農村電商尚處于相對落后的狀態。為促進領域發展,國家各部委接連出臺多項政策,鼓勵和扶持農村地區發展電子商務產業[3]。洛陽市也積極響應,大力支持電商發展,撬動當地非城鎮地區經濟發展。
1.1農村電商發展迅速
自2014年起,洛陽市農村電商發展取得卓越成效,洛陽市新安縣、汝陽縣、洛寧縣、嵩縣等四縣在2014-2017年間先后被評為國家級電子商務進農村綜合示范縣。洛陽市電子商務交易總額在2016年高達1710億元,增長幅度很大,具體如圖1所示。洛陽市嵩縣、洛寧縣、汝陽縣和新安縣在2014-2017年間也成為國家級電商走進農村的示范縣。洛陽市在2017年7月前供銷系統完成6個縣級電商運營中心的建立,其中“聚客隆商超”和“洛陽農超”2個電子商務平臺會員數量就已經有14.1萬人,銷售總額共計2.6億元,商品種類超過八千種。欒川縣也完成電商服務平臺,同時建立配套的倉儲物流中心,鄉鎮級和村級電商信息服務中心分別為15個和150個,主要負責宣傳和推廣農村手工藝品、加工品和農副產品等。
1.2農村電商致富效應增強
傳統農村產業面臨“酒香也怕巷子深”的困局,市場和受眾規模有限,傳播、運輸不便,小作坊式生產難以形成品牌化、規模化效應。電子商務渠道一方面為村民帶來更多創業機會和就業崗位,另一方面,也結合區位優勢和當地農業發展形成的特色,給村民帶來了新的致富機會。比如伊濱區龐村鎮在鋼制家具制作方面獨具特色,與知名電商合作以實現伊濱區電商銷售中心的建立,為當地農民提供更多就業機會。宜陽地區農產品別具一格,與阿里巴巴合作建立農村淘寶中心,借助這一電商平臺進行線上銷售農產品;嵩縣地處山區,旅游資源豐富,因此與旅游業網站進行合作實現更好的宣傳,使當地經濟發展速度不斷加快,農民生活水平也隨之提升。
2電子商務客戶價值
2.1客戶價值理論
關于企業戰略決策理論有很多,其中被大部分企業都高度認可的理論之一就是客戶價值理論,該理論具有指導性意義,是客戶關系管理理論的關鍵構成。2016年詹姆斯指出,客戶價值分成期望價值和實際價值兩類,前者是站在客戶角度分析,后者是以企業盈利角度分析。企業辨別這兩個價值能夠對客戶在服務和產品方面的潛在性需求進行更好的挖掘,以便于為客戶提供更有針對性的服務和產品。這兩種價值實際上反映了客戶期望和實際消費之間的差距,對比這兩種價值,可以對客戶滿意度情況進行映射:當期望價值大于所獲實際價值,客戶需求沒有被完全滿足,客戶滿意度較低;反之,實際價值與期望價值之間平衡,甚至大于期望價值,客戶滿意度較高,復購和轉介紹的幾率增大。
2.2客戶潛在價值評價指標選取
以客戶生命周期理論、利潤和RFM分析模型探究為前提,本課題以數碼產品電商特征為核心,對有關數據從行為習慣和客觀屬性兩個方面的指標展開分析。
其中,客觀屬性指標包括年齡、性別、收入等客戶實際信息數據。
行為習慣指標主要由一次消費總額、一次消費產品類型、一次消費時間、客戶喜好、客戶評價、最后消費時間和歷史交易次數等構成。
具體指標和取值說明如表1。
根據數碼產品的特性和電商消費者網上購物的實際特點,在一定范圍內,客戶可以被進行廣泛分類。其中,客戶評分反映客戶對當次購買產品的滿意度;買家等級數據反映客戶對電商消費渠道的熟悉和偏好程度,并間接體現客戶的購買潛力和消費習慣;客戶偏好(愛好)直接反映客戶的消費傾向;一次消費寶貝體現用戶需求的跨度范圍,即其需求是否多樣。此外,歷史購買總次數能夠反映客戶對品牌或商家的忠誠度;一次消費總金額與客戶的消費能力和消費意愿相關性較強;最后一次消費時間則可以作為對客戶再次購買可能性的判斷依據之一。在快消、零售等行業,客戶最后一次消費時間越近,通過針對性營銷手段促使其復購的幾率越高,而由于數碼產品單價高,較為耐耗,更換頻率較低的特點,在一定時間范圍內,最近一次消費時間越近,其對同類產品發生復購的可能性越低。
3基于客戶潛在價值的客戶分類模型構建
3.1建模方法
3.1.1 k-means聚類
k-means聚類算法是圓形額目標函數聚類方法中的典型算法,是數據點到類別中心的特定距離和實現優化的目標函數,通過極值求解獲取到迭代運算調整規則[4]。該算法相似度測度為歐式距離,它是求對應某一初始聚類中心向量V=(v1,v2,…,vk)T最優分類,使得評價指標JC值最小。聚類準則函數一般會選擇誤差平方和準則函數,即:。其中,Mi是類Ci中數據對象的均值,p是Ci中的空間點。
對以上函數分析可知:該算法實際上是最優求解過程,目標函數具有很多局部極小點,其中僅有一個為全局最小點。目標函數順著誤差平方和準則函數降低的方向進行搜索。初始值的差異性確定V(聚類中心向量)因路徑差異性而使目標函數減少。如圖2所示目標函數順著VA,VB,VC三個初始值向量路徑逐漸邊小,并得到與之對應的極小值,局部最小值對應A、C點,全局最小值對應B點。該算法屬于爬山算法的一種,基本上都是在局部最小值處算法結束。
k-means算法采用迭代更新的方法:所有迭代過程以k個聚類中心將附近點形成k個簇,對所有簇質心再次計算就作為后面一輪迭代參照點,經過迭代實現參照點與簇真正的質心相距不斷拉近,因此目標函數不斷減小,聚類效果提升。如圖3為該算法的流程圖。
速度快和方便簡單是該算法最顯著的優勢,所以本課題對于客戶年紀、性別和每月收入等客觀屬性分類通過該算法實現;不過該算法也有其缺陷所在,即聚類中心對算法造成較為嚴重的影響[5]。
3.1.2自組織競爭人工神經網絡
客戶行為習慣屬性具有多邊性和復雜性等特征,對其分類時若采用線性或非線性模型顯然不夠精準,所以本課題對其分類確定為神經網絡方法,這種分類方式的優勢在于反映快捷、結構簡單,對于大量數據的分類也能保證精準性,對客戶分類尤為適用[6]。自組織競爭人工神經網絡屬于網絡訓練的一種,且沒有教師示教,這類神經網絡可以獨立完成訓練,完成輸入模式自行分類。如果輸入層和競爭層神經元分別為N個和M個,則算法流程圖如圖3所示,自組織競爭人工神經網絡基本結構如圖4所示。
網絡的連接權值為wij=(i=1,2,…,N,j=1,2,…,M)且滿足約束條件。競爭層神經元互相競爭,取勝神經元數量僅有一個并與當下輸入樣本對應,這個神經元就是當前樣本分類模式。根據以下方法可計算得到競爭層神經元j的狀態。
(1)
式中,xi為輸入樣本向量的第i個元素。以競爭機制為前提,神經元k在競爭層內加權值最高,k取勝且對應輸出是
(2)
競爭后的權值按照下式進行修正,對于所有的輸入層神經元i,有
(3)