999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

改進(jìn)的K-means算法在客戶分類中的應(yīng)用

2016-10-17 01:13:44崔曉云王歡歡錢慎一
現(xiàn)代計(jì)算機(jī) 2016年24期
關(guān)鍵詞:數(shù)據(jù)挖掘價(jià)值

崔曉云,王歡歡,錢慎一

(1.河南省煙草公司鄭州市公司卷煙配送中心,鄭州450000;2.鄭州輕工業(yè)學(xué)院計(jì)算機(jī)與通信工程學(xué)院,鄭州 450000)

改進(jìn)的K-means算法在客戶分類中的應(yīng)用

崔曉云1,王歡歡2,錢慎一2

(1.河南省煙草公司鄭州市公司卷煙配送中心,鄭州450000;2.鄭州輕工業(yè)學(xué)院計(jì)算機(jī)與通信工程學(xué)院,鄭州450000)

0 引言

面對異常激烈的市場競爭,企業(yè)無論在生存還是在發(fā)展上均受到了嚴(yán)峻的考驗(yàn)。目前,有許多著名的研究所表明,企業(yè)開發(fā)客戶雖然很難,但維持一個(gè)客戶會(huì)更難。此外,帕累托理論顯示,企業(yè)的絕大部分的利潤是由企業(yè)20%的客戶創(chuàng)造的,而這20%就是企業(yè)最重要客戶。說明雖然很少但很重要。此外,另外一些研究結(jié)果表明,高成本顧客抵消掉了企業(yè)一半的利潤[1]。因此,企業(yè)在進(jìn)行客戶關(guān)系管理時(shí)挖掘出哪些是企業(yè)最重要的客戶、哪些是不重要的客戶是至關(guān)重要的。

數(shù)據(jù)挖掘技術(shù)一直是值得學(xué)習(xí)的一門知識(shí)。從大量數(shù)據(jù)中用數(shù)據(jù)挖掘的方法發(fā)現(xiàn)其中潛在的信息和人們感興趣的數(shù)據(jù)模式成為了人們的一種一般需求。隨著數(shù)據(jù)挖掘的不斷發(fā)展,挖掘的方法層出不窮,其中最基本的方法是聚簇。k-means算法在聚簇方法中,是最著名也是最常用的劃分法之一[2]。再許多實(shí)際的問題中,聚類分析在都有著很重要的應(yīng)用,如:在股票市場,用此方法把具有相似價(jià)格浮動(dòng)的股票進(jìn)行分組;用于客戶關(guān)系管理中的客戶價(jià)值劃分等[3]。在生物學(xué)和醫(yī)學(xué)領(lǐng)域里,將有相似功能的蛋白質(zhì)和基因分組;K-means聚類算法是目前最為傳統(tǒng)也最為經(jīng)典的聚類算法,通過不斷地調(diào)整更新,整合離中心點(diǎn)相鄰數(shù)據(jù)的均值,將數(shù)據(jù)聚類。該算法具有算法速度快,穩(wěn)定性好,原理簡單等優(yōu)點(diǎn),被廣泛的應(yīng)用于科學(xué)研究和工商業(yè)等領(lǐng)域[4]。

1 客戶價(jià)值理論

客戶的價(jià)值是指能為企業(yè)帶來的最大的效益,為了能獲得更大的利潤企業(yè)就需要對客戶進(jìn)行分門別類的管理,利用合理的營銷策略激發(fā)客戶的購買熱情,使其更好地為企業(yè)服務(wù),創(chuàng)造出更多的價(jià)值。

如果客戶對某種服務(wù)或者產(chǎn)品者生產(chǎn)不太滿意,他們會(huì)很快轉(zhuǎn)移把目標(biāo)和興趣,重新發(fā)現(xiàn)或者關(guān)注其他的產(chǎn)品,甚至更換產(chǎn)品供應(yīng)商,從而給企業(yè)帶來巨大損失。因此,企業(yè)要將客戶的滿意度提高,就不得不對客戶進(jìn)行分門別類的管理[5]。

2 K-means算法[6]

2.1K-means算法原理

K-means算法,也被稱之為K-均值。該算法首先人任意地抽取幾個(gè)對象作為初始的質(zhì)心;然后將剩余的每個(gè)對象,根據(jù)其與各個(gè)質(zhì)心的距離賦給最近的簇,然后對每個(gè)簇的質(zhì)心進(jìn)行重新計(jì)算;不斷重復(fù)這個(gè)過程,直到準(zhǔn)則函數(shù)不再發(fā)生任何變化。通常采用的準(zhǔn)則函數(shù)為,SSE(Sum of the Squared Error),其定義如下:

2.2初始中心的確定

對聚類結(jié)果產(chǎn)生較大影響的是對初始聚類中心的選擇,如果選擇的不好,將無法得到有效的聚類結(jié)果。可以通過多對一些不同初值的設(shè)置,將最后的運(yùn)算結(jié)果進(jìn)行對比,如果結(jié)果一直趨于穩(wěn)定,則說明選取恰當(dāng),但比較浪費(fèi)資源且耗時(shí)比較大。本文通過建立MTA數(shù)據(jù)模型,通過V值對數(shù)據(jù)進(jìn)行初始值處理,確定的初始質(zhì)心,可以得到良好的聚類效果。

在《大數(shù)據(jù)》書中曾提到兩種方法對初始質(zhì)心點(diǎn)的選取[8]:(1)選擇點(diǎn)時(shí)彼此盡可能遠(yuǎn)(2)用Canopy算法或者層次聚類算法進(jìn)行聚類,然后,從得到K個(gè)簇中選擇一個(gè)點(diǎn),該點(diǎn)可以是距離類簇中心點(diǎn)最近的那個(gè)點(diǎn)或者是該類簇的中心點(diǎn)。

3 在某公司客戶價(jià)值細(xì)分中的應(yīng)用

3.1數(shù)據(jù)清洗[7]

本文所使用的數(shù)據(jù)來源于鄭州市金水區(qū)煙草物流公司近一年的134萬訂單數(shù)據(jù),在數(shù)據(jù)庫中一共六張與顧客購買記錄相關(guān)的數(shù)據(jù)表。數(shù)據(jù)表中的記錄為主要研究對象包含了訂單代碼、客戶編碼、訂單日期、商品編號(hào)、商品數(shù)量、商品金額、購買次數(shù)、線路編號(hào)等50個(gè)字段。

數(shù)據(jù)清洗通過對數(shù)據(jù)進(jìn)行一致性檢查,缺失值和無效值的處理,發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識(shí)別的錯(cuò)誤。根據(jù)每個(gè)變量的相互關(guān)系和合理取值范圍進(jìn)項(xiàng)一致性檢查,檢查此數(shù)據(jù)是否合乎要求。本文首先對數(shù)據(jù)進(jìn)行了一致性檢查,發(fā)現(xiàn)本次數(shù)據(jù)并無超出正常范圍而且邏輯上合理或者不存在矛盾的數(shù)據(jù)。之后對數(shù)據(jù)進(jìn)行了缺失值的檢查,將存在缺失值的數(shù)據(jù)刪除。

3.2數(shù)據(jù)整合

數(shù)據(jù)整合的目的就是將同一個(gè)客戶的不同記錄進(jìn)行合并。本文針對客戶12個(gè)月的訂單數(shù)據(jù)進(jìn)行了整合。首先,我們 從數(shù)據(jù)庫中抽取出客戶購買次數(shù)、購買數(shù)量、消費(fèi)金額、訂單編碼客戶編碼五個(gè)字段。之后將提取出的客戶在12個(gè)月中的消費(fèi)金額匯總得到購買總金額。將客戶的購買編號(hào)進(jìn)行計(jì)數(shù),得到購買次數(shù)。其次,將每月 31號(hào)設(shè)置為截止日期,提取出每個(gè)客戶每個(gè)月最后一次購買時(shí)間,并將這個(gè)時(shí)間與截止日相減,得到最后總的購買數(shù)量。

3.3建立客戶價(jià)值細(xì)分模型

綜合前述客戶價(jià)值劃分理論,建立二維客戶價(jià)值細(xì)分矩陣。根據(jù)客戶價(jià)值評價(jià)指標(biāo)體系矩陣,客戶價(jià)值評價(jià)指標(biāo)體系具有三個(gè)象限,綜合客戶的當(dāng)前價(jià)值和潛在價(jià)值,分別根據(jù)客戶當(dāng)前價(jià)值和潛在價(jià)值的不同,得出客戶總價(jià)值。將公司客戶細(xì)分為三類,分別是:高價(jià)值客戶、低價(jià)值價(jià)值、潛在價(jià)值客戶。

3.4指標(biāo)及其權(quán)重的確定

根據(jù)隨機(jī)抽取的21個(gè)客戶,選擇次數(shù)、金額和數(shù)量作為指標(biāo)體系,三個(gè)指標(biāo)的權(quán)重系數(shù)分別為:0.3,0.2 和0.5.采用下面的公式計(jì)算客戶價(jià)值,初步用V值進(jìn)行分類,并對其排序。如表1所示:

v=0.5×(數(shù)量/數(shù)量平均值)+0.3×(次數(shù)/次數(shù)平均值)+0.2×(金額/金額平均值)

表1 客戶指標(biāo)數(shù)據(jù)

3.5聚類迭代分析

對初步處理后的數(shù)據(jù)進(jìn)行規(guī)格化處理后,設(shè)k=3,即將這21個(gè)客戶分成三個(gè)集團(tuán)。抽取客戶編號(hào)為900536、926329和932746的值作為三個(gè)初始運(yùn)算點(diǎn),即初始化三個(gè)中心為:

A:{0.9285714,0.501555772,0.286658528}

B:{0.6870329 0.0638110870.654634025}

C:{0.909090909,0.014509259,0.014509259}

期間不斷調(diào)整三個(gè)中心點(diǎn),利用K-means算法進(jìn)行三次運(yùn)算后,得到如圖1所示客戶價(jià)值分布圖:

圖1 客戶價(jià)值分布圖

3.6基于優(yōu)化K-means聚類的客戶細(xì)分效果

利用以上優(yōu)化的K-means算法,我們利用MATLAB軟件,將客戶分為三部分,其中紅色部分為最重要的客戶,藍(lán)色部分為次重要的客戶,黑色部分為隱含的客戶,從圖上不但可以直觀地看出客戶價(jià)值的分布情況,同時(shí)還可以得出處在每個(gè)價(jià)值區(qū)間的客戶數(shù)量,聚類效果清晰明了。聚類效果圖如圖2所示。

3.7決策的制定

具有較高價(jià)值的客戶,公司需要加大關(guān)注力度以防流失,穩(wěn)固為主提升為輔。提高他們的活躍程度,加長存留期。一般來說,低價(jià)值客戶,公司可以從客戶的愛好、習(xí)慣、生活背景等多角度進(jìn)行分析。找出購買力度低的主要原因,制定針對性的策略提高他們的購買頻率。對于潛在客戶則要想法挖掘,同時(shí)不能流失,在關(guān)注的同時(shí)想法激發(fā)起活躍度,使其有潛在客戶轉(zhuǎn)型為高價(jià)值客戶。

圖2 基于K-means的聚類效果圖

4 結(jié)語

通過對該系統(tǒng)數(shù)據(jù)的分析,可以得知該公司的發(fā)展規(guī)模和基本情況,可以進(jìn)行有針對性的管理,該算法在其中發(fā)揮了良好的作用,具有很好的實(shí)用性。通過對比不同情況下的分布圖可知,結(jié)果比較穩(wěn)定,符合了實(shí)際情況。

[1]范明,孟小峰譯.數(shù)據(jù)挖掘概念與技術(shù)——聚類分析[M].北京:機(jī)械工業(yè)出版社,2001.223-258.

[2]Andrea Vattani.k_means Requires Exponentially Many Iterations[J].Discrete Comput Geom,2011(45).

[3]Ching-Hsue Cheng.Classifying the Segmentation of Customer Value Via RFM Model and RS theory[J].Expert Systems with Applications,2009(36).

[4]于輝,廖小紅.客戶細(xì)分方法綜述[J].中小企業(yè)管理與科技(下旬刊),2014,11:17-18.

[5]Wishart D.K-meansClustering with Outlier Detection[C].Proc.of the 25th Annual Conf.of the German Classification Society.Munich,Germany:University of Munich Press,2001:14-16.

[6]詹海亮,薛惠鋒,蘇錦旗.基于人工免疫系統(tǒng)的克隆——K均值算法[J].計(jì)算機(jī)仿真,2008,25(11):191-195.

[7]張建萍,劉希亞.基于聚類分析的K-Meams算法研究與應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2007,24(5):166-168.

[8]袁方,周志勇,宋鑫.初始聚類中心優(yōu)化的K-Means算法[J].計(jì)算機(jī)工程,2007,33(3):5-66.

Customer Value;K-means Algorithm;Customer Relationship Management

Application of Optimized K-means Algorithm in Customer Value Segmentation

CUI Xiao-yun1,WANG Huan-huan2,QIAN Shen-yi2
(1.Henan Tobacco Companies Zhengzhou Company Cigarette Distribution Center,2.School of Computer and Communication Engineering,Zhengzhou University of Light Industry,Zhengzhou 450000)

1007-1423(2016)24-0025-04DOI:10.3969/j.issn.1007-1423.2016.24.006

崔曉云(1977-),女,河南鄭州人,本科,高級物流師,研究方向?yàn)槲锪鞴芾?/p>

王歡歡(1989-),女,河南汝州人,碩士研究生,研究生,研究方向?yàn)閿?shù)據(jù)挖掘

錢慎一(1975-),男,江蘇揚(yáng)州人,碩士,副教授,碩士生導(dǎo)師,CCF會(huì)員,研究方向?yàn)閿?shù)據(jù)庫與信息集成、計(jì)算機(jī)應(yīng)用技術(shù)

2016-03-22

2016-08-15

對客戶價(jià)值的劃分,可以為企業(yè)進(jìn)行準(zhǔn)確的客戶定位,制定良好的市場營銷戰(zhàn)略。利用優(yōu)化K-means算法初始值的選取,建立客戶潛在價(jià)值和客戶當(dāng)前價(jià)值表,并以某物流公司現(xiàn)有的實(shí)際數(shù)據(jù)為基礎(chǔ)進(jìn)行實(shí)證分析。將所有客戶分為重要客戶、次重要客戶、隱含價(jià)客戶三類,分析各類客戶的消費(fèi)特性,提出針對性的客戶營銷及管理方式。

客戶價(jià)值;K-means算法;客戶關(guān)系管理

河南省煙草公司科技研究項(xiàng)目,河南省科技攻關(guān)項(xiàng)目(No.122102210024)

Customer value for enterprise,can accurate positioning,establish a good marketing strategy.Selects K-means optimization algorithm of the initial value,builds customer potential value and customer current value table,and makes the actual data of a logistics company based on existing empirical analysis.All customers are divided into three types:high value customers,low value customers,potential value customers,analyzes the various types of customer consumption characteristics,and puts forward the targeted customer marketing and management.

猜你喜歡
數(shù)據(jù)挖掘價(jià)值
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
踐行初心使命的價(jià)值取向
價(jià)值3.6億元的隱私
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
一粒米的價(jià)值
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
“給”的價(jià)值
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
主站蜘蛛池模板: 波多野结衣在线se| 毛片基地美国正在播放亚洲 | 欧美成人在线免费| 日本三区视频| 欧美精品导航| 91国内在线观看| 91在线一9|永久视频在线| 成人日韩欧美| 91小视频在线观看免费版高清| 毛片基地视频| 亚洲永久精品ww47国产| 国产成+人+综合+亚洲欧美| 亚洲中文字幕精品| 国产成人高清在线精品| 在线国产91| 婷婷中文在线| 91久久偷偷做嫩草影院电| 一级毛片在线免费视频| 国产va在线观看| 在线看片免费人成视久网下载| 乱人伦99久久| 久久精品国产免费观看频道| 国产成人福利在线视老湿机| 国产精品99一区不卡| 一级黄色欧美| 人与鲁专区| 伊人久久久久久久| 亚洲国产精品VA在线看黑人| 国产97公开成人免费视频| 亚洲成人黄色在线| 91福利在线观看视频| 亚洲精品国产成人7777| 蜜芽国产尤物av尤物在线看| 久久精品亚洲中文字幕乱码| 97久久免费视频| 激情午夜婷婷| 国产91丝袜在线播放动漫 | 久久久久久久蜜桃| 久久久久久尹人网香蕉| 蜜臀AV在线播放| 欧洲极品无码一区二区三区| 国产女主播一区| 亚洲丝袜中文字幕| 亚洲最新网址| 内射人妻无码色AV天堂| 在线人成精品免费视频| 亚洲午夜福利在线| 国产亚洲精久久久久久久91| 中文字幕在线免费看| 久久国产亚洲欧美日韩精品| 六月婷婷精品视频在线观看| 国产无码高清视频不卡| 亚洲成av人无码综合在线观看| 久久国语对白| 国产免费网址| 欧美亚洲第一页| 毛片基地视频| 欧美成人一区午夜福利在线| 欧美啪啪网| 女人天堂av免费| 日本免费一区视频| a亚洲视频| 国产一在线观看| 久久精品这里只有国产中文精品| 九九视频在线免费观看| 青草视频免费在线观看| 亚洲成人在线网| 国产精选自拍| 亚洲第一视频免费在线| 国产特级毛片aaaaaa| 2019年国产精品自拍不卡| 精品无码一区二区在线观看| 精品伊人久久久大香线蕉欧美 | 女人18一级毛片免费观看| 国产成人免费| 免费国产无遮挡又黄又爽| 国产高清在线观看| 亚洲欧美日本国产综合在线| 蜜芽国产尤物av尤物在线看| 亚洲动漫h| 98精品全国免费观看视频| 亚洲视频二|