999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘在電信客戶分群中的應(yīng)用

2008-12-31 00:00:00柳益君洑涵妤蔡秋茹
電腦知識與技術(shù) 2008年24期

摘要:介紹了電信企業(yè)數(shù)據(jù)挖掘的若干主題及常用數(shù)據(jù)挖掘模型;利用數(shù)據(jù)挖掘工具KXEN,采用K-means聚類方法給出了一個電信客戶分群的解決方案。

關(guān)鍵詞:客戶分群;聚類分析;K-means算法

中圖分類號:TP311.13文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2008)24-1123-03

Application of Data Mining in Telecom Customer Segmentation

LIU Yi-jun1, FU Han-yu1, CAI Qiu-ru1, HE Hui2, LUO Ye1

(1.Jiangsu Teachers University of Technology, School of Computer Sciences and Engineering, Changzhou 213001,China; 2.Changzhou Branch of Jiangsu Telecom, Changzhou 213003,China)

Abstract: The paper introduces the data mining topics and data mining models frequently used in telecom. A resolution of Customer segmentation is proposed based on the data mining tool KXEN and K-means method.

Key words: customer segmentation; clustering analysis; K-means algorithm

1 引言[1]

隨著電信體制改革的深化,電信業(yè)的競爭也日趨激烈。電信業(yè)是典型的數(shù)據(jù)密集行業(yè),與其他行業(yè)相比,則電信行業(yè)擁有更多的有關(guān)用戶的數(shù)據(jù)。誰能正確地分析這些數(shù)據(jù)得到有用的知識,誰就能更好地向用戶提供服務(wù),發(fā)現(xiàn)更多的商機(jī),從而在競爭中獲勝。數(shù)據(jù)挖掘可以從大量數(shù)據(jù)中自動獲取有用信息或知識,因此數(shù)據(jù)挖掘在電信業(yè)中有重要的應(yīng)用價值。

該文組織結(jié)構(gòu)如下:第二部分分析了電信數(shù)據(jù)挖掘的若干主題及其相關(guān)的數(shù)據(jù)挖掘模型;第三部分介紹了客戶分群及其K-means聚類算法的實現(xiàn)流程;第四部分基于實踐經(jīng)驗給出了建立電信客戶分群模型的解決方案。

2 電信領(lǐng)域的數(shù)據(jù)挖掘模型[2,3]

電信的數(shù)據(jù)挖掘應(yīng)用開發(fā),主要進(jìn)行客戶分群、客戶流失分析、客戶發(fā)展分析、客戶行為分析等數(shù)據(jù)挖掘?qū)n}分析,逐步實現(xiàn)業(yè)務(wù)預(yù)測和信息挖掘等功能。

1)客戶分群:客戶分群將一個大消費(fèi)群體劃分為一個個細(xì)分群體,同屬一個分群的消費(fèi)者相似,而隸屬于不同分群的消費(fèi)者被視為不同的群體。企業(yè)根據(jù)客戶提出的要求和實際所做的不斷地改善產(chǎn)品和服務(wù),從而不斷提高該客戶群的滿意度。

2)客戶消費(fèi)模式分析:從消費(fèi)能力、消費(fèi)習(xí)慣、消費(fèi)周期等諸方面對客戶的話費(fèi)行為進(jìn)行分析和預(yù)測,從而為相關(guān)經(jīng)營決策提供依據(jù)。

3)客戶市場推廣分析:利用數(shù)據(jù)挖掘技術(shù)實現(xiàn)優(yōu)惠策略的仿真,根據(jù)數(shù)據(jù)挖掘模型進(jìn)行模擬計費(fèi)和模擬出賬,其仿真結(jié)果可以揭示優(yōu)惠策略中存在的問題,并進(jìn)行相應(yīng)的調(diào)整優(yōu)化,以達(dá)到優(yōu)惠促銷活動的收益最大化。

4)客戶欠費(fèi)分析和動態(tài)防欺詐:總結(jié)各種騙費(fèi)、欠費(fèi)行為的內(nèi)在規(guī)律,并建立欺詐和欠費(fèi)行為的規(guī)則庫。當(dāng)客戶的話費(fèi)行為與庫中規(guī)則吻合時,系統(tǒng)可以提示運(yùn)營商相關(guān)部門采取措施,從而降低運(yùn)營商的損失風(fēng)險。

5)客戶流失分析:根據(jù)已有的客戶數(shù)據(jù),建立客戶屬性、服務(wù)屬性、客戶消費(fèi)情況等數(shù)據(jù)與客戶流失概率相關(guān)聯(lián)的數(shù)學(xué)模型,然后根據(jù)此模型來監(jiān)控客戶流失的可能性,如果客戶流失的可能性過高,則通過促銷等手段來提高客戶忠誠度,防止客戶流失的發(fā)生。

6)大客戶的識別:企業(yè)的大客戶群體往往是利潤的主要來源。識別出大客戶,為他們制定有針對性的措施,提高大客戶的忠誠度,是電信運(yùn)營商繼續(xù)保持領(lǐng)先的關(guān)鍵所在。此外數(shù)據(jù)挖掘工具不僅能夠根據(jù)現(xiàn)有的消費(fèi)量的多少來判斷用戶是否為大客戶,還應(yīng)該可以根據(jù)現(xiàn)有大客戶的資料,提取大客戶的特征,并發(fā)現(xiàn)潛在的大客戶。

7)客戶利潤分析:分析客戶的利潤分布情況,得到帶來不同利潤的客戶的具體特征。系統(tǒng)將客戶利潤分為高、中、低三種類型。用戶可以對高、中、低的具體情況進(jìn)行設(shè)置。

表1總結(jié)了電信領(lǐng)域中可以應(yīng)用的主要數(shù)據(jù)挖掘模型及其采用的方法。

3 基于K-means聚類的客戶分群[4,5]

客戶分群是根據(jù)一個或多個客戶屬性組合把所有客戶劃分成不同的類,同類內(nèi)的客戶具有最大的相似性,異類間的客戶具有最大的差異性。

通過對客戶合理的類別劃分,并對當(dāng)前客戶以及預(yù)期的客戶群作區(qū)段分析,判斷不同區(qū)段的突出特點(diǎn),對客戶總體構(gòu)成有準(zhǔn)確的認(rèn)識,對客戶的服務(wù)和營銷更具針對性。對客戶分群可以達(dá)到如下目標(biāo):

1)了解客戶的總體構(gòu)成;2)了解各種客戶價值的客戶群體特征;3)了解流失客戶的客戶群體特征;4)了解客戶群體的消費(fèi)特征;5)了解各信用等級的客戶群體特征。

數(shù)據(jù)挖掘技術(shù)中的聚類(Clustering)分析技術(shù)能夠被運(yùn)用來從客戶基本庫中發(fā)現(xiàn)不同的客戶群,并且刻畫不同客戶群的特征,達(dá)到細(xì)分客戶群的目的。本文采用K-Means聚類模型進(jìn)行客戶分群,主要因為K-means算法具有以下優(yōu)點(diǎn):1)能夠很好的解決給出數(shù)值型屬性的數(shù)據(jù)對象的聚類問題,經(jīng)常以局部最優(yōu)結(jié)束;2)對處理大數(shù)據(jù)集,該算法是相對可伸縮的和高效率的;3)對輸入數(shù)據(jù)順序的敏感度一般;4)雖然對處理噪聲數(shù)據(jù)的能力不高,由于電信的數(shù)據(jù)還算完整,可以通過數(shù)據(jù)預(yù)處理來彌補(bǔ);5)該算法結(jié)果比較容易理解,建模速度也較快。

K-means處理流程以算法形式表示如下。算法的復(fù)雜度是0(nkt),其中,n是所有對象的數(shù)目,k是簇的數(shù)目,t是迭代的次數(shù),通常k<

輸入:結(jié)果簇的數(shù)目k,包含n個對象的數(shù)據(jù)庫。

輸出:k個簇,使平均誤差準(zhǔn)則最小。

方法:

① 任意選擇k個對象作為初始的簇中心。② repeat。③ 根據(jù)簇中對象的平均值,將每個對象(重新)賦給最類似的簇。④ 更新簇的平均值,即計算每個簇中對象的平均值。⑤ until不再發(fā)生變化。

K-means算法嘗試找出平方誤差函數(shù)值最小的k個劃分。算法使得各聚類本身盡可能緊湊,而各聚類之間盡可能的分開。當(dāng)結(jié)果簇是密集的,而簇與簇之間區(qū)別明顯時,它的效果較好。本文選擇這種算法建立數(shù)據(jù)挖掘模型,從而對客戶做初步的劃分,將含原始客戶信息的數(shù)據(jù)庫劃分成K個聚簇,使得同一簇中的對象是“相似的”,而不同簇中的是“相異的”。

4 實例研究

我們使用商業(yè)數(shù)據(jù)挖掘自動化軟件KXEN對常州電信客戶進(jìn)行分群研究。KXEN軟件分群采用結(jié)構(gòu)風(fēng)險最小化的K-Means算法實現(xiàn)。我們選擇了營銷服務(wù)相對薄弱的小型商客作為目標(biāo)客戶群,取得目標(biāo)客戶群的近一年的相關(guān)數(shù)據(jù)。其中小型商客是指客戶有1-2門電話、小靈通的客戶,不包含已經(jīng)安裝寬帶的客戶,有效小型商客為23074戶?;A(chǔ)表涵蓋了以下數(shù)據(jù):①用戶及客戶的基本信息:包括客戶身份信息、聯(lián)系方式、產(chǎn)品擁有情況、入網(wǎng)時長、服務(wù)開通情況、優(yōu)惠套餐信息、客戶服務(wù)信息(投訴、咨詢、催繳情況)等;②價值信息:包括業(yè)務(wù)月租費(fèi)、使用費(fèi)、優(yōu)惠費(fèi)用及增值業(yè)務(wù)、新業(yè)務(wù)、信息費(fèi)和卡類、結(jié)算費(fèi)用、繳欠費(fèi)信息等;③行為信息:包括時長、次數(shù)、跳次、發(fā)話不同號碼數(shù)、時長集中度、次數(shù)集中度等。

我們通過KXEN軟件對客戶價值(V)與客戶行為(B)進(jìn)行多維分群,其中參加分群的V變量有21個,B變量有15個。首先根據(jù)價值維度的分群結(jié)果,計算出每個群的平均收入進(jìn)行客戶價值分析:

ARPU=客戶群總收入/m

其中m為該群客戶人數(shù),ARPU(Average Revenue Per User)為每用戶平均收入。

然后對行為B變量作Z分?jǐn)?shù)。設(shè)某個客戶i使用產(chǎn)品j的時長是Tij,所有客戶使用產(chǎn)品j的平均時長為Tj。對于客戶i,其產(chǎn)品j的 分?jǐn)?shù)為Zij=(Tij-Tj)/σj,其中σj為所有客戶使用產(chǎn)品j的時長標(biāo)準(zhǔn)差。單個客戶i使用電信所有產(chǎn)品的Z分?jǐn)?shù)為Zi= Zij,其中n為客戶使用的產(chǎn)品數(shù)量??蛻羧簁的Z分?jǐn)?shù)為Zk=( Zi)/m,其中m為分群k中的客戶數(shù)。

最后對V變量按總費(fèi)用進(jìn)行群排序,形成VB矩陣交叉圖。在組成的交叉矩陣中根據(jù)客戶數(shù)的多少選出SS1-SS8共8個戰(zhàn)略客戶群,共有客戶17128戶,占總客戶的比例為74.23%,接著對戰(zhàn)略客戶群進(jìn)行特征分析。圖1是分群后的總體情況,圖2是分群矩陣圖,圖3是各群分布?xì)馀輬D。

群分布?xì)馀輬D

圖3中氣泡的大小代表客戶數(shù)的多少。SS7、SS8客戶群最大。橫軸方向越靠右,表明客戶價值越高。SS1、SS2、SS3群為高值的小商客,SS7、SS8為低值小商客。在橫軸的上下,表明客戶的消費(fèi)趨勢值情況,在橫軸以下為下降趨勢,偏離越多,下降值越大。SS2群下降最多。SS1上升最為明顯。

下面以中值下降的SS6群為例進(jìn)行分析(限于篇幅,僅給出競爭特征的圖表)。

1)總費(fèi)用特征

該群屬中值群,客戶數(shù)1964,占總中小商業(yè)客戶的8.5%,客戶ARPU為 93.35元;總體費(fèi)用下降趨勢為-5.28元,為各群次低;總費(fèi)用趨勢上升的客戶比例極少??傎M(fèi)用前半年均值106元,前半年趨勢基本平穩(wěn)。

2)長話特征

該群用戶長話費(fèi)均值為9.97元,占總費(fèi)用的比例為11%,相對較低。長話費(fèi)用月均下降1.96元,為各群次高。長話費(fèi)用高于50元的和長話費(fèi)上升的客戶比例都很低;使用傳統(tǒng)長話的客戶各群中比例最高。另外,該群用戶長話使用量很少,且主要使用傳統(tǒng)長途,傳統(tǒng)長話占長話比例最高;長話費(fèi)12個月均呈下降趨勢。

3)市話特征

該群用戶市話費(fèi)用均值為中值,為41.67元,月平均下降3.53元。區(qū)間費(fèi)用的均值2.92元,區(qū)間費(fèi)用趨勢月下降0.37元。

4)競爭特征

結(jié)合圖4分析可得,該群客戶也有較明顯的卡類業(yè)務(wù)使用習(xí)慣,主要使用他網(wǎng)卡類業(yè)務(wù),但是下降趨勢最為明顯。

5)其他特征

該群用戶的窄帶上網(wǎng)信息費(fèi)也在下降,優(yōu)惠費(fèi)用均值為13元,為各群中次低。套餐用戶較少。

綜上可得SS6群特征如下:

a.該群為中值下降群,ARPU值為93.35元??傎M(fèi)用趨勢下降較明顯,月均下降5.28元,各項費(fèi)用均呈下降趨勢。

b.該群客戶為長話低值客戶,長話主要使用傳統(tǒng)長途。

c.使用他網(wǎng)卡較多,但他網(wǎng)IP卡下降趨勢明顯。SS6群使用非電信卡消費(fèi)均值最高,長話流失嚴(yán)重。

針對上述情況,擬采用的營銷策略是用超級IP、商務(wù)行、17908卡等有針對性地開展策反工作。

5 結(jié)論

數(shù)據(jù)挖掘可以對大量數(shù)據(jù)進(jìn)行自動分析,幫助我們?nèi)W(xué)習(xí)新的潛在模式。聚類分析能夠為我們解決客戶分群問題,從而應(yīng)用于電信目標(biāo)市場營銷。本文使用數(shù)據(jù)挖掘工具KXEN,采用K-means方法給出了一個電信客戶分群的解決方案。實踐證明本文提供的電信目標(biāo)市場營銷客戶分群的解決方案是成功有效的。

參考文獻(xiàn):

[1] 廖里,余英澤.數(shù)據(jù)挖掘和數(shù)據(jù)倉庫及其在電信業(yè)中的應(yīng)用[J].重慶郵電學(xué)院學(xué)報自然科學(xué)版,2000(4):34-37,81.

[2] 宋威.江蘇電信數(shù)據(jù)挖掘?qū)n}分析報告[J].江蘇電信,2004.6.

[3] 陶露菁.基于數(shù)據(jù)挖掘的電信客戶分群設(shè)計和實現(xiàn)[D].南京大學(xué)碩士學(xué)位論文,2005.06.

[4] 鄧曉梅.基于數(shù)據(jù)挖掘的電信客戶細(xì)分模型研究[D].大連理工大學(xué)碩士學(xué)位論文,2006.10.

[5] 韓家煒,Kamber M,著. 數(shù)據(jù)挖掘:概念與技術(shù)[M].范明譯.北京:機(jī)械工業(yè)出版社,2001.

[6] 劉文.凱森(KXEN)商業(yè)數(shù)據(jù)挖掘[EB/OL].www.datom-i.com.

注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文。”

主站蜘蛛池模板: 91欧美在线| 国产在线精品网址你懂的| 日韩免费毛片| 国产另类视频| 亚洲中文字幕国产av| 91精品国产丝袜| 国产成年无码AⅤ片在线 | 色综合久久88色综合天天提莫| 99伊人精品| 精品在线免费播放| 午夜久久影院| 亚洲无码37.| 国产制服丝袜无码视频| 国产91蝌蚪窝| 国内丰满少妇猛烈精品播| 毛片网站在线看| 国产欧美日韩综合在线第一| 欧洲亚洲欧美国产日本高清| 欧美日本二区| 欧美激情第一欧美在线| 蜜桃视频一区二区| 2020最新国产精品视频| 日本成人在线不卡视频| 久久久久亚洲Av片无码观看| 国产精品分类视频分类一区| 免费毛片视频| 一级毛片网| yjizz视频最新网站在线| 国产毛片不卡| 人禽伦免费交视频网页播放| 囯产av无码片毛片一级| 97视频免费在线观看| 午夜a级毛片| 67194亚洲无码| 国产精品污视频| 99视频在线观看免费| 成人免费午夜视频| 无码国内精品人妻少妇蜜桃视频| 欧美日本激情| 一区二区欧美日韩高清免费| 亚洲男人的天堂久久香蕉 | 欧美色图第一页| 国产成人一区二区| 欧美在线伊人| 精品人妻一区二区三区蜜桃AⅤ| 国产成人综合久久精品尤物| 亚洲 欧美 日韩综合一区| 国产成人一区在线播放| 免费A∨中文乱码专区| 国产精品污污在线观看网站| 国产精品白浆无码流出在线看| 国产玖玖视频| 久久精品国产999大香线焦| 2021亚洲精品不卡a| 五月天福利视频| 青青草91视频| 国产日韩欧美在线视频免费观看| 国产又粗又猛又爽| 欧美一区精品| 国产尤物jk自慰制服喷水| 亚洲精品自拍区在线观看| 日韩欧美色综合| 欧美成一级| WWW丫丫国产成人精品| 日韩精品成人网页视频在线| 色偷偷av男人的天堂不卡| 日韩精品免费在线视频| 久久综合色天堂av| 国产精品不卡片视频免费观看| 一本一道波多野结衣一区二区| 福利视频99| 国产毛片片精品天天看视频| 在线国产欧美| 114级毛片免费观看| 亚洲码在线中文在线观看| 91久久天天躁狠狠躁夜夜| 亚洲二区视频| 思思热在线视频精品| 欧美日韩国产高清一区二区三区| 国产呦视频免费视频在线观看| 色欲国产一区二区日韩欧美| 国产在线视频二区|