李權(quán)

引言:本文對(duì)3G時(shí)代用戶的細(xì)分方法和3G目標(biāo)市場(chǎng)的定位作了初步的研究,提出了3G時(shí)代客戶識(shí)別數(shù)據(jù)挖掘模型,并采用BP神經(jīng)網(wǎng)絡(luò)和決策樹(shù)對(duì)該模型進(jìn)行驗(yàn)證,最后研究了3G目標(biāo)市場(chǎng)定位考慮的要素和初步的建議。
一、3G用戶細(xì)分體系架構(gòu)
用戶細(xì)分是3G業(yè)務(wù)開(kāi)發(fā)及市場(chǎng)營(yíng)銷的基礎(chǔ),用戶細(xì)分能夠使差異化成為可能,使運(yùn)營(yíng)商提供的3G產(chǎn)品和服務(wù)能夠更有針對(duì)性。3G用戶細(xì)分方法的選擇直接決定了相關(guān)用戶細(xì)分結(jié)果的準(zhǔn)確性及實(shí)用性。對(duì)于3G用戶細(xì)分的體系搭建的思路是: 采用3 個(gè)緯度進(jìn)行用戶的細(xì)分,首先按照用戶價(jià)值緯度進(jìn)行用戶細(xì)分,然后再結(jié)合消費(fèi)行為緯度和消費(fèi)心理緯度細(xì)分用戶群。在3G用戶細(xì)分的體系架構(gòu)中,3個(gè)緯度的用戶細(xì)分依據(jù)、方法及應(yīng)用價(jià)值如表1 所示。
二、客戶識(shí)別分類模型
(一)數(shù)據(jù)抽取
本案例數(shù)據(jù)來(lái)源于某電信運(yùn)營(yíng)公司,該數(shù)據(jù)總量為26000條。每一條對(duì)應(yīng)一個(gè)客戶近六個(gè)月的統(tǒng)計(jì)信息。其中已知分類(2G、3G)的為18000條,未知分類8000 條。其中包括客戶年齡,月平均消費(fèi)額,月平均通話時(shí)長(zhǎng)等屬性250 個(gè)(包括客戶類型)。本例利用26000條已知分類的數(shù)據(jù)進(jìn)行分類模型的建立,隨機(jī)抽取訓(xùn)練數(shù)據(jù)10000條,測(cè)試數(shù)據(jù)8000條。
(二)數(shù)據(jù)預(yù)處理
上述采集的數(shù)據(jù)有數(shù)據(jù)多、數(shù)據(jù)取值范圍廣和數(shù)據(jù)取值類型多樣的特點(diǎn),因此必須在建模前對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,如采集的樣本數(shù)據(jù)存在一些屬性值缺省或空值,如果不做處理,將直接影響后續(xù)算法的挖掘效果,嚴(yán)重時(shí)甚至得到錯(cuò)誤的結(jié)果。……