999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的移動用戶預測

2016-01-21 02:05:57吳曜宏王鶴鳴劉義銘
通信技術 2015年6期
關鍵詞:移動通信數據挖掘

吳曜宏,王鶴鳴,劉義銘

(1. 中國電子科技集團公司第三十研究所,四川 成都 610041)

摘 要:隨著3G市場的深入以及4G商用的開始,移動通信行業面臨著激烈的競爭,企業的發展型態已由過去以產品為中心的經營方式轉變成為以客戶為中心的消費型態。企業的發展必須以對客戶的需求和消費行為的了解為重心,否則將會流失重大的商機。對于移動通信行業來說,如何通過數據挖掘技術去找優質客戶群及可能流失的客戶群具有十分重要的意義。利用數據挖掘技術,通過建立模型,預測電信企業的客戶流失情況,為企業提高效益提供參考。

關鍵詞:數據挖掘;移動通信;客戶預測

doi:10.3969/j.issn.1002-0802.2015.06.019

基于數據挖掘的移動用戶預測

吳曜宏1,王鶴鳴1,劉義銘1

(1. 中國電子科技集團公司第三十研究所,四川 成都 610041)

摘要:隨著3G市場的深入以及4G商用的開始,移動通信行業面臨著激烈的競爭,企業的發展型態已由過去以產品為中心的經營方式轉變成為以客戶為中心的消費型態。企業的發展必須以對客戶的需求和消費行為的了解為重心,否則將會流失重大的商機。對于移動通信行業來說,如何通過數據挖掘技術去找優質客戶群及可能流失的客戶群具有十分重要的意義。利用數據挖掘技術,通過建立模型,預測電信企業的客戶流失情況,為企業提高效益提供參考。

關鍵詞:數據挖掘;移動通信;客戶預測

doi:10.3969/j.issn.1002-0802.2015.06.019

收稿日期:2015-02-19;修回日期:2015-04-20Received date:2015-02-19;Revised date:2015-04-20

中圖分類號:TP311

文獻標志碼:碼:A

文章編號:號:1002-0802(2015)06-0724-05

Abstract:For the deep-going of 3G markets and the beginning of 4G commercialization, the mobile industry faces fierce market competition. The development pattern of the enterprises changes from product-centric operation mode in the past times to the customer-centric operation mode at present. The enterprise must, for its development, focus on the requirements and consuming behaviors, or otherwise it would lose the major business opportunities. It is very important for the mobile industry to find the high-quality customer groups and the possibly lost customer groups via data mining technology. This paper describes the model based on data mining technology. Simulation results show that this method can effectively forecast the customer loss of telecom enterprise, and provide a reference for enterprises to improve their efficiency.

作者簡介:

Mobile Customer Forecast based on Data Mining

WU Yao-hong ,WANG He-ming ,LIU Yi-ming

(No.30 Institute of CETC, Chengdu Sichuan 610041, China)

Key words:data mining; telecommunication industry; customer prediction

0引言

自我國電信重組以來,逐步形成了多家運營商共同競爭的市場格局。隨著3G市場的深入以及4G商業化的開始,電信產業的競爭變得尤為激烈,并且競爭的方式已悄然發生改變。企業的發展型態已由過去以產品為中心的經營方式轉變成為以客戶為中心的消費型態。企業的發展必須以客戶的需求和消費行為的了解為重心,否則將會流失重大的商機,造成企業的損失。事實上,電信市場已趨近飽和,再加上電信行業市場的激烈競爭,因而,要在這樣的環境下再去花更多的人力、物力、財力去開發新的客戶,對電信企業來說并不是一個有效的方法。那么,如何才能留住客戶并不斷挖掘新的客戶,以增加企業效益,對于移動通信行業具有十分重要的意義。

1數據挖掘基本概念

1.1數據挖掘的產生

數據挖掘(Data Mining,DM)自提出以來,其發展經歷了經典的統計,人工智能,機器學習三個階段。特別是在對商業和服務型領域所需要的大量數據進行處理應用時,數據挖掘技術可以充分發掘隱藏在海量數據后的價值信息,這是傳統的數據分析方法無法做到的。數據挖掘是數據庫技術、信息科學、可視化等各種學科綜合發展的結果。

數據挖掘技術是企業從海量數據中找出有價值的信息的一項利器。現代企業搜集了大量的數據,包括交互過程中產生的客戶信息、市場收集信息、行業態勢信息等各種重要信息,但是這些信息往往數據量過大且雜亂無章,使得企業決策中無法直接利用,甚至可能會因為理解和利用的失誤導致決策行為產生嚴重錯誤。如果能夠利用數據挖掘技術,從數據庫中挖掘出有用的信息與知識,作為決策支撐,必然能增強企業的競爭優勢。

圖1數據挖掘的多學科交叉

數據挖掘技術自產生以來,就引起了人們的重視,眾多學者開始關注這一新領域,并不斷研究。文獻[1]對數據挖掘的概念、發展及其常用技術作了詳細而深入的研究。對數據挖掘中相關技術、算法的改進作了進一步的研究。文獻[2]則對數據挖掘的應用進行了研究,分別闡述了其在客戶忠誠度分析及CRM系統中的應用。這些研究都不斷推動著數據挖掘技術的快速發展。

1.2數據挖掘的定義及體系結構分析

數據挖掘,就是從大量的數據中發掘出有用信息,并且加以分析和利用。其主要由各類數據庫或數據倉庫、數據挖掘引擎、知識、模式評估、圖形用戶界面模塊組成,這些模塊的有機組成就構建了數據挖掘系統的體系結構,典型的數據挖掘體系結構如圖2所示。

圖2典型的數據挖掘體系結構

下面對各個有機組成的模塊作簡單介紹。

(1)數據庫或數據倉庫服務器:數據挖掘的基礎是相關數據信息,因而,當數據挖掘過程開始時,數據庫或數據倉庫服務器從底層的操作性數據庫或數據倉庫,甚至是外部數據源中通過一定的處理過程提取相關數據,如對數據進行清理、過濾、轉換、集成等。

(2)領域知識庫:領域知識庫主要用來指導搜索和挖掘的過程,或對挖掘的結果進行評價。

(3)數據挖掘引擎:該模塊可以說是整個挖掘體系中最核心最重要的組成部分,一般由多個功能模塊組成,用于對數據進行深層次的分析和處理,如:分類模塊、聚類分析模塊、關聯規則模塊、時間序列模塊等。

(4)模式評估模塊:該模塊主要是實現與數據挖掘模塊的交互,使得數據挖掘能夠按照預期的方向進行。一般來說,模式評估模塊與數據挖掘引擎集成度越高,其交互影響也就越深,則該系統越高效。因而,在設計數據挖掘系統的過程中,二者的交互是必須要考慮的。

(5)圖形用戶界面:該模塊主要是采用圖形方式來實現用戶和數據挖掘系統之間的交互,提供相關交互接口。在實際應用中,由用戶提出數據挖掘任務,提供一定的數據挖掘參數,指導數據挖掘的過程,并根據數據挖掘返回的過程處理結果進行干預和指導,從而更進一步研究數據挖掘工作。此外該模塊還可以實現用戶對數據庫的瀏覽及對挖掘模式的額評估。

2常用數據挖掘模式

一般的數據挖掘可以分為預測型挖掘和描述型挖掘兩種。預測型數據挖掘一般由已知結果建立,用于預測新的行為表現,如分類(classification)、回歸分析(regression)、時間序列(time series)等。描述型數據挖掘大多為分析現有數據,描述數據中的行為關系,如分群(clustering)、關聯法則(association rule)、序列分析(sequential affinity)等。數據挖掘按其學習模式的不同又可分為監督式學習的數據挖掘技術及非監督式學習的數據挖掘技術,分別以分類技術和分群技術為代表。

數據挖掘的這些模式已經成功應用于各個行業。文獻[3]利用數據挖掘對LTE網絡進行優化,文獻[4]則闡述了數據挖掘在電子商務中的應用。電信市場的競爭激烈,要在這樣的市場格局再去花更多的人力、物力、財力去開發新的客戶并不是一個有效的方式。本文將以用戶數據信息為樣本,構建數據挖掘算法,分析其特征。

3模型建立與仿真分析

3.1建模方法分析

首先,篩選出客戶數據中的重要屬性,通過與專家討論的方式,過去的經驗值以及參考相關文獻來選擇客戶的屬性。然后,對數據進行預處理,并將數據分成訓練數據及測試數據來建立優質客戶及可能流失客戶的預測模型,并對模型做評估與比較,其實現流程如圖3所示。數據的預處理的主要目的是避免“垃圾進,垃圾出”的情況。針對原生數據中的不完整或不一致或無法辨別的數據進行加工處理。而另一方面,也對數據進行篩選,降低數據處理的維度。

圖3 客戶流失預測實現流程圖

3.2實現算法

數據挖掘的算法很多,如文獻[4]提出的基于遺傳規則算法。本文根據移動通信行業實際,采用決策樹中的C4.5算法。C4.5算法是先構建一顆完整的決策樹,再針對每一個內部節點依使用者定義的錯誤預估率(Predicted Error Rate)來做判定樹修剪的動作。而C4.5在建立分支節點時,則是通過內部節點的數據比重,動態的去決定判定樹的分支節點。C4.5算法構造決策樹的過程為:

Function C4.5(R:包含連續屬性的無類別屬性集合,C:類別屬性,S:訓練集)

Begin

If S為空,返回一個值為Failure的單個節點;

If S是由相同類別屬性值的記錄組成,

返回一個帶有該值的單個節點;

If R為空,則返回一個單節點,其值為在S的記錄中找出的頻率最高的類別屬性值;[注意未出現錯誤則意味著是不適合分類的記錄];

For所有的屬性R(Ri) Do

If屬性Ri為連續屬性,則

Begin

將Ri的最小值賦給A1:

將Rm的最大值賦給Am;

For j From 2 To m-1 Do Aj=A1+j*(A1Am)/m;

將Ri點的基于{< =Aj,>Aj}的最大信息增益屬性(Ri,S)賦給A;

End;

將R中屬性之間具有最大信息增益的屬性(D,S)賦給D;

將屬性D的值賦給{dj/j=1,2…m};

將分別由對應于D的值為dj的記錄組成的S的子集賦給{sj/j=1,2…m};

返回一棵樹,其根標記為D;樹枝標記為d1,d2…dm;

再分別構造以下樹:

C4.5(R-{D},C,S1),C4.5(R-{D},C,S2)…C4.5(R-{D},C,Sm);

End C4.5

3.3建模結果與分析

通過挑選的八個客戶屬性包含客戶的性別、客戶的年齡、客戶的費率方案、客戶的付款方式、客戶的欠款金額、客戶的入網年限和客戶平均賬單金額來建立預測模型。由于客戶的平均賬單金額是連續型的數值。所以,將平均賬單金額用類別的方式做分類,然后增加一個平均賬單金額范圍的屬性并作為目標屬性。而分類的方式則是按照移動公司內部政策將平均賬單金額做分類。如表1所示。

表1 賬單分類

經過決策樹的分類,找出預測的模型,而預測客戶平均賬單金額模型此實驗結果是將客戶分成四群,分別是1.06,1.98,2.85,3.97這四類的客戶群。第一群是1.06這個群組,代表的是客戶平均賬單金額小于250.5元的客戶群。第二群是1.98這個群組,代表的是客戶的平均賬單金額大于或等于250.5元且小于1 299.43元的客戶群,以此類推。比較移動公司與本文預測模型對賬單平均金額的分類情況。如下表2所示。

表2 賬單分類的對比

假定在當時移動公司對于優質客戶群是定義在客戶的平均賬單金額大于或等于1 400元的群組里,即表2中的第3、4、5的群組。而本文對于優質客戶群的定義則是平均賬單金額大于或等于1 299.43元的群組里。

當預測出客戶的平均賬單金額的范圍后,可以針對所定義的客戶群去找出需要的優質客戶。而優質客戶就是落在平均賬單金額范圍是在3~5的客戶群,另一種就是平均賬單金額大于1 299.43的客戶。但是,如果客戶的平均賬單金額大于1 299.43,而可能這樣的客戶早就已經流失掉了。為了讓預測模型更準確,進一步做客戶群是否會流失的預測,以確定所預測出來的優質客戶是具有實質意義的。圖4所示為用于分析四類的客戶群是否會流失的預測模型。

圖4預測模型

通過上面的模型,只有賬單平均金額范圍落在1,賬單平均金額介于0到250.5元的客戶才會流失。而優質客戶,即賬單平均金額范圍是3、4的客戶是不會流失的。表3為選擇數據進行的四次實驗情況和預測的平均準確度。

因而,第一次的預測準確度為(339+229)/639=88.8889%;以此計算得第二、第三、第四次的預測準確度分別為89.5149%、88.7324%、88.8889%。平均準確度為:89.0063%。

從模型結果可以看出,在預測客戶平均賬單金額的模型中,平均準確度達到89.0063%。這就意味著可以通過所建立的預測模型篩選出優質客戶群。同時,也可以發現一些預測錯誤客戶的特征。因而,客戶有效的分群(包括優質客戶,可能流失的客戶以及預測錯誤的情況) ,那么就能與不同的客戶群保如果將客戶有效的分群(包括優質客戶,可能流失持良好的關系,進而降低客戶的流失比例。一方面,可以讓優質客戶可以持續為企業創造利潤。另一方面,也能及早地對于可能會流失的客戶采取一定的措施,以避免客戶大量的流失。此外,還可以針對預測錯誤的情況加以分析,避免讓企業花更多的成本去處理不具實質效益的客戶群。

表3 預測結果

4結語

數據挖掘及數據倉庫技術在電信行業中具有十分廣泛的應用,包括客戶細分,業務預測,重要客戶挖掘以及客戶流失預測和控制識別等。本文闡述了數據挖掘的體系結構及常用模式,針對移動通信行業的客戶流失問題,建立了基于用戶集合的數據挖掘模型,對移動通信行業的優質客戶及可能流失客戶進行預測,仿真分析結果驗證了該模型的有效性及實用性。通過所建立的預測模型挖掘出優質客戶群,并對將流失的客戶群采取針對性措施,將大大提高企業的效益及數據的價值。

參考文獻:

[1]HAN Jia-wei,Micheline Kamber.數據挖掘概念與技術[M].北京:機械工業出版社,2005.

HAN Jiawei, Micheline Kamber.Data Mining Concepts and Techniques.[M]. Beijing: China Machine Press,2005.

[2]劉芳,郭宇春.基于數據挖掘的用戶忠誠度分析[J].計算機技術與發展,2013,07(23):14-17,21.

LIU Fang, GUO Yu-chun. User Loyalty Analysis based on Data Mining[J].Computer Technology and Development,2013,07(23):14-17,21.

[3]劉毅,劉珂,孔建坤.基于大數據挖掘的LTE網絡規劃研究[J].通信技術,2015(02):194-198.

LIU Yi, LIU Ke, KONG Jian-kun.TD-LTE Network Planning based on Big-Data Mining [J].Communications Technology, 2015(02):194-198.

[4]李嵐.數據挖掘技術在電子商務中的應用[J].通信技術,2007(08):74-76.

LI Lan. Application of Data Mining Technology In Electronic Business [J].Communications Technology,2007(08):74-76.

吳曜宏(1981—),男,碩士,主要研究方向為計算機網絡及通信技術;

王鶴鳴(1988—),男,助理工程師,主要研究方向為數據庫、信息處理;

劉義銘(1982—),女,碩士,主要研究方向為信息安全。

猜你喜歡
移動通信數據挖掘
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
移動通信WLAN平臺下的網絡均衡器的設計與實現
軟件無線電技術在移動通信測試領域的應用
數據挖掘技術在中醫診療數據分析中的應用
淺談移動互聯網通信技術
當前高速鐵路移動通信系統關鍵技術的演進及發展探析
探究集約化理念在移動通信基站建設中的運用
一種基于Hadoop的大數據挖掘云服務及應用
下一代移動通信系統中的無線資源管理問題研究
科技視界(2015年25期)2015-09-01 16:03:17
主站蜘蛛池模板: 九色免费视频| 成人精品区| 激情五月婷婷综合网| 精品福利视频网| 久久综合九色综合97网| 亚洲AV免费一区二区三区| 国产成人精品男人的天堂下载| 亚洲成A人V欧美综合| 久久亚洲美女精品国产精品| 久久久精品久久久久三级| 国模私拍一区二区| 91精品国产情侣高潮露脸| 国产日韩欧美在线播放| 亚洲AV无码不卡无码| 99免费视频观看| 91亚洲影院| 亚洲女同欧美在线| 九色在线观看视频| 丁香六月综合网| 国产欧美精品一区二区| 欧美一级夜夜爽| 国产亚洲精品97在线观看| av免费在线观看美女叉开腿| 一级全黄毛片| 久久天天躁狠狠躁夜夜躁| 依依成人精品无v国产| 最新亚洲av女人的天堂| 美女被躁出白浆视频播放| 特级毛片免费视频| 91精品情国产情侣高潮对白蜜| 九九香蕉视频| 真实国产精品vr专区| 欧美国产另类| 欧美日韩福利| 欧美国产日韩在线播放| 国产精品任我爽爆在线播放6080 | 日韩欧美高清视频| 国产精品久久久精品三级| 日韩黄色精品| 婷婷伊人五月| 欧美午夜网| 三上悠亚在线精品二区| 在线国产综合一区二区三区| 久久精品国产精品青草app| 亚洲精品爱草草视频在线| 日韩黄色在线| 日本在线亚洲| 国产精品大尺度尺度视频| 国产免费久久精品99re不卡| 国产人成乱码视频免费观看| 2021国产精品自拍| 国产福利在线观看精品| 成人小视频网| 秘书高跟黑色丝袜国产91在线| 99视频在线免费| 伊人无码视屏| 亚洲欧美一区二区三区图片| 国产人妖视频一区在线观看| 国产熟睡乱子伦视频网站| 欧美a级完整在线观看| 四虎综合网| 午夜丁香婷婷| 亚洲天堂网在线观看视频| 国产欧美精品一区二区| 亚洲第七页| 欧洲一区二区三区无码| h视频在线播放| 亚洲嫩模喷白浆| 亚洲黄网视频| 亚洲天堂网站在线| 91精品啪在线观看国产60岁| 国产拍在线| 手机永久AV在线播放| 特级毛片8级毛片免费观看| 天堂中文在线资源| 依依成人精品无v国产| 69免费在线视频| 亚洲AⅤ永久无码精品毛片| 亚洲天堂日韩在线| 九九热免费在线视频| 99精品免费在线| 国产麻豆精品久久一二三|