999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于貝葉斯分類算法的客戶流失分析模型研究

2008-12-31 00:00:00郭凱明
電腦知識與技術(shù) 2008年35期

摘要:客戶關(guān)系管理以客戶為中心,通過再造企業(yè)組織體系和優(yōu)化業(yè)務(wù)流程,展開系統(tǒng)的客戶研究,最大程度地改善、提高了整個客戶關(guān)系生命周期的績效,從而提高客戶的滿意度和忠誠度,提高運營效率和利潤收益。該文研究和探討了客戶關(guān)系管理系統(tǒng)開發(fā)的技術(shù)環(huán)節(jié)及實現(xiàn)過程,并對基于貝葉斯分類算法的客戶流失分析模型的建立進行了分析。

關(guān)鍵詞:貝葉斯分類算法,數(shù)據(jù)挖掘,客戶關(guān)系管理

中圖分類號:TP393文獻標識碼:A文章編號:1009-3044(2008)35-2251-02

Bayesian classification algorithm based on the analysis of the loss of customers Model

GUO Kai-ming

(Taiyuan University of Technology Institute of Computer and software,Taiyuan 030024,China)

Abstract: Customer Relation Management takes the customers as the center, it gives a new life to the enterprise organization system and optimizes the business process, then launches a general research of the customers, and in order to raise the results of the whole customer life cycle, thus raises the customers' satisfaction and company's profit. This paper mainly focused on the discussion and the research of the basic technique concerned with data mining,And Bayesian classification algorithm based on the analysis of the loss of customer model are analyzed.

Key words: Bayesian classification algorithm, data mining, customer relationship management

1 引言

客戶關(guān)系管理是現(xiàn)代管理科學(xué)和信息技術(shù)結(jié)合的產(chǎn)物,是企業(yè)最終實現(xiàn)電子化、運營目標所使用的軟硬件系統(tǒng)及集成的管理方法、解決方案的總和。它以客戶為中心,通過再造企業(yè)組織體系和優(yōu)化業(yè)務(wù)流程,展開系統(tǒng)的客戶研究,從而提高客戶的滿意度和忠誠度,提高運營效率和利潤收益。

本文所研究的客戶分類挖掘系統(tǒng)是以打印行業(yè)為背景,目標立足于A公司客戶的內(nèi)部信息、業(yè)務(wù)狀況信息、市場競爭信息等基本信息,采取數(shù)據(jù)倉庫技術(shù),結(jié)合OLAP 分析技術(shù)和數(shù)據(jù)挖掘技術(shù)以統(tǒng)計報表、圖表、以及生成相關(guān)文檔的形式向決策人員和客戶經(jīng)理提供決策和工作的依據(jù)。對客戶進行定級、分析、核定信用度,對不同的客戶建立相應(yīng)的聯(lián)系,并根據(jù)其特點提供“一對一”的個性化營銷策略。

2 貝葉斯分類算法

分類算法(Classification)是屬于預(yù)測式數(shù)據(jù)挖掘的一種數(shù)據(jù)分析方法,其目的是根據(jù)重要樣本數(shù)據(jù)集找出能準確描述并區(qū)分數(shù)據(jù)類或概念的模型,以便依據(jù)實體的屬性值及其它約束條件將其劃分到某個數(shù)據(jù)類別中去。分類是數(shù)據(jù)挖掘領(lǐng)域中一個非常重要的研究課題。目前的技術(shù)和方法主要有決策樹分類、樸素貝葉斯分類、貝葉斯信念網(wǎng)絡(luò)、向后傳播分類、遺傳算法、粗糙集方法、基于案例的推理等。

貝葉斯分類是統(tǒng)計學(xué)分類的方法,它可以預(yù)測類成員關(guān)系的可能性,如給定樣本屬于一個特定類的概率。貝葉斯分類的特點是使用概率規(guī)則來實現(xiàn)學(xué)習(xí)或某種推理過程,即將學(xué)習(xí)或推理的結(jié)果表示為隨機變量的概率分布,這可以解釋為對不同可能性的信任程度。貝葉斯分類的出發(fā)點就是貝葉斯定理,即:

P(C|X)=

其中:P(C|X)表示條件X下C的后驗概率;

P(C)表示C的先驗概率;

P(X|C)表示條件C下X的后驗概率;

P(X)表示X的先驗概率。

貝葉斯分類方法有兩種,一種稱為樸素貝葉斯分類,另一種稱為貝葉斯信念網(wǎng)絡(luò)。樸素貝葉斯分類假定一個屬性值對給定類的影響對立于其他屬性的值。這一假定稱作類條件獨立。作此假定是為了簡化所需計算,并在此意義下稱為“樸素的”。貝葉斯信念網(wǎng)絡(luò)是圖形模型,它能表示屬性子集之間的依賴。

3 系統(tǒng)設(shè)計

通過公司的mis系統(tǒng),可以搜集到關(guān)于客戶的基本信息、客戶近段時間內(nèi)的訪談記錄、客戶的銷售確認單(SO 單)、客戶擁有的設(shè)備等信息資料。接下來的工作就是如何從這些信息資料中挖掘出公司所需要的知識。我們先來回答以下問題:1)用戶的根本需要,即用戶需要發(fā)現(xiàn)什么?2)用戶對現(xiàn)有數(shù)據(jù)中的那些屬性更加關(guān)注?3)數(shù)據(jù)挖掘的目的是什么?

需要是發(fā)明之母。對每個問題有了一個比較清晰的結(jié)論才可以進行以后的工作,才可以保證以后的工作的有用性。下面一一作答:1)用戶需要對所有客戶合理分類,為公司制定各種營銷和服務(wù)活動打好基礎(chǔ)。2)用戶對數(shù)據(jù)中客戶的SO單、訪談記錄數(shù)量等更加關(guān)注;3)數(shù)據(jù)挖掘的目的是選擇合適的分類算法將公司的客戶合理分類。

由上面的問題分析可以分析出用戶的需求:用戶已經(jīng)有了一個業(yè)務(wù)數(shù)據(jù)庫,而且積累了大量的數(shù)據(jù),用戶希望可以利用這些數(shù)據(jù)將客戶合理分類,以便公司制定各種營銷和服務(wù)活動,增加銷售收入。

本文時間和課題經(jīng)費有限,暫時不考慮較復(fù)雜的分類算法,如K-最臨近分類法、遺傳算法、模糊集算法等。課題中分類算法的選取主要集中在貝葉斯分類上。

對于貝葉斯分類:1)貝葉斯分類返回的不是一個類別標記,而是每個類別的預(yù)測概率。這里是把后驗概率P(C | X ) i 最高的類別Ci作為對任意給定值X的類別預(yù)測,因為這個類別最可能產(chǎn)生這個數(shù)據(jù)。這種方案具有最優(yōu)性,因為其分類誤差率(貝葉斯誤差率):

PB(1-maxP(Ci/X))P(X)dx)

是可能的最小誤差率。沒有其他分類方法可以對新的未見過的數(shù)據(jù)達到更低的預(yù)期誤差率。2)盡管樸素貝葉斯分類的類條件獨立假定可能不是很切合實際,但它仍有可能做出相當(dāng)精確的分類預(yù)測。原因有多種,比如:要估計的參數(shù)較少,因此加強了估計的穩(wěn)定性;雖然概率估計是有偏的,但人們關(guān)心的并不是它的絕對值,而是它的排列次序,因此可能并不要緊;很多時候已經(jīng)對變量進行了篩選,可能在篩選中已經(jīng)去掉了高度相關(guān)變量對中的多余變量等等。3)除了分類性能很好外,貝葉斯分類還具有形式簡單、很強的可擴展性和可理解性等特點。系統(tǒng)大致可以分成三層:數(shù)據(jù)層(包括業(yè)務(wù)數(shù)據(jù)庫和數(shù)據(jù)倉庫)、業(yè)務(wù)邏輯層、數(shù)據(jù)展現(xiàn)層。如圖1所示。

數(shù)據(jù)層的業(yè)務(wù)數(shù)據(jù)庫就是公司mis系統(tǒng)日常的應(yīng)用數(shù)據(jù)庫,記錄了公司所有客戶的各種信息資料。數(shù)據(jù)倉庫是從業(yè)務(wù)數(shù)據(jù)庫中得到的,把經(jīng)過集成和清理的數(shù)據(jù)進行抽取和集成,形成事實數(shù)據(jù)表和維度數(shù)據(jù)表。業(yè)務(wù)邏輯層負責(zé)對數(shù)據(jù)倉庫和業(yè)務(wù)數(shù)據(jù)庫中數(shù)據(jù)的各種處理,以及實際操作中具體業(yè)務(wù)的處理,比如權(quán)限的處理,該層還包括分類算法的實現(xiàn)。數(shù)據(jù)展現(xiàn)層實現(xiàn)對數(shù)據(jù)挖掘所產(chǎn)生的知識的各種展現(xiàn),以及對數(shù)據(jù)倉庫中數(shù)據(jù)的數(shù)據(jù)透視。

4 系統(tǒng)實現(xiàn)

本次數(shù)據(jù)挖掘,服務(wù)器端所用的關(guān)系數(shù)據(jù)庫是 Microsoft 公司的 SQL Server2000 數(shù)據(jù)庫。這種數(shù)據(jù)庫管理系統(tǒng)具有非常好的數(shù)據(jù)完整性和一致性,良好的人機界面,功能強大,并附帶有 Analysis Service,它是 SQL Server OLAP 的升級,通過它我們可以創(chuàng)建多維數(shù)據(jù)集。

客戶端的開發(fā)環(huán)境使用 Windows XP 操作系統(tǒng),為程序的正常運行提供保障。開發(fā)語言采用Java 語言,開發(fā)工具選用 Borland 公司的JBuilder 2005 Enterprise,因為有強大的數(shù)據(jù)庫連接功能和強大的數(shù)據(jù)處理功能。

由于篇幅有限本文主要介紹系統(tǒng)的業(yè)務(wù)邏輯層和數(shù)據(jù)展現(xiàn)層的實現(xiàn)。

1)填補空缺值

算法名稱:均值填補空缺值算法

輸入:數(shù)值型表數(shù)據(jù)集

輸出:無1值的表數(shù)據(jù)集處理流程:

求所有該屬性不為1的記錄的該屬性平均值;用該平均值填充所有為1的記錄的該屬性。

程序流程圖如圖2所示。

算法分析:該算法具有方便易用快速的特點,缺點也很明顯,如果噪聲數(shù)據(jù)多,則會對挖掘結(jié)果產(chǎn)生誤導(dǎo)。但公司mis系統(tǒng)的基礎(chǔ)數(shù)據(jù)比較穩(wěn)定,并且大部分為數(shù)值型數(shù)據(jù),因此可以應(yīng)用此算法。

2)數(shù)據(jù)轉(zhuǎn)換

算法名稱:批量數(shù)據(jù)轉(zhuǎn)換算法

輸入:key為客戶ID,value為客戶某屬性數(shù)量的Map

輸出:key為客戶ID,value為客戶某屬性離散值的Map處理流程:

用select 語句和count 函數(shù)統(tǒng)計出客戶某屬性的數(shù)量,比如:select customer_Id,count(*) from Table_visiting group by customer_Id order by customer_Id ;

將統(tǒng)計得到的數(shù)量按照預(yù)定的規(guī)則離散化;

將離散化的結(jié)果存入數(shù)據(jù)倉庫備用。

程序流程圖如圖3所示。

算法分析:該算法實現(xiàn)簡單,主要問題是將分類所需要的各屬性分開處理,這樣在將離散化的結(jié)果存入數(shù)據(jù)倉庫時效率相對較低。但是根據(jù)行業(yè)特點,公司客戶的分類相對穩(wěn)定,并不需要時時運行CRM系統(tǒng),因此還是可以使用該算法的。

3)構(gòu)建決策樹

業(yè)務(wù)邏輯層的核心是ID3算法,其中構(gòu)建決策樹的偽代碼如下所示:

Procedure BuildTree(S) {用數(shù)據(jù)集S初始化根節(jié)點R用根結(jié)點R初始化隊列QWhile Q is not Empty do {取出隊列Q中的第一個節(jié)點N if N 不純 (Pure) {for 每一個屬性 A估計該節(jié)點在A上的信息增益選出最佳的屬性,將N分裂為N1、N2}}}

4)繼續(xù)挖掘需求,改善系統(tǒng)

數(shù)據(jù)倉庫的建立和數(shù)據(jù)挖掘的進行不是在設(shè)計和建造階段就可以最終確定的,要經(jīng)過用戶的反復(fù)驗證和不斷改進才可以做到真正滿足用戶的需要,所以在數(shù)據(jù)挖掘中,不會系統(tǒng)剛剛開發(fā)出來就完全滿足用戶的需要,要經(jīng)過用戶的不斷使用,發(fā)現(xiàn)其中的不合理,不方便的地方,并加以改進,直到滿足用戶需求為止。

參考文獻:

[1] 王海波,仲秋雁. 基于數(shù)據(jù)挖掘的客戶關(guān)系管理體系結(jié)構(gòu)研究. 大連理工大學(xué)學(xué)報-社會科學(xué)版. 2004(7).

[2] 青虹宏. 基于數(shù)據(jù)挖掘技術(shù)的客戶關(guān)系管理系統(tǒng). 重慶工商大學(xué)學(xué)報-自然科學(xué)版. 2004(8).

[3] 鄧光利,劉強,陳新度. 基于數(shù)據(jù)挖掘提升客戶價值的實現(xiàn)框架探索. 管理科學(xué).2005(3).

主站蜘蛛池模板: 2021国产v亚洲v天堂无码| 久久a级片| 欧美日韩一区二区三区在线视频| av色爱 天堂网| 亚洲综合色区在线播放2019| 国产性生大片免费观看性欧美| 香蕉eeww99国产在线观看| 美女内射视频WWW网站午夜 | 天堂成人av| av天堂最新版在线| 国产网站免费观看| 国产成人AV综合久久| 国产精品一区二区不卡的视频| 一级片一区| 日韩激情成人| 久青草免费在线视频| 国产在线91在线电影| 欧美天堂在线| 久久综合婷婷| 欧美乱妇高清无乱码免费| 国产午夜福利在线小视频| 欧美翘臀一区二区三区| 91精品啪在线观看国产60岁| 精品国产香蕉在线播出| 欧美www在线观看| 午夜欧美在线| 久久夜色精品| 欧美中文字幕一区二区三区| 亚洲系列无码专区偷窥无码| 日韩福利在线视频| 国产成人三级| 亚洲第一区精品日韩在线播放| 亚洲精品人成网线在线| 91视频免费观看网站| 國產尤物AV尤物在線觀看| 国产成人亚洲日韩欧美电影| 香蕉伊思人视频| 久久99热这里只有精品免费看| 99精品免费在线| 久久精品免费国产大片| 97亚洲色综久久精品| 国产草草影院18成年视频| 美女视频黄又黄又免费高清| 国产幂在线无码精品| 国产又爽又黄无遮挡免费观看 | 91www在线观看| 在线观看欧美国产| 亚洲成人动漫在线观看| 国产成人艳妇AA视频在线| 亚洲欧美成aⅴ人在线观看| 日本高清有码人妻| 久久国产高清视频| 亚洲AⅤ无码国产精品| 成人免费网站久久久| AV无码国产在线看岛国岛| 成人另类稀缺在线观看| 午夜a级毛片| 精品国产成人三级在线观看| 日本国产一区在线观看| 精品国产一区91在线| 香蕉在线视频网站| 免费一级成人毛片| 午夜一级做a爰片久久毛片| 国产午夜一级毛片| 无码日韩视频| 99色亚洲国产精品11p| 国产成人福利在线视老湿机| 国产成人综合久久精品尤物| 欧美a在线| 免费一级无码在线网站| 久久免费精品琪琪| 国产99久久亚洲综合精品西瓜tv| 国产亚洲精品在天天在线麻豆| 久久先锋资源| 免费看av在线网站网址| 亚洲精品视频免费观看| 免费久久一级欧美特大黄| 91 九色视频丝袜| 无码区日韩专区免费系列| 国产97公开成人免费视频| 亚洲精品无码专区在线观看| 3D动漫精品啪啪一区二区下载|