999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

SSAS聚類分析算法在顧客分組分析中的應用*

2011-11-07 03:28:12黃青松葉曉波
楚雄師范學院學報 2011年9期
關鍵詞:數據挖掘分類模型

王 松 黃青松 葉曉波

(1.昆明理工大學信息工程與自動化學院,云南 昆明 650093;2.楚雄師范學院計算機信息管理中心,云南 楚雄 675000)

SSAS聚類分析算法在顧客分組分析中的應用*

王 松1,2黃青松1葉曉波2

(1.昆明理工大學信息工程與自動化學院,云南 昆明 650093;2.楚雄師范學院計算機信息管理中心,云南 楚雄 675000)

介紹一種利用數據挖掘技術建立顧客分類分析的挖掘模型。主要介紹了基于Microsoft SQL SERVER Analysis Services(SSAS)的聚類分析算法,以及SSAS聚類分析算法在對某銷售信息進行顧客分組分析中的應用,通過分析聚類分析算法挖掘模型所發現的模式,得出了對顧客分類的結果,為銷售公司管理層的營銷決策提供有力的參考和輔助。

數據挖掘;SSAS聚類分析算法;顧客分組

1.引言

隨著計算機應用技術的不斷發展,銷售信息管理系統在銷售公司中得到廣泛的應用。銷售信息管理系統為各個銷售公司的日常管理提高效率的同時積累了很多顧客的購買信息。那么,這些顧客的購買信息除了為商家的日常管理提供方便外,還能有什么用嗎?促銷酬賓活動是商家經常實施的提高銷售利潤的很好的方法。為了使商家在此類活動中有的放矢,針對潛在的顧客群來高效地完成促銷活動,可以利用銷售信息管理系統中顧客的歷史購買信息來發現顧客的購買行為,從而確定最有可能購買商品的潛在顧客,為商家提供有利的決策支持。為了從這些海量數據中發現和獲取對人們有價值的信息和知識,就需要通過新技術和強大的工具以智能的方式從這些龐大的數據信息中“挖掘”出有用的信息。從商業角度來看,數據挖掘是一種新的商業信息處理技術,其主要特點是對商業數據庫中的大量業務數據進行抽取、轉換、分析和其他模型化處理,從中提取輔助商業決策的關鍵性數據。隨著數據挖掘技術的日益成熟和廣泛應用以及數據挖掘軟件市場需求量的不斷增大,許多具有成熟技術和應用價值很高的數據挖掘軟件工具應運而生。在眾多的數據挖掘工具中,Microsoft SQL SERVER Analysis Services(SSAS)以其容易上手、快速、便捷等特點得到廣泛應用。本文主要介紹數據挖掘中的聚類分析算法在顧客分組分析中的應用,用一個實際案例說明用SSAS聚類分析算法建立的顧客分組預測分析模型。

2.SSAS聚類分析算法

SSAS聚類分析算法是一種分割算法。將數據劃分為組或分類,這些組或分類的項具有相似屬性。該算法使用迭代技術將數據集中的事例分組為包含類似特征的分類。

SSAS聚類分析算法首先標識數據集中的關系并根據這些關系生成一系列分類。

在最初定義分類后,算法將通過計算確定分類表示點分組情況的適合程度,然后嘗試重新定義這些分組以創建可以更好地表示數據的分類。該算法將循環執行此過程,直到它不能再通過重新定義分類來改進結果為止。

SSAS聚類分析算法提供兩種創建分類并為分類分配數據點的方法。第一種方法是K-means算法,這是一種較難的聚類分析方法。這意味著一個數據點只能屬于一個分類,并會為該分類中的每個數據點的成員身份計算一個概率。第二種方法是“期望值最大化”(EM)方法,這是“軟聚類分析”方法。這意味著一個數據點總是屬于多個分類,并會為每個數據點和分類的組合計算一個概率。

(1)EM聚類分析

在EM聚類分析中,此算法反復優化初始分類模型以適合數據,并確定數據點存在于某個分類中的概率。當概率模型適合于數據時,此算法終止這一過程。用于確定是否適合的函數是數據適合模型的對數可能性。

如果在此過程中生成空分類,或者一個或多個分類的成員身份低于給定的閾值,則具有低填充率的分類會以新數據點重設種子,并且EM算法重新運行。

EM聚類分析方法的結果是概率性的。這意味著每個數據點都屬于所有分類,但數據點向分類的每次分配都有一個不同的概率。因為此方法允許分類重疊,所以所有分類中的項的總數可能超過定型集中的總項數。在挖掘模型結果中,指示支持的分數會相應地調整以說明這一情況。

EM算法可描述為:

①對參數向量作初始猜測:包括隨機選擇K個對象代表簇的均值或中心,以及猜測其他的參數。

②用下面兩個步驟反復求精參數 (或簇):

Ⅰ.期望步:用以下概率將每個對象xi指派到簇Ck:

其中,p(xi|Ck)=N(mk,Ek(xi))服從均值為mk、期望為Ek的高斯分布。

Ⅱ.最大化步:利用前面得到的概率估計重新估計模型參數。例如:

與k-means聚類分析算法相比,它有多個優點:①最多需要一次數據庫掃描;②工作時不受內存(RAM)限制;③能夠使用只進游標;④優于抽樣方法。

(2)k-means聚類分析

k-means聚類分析是一種廣為人知的方法,它通過盡量縮小一個分類中的項之間的差異,同時盡量拉大分類之間的距離,來分配分類成員身份。k-means中的“means”指的是分類的“中點”,它是任意選定的一個數據點,之后反復優化,直到真正代表該分類中的所有數據點的平均值。“k”指的是用于為聚類分析過程設種子的任意數目的點。k-means算法計算一個分類中的數據記錄之間的歐幾里得距離的平方,以及表示分類平均值的矢量,并在和達到最小值時在最后一組k分類上收斂。

k-means算法僅僅將每個數據點分配給一個分類,并且不允許成員身份存在不確定性。分類中的成員身份表示為與中點的距離。

通常,k-means算法用于創建連續屬性的分類,在這種情況下,計算與平均值的距離非常簡單。但是,SSAS實現通過使用概率針對分類離散屬性對k-means方法進行改編。對于離散屬性,數據點與特定分類的距離按如下公式計算:

1-P(數據點,分類)

k-means算法的步驟:

輸入:K(期望簇的數目)、n個對象的數據集

輸出:K個簇的集合

①任意選取數據集中的K個對象作為初始簇的中心

②對于所有n個對象,一一找其最近似的簇中心 (一般是以距離最近者相似度較高),然后將該對象分配到最近似的簇

③根據第②步的結果,重新計算各個簇的中心 (各個簇的平均值)

重復以上兩個步驟,直到所設計的準則函數收斂為止 (一般是以沒有任何對象變換所屬簇為收斂條件),也就是平方誤差準則,其定義如下:

其中:mi是簇i的中心,p是簇i內的對象,ci代表簇i

3.實例分析

3.1 實例概述

本文以某銷售公司的銷售信息為數據依據,根據顧客的歷史購買情況來詳細了解該公司的顧客,然后使用這些歷史數據進行可用于營銷的預測。按照顧客歷史信息中的“之前是否已購買”(顧客購買自行車的行為)這個屬性和顧客的年齡、所在地區、隨同居住的孩子數、擁有車數量、年收入、婚姻狀況、上下班路程、擁有孩子數、是否有房等屬性,將相似的顧客聚成簇,使得在一個簇中的顧客具有很高的相似性,而與其他簇中的顧客很不相似,從而發現未知的類別。所形成的每個簇可以當作一個類別,形成對每個類別的描述。本例采用的是k-means算法。

3.2 分析聚類分析算法挖掘模型所發現的模式

3.2.1 所生成的分類特征

表1

表2

表3

表4

表5

3.2.2 聚類分析結果

通過對所生成的分類特征的分析,可對聚類結果作出如下的判斷:

分類1(購買者百分比最高):性別分布很均勻,擁有一個孩子,沒有車子,沒有隨同居住的孩子,上下班路程較短,有房的,已婚的,年齡較大,年收入在五類中居第二位。

分類2(購買者百分比第二):性別分布很均勻,擁有一個孩子,沒有車子,沒有隨同居住的孩子,上下班路程較短,有房的,已婚的,較年青 (26—37),年收入在五類中居第三位。

分類3(購買者百分比第三):性別分布很均勻,沒有孩子,擁有兩輛車,沒有隨同居住的孩子,上下班路程較長,有房的,已婚的,年齡較大,年收入在五類中居首位。

分類4(購買者百分比第四):性別分布很均勻,沒有孩子,擁有兩輛車,沒有隨同居住的孩子,上下班路程較短,有房的,未婚的,年齡分布均勻,年收入在五類中居末位。

分類5(購買者百分比第五):性別分布很均勻,沒有孩子,擁有兩輛車,沒有隨同居住的孩子,上下班路程較長,有房的,未婚的,較年青,年收入在五類中居末位。

4.總結

通過上述對SSAS聚類分析算法的討論,以及利用基于SSAS聚類分析算法建立的挖掘模型應用到一個具體實例,通過分析聚類分析算法挖掘模型所發現的模式,得出了對顧客分類的結果。這種對顧客特征描述的分類歸納能為銷售公司管理層的營銷決策提供有力的參考和輔助,對同一類型的顧客制定特定的營銷管理策略,有針對性的提高管理顧客和提高銷售量的效率。

[1] JIAWEIHAN MICHELINE KAMBER.Data Mining:Concepts and Techniques,2nd ed[M].China Machine Press,2006.

[2]郭麗.SQLServer2005構建數據挖掘解決方案 [J].計算機與現代化.2007(5):1.

[3](美)陳封能,(美)斯坦巴赫,(美)庫瑪爾著,范明等譯.數據挖掘導論 (完整版)[M].北京:人民郵電出版社,2011.

[4]謝邦昌.商務智能與數據挖掘Microsoft SQL Server應用 [M].北京:機械工業出版社,2008.

[5](美)邁克倫南,(美)唐朝暉,(美)克里沃茨著,董艷,程文俊譯.數據挖掘原理與應用 (第2版)—SQL Server 2008數據庫[M].北京:清華大學出版社,2010.

Application of SSAS cluster parsing algorithm in customers partitioning analysis

WANG Song1.2;HUANG Qing-song1;YE Xiao-bo2
(1.School of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650093,China;2.Computer Information Management Center,Chuxiong Normal University,Chuxiong 675000,China)

A model of customers partitioning analysis using data mining technology was described.This paper mainly recommends a cluster parsing algorithm based on Microsoft SQL SERVER Analysis Services(SSAS)and its application in customers partitioning of sales information.The results of customer partitioning obtained from the pattern excavated by analyze cluster parsing algorithm data mining model,and it provided sufficiently reference and supplement for management’s marketing decision-making of a sales company.

Data mining;SSAS cluster parsing algorithm;customers partitioning

TP391.1

A

1671-7406(2011)09-0011-06

2011-04-12

王 松 (1976—),男,云南楚雄人,昆明理工大學在讀碩士,楚雄師范學院計算機信息管理中心實驗師,主要研究方向:人工智能。

(責任編輯 劉洪基)

猜你喜歡
數據挖掘分類模型
一半模型
分類算一算
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
3D打印中的模型分割與打包
主站蜘蛛池模板: 伊人中文网| 欧美一区国产| 国产特级毛片| 亚洲精品成人片在线观看| 日韩123欧美字幕| 激情网址在线观看| 毛片免费视频| 亚洲国产天堂久久综合| 四虎国产精品永久在线网址| 囯产av无码片毛片一级| 视频国产精品丝袜第一页| 深夜福利视频一区二区| 欧洲一区二区三区无码| 91香蕉国产亚洲一二三区| 国产成人91精品| 国产传媒一区二区三区四区五区| 国产精品无码在线看| 制服丝袜亚洲| 狠狠综合久久| 欧美视频二区| 中文字幕调教一区二区视频| av午夜福利一片免费看| 小说 亚洲 无码 精品| 亚洲精品在线观看91| 亚洲一级色| 无遮挡一级毛片呦女视频| 亚洲精品不卡午夜精品| 欧美成人在线免费| 精品国产免费观看一区| a级免费视频| 亚洲无线一二三四区男男| 亚洲视频一区在线| 国产在线一二三区| 国产性精品| 亚洲va在线∨a天堂va欧美va| 99热国产这里只有精品9九 | 国产产在线精品亚洲aavv| 午夜国产精品视频| 天堂va亚洲va欧美va国产| 97亚洲色综久久精品| 国内精品免费| 99热这里只有精品在线播放| 欧美另类图片视频无弹跳第一页| 六月婷婷综合| 欧美成人A视频| 中文纯内无码H| 无码精油按摩潮喷在线播放| 国产人成在线观看| 久久综合一个色综合网| 日本欧美中文字幕精品亚洲| 直接黄91麻豆网站| 性激烈欧美三级在线播放| 欧美中文字幕在线播放| 亚洲乱码在线视频| 欧美日韩在线成人| 中国丰满人妻无码束缚啪啪| 国产一级视频久久| 91视频99| 国产成人成人一区二区| 国产制服丝袜91在线| 大陆国产精品视频| 99成人在线观看| 性喷潮久久久久久久久| 免费全部高H视频无码无遮掩| 性欧美精品xxxx| 久久黄色小视频| 国产福利小视频在线播放观看| 凹凸国产熟女精品视频| 亚洲狼网站狼狼鲁亚洲下载| 亚洲丝袜第一页| 久久精品aⅴ无码中文字幕| 麻豆国产精品| 国产一级小视频| 久久精品aⅴ无码中文字幕| 久久永久精品免费视频| 国产99精品久久| 国产日韩欧美黄色片免费观看| 激情综合网址| 久久人搡人人玩人妻精品| 99久久国产综合精品2023| 国产激情影院| 久久成人免费|