999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于熵權(quán)法與改進(jìn)的PCA聚類算法的電力客戶價(jià)值分類與應(yīng)用

2017-04-14 12:52:32皇甫漢聰肖招娣余永忠
現(xiàn)代電子技術(shù) 2017年7期
關(guān)鍵詞:數(shù)據(jù)挖掘

皇甫漢聰 肖招娣 余永忠

摘 要: 對電力客戶進(jìn)行價(jià)值分析,有利于全面了解客戶,為電力客戶提供差異化服務(wù)。同時(shí)也可以提高客戶滿意度,實(shí)現(xiàn)供電企業(yè)、客戶雙贏的局面。運(yùn)用數(shù)據(jù)挖掘方法對電力客戶價(jià)值分類,構(gòu)建電力客戶價(jià)值評價(jià)指標(biāo)體系,這些指標(biāo)涵蓋客戶的用電行為、繳費(fèi)行為、輿情和行業(yè)發(fā)展?fàn)顩r等,運(yùn)用熵權(quán)法計(jì)算指標(biāo)的權(quán)重,提出一種改進(jìn)的PCA聚類算法對電力客戶價(jià)值進(jìn)行分類,為供電企業(yè)制定差異化服務(wù)策略提供輔助支撐。

關(guān)鍵詞: 電力客戶價(jià)值; 熵權(quán)法; 改進(jìn)的PCA聚類算法; 數(shù)據(jù)挖掘

中圖分類號: TN911.1?34 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)07?0183?04

Power consumer value classification and application based on entropy weight method

and improved PCA clustering algorithm

HUANGFU Hancong, XIAO Zhaodi, YU Yongzhong

(Foshan Power Supply Bureau, Guangdong Power Grid Co., Ltd., Foshan 528000, China)

Abstract: The analysis of the power consumer value helps the power enterprises to understand their consumers comprehensively, provides the differentiated services for power consumers, and can improve the consumer satisfaction to benefit both of the power supply enterprises and consumers. The data mining method is used to classify the power customer value, and construct the evaluation index system of the power consumer value. The indexes involve the consumer′s power consumption behavior, paying behavior, public feelings and industrial development status. The weights of the indexes are calculated with the entropy weight method. A new improved PCA clustering algorithm is proposed to classify the power consumer value, which provides the ancillary support for the power enterprises to formulate the differentiated services strategy.

Keywords: power consumer value; entropy weight method; improved PCA clustering algorithm; data mining

0 引 言

經(jīng)濟(jì)的發(fā)展推動(dòng)著我國電力事業(yè)的快速發(fā)展,隨著電力市場化步伐的加快,供電企業(yè)面臨著越來越激烈的競爭,電力客戶不再完全是被動(dòng)接受者,客戶的作用越來越大,客戶價(jià)值的影響也越來越大。然而,電力客戶群體廣泛,不同客戶對于服務(wù)內(nèi)容、方式、深度的需求存在巨大的差異。因此,供電企業(yè)迫切需要對客戶進(jìn)行科學(xué)的分析,根據(jù)客戶的綜合價(jià)值對其進(jìn)行分類,針對不同的客戶群體制定不同的營銷策略,為客戶提供精益化的服務(wù)。

迄今為止,客戶價(jià)值評價(jià)分析的主要方法有模糊層次分析法[1]、結(jié)合利益細(xì)分法和K?均值的混合方法[2]、結(jié)合熵權(quán)法與區(qū)間數(shù)概率分布的混合方法[3]、支持向量機(jī)法[4]等。在有些情況下這些算法能取得不錯(cuò)的效果,然而依然存在一些不足之處,如模糊層次分析法包含較強(qiáng)的主觀因素,支持向量機(jī)法不能確定數(shù)據(jù)中哪些知識是冗余的,K?均值因隨機(jī)選取初始中心點(diǎn)會導(dǎo)致結(jié)果不穩(wěn)定。

鑒于上述算法的不足,本文構(gòu)建了電力客戶價(jià)值評價(jià)的指標(biāo)體系。提出一種對電力客戶價(jià)值分類的新方法,即基于熵權(quán)法和改進(jìn)的PCA聚類算法的混合方法,熵權(quán)法用于計(jì)算各個(gè)指標(biāo)的權(quán)重,改進(jìn)的PCA聚類算法用于電力客戶價(jià)值分類。

1 電力客戶價(jià)值評價(jià)指標(biāo)體系

在遵循完整性、可比性、易獲取性、非重疊性等原則的基礎(chǔ)上,結(jié)合電力行業(yè)的現(xiàn)狀和客戶價(jià)值理論[5?6],從電力客戶的收入貢獻(xiàn)、風(fēng)險(xiǎn)性、成長性等三個(gè)方面選取了11個(gè)指標(biāo),這11個(gè)指標(biāo)從不同角度反映電力客戶的價(jià)值,并初步構(gòu)成了電力客戶價(jià)值評價(jià)指標(biāo)體系,如表1所示,各指標(biāo)計(jì)算說明見表2。

2 權(quán)重和聚類方法

2.1 權(quán)重的計(jì)算方法

權(quán)重的計(jì)算方法有專家評分法、層次分析法[7]、主成分分析法、熵權(quán)法等。專家評分法主觀性強(qiáng);層次分析法具有多層次、多指標(biāo)、定量定性相結(jié)合的特點(diǎn),但它要求同層次指標(biāo)間相互獨(dú)立以及跨層次指標(biāo)間不具備支配關(guān)系[5]。主成分分析法是一種客觀性較強(qiáng)的方法,主要是依據(jù)指標(biāo)數(shù)據(jù)的方差計(jì)算權(quán)重,不能真實(shí)反應(yīng)指標(biāo)對綜合評價(jià)的貢獻(xiàn)。鑒于以上方法的一些不足,本文采用熵權(quán)法計(jì)算指標(biāo)權(quán)重,熵權(quán)法精度較高且客觀性較強(qiáng),適用于任何需要確定權(quán)重的地方。

熵權(quán)法的計(jì)算方法如下:

步驟1:將各個(gè)指標(biāo)的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。

假設(shè)給定了[k]個(gè)指標(biāo)[X1,X2,…,Xk,]其中[Xi=x1,x2,…,xn]。假設(shè)對各指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化后的值為[Y1,Y2,…,Yk。]

步驟2:求各指標(biāo)的信息熵。

計(jì)算各個(gè)指標(biāo)的信息熵[Ej=-1lnni=1npijlnpij]。其中[pij=Yiji=1nYij,]如果[pij=0,]則定義[limpij→0pijlnpij=0]。

步驟3:確定各指標(biāo)權(quán)重。

根據(jù)各指標(biāo)的信息熵計(jì)算各指標(biāo)的權(quán)重[Wi=1-Eik-Ei,i=1,2,…,k]。

2.2 聚類算法

聚類分析指的是根據(jù)不同數(shù)據(jù)對象之間的差異,將數(shù)據(jù)集合分組成為由類似的對象組成的多個(gè)類或簇的分析過程。聚類算法主要有層次聚類算法和劃分類的聚類算法等。層次聚類算法是將所有樣本點(diǎn)自底向上合并成一棵樹或者自頂向下分裂成一棵樹的過程,但是層次聚類算法有一個(gè)缺點(diǎn)就是一旦一個(gè)凝聚或是分割形成,這個(gè)操作永遠(yuǎn)不會被改變了,且層次聚類算法計(jì)算復(fù)雜。劃分的聚類算法中最經(jīng)典的是K?means聚類算法,計(jì)算簡單高效,但是,它對初始聚類中心敏感。此外,隨機(jī)選取初始聚類中心會導(dǎo)致聚類結(jié)果不穩(wěn)定。因此,學(xué)者們提出了許多改進(jìn)的聚類算法。

初始聚類中心算法[8]的實(shí)現(xiàn)過程如下:

步驟1:數(shù)據(jù)集[X]有[n]個(gè)數(shù)據(jù)對象,聚類的類數(shù)為[k],計(jì)算其中最小的數(shù)據(jù)對象[min(X)];

步驟2:計(jì)算[X]中所有數(shù)據(jù)對象到[min(X)]的距離[Dis1,Dis2,…,Dis n,]根據(jù)此距離升序排列所有數(shù)據(jù)對象;

步驟3:將第[1+(i-1)(n-2)(k-1),i=1,2,…,k]項(xiàng)數(shù)據(jù)對象設(shè)為對應(yīng)類的初始成員;

步驟4:對尚未分配的數(shù)據(jù)對象,計(jì)算其與每個(gè)類中初始成員的距離,同時(shí)將數(shù)據(jù)對象歸入到距離最小的類中;

步驟5:計(jì)算每個(gè)類中所有數(shù)據(jù)對象的平均值,即為初始中心點(diǎn)。

上述初始聚類中心算法避免了隨機(jī)的步驟,使得聚類結(jié)果更加可靠,同時(shí)計(jì)算得出的初始聚類中心點(diǎn)分布均勻,更能代表原始數(shù)據(jù)的整體分布,可適當(dāng)?shù)臏p少迭代次數(shù)。結(jié)合改進(jìn)的初始聚類中心算法和K?means的思想,得出了改進(jìn)的K?means聚類算法,記為算法1,該算法的實(shí)現(xiàn)步驟如下:

步驟1:應(yīng)用初始聚類中心算法選取[K]個(gè)初始聚類中心。

步驟2:計(jì)算所有數(shù)據(jù)對象與聚類中心的距離,同時(shí)將數(shù)據(jù)對象分配到最近的類中。

步驟3:重新計(jì)算每個(gè)聚類中所有數(shù)據(jù)對象的平均值,作為新的聚類中心。

步驟4:循環(huán)步驟2,步驟3,直到前后兩次迭代得到的每個(gè)聚類中心點(diǎn)相同為止。

雖然改進(jìn)的K?means聚類算法具有計(jì)算簡單、高效,聚類結(jié)果穩(wěn)定等優(yōu)點(diǎn),但是處理大規(guī)模高維度數(shù)據(jù)時(shí)相似度(距離)的計(jì)算需要耗費(fèi)大量的時(shí)間,結(jié)合主成分分析[9]即PCA的思想與算法1,本文提出了改進(jìn)的PCA聚類算法,算法步驟如下:

步驟1:設(shè)原始數(shù)據(jù)矩陣為[X∈Rn×d;]

步驟2:令[B∈Rd×d,]且[B=XX;]

步驟3:計(jì)算矩陣[B]的特征值和特征向量,并取出最大特征值對應(yīng)的特征向量[V;]

步驟4:令[C=X?V,]則[C∈Rn×1;]

步驟5:應(yīng)用算法1對1維列向量[C]進(jìn)行聚類,然后再對應(yīng)到原始數(shù)據(jù),得出原始數(shù)據(jù)的聚類結(jié)果,即原始數(shù)據(jù)對象[Xi]被劃分到第[j]類中,當(dāng)且僅當(dāng)向量[C]的第[i]行被劃分到第[j]類。

該算法既具有PCA主成分分析降維的特點(diǎn), 又避免了K?means算法聚類結(jié)果不穩(wěn)定的缺點(diǎn), 同時(shí)又具有K?means算法的高效性與簡潔性等優(yōu)點(diǎn), 因此該算法適合處理大規(guī)模高維度數(shù)據(jù)。

3 模型應(yīng)用

為了說明本文所提出的改進(jìn)PCA聚類算法的可行性,抽取了一些電力客戶的樣本數(shù)據(jù),應(yīng)用Matlab R2012b軟件對其編程。

為確保樣本選取的公平性,首先需保證指標(biāo)體系中的各個(gè)指標(biāo)都要對應(yīng)選取一定量的樣本,其次,隨機(jī)抽取樣本。根據(jù)此樣本數(shù)據(jù)選取方法抽取8個(gè)樣本客戶,分別記為客戶1、客戶2、…、客戶8,客戶指標(biāo)數(shù)據(jù)如表3所示。

指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化處理說明:

(1) 指標(biāo)[X1,X2,X3,X7]屬于高優(yōu)指標(biāo),即指標(biāo)的值越大越好,這兩個(gè)指標(biāo)標(biāo)準(zhǔn)化處理的方法為:

[(原值-最小值)(最大值-最小值)×100] (1)

(2) 除去上述4個(gè)指標(biāo)之外,其他指標(biāo)均屬于低優(yōu)指標(biāo),即指標(biāo)的值越小越好,這些指標(biāo)標(biāo)準(zhǔn)化處理的方法為:

[(最大值-原值)(最大值-最小值)×100] (2)

根據(jù)2.1節(jié)中權(quán)重的計(jì)算方法,得出各指標(biāo)的權(quán)重如表4所示。對客戶指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化處理,結(jié)合表4中的各個(gè)指標(biāo)的權(quán)重,加權(quán)求和得出每個(gè)客戶的綜合得分,應(yīng)用改進(jìn)的PCA聚類算法對客戶進(jìn)行分類,如表5所示。根據(jù)綜合得分和改進(jìn)的PCA聚類算法的分類結(jié)果可知本文所提算法的可行性。

為了說明改進(jìn)的PCA聚類算法的有效性,在相同數(shù)據(jù)集的情況下,把它同算法1進(jìn)行比較。其中改進(jìn)的PCA聚類算法的運(yùn)行時(shí)間是0.010 158 s,算法1的運(yùn)行時(shí)間是0.022 612 s,改進(jìn)的PCA聚類算法在運(yùn)行效率上要優(yōu)于算法1,運(yùn)行結(jié)果相同。

4 結(jié) 論

電力客戶綜合價(jià)值評價(jià)體系的建立為供電企業(yè)制定營銷策略提供依據(jù),是客戶關(guān)系管理的基礎(chǔ)。首先,結(jié)合客戶價(jià)值理論和電力行業(yè)的特殊性建立電力客戶價(jià)值評價(jià)指標(biāo)體系,指標(biāo)體系涵蓋客戶用電行為、繳費(fèi)行為、輿情和行業(yè)發(fā)展動(dòng)態(tài);其次,提出了一種行之有效的對電力客戶價(jià)值評價(jià)的混合方法,即結(jié)合熵權(quán)法和改進(jìn)的PCA聚類算法,該算法能夠根據(jù)數(shù)據(jù)自身的特征計(jì)算各指標(biāo)的權(quán)重并科學(xué)的確定分類標(biāo)準(zhǔn)。熵權(quán)法是一種精度較高,客觀性較強(qiáng)的計(jì)算權(quán)重的方法。改進(jìn)的PCA聚類算法既具有主成分分析降維的優(yōu)點(diǎn),同時(shí)避免了因隨機(jī)選取初始中心點(diǎn)導(dǎo)致的聚類結(jié)果不穩(wěn)定這一缺陷,也具有K?means聚類算法簡潔高效等優(yōu)點(diǎn),因此該算法適合處理大規(guī)模高維度數(shù)據(jù);最后,通過實(shí)例驗(yàn)證了該方法的有效性,且該技術(shù)在某供電企業(yè)得到了深入應(yīng)用,并取得了良好效果。

參考文獻(xiàn)

[1] 王松濤.市場條件下的電力客戶價(jià)值分析體系[J].電網(wǎng)技術(shù),2010,34(2):155?158.

[2] 曾鳴,楊素萍,楊鵬舉,等.社會節(jié)能環(huán)境下電力客戶價(jià)值評估研究[J].華東電力,2008,36(6):15?19.

[3] 李金超,李金穎,牛東曉,等.考慮區(qū)間數(shù)概率分布的電力客戶價(jià)值綜合評價(jià)[J].華北電力大學(xué)學(xué)報(bào),2005,32(4):56?58.

[4] 李俊飛.集成粗糙集和支持向量機(jī)的電力客戶價(jià)值評價(jià)[D].保定:華北電力大學(xué),2007.

[5] 趙曉波.供電企業(yè)大客戶管理的研究[D].南京:南京理工大學(xué),2005.

[6] 靳方明.基于客戶價(jià)值分析的電力客戶服務(wù)管理研究[D].北京:華北電力大學(xué),2007.

[7] 沈利香,曹國.基于網(wǎng)絡(luò)層次分析法的商業(yè)銀行網(wǎng)絡(luò)安全評估模型[J].計(jì)算機(jī)應(yīng)用,2012,32(2):480?484.

[8] 董騏瑞. K?均值聚類算法的改進(jìn)與實(shí)現(xiàn)[D].吉林:吉林大學(xué),2015.

[9] 劉倩.基于主成分聚類分析的中小企業(yè)成長性研究[J].企業(yè)管理,2011,16(4):186?188.

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
主站蜘蛛池模板: 国产成人精品一区二区秒拍1o| 日韩精品久久久久久久电影蜜臀| 国产小视频网站| 青青草国产精品久久久久| 韩日免费小视频| 国产在线观看成人91| 亚洲欧洲日产国产无码AV| 免费无码AV片在线观看中文| 亚洲中文字幕久久精品无码一区| 国产 在线视频无码| 亚洲不卡av中文在线| 最新国产高清在线| 亚洲日韩高清无码| 亚洲国产成人自拍| 久久福利网| a级免费视频| 国产AV无码专区亚洲A∨毛片| 国产又色又爽又黄| 国产香蕉在线视频| 欧美福利在线观看| 91小视频在线观看| 欧美人与牲动交a欧美精品 | 国产精品久久久精品三级| 19国产精品麻豆免费观看| 国产精品欧美日本韩免费一区二区三区不卡| 亚洲看片网| 久久这里只有精品国产99| 国产偷倩视频| 欧美激情视频二区| 高清无码一本到东京热| 国产永久在线观看| 成人国产精品视频频| 青青青草国产| a亚洲天堂| 日韩大乳视频中文字幕| 色成人亚洲| 伊人久久精品无码麻豆精品 | 波多野结衣中文字幕一区| 日韩免费毛片| 无码日韩精品91超碰| 成人毛片免费观看| 99精品国产高清一区二区| 99久久精品无码专区免费| 国产簧片免费在线播放| 国内精品小视频福利网址| 欧洲亚洲欧美国产日本高清| 午夜视频www| 一级毛片在线播放免费| 亚洲大尺度在线| 日韩乱码免费一区二区三区| 日本91视频| 秋霞国产在线| 亚洲天堂免费| 热热久久狠狠偷偷色男同| 欧美三级视频在线播放| 亚洲天堂视频在线播放| 亚洲午夜18| 九色91在线视频| 一区二区三区高清视频国产女人| 日本亚洲国产一区二区三区| 亚洲第一黄色网| 亚洲精品波多野结衣| 国产福利在线免费| 中文字幕2区| 国产传媒一区二区三区四区五区| 高潮爽到爆的喷水女主播视频 | 久久国产精品国产自线拍| 美女无遮挡免费视频网站| 欧美成人午夜在线全部免费| 99成人在线观看| 亚洲美女一区二区三区| 亚洲一区无码在线| 国产精品尤物铁牛tv| 91丝袜在线观看| 国产农村精品一级毛片视频| 久久久久久久久久国产精品| 中文天堂在线视频| 制服丝袜 91视频| 久久亚洲美女精品国产精品| 日本免费高清一区| 免费无码AV片在线观看国产| 国产H片无码不卡在线视频|