王波,羅楊,王亮,胡靜蕾
(1.國網寧夏電力有限公司吳忠供電公司,寧夏 吳忠 751100;2.國網寧夏電力有限公司,寧夏 銀川 750001;3.濟南銀華信息技術有限公司,寧夏 銀川 750001)
目前,利用因子分析進行綜合分析評價的研究很多:楊帆[1]等建立的供電營業廳運營效率[2-3]模型實現了對營業廳整體服務資源[4]及運營效率的評估;王磊[5]等針對電能質量綜合評估的特點,采用因子分析方法,提出了基于因子分析法的電能質量綜合評估模型;宋新甫[6]等基于主成分分析法將電網精準投資影響因素進行降維分析,得到新的綜合影響因素。本文構建基于主成分、因子分析法建立的綜合分析評價模型,其評價結果能客觀地評估營業廳的綜合業務水平。
主成分分析過程是一種數學降維的過程,從多個原始變量中提取出幾個綜合變量,并且這幾個綜合變量能夠涵蓋原始變量的絕大多數信息,且彼此之間沒有相關性。
假設有n個樣品,每個樣品有p項指標,即X1,X2,…,Xp,這p個指標構成的p維隨機向量記為X=(X1,X2,…,XP),得到如下原始數據矩陣:

主成分分析就是將p個觀測變量綜合成為p個新的綜合變量的過程,即:

簡化為Fj=aj1x1+aj2x2+…+ajpxp。
式中:j=1,2,……p。
式(2)要求模型滿足以下條件:
①Fi,Fj互不相關(i≠j,i,j=1,2,…,p)
②F1的方差大于F2的方差大于F3的方差,依次類推。

F1為第一主成分,F2為第二主成分,依此類推,Fp為第p個主成分。
因子分析是主成分分析的一種延伸和應用,利用降維的思想研究原始變量相關矩陣內部的依賴關系,把一些錯綜復雜的變量歸結為少數綜合因子的統計分析方法。
假設有n個樣品,p個指標,要求所選取的p個指標間有很強的相關性。將樣本觀測值構成的數據陣進行標準化處理,數據陣標準化后的矩陣均用X表示,用C1,C2,…,Cm(m
1)X=(X1,X2,…,Xp)T是可觀測隨機向量,且E(X)=0,協方差矩陣S=cov(X),并且協差陣S與相關陣R相等;
2)C=(C1,C2,…,Cm)T(m
ε=(ε1,ε2,…,εp)與W相互獨立,E(ε)=0,ε的協方差矩陣Sε是對角陣:

即ε的各分量之間也是相互獨立的。
則式(4)成為因子模型:

由模型及其假設前提可知,公共因子C1,C2,…,Cm(m
以營業廳前臺人員優化調配為目標,依據跨行業數據挖掘標準流程(cross-industry standard process for data mining,CRISP-DM)數據分析方法論,以電力營銷業務系統[7]營業廳線上7類業務17項指標數據為基礎數據,構建營業廳分析評價指標體系,如圖1所示。
2.2.1 選擇指標數據并進行標準化處理

(5)



圖1 營業廳綜合評價指標體系
2.2.2 充分性與相關性檢驗
在做主成分、因子分析前要判斷他們之間是否有較強相關性,如果指標彼此互相獨立或相關性較小,則無法從中提取公共因子,判斷能否進行主成分、因子分析的檢驗是KMO(Kaiser-Meyer-Olkin)檢驗[8]和Bartlett(巴特利)球體檢驗[8]。
KMO檢驗是Kaiser,Meyer和Olkin提出的抽樣適合性檢驗,是對原始變量之間的簡相關系數和偏相關系數的相對大小進行檢驗,取值在0~1之間,值越接近1,變量間相關性越強,偏相關性越弱,因子分析效果越好。計算公式為
(6)
式中:E—KMO檢驗;


巴特利球體檢驗主要用于檢驗相關陣中各變量間的相關性是否為單位陣,即檢驗各個變量是否各自獨立。

(7)

R—全體的均方誤差MSE。
2.2.3 確定因子個數
因子個數的確定可以根據因子方差和累計方差貢獻率來決定,只取方差大于1(或特征值大于1)的因子,按照因子的累計方差貢獻率來確定,一般要達到60%才能符合要求。
2.2.4 計算因子得分和綜合排名
利用最大方差旋轉法對上一步中提出的公共因子進行旋轉,使得各因子的方差差異達到最大,并計算公因子得分。
因子總得分=因子1×權重1+因子2×權重2+…+因子n×權重n
式中的權重計算方法,通常可以理解為已經提取的各因子的方差貢獻率占累積方差貢獻率的百分比,即累計方差占比。
本文使用Python分析工具,用factor_analyzer包進行主成分、因子分析。分析前,先對采集到的17類原始指標數據進行標準化處理,這17類指標分別為X1-低壓工單數,X2-低壓時戶數,X3-低壓平均工單時長,X4-居民工單數,X5-居民時戶數,X6-居民平均工單時長,X7-退費筆數,X8-退費金額,X9-人工繳費筆數,X10-變更工單數,X11-其他類工單數,X12-發票數量,X13-已沖紅數量,X14-已開具數量,X15-合同簽訂戶數,X16-變更數量,X17-新簽類數量。標準化處理部分結果如表1所示。

表1 數據標準化處理部分結果
3.2.1 充分性與相關性檢驗
經KMO檢驗,值為0.622,大于0.5;經巴特利球形度檢驗值p(Sig值)為0,拒絕原假設,因此適合做主成分及因子分析。
3.2.2 獲取公共因子
這一步用主成分分析法來繪制碎石圖,求解特征值,碎石圖的橫坐標指的是因子數量,縱坐標為因子特征值(可以理解為因子對樣本整體的貢獻),此碎石圖顯示特征值在第六個主分量之后開始形成直線,因此,剩余的主分量在變異性中所占比率非常小(接近于零),并且可能不重要。所以選擇特征值大于1的6個因子(FAC1_1、FAC1_2、FAC1_3、FAC1_4、FAC1_5、FAC1_6)作為公共因子,也就是說剩下的因子都能由這6個來涵蓋。其因子數與因子特征值如圖2所示。

圖2 因子數與因子特征值
3.2.3 計算綜合得分及排名
以各公因子所對應的方差貢獻率比例作為權重計算綜合得分及排名。
綜合得分Q=FAC1_1×33.041/83.12+FAC2_1×23.794/83.12+FAC3_1×9.445/83.12+FAC4_1×6.57/83.12+FAC5_1×5.61/83.12+FAC6_1×4.665/83.12。
對得出的綜合主成分值,根據實際結果、經驗與原始數據進行了檢驗,符合實際情況。根據綜合得分公式計算營業廳得分及排名情況,營業廳綜合得分及排名后20名見表2,營業廳綜合得分及排名前10名見表3。

表2 營業廳綜合得分及排名后20名

續表2

表3 營業廳綜合得分及排名前10名
本文以主成分及因子分析方法為基礎,通過構建營業廳分析評價模型,并將其運用于營業廳綜合得分排名實證研究中。該模型從原始指標出發,尋找少數幾個主成分[9]或共同因子作為新的評價指標,從而降低評價指標的維數,可以在信息量損失盡量少的情況下減少評價工作量。該方法具有客觀性,評價數據來源于原始指標,不是人為確定,因此減少了人為判斷因素造成評價結果的偏差。分析過程完成了去量綱、去相關性、降維、定權數等工作,最后建立1個營業廳綜合評價模型,并計算出綜合得分和排名。
通過分析營業廳綜合得分及排名情況,業務部門可以結合實際情況,因地制宜地制定相關措施進行營業廳資源的合理配置[10],如條件成熟,可考慮撤并,在確保服務質量的前提下,實現營業廳工作提質增效。
本文充分利用電力營銷業務系統營業廳線上指標數據,獲取需要評價的各營業廳與工作量指標相關的17類指標數據,構建基于因子分析法的供電營業廳分析評價模型,計算營業廳得分及綜合排名。通過分析評價結果,給出了排名較高及排名較低營業廳列表,為資源優化配置提供借鑒,能夠在一定程度上反映營業廳資源效率的配置情況。