方志丹
摘 要:隨著信息技術大數據時代的到來,以及供電局信息化建設的逐步推進和深化,信息業務系統的應用數據飛速增長,對這些數據有效的處理需求也日趨提升。該文從電力行業角度,在業務和硬件層面列舉了目前信息系統應用數據處理所面臨的問題和對數據分析技術的應用需求,闡述了數據分析技術對電力行業信息數據的應用思路并進行了探討和展望。
關鍵詞:數據分析 信息系統 應用數據
中圖分類號:TM73 文獻標識碼:A 文章編號:1674-098X(2015)10(a)-0057-02
在物聯網、云計算、移動互聯網、電子商務、社交媒體等基于網絡的信息技術的快速發展和廣泛應用的作用下,全球的信息數據量呈現出指數增長的趨勢,IDC《數字宇宙》(Digital Universe)[1]在2014年的研究報告中指出,全球的數據總量按照每年40%的幅度增長,即每兩年翻一番,在這個速度下,到2020年時全球數據總量將可以達到4.4ZB(即4.4萬億GB)。在這樣的環境下,各種信息應用數據的迅速產生和積累也促使著企業的信息化加速進入大數據階段,其中,雖然有2/3的數據創建自個人,但各企業仍須對85%的數據負有各種相關責任。
傳統信息系統對數據的創建和使用的依據僅建立在業務流程和業務模型的基礎上,實現底層業務關系數據的增刪查改基礎操作,而對海量數據、對不同類型和范疇數據的價值提取卻存在不少的缺陷。與之相比,基于數學分析理論的數據分析技術側重于海量數據處理,跳出傳統信息系統的形式約束,可對已收集到的數據進行進一步統計分析和挖掘,從而獲取這些數據更深層的意義或規律,更深入發掘數據背后的隱藏價值,能進一步提高信息利用率,提高數據效益。
如今,傳統信息系統已逐漸無法滿足對大數據的處理需求,中國的互聯網、政府、金融、通訊等行業和企業都在逐步深入和逐步拓展對大數據和數據分析技術的應用,從結構化數據到半結構化、非結構化數據,以充分挖掘各行業數據的表層及潛在或隱藏的價值。同樣,近年來,隨著電力行業的信息化不斷推廣和深入,諸如電力營銷管理、營配信息集成、GIS、資產管理等大型、復雜業務系統的建設和廣泛投運,使得各層面的電網單位均面臨著對諸如電費詳單、用戶分布、業務峰谷、服務器性能、存儲數據等方面的巨大數據量的處理和管理上的難題,加之相對于金融、通訊等行業,電力行業的業務和用戶數據的變化性和多樣性較低,在價值提取方面更具難度,需要尋求適應企業自身需求的數據分析技術對這些數據進行更有效的統計、挖掘或預測。
1 電力行業信息系統現狀和數據分析需求
一般情況下,基于信息系統的各項業務均存在峰谷分布特性,即在某一時段會集中發生大量業務操作,此時用戶訪問量大、操作數多、服務器資源消耗高、網絡帶寬占用大、數據庫讀寫頻繁;反之,在另一時段則是業務低谷期,此時很少外部用戶訪問業務系統,可分配服務器的一部分計算資源進行數據整理或備份操作。
應用系統層面上,根據電力營銷系統的歷史業務記錄,可以看出,在用戶繳費方面,本地供電局每月的用戶繳費行為大體上集中出現在當月的第一周之后(圖2),因此供電局需在用戶繳費前完成大量的電費計算、核查和發行操作(圖3),以確保用戶可以順利完成繳費。
服務器運維層面上,服務器計算資源的消耗與應用系統業務使用量成正相關關系,業務繁忙程度越高,服務器出現資源異常的可能性就越大,所以保障服務器正常運轉的需求也越高。以電力營銷系統為例,其系統架構總體上采用客戶機—負載均衡設備—應用服務器—數據庫集群—存儲設備的結構建設,其中數據庫的IO、日志文件同步等指標可在一定程度上反映出當前業務量情況。圖4所示為某月各工作日對數據庫3個性能指標的執行等待時間統計,可以看出,從該月第二周開始逐步出現一定程度的數值升高,此處反映該時段內集中出現的客戶繳費行為,引起數據庫讀寫量和事務量上升,從而增加了事務的等待時間。
另外,服務器硬件發生故障的概率雖然大體上隨著設備使用時長的增長而提高,但某些情況也會存在一定的偶然性和突發性。當在業務過程中出現硬件故障,尤其是在業務高峰期,會出現較為嚴重的影響,這也要求運維人員對業務高峰有一定的估測能力以及對設備故障有足夠快的響應速度。
綜上,不論是面向客戶的行業主營業務,還是內部的服務器性能消耗和信息系統日常使用,各項數據都在各方面存在一定的規律性特點或互相關聯的因素,這不僅對上述的業務量或服務器性能統計來說如此,對行業內的各類具體數據同樣適用。然而,目前對這些數據的利用往往只停留在表層的增刪查改操作上,并不能很好地抽象出其中的特征或模式,造成信息利用率的下降。電力行業的數據具有數據量大、類型多、價值高的特點,對控制管理和企業盈利的影響甚多,有專家分析稱,數據利用率每提高10%,電網的利潤則可提高20%~49%。為了適應大數據的逐步普及、適應企業的改革與轉型、滿足新階段對信息技術的要求,亟需尋求合適的技術充分利用這些數據,實現對變化趨勢的預測和拓展企業核心能力、提高企業經濟效益的目的。
2 數據分析技術在電力行業的應用
常用的數據分析方法包括聚類分析、相關分析、回歸分析等涉及統計學和概率論的理論,目前市面常用的數據分析軟件有SPSS、Stata、SAS、R、Matlab等系統,分別適用于不同專業程度的應用場景。
如今各行業已開始探索和采用這些技術來處理與行業自身相關的各項數據,例如對根據時間和話費等指標分析移動通信客戶的消費行為[2]、利用收集的資料分析及發現銀行零售業務的潛在客戶[3]、利用關聯分析等方法評價病人病因、處方及藥物副作用[4]等,同樣,在電力行業,可以從客戶用電量、用電時間、客戶分類和分布狀況、季節和氣候變化、政府法規政策、信息系統使用情況、計算和存儲資源消耗狀態等各項指標著手進行分析,實現相同或類似的目的。
利用數據分析技術處理電力行業數據,優化企業管理模式,提升企業經營水平,其適用場景包括以下方面。
2.1 客戶信息分析
類似于通訊行業的客戶行為和消費分析,根據電力營銷的大量的歷史數據,一是可利用聚類分析的方式,在時間、空間和客戶性質上分析客戶的用電行為和用電規律,采用手動標簽類別特征或對數據特征做自動聚類的方法,對客戶群進行不同粒度的細分,從而可在不同層面制定不同的更具針對性的營銷方案和服務模式,也可避免供電業務的一刀切問題;二是可利用關聯分析的方式,統計收集到的可能與客戶用電存在影響關系的電價、氣候、環境、政策、交通等因素,提取這些因素與客戶用電數據的相關性,找出對其存在顯著影響性的成分,并據此優化客戶的用電需求預測模型,從而通過多維的因素對市場和業務進行分析和預判,也可實現避免客戶流失和發掘潛在客戶的目的。
2.2 業務服務質量提升
目前,電力業務普遍只為客戶提供基礎性的供電服務,僅確保客戶能夠正常用電。而隨著企業的改革和轉型,更大的需求是以客戶為中心,從客戶體驗出發,提供更為全面和豐富的電力增值服務,可從地區、行業、客戶等不同層面的用電明細歷史數據提取出各自的用電規律和特殊需求,制定合理、優化的營銷方案或業務套餐,或讓客戶根據自身的用電行為和趨勢調整相應的用電方案,提高客戶的用電效益。
2.3 協助優化IDC資源
如前文所述,信息系統的資源使用量往往取決于其業務的使用情況。對于營銷系統,可從大量的客戶繳費時間、繳費數量和對應的服務器資源使用記錄中擬合出服務器資源隨時間變化的占用曲線,并根據實際情況進行適當的業務窗口或后臺數據處理窗口調整,在確保業務正常進行的前提下降低業務高峰和提高空閑時段的資源利用率,此外,對業務量和數據存儲量的綜合測算,可對系統的存儲資源占用量趨勢做出更為準確的短期和中期預測,避免存儲資源池的短缺或浪費問題;類似地,對于企業門戶、辦公自動化、人力資源等內部業務系統,用戶訪問量分布和各端點間的數據交互數量則是影響其服務器計算和存儲資源使用的主要因素,也是形成對服務器的采購、運維和升級的具體需求的來源之一。
2.4 營銷稽查數據的進一步分析
本地供電局于2013年建成在線稽查業務精益化管理平臺,投運至今成效明顯,其中部分重要規則共篩查差錯樣本2000多個,糾錯挽回或減少經濟損失約450萬元,為營銷稽查工作、營銷業務單位自我診斷、風險管控提供了強有力的支持。在此基礎上,根據對差錯數據的數量、區段、等級、來源的分析,結合營銷客戶信息分析,可推斷差錯的性質、原因和客戶用電行為、營銷方案、收費操作之間的聯系程度,趨利避害,進一步規避問題數據乃至偷電行為的出現。
2.5 為電力基礎設施建設提供支持
電力基礎設施的選址往往需要以大量的前期調研為依據,其影響涉及地區性質、行業分布、人員密集程度、交通流量、氣候條件等社會環境因素,此外,隨著社會發展和城市建設,若干已有的線路規劃、高壓桿塔、變壓器,乃至變電站、發電設施都可能成為發展阻礙成分,進行改建則需進一步花費人力財力。通過對相關數據的分析,可以預測當地的電力使用量和發展趨勢,為基建選址提供更多的客觀的參考依據。
數據分析技術對電力行業信息數據的應用并不只局限于上述的若干場景,在未來的信息技術發展過程中,各個信息系統、業務線條、電力運營單位之間的數據界限將逐漸淡化,形成具有更高關聯度的大數據整體,而大數據技術也會得到更廣泛的應用。
3 結語
與物聯網、云計算等新興技術的快速普及一樣,大數據技術在企業發展過程中的重要性和影響力也逐漸顯現。隨著信息技術數據價值的日趨凸顯,電力行業在推進信息化建設的過程中,需要加速完成的任務之一,便是快速適應新時代的發展需求、利用現有資源和技術,構建大數據的技術環境,充分應用數據分析技術,提升信息化產業效益,為企業的總體發展提供更為有效的助推力。
參考文獻
[1] Vernon Turner,John F.Gantz,David Reinsel,et al.The Digital Universe of Opportunities:Rich Data and the Increasing Value of the Internet of Things[J]Australian Journal of Telecommunications & the Digital Economy,2014,2(3).
[2] 劉蓉,陳曉紅.基于數據挖掘的移動通信客戶消費行為分析[J].計算機應用與軟件,2006(2):60-62,130.
[3] 王真真.我國中小商業銀行零售業務潛在客戶開發管理[D].大連:大連海事大學,2012.
[4] 鄒北驥.大數據分析及其在醫療領域中的應用[J].計算機教育,2014(7):24-29.