伍潤(rùn)澤 王莉
(國(guó)網(wǎng)四川省電力公司德陽(yáng)供電公司,四川 德陽(yáng) 618000)
移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等新一代信息技術(shù)的快速發(fā)展和5G技術(shù)的應(yīng)用推廣,標(biāo)志著人類社會(huì)正式進(jìn)入大數(shù)據(jù)時(shí)代,數(shù)據(jù)成為重要的戰(zhàn)略資源。通過(guò)深入探索電力數(shù)據(jù)與社會(huì)數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)的融合創(chuàng)新,促進(jìn)大數(shù)據(jù)的流通集成和深度挖掘,創(chuàng)造大數(shù)據(jù)在智慧城市、人工智能發(fā)展應(yīng)用中的良性生態(tài)環(huán)境。
電力是國(guó)家能源,電力行業(yè)的發(fā)展是國(guó)民生計(jì)大事。隨著大數(shù)據(jù)的時(shí)代的到來(lái),智能電網(wǎng)和信息化建設(shè),電力行業(yè)積累了海量數(shù)據(jù),這些數(shù)據(jù)在數(shù)據(jù)量、多樣性、速度和價(jià)值方面具有大數(shù)據(jù)的特征。
研究城市的未來(lái)發(fā)展、城市的合理布局和綜合安排城市各項(xiàng)工程建設(shè)的綜合部署,是一定時(shí)期內(nèi)城市發(fā)展的藍(lán)圖,是城市建設(shè)和管理的依據(jù)。城市規(guī)劃是以發(fā)展眼光、科學(xué)論證、專家決策為前提,對(duì)城市經(jīng)濟(jì)結(jié)構(gòu)、空間結(jié)構(gòu)、社會(huì)結(jié)構(gòu)發(fā)展進(jìn)行規(guī)劃。通過(guò)優(yōu)化城市規(guī)劃,發(fā)揮指導(dǎo)和規(guī)范城市建設(shè)的重要作用,進(jìn)行城市造影構(gòu)建根據(jù)城市發(fā)展與運(yùn)行狀況不斷修訂城市規(guī)劃,持續(xù)改進(jìn)和完善進(jìn)行連續(xù)決策。
以電力數(shù)據(jù)為核心,構(gòu)建多維城市發(fā)展歷史狀態(tài)比對(duì)模型,并在此基礎(chǔ)之上形成電力數(shù)據(jù)城市造影信息分析,通過(guò)海量電力數(shù)據(jù)為基礎(chǔ),利用降維分析、系統(tǒng)聚類分析、主成分分析等方法,構(gòu)建城市發(fā)展?fàn)顟B(tài)的多維模型,另一方面結(jié)合外部城市經(jīng)濟(jì)環(huán)境數(shù)據(jù)與電力數(shù)據(jù)指標(biāo),通過(guò)動(dòng)態(tài)時(shí)間規(guī)整、支持向量機(jī)等算法對(duì)目標(biāo)城市與全國(guó)范圍內(nèi)所有城市進(jìn)行比對(duì),實(shí)現(xiàn)全視角、多空間、多城市的發(fā)展?fàn)顟B(tài)比對(duì)。

動(dòng)態(tài)時(shí)間規(guī)整DTW對(duì)各樣本的綜合得分時(shí)間序列數(shù)據(jù)進(jìn)行相似性測(cè)度,得到各樣本的初始距離陣。采用計(jì)算樣本綜合得分時(shí)間序列(面板數(shù)據(jù)轉(zhuǎn)時(shí)間序列),對(duì)時(shí)間序列編碼符號(hào)化,引入趨勢(shì)距離得出兩條時(shí)間序列的原始數(shù)據(jù)距離及其發(fā)展趨勢(shì)的相似程度,再用根據(jù)樣本距離矩陣用ward聚類。
電力數(shù)據(jù)造影模型本質(zhì)是以應(yīng)用為中心的開(kāi)源SaaS服務(wù)平臺(tái),其整體架構(gòu)由多源數(shù)據(jù)管理、計(jì)算資源管理、應(yīng)用場(chǎng)景管理三個(gè)資源層與應(yīng)用層構(gòu)成,以滿足多用戶,多場(chǎng)景定制分析應(yīng)用的需求:

電力造影模型Saas服務(wù)使用SOA技術(shù)架構(gòu)進(jìn)行開(kāi)發(fā),SOA提供邏輯與物理層面的松散耦合,因此可以根據(jù)造影平臺(tái)需要對(duì)不同數(shù)據(jù)服務(wù)場(chǎng)景使用不同的API暴露方案,具有可重用的服務(wù)和可重組服務(wù)以及標(biāo)準(zhǔn)化的服務(wù)接口。并且具有服務(wù)獨(dú)立性和平臺(tái)中性,可以滿足擴(kuò)展性不受到平臺(tái)、語(yǔ)言以及應(yīng)用框架的約束,最大限度滿足造影平臺(tái)分析場(chǎng)景及應(yīng)用環(huán)境的多樣性。基于SOA框架,具體使用Docker、Kubernetes等容器技術(shù)開(kāi)展研發(fā),可作為公有云環(huán)境下的應(yīng)用交付平臺(tái)、DevOps平臺(tái)、自動(dòng)化運(yùn)維平臺(tái)和行業(yè)云平臺(tái),或作為企業(yè)級(jí)的混合云多云管理工具、kubernetes容器管理工具或Service Mesh微服務(wù)架構(gòu)治理工具。
時(shí)間序列數(shù)據(jù)存在多種相似或距離函數(shù),其中最突出的是動(dòng)態(tài)時(shí)間規(guī)整[1](Dynamic Time Warping)。動(dòng)態(tài)時(shí)間規(guī)整未知量伸長(zhǎng)或縮短(壓擴(kuò)),直到與參考模板的長(zhǎng)度一致,在這一過(guò)程中,未知單詞的時(shí)間軸會(huì)產(chǎn)生扭曲或彎折,以便其特征量與標(biāo)準(zhǔn)模式對(duì)應(yīng)。給定兩個(gè)時(shí)間序列Q和C,Q=[q1,q2,…qn],C=[c1,c2,…cm],若n=m,可直接計(jì)算兩個(gè)序列的距離;若n≠m,則需要線性縮放到一樣的長(zhǎng)度再進(jìn)行比較。為對(duì)齊這兩個(gè)序列,構(gòu)造一個(gè)n x m的矩陣網(wǎng)格,矩陣(i,j)處的元素為為qi和和cj兩兩個(gè)點(diǎn)的距離d(qi,cj)(即序列Q的每一個(gè)點(diǎn)和C的每一個(gè)點(diǎn)之間的相似度,距離越小相似度越高)。尋找一條通過(guò)該矩陣網(wǎng)格若干格點(diǎn)的路徑,路徑通過(guò)的格點(diǎn)即為兩個(gè)序列進(jìn)行計(jì)算的對(duì)齊的點(diǎn)。該路徑定義為warping path規(guī)整路徑,用W表示。W=w1,w2……wk其中=中wk=(i,j)k。W需滿足邊界條件、單調(diào)性和連續(xù)性。滿足這些約束條件的路徑可以有指數(shù)個(gè),然后需要使得下面的規(guī)整代價(jià)最小的路徑,該路徑可通過(guò)動(dòng)態(tài)規(guī)劃算法得到。
ARIMA屬于時(shí)間序列分析法[2],其在電力數(shù)據(jù)預(yù)測(cè)中的應(yīng)用也比較多,其具體的處理步驟為:首先通過(guò)ARIMA模型對(duì)原始數(shù)據(jù)進(jìn)行檢驗(yàn),檢驗(yàn)其是否為非平穩(wěn)時(shí)間序列, 如果不是非平穩(wěn)時(shí)間序列,則需要對(duì)其進(jìn)行處理;多次處理后檢驗(yàn)為平穩(wěn)的時(shí)間序列,再根據(jù)識(shí)別階數(shù),建立ARIMA(p,q)模型。
時(shí)間序列數(shù)據(jù)變化的影響因素歸結(jié)為四類: 長(zhǎng)期趨勢(shì)(Trend)、季節(jié)變動(dòng)因素(Seasonal variation)、循環(huán)變動(dòng)因素(Cyclic variation)以及非規(guī)律性變化因素 (Irregular variation)。其中,長(zhǎng)期趨勢(shì)與季節(jié)變動(dòng)因素屬于基本決定因素,循環(huán)變動(dòng)因素屬于規(guī)律性因素,而非規(guī)律性因素則是偶然不規(guī)則因素。然而,在特定時(shí)間段內(nèi),三類因素并不是同時(shí)顯著影響時(shí)間序列的變化,每一類因素對(duì)數(shù)據(jù)影響是否顯著、顯著程度需要通過(guò)計(jì)算分解獲得。 因此通常在傳統(tǒng) ARIMA 模型基礎(chǔ)上,加入季節(jié)調(diào)整算法,及考慮季節(jié)變動(dòng)、非規(guī)律因素對(duì)數(shù)據(jù)的影響,并通過(guò)趨勢(shì)分解,分別預(yù)測(cè)不同的因素對(duì)時(shí)間序列的影響。
電力城市造影分析主要包含電力數(shù)據(jù)、政務(wù)數(shù)據(jù)、企業(yè)數(shù)據(jù)、公開(kāi)數(shù)據(jù)四部分:
電力數(shù)據(jù):電力數(shù)據(jù)是城市造影分析的數(shù)據(jù)基礎(chǔ),因?yàn)殡娏?shù)據(jù)具有精確性、實(shí)時(shí)性、廣泛性等獨(dú)特優(yōu)勢(shì),可以在不同程度上,從多角度衡量社會(huì)發(fā)展的各個(gè)方面。
政務(wù)數(shù)據(jù):政務(wù)數(shù)據(jù)是模型服務(wù)政府治理的關(guān)鍵,通過(guò)政務(wù)數(shù)據(jù)與電力數(shù)據(jù)的鉤稽融合,可以更好地服務(wù)政府基礎(chǔ)治理,協(xié)助政府建立實(shí)時(shí)監(jiān)測(cè)場(chǎng)景。
企業(yè)數(shù)據(jù):企業(yè)數(shù)據(jù)是模型服務(wù)企業(yè)客戶的核心,主要包含企業(yè)用戶在使用本平臺(tái)接入的共享數(shù)據(jù)、可能包含授權(quán)脫敏的企業(yè)基礎(chǔ)數(shù)據(jù)、生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)、供應(yīng)商數(shù)據(jù)等。
公開(kāi)數(shù)據(jù):外部多源公開(kāi)數(shù)據(jù)是模型進(jìn)行服務(wù)優(yōu)化的重要補(bǔ)充,主要包含外部天氣、地理、文化、輿情、行業(yè)、經(jīng)濟(jì)等數(shù)據(jù),構(gòu)建的分析場(chǎng)景狀態(tài)中,需要大量外部數(shù)據(jù)用于繪圖輔助、分析參照等功能。
綜合運(yùn)用LASSO法、PCA分析法等統(tǒng)計(jì)方法,將高維的繁多的電力數(shù)據(jù)、經(jīng)濟(jì)數(shù)據(jù)輸入,基于城市各指標(biāo)的發(fā)展?fàn)顟B(tài)時(shí)間序列,運(yùn)用X-12Arima調(diào)整、DTW規(guī)劃等方法進(jìn)行特征工程,結(jié)合聚類、xgboost、svm等機(jī)器學(xué)習(xí)算法,構(gòu)建多維城市歷史狀態(tài)比對(duì)分析。實(shí)現(xiàn)面板數(shù)據(jù)中、時(shí)空視角下城市的各維度發(fā)展趨勢(shì)的相似性程度分析,以分類算法解決與目標(biāo)城市特定年份最相似城市的匹配實(shí)現(xiàn)。開(kāi)發(fā)城市發(fā)展造影模型。結(jié)合logit、BP神經(jīng)網(wǎng)絡(luò)等預(yù)測(cè)算法,利用電力數(shù)據(jù)關(guān)聯(lián)產(chǎn)業(yè)結(jié)構(gòu),透視城市產(chǎn)業(yè)群結(jié)構(gòu)狀態(tài),預(yù)測(cè)電力區(qū)域流向,達(dá)成產(chǎn)業(yè)協(xié)同最優(yōu)方案。
通過(guò)開(kāi)展城市造影分析,構(gòu)建電力數(shù)據(jù)為核心的城市整體運(yùn)行狀態(tài)數(shù)據(jù)監(jiān)測(cè)指標(biāo)體系,形成全視角、多空間的城市畫(huà)像,為城市治理、規(guī)劃、投資、城市群協(xié)調(diào)發(fā)展提供實(shí)證數(shù)據(jù)支撐。深度挖掘電力數(shù)據(jù)的社會(huì)、經(jīng)濟(jì)與商業(yè)價(jià)值,為政府、行業(yè)、用戶提供更好的服務(wù)。為政府對(duì)了解自身城市發(fā)展定位提供參考,實(shí)現(xiàn)電力服務(wù)政府治理與價(jià)值拓展。為規(guī)劃城市發(fā)展提供參考路徑,提高投資效率和規(guī)劃效率,優(yōu)化社會(huì)資源配置,提升群眾生活水平。