999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

電網(wǎng)行業(yè)元數(shù)據(jù)集成數(shù)據(jù)存儲策略研究

2021-01-28 03:35:42萬嬋魏理豪楊秋勇楊朝誼蘇華權(quán)
微型電腦應(yīng)用 2021年1期
關(guān)鍵詞:關(guān)聯(lián)智能

萬嬋, 魏理豪, 楊秋勇, 楊朝誼, 蘇華權(quán)

(廣東電網(wǎng)有限責(zé)任公司 信息中心, 廣東 廣州 510000)

0 引言

隨著電力行業(yè)以及智能電網(wǎng)技術(shù)的持續(xù)發(fā)展,電網(wǎng)行業(yè)中形成了大量的智能配用電數(shù)據(jù),此類數(shù)據(jù)包括不同的類型,并且涉及到了不同的用電主體,例如有企業(yè)、政府等,而各個主體的業(yè)務(wù)以及工作重心存在明顯的差異性,使得智能配用電數(shù)據(jù)表現(xiàn)出不同的特征。一是具有較高的數(shù)據(jù)維度,首先是電力企業(yè)的業(yè)務(wù)類型不一,并且眾多的業(yè)務(wù)之間具有較高的獨立性,但是無法保證各個系統(tǒng)數(shù)據(jù)采集時間的一致性,這是增大數(shù)據(jù)維度的重要因素;其次是不同主體在智能配用電數(shù)據(jù)的存儲與管理方面難以保持一致,顯著提高了數(shù)據(jù)維度[1-3];二是不同形式的智能配用電數(shù)據(jù)并存,從數(shù)據(jù)類型的角度來看,一般可以將智能配用電數(shù)據(jù)劃分為結(jié)構(gòu)化、非結(jié)構(gòu)化以及半結(jié)構(gòu)化類型,通常三者是共存的。其中結(jié)構(gòu)化數(shù)據(jù)主要指的是定義比較明確的數(shù)據(jù)類型,包括常見的數(shù)據(jù)庫表中的結(jié)構(gòu)化數(shù)據(jù)等,而這正是傳統(tǒng)的智能配電網(wǎng)業(yè)務(wù)相關(guān)的數(shù)據(jù)類型。在智能電網(wǎng)等新技術(shù)發(fā)展的過程中,智能配用電的基礎(chǔ)分析數(shù)據(jù)變得更加豐富,不再只是傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),而是集成了音頻、圖片以及視頻等類型的非結(jié)構(gòu)化數(shù)據(jù),在這種情況下逐步形成了三種數(shù)據(jù)類型共存的局面[4-9]。由此看出,智能配用電數(shù)據(jù)總體體現(xiàn)出數(shù)據(jù)規(guī)模大、更新頻率高等特點。如采用傳統(tǒng)的數(shù)據(jù)管理方式,已經(jīng)無法滿足智能配用電數(shù)據(jù)的管理要求。與此同時,存儲設(shè)備、處理器等硬件也處于高速發(fā)展的狀態(tài),此類技術(shù)的發(fā)展都為智能配用電數(shù)據(jù)的管理提供了支持。因此,應(yīng)結(jié)合大數(shù)據(jù)處理技術(shù)等新技術(shù)來實現(xiàn)對智能配用電數(shù)據(jù)的妥善管理,從而為用戶提供更高質(zhì)量的數(shù)據(jù)服務(wù)。

1 配用電大數(shù)據(jù)多源集成

隨著數(shù)據(jù)處理技術(shù)的不斷發(fā)展,逐步出現(xiàn)了更先進(jìn)的數(shù)據(jù)集成技術(shù),能夠?qū)Ω鞣N異構(gòu)數(shù)據(jù)源內(nèi)的數(shù)據(jù)進(jìn)行統(tǒng)一管理,降低由于數(shù)據(jù)格式不同而產(chǎn)生的影響,從而提升數(shù)據(jù)的使用效率。由于配用電數(shù)據(jù)的類型較多,在這個過程中不可避免的存在異構(gòu)化問題,目前主要利用數(shù)據(jù)規(guī)范化以及生成標(biāo)準(zhǔn)化元數(shù)據(jù)的方式進(jìn)行處理,其中前者主要是根據(jù)構(gòu)建的數(shù)據(jù)字典來規(guī)范數(shù)據(jù)的存儲格式;后者則是將各種類型的數(shù)據(jù)轉(zhuǎn)化為規(guī)范化的XML格式數(shù)據(jù)[10-11],在這個過程中首先要通過預(yù)處理技術(shù)解析非結(jié)構(gòu)化、半結(jié)構(gòu)化以及結(jié)構(gòu)化數(shù)據(jù)的內(nèi)容,由此形成標(biāo)準(zhǔn)的XML格式數(shù)據(jù),然后利用中間件技術(shù)來實現(xiàn)對標(biāo)準(zhǔn)格式數(shù)據(jù)的管理。

1.1 數(shù)據(jù)預(yù)處理

對于智能配用電數(shù)據(jù)的處理過程來說,首先應(yīng)該進(jìn)行預(yù)處理的過程,具體包括數(shù)據(jù)的篩選、歸一化等過程,由此可以將各種類型的元數(shù)據(jù)存儲為統(tǒng)一的XML 格式,并保存在集群節(jié)點中,從而為數(shù)據(jù)的查詢與應(yīng)用奠定良好的基礎(chǔ)。其中數(shù)據(jù)的預(yù)處理過程,如圖1所示。

(1) 數(shù)據(jù)篩選

首先是進(jìn)行數(shù)據(jù)篩選的過程,其實就是先采用一定的方式對現(xiàn)有的數(shù)據(jù)進(jìn)行過濾,將無用或者干擾數(shù)據(jù)剔除,一般包括數(shù)據(jù)分類、屬性識別等過程。

(2) 數(shù)據(jù)變換

在數(shù)據(jù)篩選完成后,即需要進(jìn)行數(shù)據(jù)變換的過程,數(shù)據(jù)變換有不同的方法,例如有平滑聚集、簡單函數(shù)變換等,在實際應(yīng)用中應(yīng)該根據(jù)具體要求選擇合適的方法,通過數(shù)據(jù)變換即可得到 XML 格式的元數(shù)據(jù)。

(3) 數(shù)據(jù)歸一化

在數(shù)據(jù)變換之后需要進(jìn)行歸一化的過程,即采用規(guī)范化的XML格式表示數(shù)據(jù),目前數(shù)據(jù)歸一化的方法較多,常用的有離散化方法、維度歸一化方法等。對于本文研究的智能配用電數(shù)據(jù)來說,首先將原始數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)的XML 格式數(shù)據(jù),然后按照合理的方式對電網(wǎng)數(shù)據(jù)進(jìn)行命名,如果元數(shù)據(jù)屬于電網(wǎng)外部,則主要劃分為電力用戶、第三方機構(gòu)以及政府元數(shù)據(jù);而電網(wǎng)內(nèi)部的元數(shù)據(jù)主要是根據(jù)電壓等級進(jìn)行劃分,具體包括0.4 kV、10 kV、35 kV、110 kV電壓等級元數(shù)據(jù)。在完成數(shù)據(jù)的預(yù)處理工作后會得到較為規(guī)范的XML 元數(shù)據(jù)集,便于對數(shù)據(jù)進(jìn)行后續(xù)的處理。

1.2 中間件技術(shù)

中間件技術(shù)已經(jīng)廣泛應(yīng)用于不同類型的系統(tǒng)設(shè)計中,能夠?qū)Σ煌募夹g(shù)提供統(tǒng)一的數(shù)據(jù)訪問接口,從而實現(xiàn)數(shù)據(jù)的共享與交換。隨著對中間件技術(shù)研究的增多,逐步出現(xiàn)了多種類型的中間件技術(shù),并獲得了較多的應(yīng)用。在本次研究中主要使用了數(shù)據(jù)訪問中間件技術(shù),通過這種方式能夠有效地管理XML 元數(shù)據(jù)倉庫。其具體的流程,如圖2所示。

圖2 基于中間件的元數(shù)據(jù)管理

2 基于Hadoop的多源配用電大數(shù)據(jù)存儲優(yōu)化

2.1 數(shù)據(jù)分布問題

當(dāng)前在電力數(shù)據(jù)管理方面大多采用了關(guān)系型數(shù)據(jù)庫實現(xiàn)數(shù)據(jù)的管理與存儲,這種方式能夠滿足大多數(shù)情況下的數(shù)據(jù)管理需求。但是隨著電力行業(yè)的持續(xù)發(fā)展,特別是智能電網(wǎng)以及微電網(wǎng)技術(shù)的出現(xiàn),電力數(shù)據(jù)呈現(xiàn)出更大規(guī)模、更高量級的特征,只是采用傳統(tǒng)的集中式關(guān)系型數(shù)據(jù)庫已經(jīng)無法滿足數(shù)據(jù)管理需求,并且還存在查詢速率慢、安全性低等問題。為了有效地解決這些不足問題,很多學(xué)者進(jìn)行了研究,逐步形成了更先進(jìn)的數(shù)據(jù)管理技術(shù)。其中基于Hadoop的分布式文件系統(tǒng)HDFS即為一種有效的解決方案,已經(jīng)廣泛應(yīng)用到了海量數(shù)據(jù)的存儲中,在實際案例中的應(yīng)用效果證明了其在大規(guī)模數(shù)據(jù)存儲與管理中的優(yōu)勢,未來具有廣闊的應(yīng)用前景。

2.2 基于哈希分桶算法的數(shù)據(jù)存儲優(yōu)化方法

很多學(xué)者在分布式數(shù)據(jù)儲存領(lǐng)域進(jìn)行了研究,并提出了不同的數(shù)據(jù)優(yōu)化算法,其中哈希存儲算法在數(shù)據(jù)存儲優(yōu)化方面得到了較多的應(yīng)用。部分學(xué)者提出多副本一致,哈希算法在分布式數(shù)據(jù)存儲方面能夠達(dá)到一定的優(yōu)化效果,但是這種方式存在一定的不足,即忽略了數(shù)據(jù)自身的關(guān)系,無法直接應(yīng)用到本文研究的配用電數(shù)據(jù)中。實際中的配用電數(shù)據(jù)具有較多的類型[12-15],例如有用電負(fù)荷數(shù)據(jù)、氣象數(shù)據(jù)以及地理數(shù)據(jù)等,此類數(shù)據(jù)一般不是獨立的,而是彼此關(guān)聯(lián)、互相影響。因此在數(shù)據(jù)存儲優(yōu)化中應(yīng)該考慮到這種關(guān)聯(lián)性,即設(shè)計一種基于數(shù)據(jù)關(guān)聯(lián)性的哈希分桶存儲算法,如圖3所示。

圖3 基于哈希分桶算法的數(shù)據(jù)存儲

由圖3可知,在該存儲優(yōu)化方式中,體現(xiàn)出如下四個特點。

首先,采用分離存儲的方式對實際數(shù)據(jù)與元數(shù)據(jù)進(jìn)行管理,其中實際的數(shù)據(jù)都統(tǒng)一存儲在Slave節(jié)點中,而元數(shù)據(jù)的管理則是利用Master節(jié)點實現(xiàn)的。分離存儲的方式能夠提升數(shù)據(jù)管理的邏輯性和規(guī)范性。同時對全部數(shù)據(jù)配置了三個副本,以保證數(shù)據(jù)管理的安全性與可靠性。在本次設(shè)計中考慮到不同類型業(yè)務(wù)的數(shù)據(jù)管理需求,分別采用了地理屬性、設(shè)備ID當(dāng)作電網(wǎng)外部、內(nèi)部數(shù)據(jù)的關(guān)聯(lián)字段,保證了數(shù)據(jù)查詢的規(guī)范性。

其次是關(guān)聯(lián)數(shù)據(jù)的集中存儲過程,需要先將各個數(shù)據(jù)主副本統(tǒng)一存儲在不同的桶內(nèi),然后在同一個節(jié)點中存儲相同的數(shù)據(jù),最后建立與HDFS系統(tǒng)的映射,由此實現(xiàn)了數(shù)據(jù)的集中存儲。

第三,第2、3副本具有一定的特殊性,需要根據(jù)數(shù)據(jù)的傳輸效率等信息將其與對應(yīng)的節(jié)點進(jìn)行匹配。通常情況下,主副本與第3副本可以存在于相同的機架中,而第2副本存儲的機架需要區(qū)別于主副本。

第四,對于各個數(shù)據(jù)節(jié)點來說,則需要采用合理的方式進(jìn)行劃分,例如劃分?jǐn)?shù)據(jù)塊大小為256MB、64MB等,在這個過程中應(yīng)該考慮到負(fù)載均衡以及存儲的有序性,從而保證數(shù)據(jù)存儲的規(guī)范性。

3 多源數(shù)據(jù)并行關(guān)聯(lián)查詢方法

當(dāng)前在計算機計算領(lǐng)域中越來越多的使用了并行計算方法,其主要是把復(fù)雜的執(zhí)行任務(wù)劃分為多個不同的子任務(wù),并將各個子任務(wù)分配到獨立的處理器中,使得整個計算過程可以同時執(zhí)行,采用這種方式能夠提高系統(tǒng)的處理性能,并滿足不斷增長的計算需求。在本文中基于之前提出的哈希分桶存儲優(yōu)化算法已經(jīng)實現(xiàn)了對多源配用電數(shù)據(jù)的存儲,然后需要采用一定的方法解決多源數(shù)據(jù)的查詢問題[16]。在本次研究中基于并行思想設(shè)計了一種基于MapReduce的查詢方法,這種方法將主要的查詢過程集中在Map(映射)階段實現(xiàn),避免在Reduce(約減)階段產(chǎn)生過多的操作;同時在本地節(jié)點根據(jù)之前定義的關(guān)聯(lián)字段完成查詢過程,能夠有效地提升查詢效率,減少對資源的占用。詳細(xì)的查詢流程如下。

(1) 首先對查詢的條件以及關(guān)聯(lián)字段(地理標(biāo)識或者是設(shè)備ID)進(jìn)行確定,在此基礎(chǔ)上可以得到MapReduce任務(wù)。

(2) 其次是形成節(jié)點中的數(shù)據(jù)文件,并通過預(yù)處理等過程得到符合標(biāo)準(zhǔn)的數(shù)據(jù),整個過程需要考慮到集群中數(shù)據(jù)的存儲特征。

(3) 然后獲取Map任務(wù)中符合查詢條件以及關(guān)聯(lián)字段的數(shù)據(jù),并將其劃分到相同的組中,按照相同的方式可以得到各個Map任務(wù)的結(jié)果,最后匯總所有Map任務(wù)的處理結(jié)果,并得到統(tǒng)一的關(guān)聯(lián)查詢結(jié)果。

4 實驗驗證

針對上述提出的方案,采用試驗的方式進(jìn)行驗證,以驗證算法是否能夠達(dá)到預(yù)期的性能。首先需要確定查詢的條件以及關(guān)聯(lián)字段,這里二者分別是時間與區(qū)域編號,將用電負(fù)荷、設(shè)備ID 建立關(guān)聯(lián)后,根據(jù)確定的查詢條件和關(guān)聯(lián)字段對各個數(shù)據(jù)文件進(jìn)行處理,由此可以得到含有氣象、用電負(fù)荷等信息的數(shù)據(jù)集。在實驗過程中設(shè)置不同大小的數(shù)據(jù)子集來測試對應(yīng)的查詢時間,如表1所示。

表1 數(shù)據(jù)基本情況

為了驗證本算法的應(yīng)用效果,在實驗中采用了其他的方法進(jìn)行對比,如圖4所示。

圖4 不同存儲方式的查詢時間對比

由圖4可知,相對于傳統(tǒng)的Hadoop查詢方法以及集中式關(guān)系型數(shù)據(jù)庫查詢方法,本文提出的基于哈希分桶存儲分布優(yōu)化的多源數(shù)據(jù)關(guān)聯(lián)查詢方法具有一定的優(yōu)勢,具體表現(xiàn)在較高的查詢效率方面,能夠顯著降低查詢過程花費的時間,在實驗中根據(jù)測定的查詢時間發(fā)現(xiàn)其分別占據(jù)其他兩種方法查詢時間的39.6%、16.4%。經(jīng)過分析發(fā)現(xiàn),本算法主要采用了集中存儲關(guān)聯(lián)數(shù)據(jù)的方式,無需過多的在節(jié)點之間傳輸數(shù)據(jù),在本地節(jié)點即能夠完成大多數(shù)的處理過程,由此不僅提升了處理效率,同時降低了對資源的占用。另外在數(shù)據(jù)集規(guī)模持續(xù)增大的過程中,本文提出算法的查詢時間沒有出現(xiàn)較大的增長,始終保持較為穩(wěn)定的查詢效果,因此可以將其有效地應(yīng)用到多源配用電數(shù)據(jù)的關(guān)聯(lián)查詢中。

5 總結(jié)

通過上述的研究看出,本文針對電力行業(yè)元數(shù)據(jù)的存儲問題,主要做了以下幾方面的工作:一是將數(shù)據(jù)全部轉(zhuǎn)換為XML格式數(shù)據(jù),以方便進(jìn)行管理;其次引入希哈分桶算法對數(shù)據(jù)進(jìn)行存儲,大大提高了存儲效率;三是引入MapReduce的查詢方案,提高了查詢效率。結(jié)果表明,本文構(gòu)建的方法可行,具有一定的借鑒。

猜你喜歡
關(guān)聯(lián)智能
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
智能制造 反思與期望
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
智能制造·AI未來
商周刊(2018年18期)2018-09-21 09:14:46
奇趣搭配
主站蜘蛛池模板: 亚洲精品无码不卡在线播放| 中文无码精品A∨在线观看不卡 | 日韩精品成人网页视频在线| 视频一区亚洲| 极品av一区二区| 久久久亚洲色| 国产 在线视频无码| 亚洲成人精品久久| 91福利免费| 亚洲第一视频区| 午夜毛片免费观看视频 | 97久久精品人人| 亚洲色图欧美| 久久精品国产亚洲麻豆| 91无码视频在线观看| 综合五月天网| 成人一区专区在线观看| 精品国产一区二区三区在线观看 | 国产男女XX00免费观看| 九色在线视频导航91| 一区二区日韩国产精久久| 欧美劲爆第一页| 亚洲欧美在线综合一区二区三区| 欧美精品二区| 国产超薄肉色丝袜网站| 亚洲伦理一区二区| 国产丝袜第一页| 99久视频| 日韩福利在线观看| 很黄的网站在线观看| 高清精品美女在线播放| 国产伦片中文免费观看| 蜜桃视频一区二区三区| 亚洲最黄视频| 91福利免费| 久草青青在线视频| 亚洲日本一本dvd高清| 人与鲁专区| 尤物成AV人片在线观看| 成人综合在线观看| 亚洲精品天堂自在久久77| 国产毛片高清一级国语| 欧美色综合网站| 91小视频在线观看免费版高清| 亚洲最大看欧美片网站地址| 亚洲精品大秀视频| 美女一区二区在线观看| 久久亚洲AⅤ无码精品午夜麻豆| 欧美一区精品| 99国产精品一区二区| 免费一看一级毛片| 欧美性爱精品一区二区三区| 国产精品女熟高潮视频| 日韩色图在线观看| 亚洲欧美天堂网| 久久国产免费观看| 久久国产香蕉| 在线人成精品免费视频| 日本精品中文字幕在线不卡| 精品小视频在线观看| 国产手机在线小视频免费观看 | 欧美一区二区精品久久久| 久草青青在线视频| 欧美va亚洲va香蕉在线| 国产av一码二码三码无码| 国产亚洲精品在天天在线麻豆 | 青青久视频| 国产无码网站在线观看| 久久亚洲美女精品国产精品| 国产又粗又猛又爽| 热热久久狠狠偷偷色男同| 午夜啪啪福利| 国产精品jizz在线观看软件| 亚洲综合狠狠| 亚洲成综合人影院在院播放| 日韩国产精品无码一区二区三区| 露脸国产精品自产在线播| 日韩黄色精品| 日本精品影院| 在线播放精品一区二区啪视频| 亚洲丝袜中文字幕| 在线播放精品一区二区啪视频|