999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Kafka集群的數據搜索及共享機制在電力企業的應用研究

2018-06-14 05:47:00孟椿智葉耿謝瑞浩
數字技術與應用 2018年3期
關鍵詞:搜索引擎引擎電力企業

孟椿智 葉耿 謝瑞浩

(1.廣西電網有限責任公司信息中心,廣西南寧 530023;2.廣西博聯信息通信技術有限責任公司,廣西南寧 530023)

目前電力企業已經進入大數據時代,數據信息量越來越大,通過Hadoop技術建設數據中心,實現數據采集抽取、清洗轉換、加載存儲、數據可視化顯示等,而電力企業的應用系統對數據的需求越來越旺盛,有必要就數據搜索及共享機制展開研究。

1 電力大數據趨勢

隨著計算機科學的飛速發展,電力行業的信息化程度越來越高,有關的電力數據資源也開始快速增加,電力企業的數據資源逐漸朝著異構、多源以及PB級規模迅速發展。在社會向著大數據發展的大環境下,電力大數據也逐漸成為了電力工業技術革新的必經之路。電力大數據標志著電力技術的跨越性進步,通過建設數據中心為應用系統提供強有力的數據支撐,完成數據價值變現,是智能化電力系統的重大變革要求。

圖1 電力企業全文檢索引擎系統功能設計

2 Kafka集群關鍵技術

Kafka是Apache基金會的頂級開源項目,主要應用場景有日志收集系統和消息系統,實現消息持久化、高吞吐率地數據傳輸能力。Kafka集群一般包括幾個broker(消息中間件處理結點),producer(消息提供者)將數據推送到broker上,consumer(消息消費者)再從broker拉取數據進行消費,Kafka集群使用“at least once”的機制實現數據傳輸,即數據至少傳輸一次,如果數據未接收成功,會重發直至成功。

3 基于Kafka集群的數據搜索及共享機制在電力企業的應用

3.1 設計與實現

3.1.1 功能設計

結合電力企業應用過程中對數據中心提出數據共享的需求,本文設計了以hadoop技術為主的,多種數據源應用框架結合的電力企業全文檢索引擎系統,其中應用了部分開源、擴展性強的kafka集群技術,從而建立了有效、實用的數據共享機制。圖1是電力企業全文檢索引擎系統功能的設計情況。

用戶可以通過輸入關鍵字的方式對全文進行有效檢索,并且搜索引擎可以按照用戶提供的屬性以及其他相關信息等對相關性大的搜索結果按照關聯性的大小依次進行排序,從而搜索出和用戶需求匹配的數據,再通過Kafka集群向用戶推送數據結果,達到數據共享的效果,因此,電力企業全文檢索引擎系統具備以下功能:(1)搜索引擎具備對全文數據進行快速檢索的能力。為了實現快速檢索,可以有效結合倒排索引的方式,通過反向索引實現在大規模的文本數據中準確定位相關信息的功能。(2)搜索引擎能夠對相關性進行充分、有效的檢索。查準率和查全率是對系統檢索能力進行衡量的基礎指標。查準率意味著搜索引擎檢索功能的精確程度,也就是說查準率是檢索結果中正確數據的百分比。查全率意味著搜索引擎檢索出相關信息的能力,也就是說查全率是搜索引擎檢索出的相關結果同全部相關結果的百分比。(3)穩定的數據共享機制。在用戶根據自身需求搜索出數據后,電力企業全文檢索引擎系統需要向用戶提供穩定的數據傳輸通道,確保數據可以正確、可靠地到達相關應用系統,為企業的生產運營、決策分析提供強有力的數據支撐。

3.1.2 索引模塊構建

為了實現檢索功能,需要創建相應的索引模塊。因此,應當以電力特點為基礎,構建具有檢索功能的模塊。一般來說,檢索模塊主要由檢索分析處理與檢索結果處理兩大部分構成。

對于索引模塊而言,其通常都會涉及到多個系統之間的數據同步問題。要想符合檢索系統對數據一致性和實效性的需求,就必須具備不同的數據采集方式,和多渠道的索引構建策略。為此,可以從以下三方面入手:(1)保障數據能夠被全量抽取,并構建相應的索引模塊。索引數據和業務系統數據必須具備一致性,因此,應當定期利用系統對所有的索引數據進行重建。(2)注意索引數據的實時同步。一些業務數據必須被及時且準確地檢索到,對于這部分數據應當構建相應的實時索引數據。(3)索引模塊構建過程中要注意定期增量同步。通常情況下,索引系統和業務系統以及消息中間件是相互獨立的,因此,應當有效保證異構系統之間的數據具有一致性。

3.1.3 數據共享機制

為了能夠穩定地向用戶傳輸數據,實現數據共享的機制,需要建設kafka集群,用戶作為consumer(消息消費者),訂閱從電力企業全文檢索引擎系統搜索出來的Topic(消息),即數據,數據中心作為producer(消息提供者),將用戶訂閱的Topic推送到broker(消息中間件處理結點),用戶可通過數據接口、文件下載等方式從broker獲取詳細的數據內容用于后續的數據應用。

3.2 具體應用效果

基于Kafka集群的數據搜索及共享機制在電力企業全文檢索引擎系統中得到積極應用,目前已為多個的應用系統提供服務,實際應用表明,本文設計的全文檢索引擎系統的搜索速率達到了496條/秒,每天可提供超過5GB的數據量,大大滿足了應用系統的數據共享需求。

4 結語

基于Kafka集群的數據搜索及共享機制,能夠有效提高全文檢索的查準率和查全率,為應用系統提供強有力的數據傳輸,其對于電力企業的發展具有重要意義。

[1]李愛軍,王海濱,鄭曉波.基于推理控制策略的智能型電力搜索引擎的研究[J].西華大學學報(自然科學版),2008,27(06):34-37+48+122.

[2]宋宛凈,姚建剛,汪覺恒,等.全壽命周期成本理論在主變壓器選擇中的應用[J].電力系統及其自動化學報,2012,24(06):111-116.

[3]白紅偉,馬志偉,朱永利.基于云計算的絕緣子狀態監測數據的處理[J].電瓷避雷器,2011,(04):19-22+28.

[4]曲朝陽,熊澤宇,顏佳,等.基于空間分割的電力大數據三維全景可視化場景管理方法[J].華北電力大學學報(自然科學版),2016,43(02):23-29.

猜你喜歡
搜索引擎引擎電力企業
電力企業物資管理模式探討
消費導刊(2018年10期)2018-08-20 02:57:10
藍谷: “涉藍”新引擎
商周刊(2017年22期)2017-11-09 05:08:31
中國電力企業的海外投資熱潮
能源(2017年9期)2017-10-18 00:48:25
關于電力企業生產管理信息系統的設計與實現應用
網絡搜索引擎亟待規范
中國衛生(2015年12期)2015-11-10 05:13:38
無形的引擎
河南電力(2015年5期)2015-06-08 06:01:46
基于Cocos2d引擎的PuzzleGame開發
基于Nutch的醫療搜索引擎的研究與開發
廣告主與搜索引擎的雙向博弈分析
關于電力企業檔案管理之創新探討
河南科技(2014年7期)2014-02-27 14:11:32
主站蜘蛛池模板: 高清无码手机在线观看| 国产精品所毛片视频| 午夜性刺激在线观看免费| 91精品久久久久久无码人妻| 欧美成人手机在线视频| 国产第八页| 国产综合日韩另类一区二区| 久久综合伊人77777| 青青草原国产精品啪啪视频| 2021国产在线视频| 久久成人国产精品免费软件| 久久久久久尹人网香蕉| 99久久国产综合精品2023| 在线va视频| a欧美在线| 日本欧美一二三区色视频| 亚洲欧美另类视频| 波多野结衣无码视频在线观看| 天天色天天综合| 日韩精品免费一线在线观看| 九色视频最新网址| 波多野结衣无码视频在线观看| 成人伊人色一区二区三区| 国产在线观看成人91| 2021天堂在线亚洲精品专区| 人人91人人澡人人妻人人爽| 亚洲一区无码在线| 国国产a国产片免费麻豆| 女人av社区男人的天堂| 91福利在线看| 在线欧美日韩| 思思热精品在线8| 亚洲视频三级| 色悠久久久久久久综合网伊人| 亚洲AV免费一区二区三区| 久久黄色小视频| 午夜福利在线观看入口| 国产亚洲高清视频| 日韩精品中文字幕一区三区| 午夜限制老子影院888| 亚洲国产天堂久久综合| 婷婷午夜天| 天堂在线视频精品| 中文字幕无码中文字幕有码在线| 国产精品熟女亚洲AV麻豆| 国产精品私拍在线爆乳| 日韩精品免费在线视频| 欧美专区日韩专区| 国产欧美精品午夜在线播放| 波多野结衣久久高清免费| 欧美区一区| 亚洲天堂网站在线| 九九久久99精品| 亚洲人成网站在线播放2019| 又爽又大又黄a级毛片在线视频| 午夜视频在线观看免费网站| 亚洲a免费| 97成人在线观看| 免费av一区二区三区在线| 美女被操黄色视频网站| 免费一级全黄少妇性色生活片| 精品欧美日韩国产日漫一区不卡| 黄色一级视频欧美| 手机看片1024久久精品你懂的| 国产又爽又黄无遮挡免费观看| 亚洲中文精品久久久久久不卡| 国产午夜不卡| 狠狠v日韩v欧美v| 亚洲精品福利视频| 99精品国产自在现线观看| 亚洲91精品视频| 青草娱乐极品免费视频| 欧美一区日韩一区中文字幕页| 欧美精品亚洲日韩a| 久久a毛片| 中文字幕在线观| 欧美区一区| 在线观看国产小视频| 福利一区三区| 亚洲人成人无码www| 人妻中文字幕无码久久一区| 91毛片网|