吳海江,唐鶴,駱國銘
(廣東電網公司佛山供電局,廣東佛山 528000)
隨著近年來電力企業發展進程的不斷加快,信息化發展態勢愈來愈快,數據成為各專業應用的重要核心。我國電力行業歷經長時間的持續化信息發展,目前已經逐漸發展成為大量專業信息系統,譬如OA、電力交易運營、電力營銷、電力調度、配電管理、生產管理、項目管理等系統。分別由不同廠家負責生產,不同系統之間互相獨立,所以極易產生“信息孤島”,導致無法真正高效實現數據共享。隨著我國電力機制改革進程的逐步深入,電力企業的信息化建設也獲得了飛速發展,電力企業領導層逐漸提高對自身管理決策綜合水平的要求,對于各信息數據需求也要求更加充分、準確且及時,能夠實時統一地完成信息的傳遞共享,因此建立能夠滿足傳遞共享的綜合調度管理數據平臺,已經逐漸發展成為如今電力行業信息化發展的主要方向。近年來,網絡搜索引擎技術也取得了極大進展,譬如Google、百度等搜索引擎,能夠滿足短時間內數據信息的快速獲取,更受到各大行業領域的普遍認可。但往往該類搜索引擎,并不能滿足搜尋企業內部信息需求,更無法實現搜尋用戶信息實現統一共享調度。因此,檢索成為如今電力行業信息資源共享的核心技術點,文中提出的基于搜索引擎的供電信息資源多用戶調度管理平臺,能夠解決以上信息資源調度共享的問題。
搜索引擎主要包括了以下程序設備:信息收集程序,分析、索引和檢索設備,以及查詢接口。搜索引擎的結構原理如圖1 所示。

圖1 搜索引擎結構原理示意圖
1)在信息收集程序中。該結構主要實現網絡所覆蓋所有公開領域內,信息站點記錄具體網址,并將站點的鏈接指針成功找出后,尋找新型信息空間,然后將創建形成的新信息空間文檔順利取出。
2)分析器。該結構針對信息收集程序中所成功收集的文檔信息,通過運用分詞、過濾、轉換等不同操作方法進行索引。
3)索引器。索引文檔作為一種新型的檢索方式,成功存儲于建立的索引數據庫內,具體索引操作可以依照倒排文件這一存放格式。
4)檢索器。該結構根據索引數據庫,成功找出密切相關用戶查詢需求的文檔,并根據設定的相關度遞減這一排列順序,將相關度較閾值明顯偏大的文檔成功排列并最終返回至用戶。
5)查詢接口。該結構是為了能夠方便提供用戶信息查詢輸入及輸出的結果界面。
異構數據集成實現了用戶信息數據調度集成,是一種能夠有效維護數據源一致性,真正提升并實現數據信息共享效率的技術,能夠為電力行業供電信息資源多用戶提供統一集成的數據訪問源及接口,并且執行相應的用戶對數據源提出的訪問請求。圖2 為異構用戶數據集成系統模型。

圖2 異構數據集成系統模型示意圖
一是采用虛擬視圖法,基于該方法建立的數據集成系統,可以在用戶經系統提出查詢請求時,系統能夠自主根據用戶的數據源執行操作,該方法也被稱為Lazy 方法。
二是聯邦數據庫系統,主要包括了緊耦合FDBS、松耦合FDBS 共兩類(見圖3)作為聯邦數據庫體系結構。前者擁有一個或多個統一模式,能夠經模式集成技術實現半自動生成,還可以經用戶實現手工構造。只需將邏輯異構關系妥善解決,便可以實現同領域專家決定數據庫模式對應關系,但是緊耦合也存在靜態升級困難這一問題。后者并未形成統一模式,但是提供了部分數據庫統一查詢語言,FDBS 數據庫內相關數據的自洽性,能夠對語義異構妥善解決,但是這種耦合并不具備全局模式。

圖3 聯邦數據庫體系結構
三是中介系統,能夠提供全部的異構數據源虛擬化視圖實現用戶數據集成。在這里所指的數據源包括了數據庫、遺產系統、Web 數據庫等各類模式。能夠建立數據源與全局模式之間的銜接橋梁,并且滿足用戶的透明化異構操作,無需全部得知數據源所在的模式、位置和所要采用的訪問方式。Mrdiated系統典型結構示意圖如圖4 所示。

圖4 Mrdiated系統典型結構示意圖
電力調度專業搜索供電信息資源用戶調度管理平臺的建立,需要基于搜索引擎這項技術來實現,建立知識庫也與搜索引擎存在依賴關系。除此之外,還能夠提供用戶平時高頻次訪問的相應站點的異構數據集成,建立圖5 所示的系統結構框架。

圖5 平臺系統架構示意圖
如圖5 所示,在該平臺信息展現功能方面,實現資訊數據集成,經資訊集成該功能模塊,可以集中統一展現用戶關心的數據信息統一調度,省去原本需要不斷登錄各網站進行搜索的麻煩。在信息分類模塊則能夠將用戶搜索信息調度分類,以便用戶能夠在平臺應用中及時方便查詢。用戶模塊基于Web2.0 技術能夠個性化定制數據信息,并且最終可以成功展現個性化信息。建立基于搜索引擎的供電信息資源多用戶調度管理平臺,能夠為用戶在應用過程中,提供多樣化信息展現途徑,并創建便捷高效化的工作方式。
該系統平臺主要實現的系統檢索功能,基于網絡爬蟲、索引器、檢索器三大硬件實現。
1)外網搜索。平臺用戶可以在應用中確保網絡環境安全的前提下,為用戶提供外網相關信息的搜索引擎功能服務,能夠實現電力有關信息網站的全面檢索。
2)內網搜索。平臺可以為用戶提供電力行業內部網絡信息資源搜索,以IP 地址作為搜索依據,設定具體的檢索范圍。
3)本地搜索。通過為平臺用戶提供本地搜索源,譬如可以搜索成功保存于計算機終端的硬盤文件。并且可以集成文件管理系統,并為內部網站提供相應的站內檢索這一功能。此功能設計代碼示例如下:

文檔類型:該平臺能夠實現Word、PDF、網頁等全文檢索功能。
檢索規模速度:該平臺的配置技術水平,直接對檢索速度和最終規模起決定影響作用,能夠滿足用戶應用該平臺的檢索操作要求。
本地緩存:該系統可以為用戶在應用過程中,提供所需的快照功能,方便對閱讀文檔做html 版本處理,這樣一來用戶可以在應用中迅速查詢自己所需的相關信息。
更新周期:通過在該平臺增設了增量更新這一全新模式,包含具體的檢索范圍以及確定的系統硬件設備。通常情況下企業用戶能夠滿足在有限時間(1 周內),作為搜索引擎信息調度的完整更新周期,并運用廣度優先這一方式,真正實現每一個分布站點的信息更新。
用戶在應用該平臺過程中,隨著網站數量的逐漸增加,也會導致數據集成的整體效率不斷降低。所以為了提高用戶的調度平臺應用效率及便捷性,通過提供資訊集成類服務在統一頁面中顯示用戶感興趣的主要頁面,并實現該頁面的及時更新,如圖6所示。

圖6 搜索引擎體系結構框圖
1)資訊源作為用戶信息調度的興趣主站點,譬如包括了用戶主要關心的站點,供電公司網站、供電系統地調網站等站點,通過設置這些作為實時監測站點,并在每一個站點中實現多URL 信息監視。
2)該系統的更新周期可以以人工設定為主,設定相應的調度平臺更新周期后,即可確定是否實時更新相關信息及資訊鏈接。
3)內容展現。在統一模塊中集中向用戶展現統一的資訊源信息,并且依照不同的信息發布時長完成排序。
用戶在應用該平臺中實現的內網搜索功能主要是面向當地供電官網、省級供電調度通訊主頁、市級調度中心主頁的相關信息搜索,如圖7 所示。

圖7 站點或基于局域網內部的網頁資源的檢索系統
在電力行業的供電系統平臺內部,包含大量文檔資料,譬如Word、Office、PDF、TXT 等不同文檔資料,具備了大量、復雜化特點,存儲于供電內網PC 終端設備中,用戶可以通過在該平臺搜索關鍵詞來查詢所需文檔資料,便于用戶滿足自己的信息資料調度所需。并且該平臺還實現了用戶名及網址的雙重認證,嚴格保證了用戶擁有搜索的權限,與文檔保密性要求相符。
供電公司網站相關要聞檢索,能夠根據不同用戶的應用所需,自主選擇需要的相關內容添加至個性化主頁中。
該平臺可實現的高級搜索功能,可以滿足用戶在具體應用中根據自主需求,自定義不同的文件格式、重命名、關鍵詞、日期以及具體的搜索范圍。
總而言之,隨著供電系統平臺功能的逐漸完善,在后續應用中也會不斷增加大量電力行業相關圖文資料及專業搜索功能,最大化滿足用戶的搜索數據集成功能需求。