999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx

分布式數據檢索系統的設計與實現

2010-01-01 00:00:00鐘求喜
湖南大學學報·自然科學版 2010年1期

摘 要 提出了一套對非結構化數據進行分析和檢索系統的設計方案。采用分布式技術在windows平臺上建立了一套以任務分發服務器為中心,運算終端為任務處理單元,帶有反饋和容錯機制的分布式數據檢索系統。在給出系統模型和設計思想基礎上,對各個功能部件進行了模塊化設計、并對各模塊故障進行了測試,結果表明,系統能夠在部分模塊出錯的情況下穩定運行,能夠滿足在實際工作中的需求。

關 鍵 詞 分布式數據檢索; windows; 反饋; 容錯機制;

中圖分類號:文獻標識碼:

DesignAnd Implement of A Data Retrieval Distribution System

ZHU Xin,ZHONG Qiu-xi

(School of Computer, National University of Defense Technology, Changsha,Hunan 410073,China)

Abstract Authors propose a set of pairs of unstructured data analysis and retrieval system design. Use of distributed technology in the windows platform to establish a set of task-distribution server as the central task of computing the terminal processing unit, with feedback and fault-tolerant mechanism for distributed data retrieval system. In the given system model and design based on the idea of the various functional components of the modular design, and failure of each module was tested, results show that the system can go wrong in some cases the module stable operation to meet the actual work requirements.

Key words Data Retrieval Distribution; windows; feedback; fault-tolerant mechanism

隨著互聯網應用技術的推廣和普及,互聯網在帶來發布、傳遞和獲取信息自由便利的同時,各種虛假信息、垃圾郵件、個人隱私問題、網上經濟犯罪、危及社會穩定、涉及國家重大利益等內容的信息所引發的問題日益突現[1]。近年來互聯網上的各種網絡犯罪形式日趨多樣,傳統的網絡監管方式已無法適應當前的需求,特別對于一些網絡黑客的攻擊行為難以被傳統的監控系統所識別。當前互聯網監管部門在對海量互聯網數據進行分析、檢索過程只關注到了結構化文本數據[2],而大量的非結構化的二進制數據由于受數據庫處理能力限制,關鍵詞的設定和并不能像文本數據那樣通過自然語言的結構化信息抽取[3]建立數據索引。因此面對互聯網上巨大的數據量就必須有一套高效的系統來對這類攻擊行為進行及時的處理。這套系統主要針對海量的省或市的出口網絡數據進行篩選和自動識別。

目前中型城市的出口帶寬都在100G以上,雖然單臺計算機的處理能力不斷提高,但是對于大規模的數據運算,單臺計算機的處理能力畢竟有限,面對如此龐大的數據量必須采用分布式技術,利用多臺計算機的計算或存儲資源來解決這一問題。作者針對目前海量非結構化數據處理的需求,在Windows環境上構建了分布式任務分數據檢索系統,以滿足省際或市際網關中對大規模網絡數據實施分布式檢索的需求。

1 系統設計

目前對省際或市際網絡數據截取的流程如下圖1:

通過部署在各個網關處的采集設備將采集的網絡數據包按不同的協議類型存儲到磁盤陣列服務器(文件池)中,待查詢。

圖 1 目前對省際或市際網絡數據截取的流程

Fig.1 The current inter-provincial or inter-city network data interception process

由于在市際、省際網關數據量極大,要在網關處對網絡數據數據包抓取,受限于計算機的成本和處理能力,因此作者在設計的該套系統部主要用對已獲取的數據進行分析和處理。

整個系統由三個部分組成,1)任務分發中心,為用戶提供特定的接口;2)運算終端,執行分發任務;3)數據庫,用于管理任務和終端。其中任務分發中心是整個系統的核心部分,主要負責將任務數據庫中的任務分發到各個終端進行運算。系統模型如圖2

圖 2 系統模型

Fig.2 System Model

文件池:通過專用系統捕獲網絡數據,以IP包的形式存于磁盤陣列器中。

數據采集模塊:采集文件池中需要被匹配的文件路徑,并將文件路徑加入數據庫中,同時監聽文件池中新增文件的系統消息,動態的將文件池的新增文件加入至數據庫之中。

任務分發中心:監聽參與運算的終端設備,采用輪詢機制檢測終端設備是否由于某種原因停止運算或脫離運算,實時調整運算任務, 即,一旦某個終端停止工作,即將其未完成的任務加入至未執行任務列表,并將該任務分發給其他終端。

運算終端:查詢數據庫中分配給自己的任務列表,并將文件池中的相應數據拷貝一份,執行運算。

2詳細設計

本系統提供的一種用于基于任務方式的分布式運算環境。

系統各功能部件詳細設計,如圖3:

圖 3系統各功能部件詳細設計

Fig.3The detailed design of the system features

2.1 各部件功能描述

系統各部件采用集中—分布的協作方式。當運算終端完成任務時,通知任務分發中心, 后者根據當前總體任務進行決策, 及時通知運算終端是否要繼續執行任務。各運算終端通過監控模塊向任務運算中心返回任務執行的進度,若任務分發中心定時輪詢到某運算終端長時間無法響應,將收回收該終端的未完成的任務,并將這些任務發送到總體任務列表中。任務分發中心通過管理任務據庫來分配任務,運算終端啟動時只需要到數據庫中取得相應的數據即可。

監控模塊: 對運算終端的忙閑狀態進行監控,并定時向任務分發中心匯報終端狀態。如果認為運算終端正在運算,向任務分發中心報告忙,如果認為運算終端已完成任務,則任務分發中心對其繼續發送任務。

通信模塊:根據協議標準規定的要求, 負責與任務分發中心進行通信, 該系統對這里的通信接口進行了簡化, 不允許各個終端之間進行直接通信, 終端只能與控制中心進行雙向通信。

任務分發中心接收用戶請求, 產生數據請求, 然后將請求根據特定負載均衡算法發送給各個運算終端,進行操作。任務分發中心由用戶接口、控制管理、監聽模塊、通訊模塊四部分組成。

用戶接口: 提供操作界面, 用戶通過圖形界面完成系統控制和管理功能。 用戶接口負責將用戶請求翻譯成系統請求交給控制管理模塊處理。

控制管理模塊: 根據請求類別, 構造協議數據傳輸單元, 通過協議接口發送請求到相應目的地。同時處理監聽模塊反饋的運算終端的退出和加入情況,根據負載均很算法動態分配任務。控制管理還完系統參數設置工作。

監聽模塊:一方面監聽各終端返回的狀態信息,另一方面,采用定時輪詢機制檢查各運算終端是否存活。如果發現某一終端在一定時間內沒有響應,則將該情況匯報值控制管理模塊。另外,當有新的終端加入該運算體系時也將情況反饋至控制管理模塊。

通信模塊: 接收識別運算終端發出的協議數據, 對協議數據進行處理,同時將控制決策中心的用戶意圖發送給各個終端,完成管理和控制功能。

任務列表: 由任務分發中心負責維護,使用MS Sql2005作為任務列表的數據庫平臺[4],分別存放運算終端信息,分配給各終端的任務,需要進行運算的規則庫[5]。

運算終端:運算終端是整個數據挖掘系統中部署在各個單機上的數據挖掘設。運算終端通過主動加入運算系統,定時向任務分發中心匯報自身狀態(CPU使用情況,任務完成情況),主動連接數據庫服務器檢查自己的任務列表,然后根據任務內容完成自己的任務。完成任務后將檢測結果回寫至數據庫,并通報任務分發中心。運算終端首次加入運算系統中,先向任務分發中心提交加入運算的申請,若審核通過任務分發中心將向其提供一個唯一標識ID,運算終端接受此ID后,即將該ID保存在本地,下次加入運算時將直接用該ID與任務分發中心通訊。

2.2部件間通信協議

( 1 ) 消息格式[7]

監聽模塊和運算終端之間通信采用統一的消息格式,如圖 3 所示。其中ID是消息標識,用于區分不同的運算終端,CPUStatus是當前運算終端的CPU使用狀態,包括消息頭和消息體;ClientIP為當前運算終端的IP地址;Status表示當前運算終端以完成的任務數;Total表示分配給當前運算終端所有任務數;Iscomplete表示當前終端是否已完成任務。

圖 3 消息格式

Fig.3 Message format

( 2 )注冊消息

運算終端到任務分發中心的注冊功能由名字請求及應答消息來完成。每個部件啟動時,向指定的控制決策中心發送名字請求消息, 該消息包含了部件自己的有關信息, 如名字、所在系統的I P 、狀態等。 任務分發中心收到名字請求后,進行身份認證, 通過后, 記錄該部件的有關信息, 并根據I D的分配策略為其分配唯一I D值,終端接收到ID將該憑據保存在本地,之后該終端將用ID接受任務分發中心控制,并執行運算。

( 3 ) 部件間的握手消息

由于系統的各部件運行在不同環境中, 任務分發中心必須實時了解其它各部件的當前狀態,各部件也必須實時了解任務分發中心的狀態,這通過HELLO消息來實現。 需要互相了解狀態的部件之間必須定時通知對方自己的狀態, 若一方超時收不到這種通知, 就認為對方出現了異常情況, 并作相應處理。 對任務分發中心采說,若它輪詢訪問某個終端時,超時收不到某個部件的HELLO消息,就將其從當前活動部件表中刪除,并不再向它發送HELLO消息、 各類查詢消息以及各類設置消息。

( 4 ) 其他消息

系統部件間的通信協議還包括其他許多交互消息, 如控制決策中心到其他部件各類信息查詢和應答、 其他部件到任務分發中心的各類事件等消息。

2.3任務分發策略[6]

本系統以固定任務數和動態任務分配相結合的方式分配任務,

(1)固定任務數

每個終端分配每次分配固定數量任務,任務完成后即向任務分發中心匯報,并申請新的任務。如果沒有任務分配將進入等待狀態。

(2)動態任務分配

每個終端加入本系統時,如果狀態顯示為閑,任務分發中心將向該終端分發配置任務數。若某個終端由于某種原因離開了運算,一旦被任務分發中心偵測到,則將會將該終端未完成的任務重新發送至任務列表中。

3 系統實現

任務分發中心如下圖4,圖中顯示了參加運算任務的終端,及其工作狀態。

圖 4 任務分發中心界面

Fig.4 The task distribution center interface

系統特點

分布性: 數據分析部分在系統的部署是分布的。

標準性:系統各部分間的通信采用標準的通信協議,擁有一整套嚴格定義的通信規范和數據格式。

擴充性:系統各部分采取標準化設計,使得新終端部分的加入變得相當簡單,運算終端和任務分發中心有著標準的協商機制。

容錯性:當系統某一個代理出現問題,不能完成自己的檢測任務時, 整個系統還可以正常運作,其運算能力不會有明顯下降。

4結 語

系統采用了易于擴充的結構,在Windows操作系統上實現了多終端的分布式系統,利用固定任務數和動態任務分配相結合的方式,解決了任務分發處理復雜,緩解了任務分發中心的運算壓力。任務分發中心和運算終端的通信模塊和控制模塊采用獨立線程實現,增強了系統可靠性。 在測試中,分別停止控制進程,通信進程;突然關閉節點電源,重啟動節點的操作系統等多手段模擬了系統故障。系統均能正確地從故障狀態切換到正常工作狀態。

參考文獻

[1]Top500 Supercomputer Site. TOP500 List [OL]. http://www.top500.org/ ,2008

[2]楊喜敏,曾廣平.信息系統中非結構化文本數據的輸入技術研究[J].微計算機信息,2006,(12)

YANG Xi-min, ZENG Guang-ping. Information system unstructured text data input technology research [J]. Micro-computer information, 2006, (12)

[3]郝愛峰.網頁結構化信息抽取技術方法研究[J].山西電子技術,2008,(4)

HAO Ai-feng. Pages of structured method of information extraction techniques [J]. Shanxi Electronic Technology, 2008, (4)

[4] Thomas Connolly Carolyn BeggDataBase Systems A Practical Approach to Design,Implementation,and Management

[5] 魯宏偉, 魏凱, 孔華鋒.華中科技大學學報:自然科學版,2006,10:

LU Hong-wei, KAI Wei, KONG Hua-feng.Journal of Huazhong University of Science and Technology:(Natural Science Edition, 2006, 10:

[6]SRINICASAN R. Distributed detection with decision feed 2 back [J ] . IEE PROCEEDINGS , 1990 , 137(1) : 427-432.

[7]Fred Halsall Computer Networking and the Internet

[8] Microsoft Visual Studio on MSDN. http://msdn.microsoft.com

[9] W.Lee, A data mining for constructing features and models for intrusion detection system [D] . Ph.D.Dissertation . Columbia University,1999

[10]Phil Picton.Neural networks[M].Second Edition.Hampshire:PALGRAVE,2000.

404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
404 Not Found

404 Not Found


nginx
主站蜘蛛池模板: 日韩第一页在线| 国产精品女熟高潮视频| 狠狠做深爱婷婷久久一区| 秋霞一区二区三区| 日韩免费中文字幕| 欧美中文字幕在线视频| 美女无遮挡拍拍拍免费视频| 人妻熟妇日韩AV在线播放| 天堂网国产| 亚洲中文字幕日产无码2021| 国产一区免费在线观看| 国产亚洲精久久久久久久91| 亚洲国产综合精品中文第一| 她的性爱视频| 欧美国产精品不卡在线观看 | 亚洲日韩精品无码专区| 亚洲精品无码人妻无码| 成人午夜福利视频| 精品国产一区二区三区在线观看 | 97视频免费看| 国产丝袜一区二区三区视频免下载| 日本成人福利视频| 亚洲AV人人澡人人双人| 青青草一区| 国产网站一区二区三区| 毛片a级毛片免费观看免下载| 亚洲六月丁香六月婷婷蜜芽| 国产黑丝视频在线观看| 国产女人水多毛片18| 成色7777精品在线| 亚洲综合第一页| 亚洲av无码片一区二区三区| 欧美亚洲香蕉| 97视频精品全国在线观看| 久久天天躁狠狠躁夜夜躁| 制服丝袜在线视频香蕉| 久久精品嫩草研究院| 国产精品页| 秋霞午夜国产精品成人片| 日本免费精品| 激情综合婷婷丁香五月尤物| 亚洲欧美人成电影在线观看| 日本一区中文字幕最新在线| 国产成人无码综合亚洲日韩不卡| 99中文字幕亚洲一区二区| 9啪在线视频| 国产人人干| 九色在线观看视频| 国产成人精品一区二区三在线观看| 青青草一区二区免费精品| 91在线日韩在线播放| 污网站在线观看视频| 熟女成人国产精品视频| 午夜视频日本| 色婷婷成人网| 国产真实乱子伦视频播放| 国产精品大白天新婚身材| 国产激情无码一区二区三区免费| 欧美在线视频不卡| 国产成人无码Av在线播放无广告| 丁香六月激情综合| 色久综合在线| 综合色区亚洲熟妇在线| 亚洲成人在线网| 亚洲国产综合自在线另类| 精品亚洲国产成人AV| 欧美人与牲动交a欧美精品| 人妻一区二区三区无码精品一区| 国产国产人成免费视频77777| 福利视频久久| 午夜福利在线观看入口| 久久国产V一级毛多内射| 九九香蕉视频| av天堂最新版在线| 欧美午夜在线播放| 国产精品福利尤物youwu | 欧美区国产区| 无码中文字幕乱码免费2| 亚洲精品天堂在线观看| Aⅴ无码专区在线观看| 国产欧美在线视频免费| 午夜福利免费视频|