摘要: 隨著信息化建設的逐步深入,實驗室檔案信息也逐步數字化,多樣化,原先的紙質檔案已不能滿足實際的需要,因此該文提出基于網格的實驗室檔案信息化管理,通過網格工具來規劃分類實驗室的檔案信息,通過利用實驗室閑置計算機設備資源來構建數字化的實驗室檔案。
關鍵詞:網格;實驗室檔案;信息化
中圖分類號:TP393.02 文獻標識碼:A 文章編號:1009-3044(2009)05-1279-02
Lab Archives Information Management Based on Grid
YE Wen-li
(College of Teacher Education NingBo University, NingBo 315211,China)
Abstract: With the development of information construction, lab archives information are also gradually digitized and diversity, the original paper archives have been unable to meet the actual needs, so this paper provide the lab archives information management based on grid, through the grid tool category the lab archives information, and through using the idle computer resources of lab to construct the digital lab archives.
Key words: grid; lab archives; information
1 引言
隨著社會的變革和市場經濟的發展, 以及信息技術的高度發展和推廣使用, 信息在諸多資源中占據了越來越重要的地位, 而目前傳統的檔案管理模式已經不能適應經濟發展的要求, 只有實現檔案數字化, 才能夠沖破檔案管理利用的種種局限, 使檔案管理部門從封閉走向開放, 從檔案的保管利用職能向信息采集、管理和服務職能轉變, 更積極主動地為經濟建設主戰場服務。例如,目前國外很多高校,已經把檔案信息進行加工利用,并通過相應的網站向社會提供檔案信息的查詢[1]。近年來,網格計算正逐步成為整合信息的有力工具,利用網格計算提升現有檔案管理信息系統功能已經成為共識,本文結合實際工作,探討了網格計算在實驗室檔案信息化建設中的應用策略。
2 網格計算與檔案信息化管理
網格計算(grid computing)就是一個集成的計算環境,網格是借鑒電力網的概念提出來的,構建網格的最終目的是希望用戶在使用網格計算能力時,如同使用家庭電力一樣方便。用戶在使用電力時,不需要知道它來自來自何處,也不要知道它以何種方式傳輸。網格也希望給最終的使用者提供與地理位置無關、與具體的計算設施無關的通用計算能力。網格能夠吸納各種計算資源,并將它們轉化成一種隨處可得的、可靠的、標準的、經濟的計算能力。除了各種類型的計算機,這里的計算資源還包括網絡通信能力、數據資料、儀器設備、甚至是人等各種相關的資源。基于網格的問題求解就是網格計算。其應用包括分布式計算、高吞吐量計算、協同工程和數據查詢等諸多功能[2-3]。
網格計算的優勢在于不僅能實現檔案信息資源的共享,還能實現計算機硬件及其他電子設備的共享,利用網格中其他實驗室中閑置計算機的計算能力為用戶查詢和數據處理服務;也可以利用存儲虛擬化技術進行網絡存儲,整合閑置的存儲資源。存儲虛擬化是指將物理的存儲設備以邏輯的形式呈現。將網絡中的存儲設備視為一個或多個存儲池進行數據存取,而不用考慮信息具體存放在哪臺設備上。利用網格計算來改善數據管理所帶來的好處是簡化管理;降低管理的復雜性;提高存儲設備的利用率。此外,隨著檔案信息數字化的發展,多媒體技術的運用使得數字化檔案信息量越來越大。而網格計算能夠充分利用現有資源,更好地解決海量數據的計算處理和分析問題;它能將分布在不同地域的計算機鏈接在一起,用戶只需通過客戶端發出要求計算的指令。網格就能把這些任務調配給各個計算機執行,然后將各個計算機計算出來的結果匯總反饋給用戶。
3 基于網格的實驗室檔案信息化管理體系結構
網格計算可以將互聯網上的多臺計算機構成一個虛擬的計算機平臺。網格體系結構是關于如何建造網格的技術描述。由美國多家機構聯合開發的Globus Toolkit 已成為網格計算的主要標準[4-6], 按照該標準,網格體系結構模型包括采用本地服務層、核心服務層、高層服務與工具層、應用層。本文結合實驗室檔案信息管理的應用現狀,對該體系結構加以簡化。具體來說, 網格環境下的實驗室檔案信息化管理結構體系包括以下三個方面:
1)網格資源層:即由分布在 Internet上的各類資源組成,包括各類主機、工作站 ,它們是異構的,可運行在多種操作系統下,也可以是上述機型的機群系統、大型存儲設備、移動設備、數據庫或其他設備 (涵蓋目前各單位能上網的信息與電子檔案數據庫 )。
2)網格中間件(middle ware):即一系列工具和協議軟件。其功能是屏蔽網格資源層中異構資源的差異和地理上的分布性,管理分布的計算、儲存、網絡等資源,提供實現應用之間的可交互性和互操作性,包括電子檔案使用者登錄、安全和服務質量控制,提供必要的網格信息供網格瀏覽器查找所需資源,向網格應用層提供透明、一致的使用接口。
3)網格應用層:即網格上用戶的應用程序。用戶對網格系統提出自己的要求,包括所需資源和相關信息。用戶可使用網格應用程序,直接向網格層中間件服務層提出要求,或者用戶利用網格語言編程環境,編寫自己的網格程序提交給網格中間件。此外,用戶還可以通過 Web在遠程資源上提交數據和收集結果。
4 基于網格的實驗室檔案信息化管理的實現網絡模型
網格計算為實現網絡信息資源的綜合利用提供了一種新的手段, 基于網格計算的實驗室檔案信息管理,其目標就是通過網格的信息管理技術來屏蔽異構信息化檔案平臺之間的差異,實現異構平臺之間的互連,對外提供統一的服務接口,形成一體化的數字檔案信息庫,用戶可以借助局域網、政務網或公共信息網來查詢所需要的檔案信息。同時通過網格節點之間的協作來減輕整個網絡內服務器的網絡負載,提高服務質量。其實驗網絡模型如圖1所示。
數字化的實驗室檔案信息不僅包括文字和圖片信息,還包括聲音和視頻等多媒體信息,考慮到這些多媒體檔案信息對于計算機的處理能力要求比較高,而目前的實驗室網絡中有很多的計算機處理器和存儲器資源卻大面積的處于閑置狀態,所以通過采用網格,來把這些處于長時間閑置的計算機處理器和存儲器資源來構造成檔案數據機群,通過這些計算機群之間的通信交互協作,來提供滿足于客戶所需要的檔案信息化數據。
5 結論
網格計算對多樣化的實驗室檔案信息化管理的影響是全面的。它必將推動實驗室檔案信息化的發展,也將為實現數字化實驗室檔案信息的收集、管理、發布和利用提供了技術上的保證。隨著我國互聯網環境的快速發展,基于網格計算的數字化檔案管理將成為未來的趨勢。從而為社會用戶提供詳盡的增值服務。
參考文獻:
[1] 周林興,蘇君華.中外檔案網站比較[J].中國檔案,2003,(9):42-43.
[2] 胡凱.網絡計算新技術[M].北京:中國社會科學出版社,2001.
[3] 都志輝,陳渝,劉鵬.網格計算[M].北京:清華大學出版社,2002.
[4] 徐志偉,馮百明,李偉.網格計算技術[M].北京:電子工業出版社,2004.
[5] 金波, 覃哲.網格技術與檔案信息資源管理[J].檔案學通訊,2007,(3):53-56.
[6] 方存好,張堯學,田鵬偉,鐘鳴.網格計算環境中主動服務模型[J].清華大學學報(自然科學版),2008,48(4):593-596.