摘要:本文首先介紹了網格的特點和優勢,針對目前我國檔案信息開發利用中存在的問題,指出建立檔案信息網格是我國檔案信息開發利用的突破方向。最后通過對檔案信息網格完整體系架構的設計,為其建設提供了實踐指導。
關鍵詞:檔案信息網格開發利用
檔案信息的開發利用是推動經濟社會全面發展的重要途徑,然而受種種原因所限,我國的檔案信息開發利用工作尚處于瓶頸之中。為此,應用先進的網格技術,尋求突破,促進檔案參與社會活動,激發并實現檔案價值,具有重大而深遠的意義。
一、網格的特點與優勢
網格(Grid)的理念萌生于1969年Klein? rock所表述的“像使用電力和電話設施一樣來使用計算機”的構想。[1]目前普遍為科研工作者所接受的概念,是Ian Foster表達的:“網格是建構在互聯網上的一組新興技術,它融高速互聯網、高性能計算機、大型數據庫、傳感器、遠程設備等為一體,為科研工作者和普通公眾提供多于普通互聯網的資源、功能與交互。”[2]由其含義可知,網格是互聯網的延伸和發展,是下一代的互聯網,與現有的網絡相比,具有如下特點(見表1):
可見,雖然傳統互聯網與網格在基本目標上是一致的,但網格在結構體系與共享的范圍、模式和效率上有著更出色的表現。互聯網解決了跨時空通訊的問題,網格則將整個互聯網整合為一個超級計算機和海量資源池,面向用戶提供電力網般“即插即用”式的資源利用方式,能夠消除資源孤島,提升人們利用全球范圍內各類資源的能力,使互聯網資源得到充分的利用。
正是這些特點決定了其獨特的優勢(見表2):
二、我國檔案信息開發利用瓶頸剖析
(一)信息資源分散
檔案信息分散于為數眾多的檔案保管部門,它們相對獨立,形成了分散、異構的孤島。這些資源具有各自的組織方式,并以不同的檢索方式提供利用,這就要求用戶掌握每一個數據庫的檢索技術,從而為檔案信息檢索獲取造成了不便。
(二)信息開發深度不足
傳統檔案管理體制和保密意識的制約、開發手段和人員的不足以及檔案館資金及軟硬件條件的缺乏等原因共同導致了目前我國檔案信息開發難以深入的現狀。大多數未經增值開發的檔案信息資源難以實現其價值,也增加了用戶利用的難度。
(三)服務方式與理念滯后
長期以來,檔案館被動等待用戶上門的服務方式、千人一面的程式化服務手段、局限于本館資源的服務內容,⑤均與差異化、個性化、知識化、智能化的現代信息服務理念相違背。不但難以滿足用戶需求,更造成了其不愿利用檔案信息的心理障礙。
網格技術能夠以其強大的共享與虛擬集成能力完成廣泛分布的檔案信息資源的整合,并提供統一的發現與獲取方式;能夠以靈活性和容涵性在最大化節約成本的條件下引入高性能計算機的計算能力和數據處理能力、引入先進的信息開發工具和人力資源,向用戶輸出高效的開發手段,對檔案信息加以深度開發;能夠以自調整、自適應和容錯性聯合多種應用服務,提供良好的應用環境,根據用戶需求提供多種服務方式和內容。
可見,檔案信息資源開發利用問題的解決與網格的優勢特點具有高度的契合性。構建檔案信息網格能夠幫助檔案信息開發利用在新環境下取得突破。

三、檔案信息網格體系架構設計
(一)總體結構
1.檔案資源組塊
該組塊是用戶利用檔案信息網格資源的基礎保障,由用戶能夠實際利用的分布于各處的各類檔案資源組成。不僅包括檔案信息資源還包括大型計算機、實驗室、應用程序等實體資源,構成整個檔案信息網格的基礎。
2.虛擬抽象組塊
該組塊負責對檔案資源組塊提供的異構資源進行虛擬化,其目的是屏蔽底層資源的異構性,為其他組塊提供統一的資源形式,并將資源進一步抽象為各類服務以為用戶利用提供支持。
3.業務處理組塊
該組塊是檔案信息網格重要的核心管理工具,提供包括服務創建、維護、生命周期管理等業務功能。
4.交互溝通組塊
該組塊允許用戶在進行一次身份認證之后便建立代理證書,隨后代理證書可被程序應用于任何遠程服務的身份驗證,保障用戶利用網格資源的便捷性。
5.用戶服務組塊
該組塊主要提供用戶利用的界面,負責屏蔽網格技術的復雜性和網格資源的多樣性。用戶通過定制的界面透明、集中、一站式地訪問網格。
(二)拓撲結構
以各組塊間的聯動式拓撲關系保證檔案信息網格的整體性:
1.用戶—交互拓撲
用戶進行登錄/注冊后,交由用戶管理器審查身份并賦予用戶權限,再由服務代理根據用戶的訪問權限處理用戶請求,調配適當的應用或服務滿足用戶需求。最后無論用戶獲取了何種格式、何種類型的檔案信息或服務,都由視圖分配器做統一響應,集中反饋給用戶。
2.交互—業務拓撲
用戶管理器通過用戶認證中心和權限管理器獲取用戶權限。服務代理把用戶需求傳遞給服務工廠來獲取用戶所需服務。服務工廠既可以組配與調度現有的檔案信息服務,也可以通過任務管理器對下層資源進行進一步抽象來形成新服務。網格服務的創建、維護與刪除由服務工廠中的服務管理器負責。
3.業務—虛擬抽象拓撲
虛擬抽象組塊通過動態資源目錄、資源組配器和資源管理器三者之間的聯動實現對抽象資源的整合與調配。然后根據業務要求將整合后的資源提供給網格服務或其他任務。
4.虛擬抽象—資源拓撲
由數據提供者利用元數據整合各類資源,并通過OAI協議與服務提供者交互,同時注冊資源。再由服務提供者結合資源注冊建立索引分類,通過各類通信協議供虛擬抽象組塊利用。
(三)節點組織結構
檔案信息網格由若干節點聯接而成。其中底層的檔案資源提供者構成一個個信息節點,其內容包括但不限于檔案資源,也可涵蓋網絡文檔等。由網格管理中間件擱置它們內部結構的差異,對其進行一一封裝后納入網格環境之中。為了維護網格的正常運行,除信息節點外,還需要若干功能節點,包括元數據采集節點、元數據目錄節點、統一入口節點及注冊與認證節點等。
這些節點不能以一盤散沙的形態存在,而必須按照一定的結構加以組織,形成高效的網絡。
1.縱向樹形結構
依據上文設計,由檔案信息網格下設功能節點與信息節點兩個根節點。以信息節點為例,采取元數據與文獻資源實體一一對應的形式按樹形結構組織檔案資源,即每個數字化檔案實體都有相應的元數據對其加以描述,而每個信息節點都利用多個樹狀的目錄將元數據組織起來,構成節點的樹形結構。
2.橫向網狀結構
為了避免節點的孤立,在檔案信息網格樹形結構的基礎上,還需要在其中各同級節點之間建立聯系。這些聯系能夠以橫向的網狀結構來表達。
該結構也代表著檔案資源的虛擬集中過程。即由各個信息節點構成樹形結構的末端,由就近的服務器對它們采用收割元數據的方式加以整合,再匯總到根節點提供統一利用。根節點通過調用各個節點上的信息資源,實現各葉子節點的整合。
彼此相鄰的兩個節點間的關系比較密切,可以形成對等節點或關聯節點。對等節點可以為相同的信息資源提供不同的獲取途徑,一方面突破了單服務器在性能上的限制,擴大服務可及性;另一方面能夠實現故障的快速轉移,確保整個檔案信息網格系統的穩定性。關聯節點是指二者具有一定的共性特點,所涵蓋的資源內容可能有所交叉的節點,它們能夠共同為用戶進行跨領域研究提供條件。
四、結語
綜上所述,通過檔案信息網格的構建,實現其信息集成、統一檢索獲取、計算與分析資源共享、用戶分級管理和服務拓展等功能。從而為目前檔案信息開發利用中突出問題的解決構筑了基礎平臺,也提供了取得進一步突破的方向。
*本文是遼寧大學青年科研基金項目:“網格環境下檔案信息開發利用研究”的部分研究成果。
注釋:
[1]Smarr L,Catlett C. Metacomputing[J]. Com? munications of the ACM,1992(6):124-135
Ian Foster. WHAT IS THE GRID? A THREE POINT CHECKLIST[EB/OL]. [2013-04-16]. http:// www.it.jcu.edu.au/Subjects/cp5170/2006-2/Tsv/re? sources/session1/What_is_the_Grid.pdf
[2]朱蘭蘭.檔案信息資源開發利用對經濟社會發展影響力測度問題初探[J].檔案學通訊,2011(3):79-83.
[3]吳珺,趙廣輝,王春麗.網格技術及其應用分析[J].武漢理工大學學報,2008(5):143-147.
[4]王萍,趙丹陽,王玉超.基于網格技術的科學數據存儲與共享[J].圖書情報工作,2011(13):63-66.