宋玉濤 張先俊
(河南省電力勘測設計院,河南 鄭州 450007)
數字檔案館是檔案行業的新興事物,是國家檔案事業信息化建設的重要歷史發展階段。中國電力規劃設計協會《電力勘測設計行業檔案工作發展三年(2006~2008)規劃》要求:加大檔案信息化建設投入,實現檔案管理方法和管理內容上的轉變,在電子檔案管理軟件應用技術上取得進展,使電子檔案管理在轉換為勘測設計能力上有明顯體現;盡可能建立本單位的數字化檔案館。
近年來國家在深圳、青島兩個檔案館試點建設數字檔案館,并將成功經驗向各行業各地方推廣。那么什么是數字檔案館?在總結成功經驗的基礎上,目前大家比較認可的定義是:以網絡為支撐,以數據庫為核心,以檔案專業的管理軟件為工具,通過建設“三個平臺”——網絡支持平臺、業務管理平臺、信息服務平臺,實現數據傳輸網絡化、業務管理自動化、信息服務在線化。

進行數字檔案館建設,首先必須要搞懂它的基本結構,否則就會無從下手。其實,在數字檔案館這么一句簡單的定義中已經揭示了它的基本結構:即網絡支持平臺、業務管理平臺、信息服務平臺。這3個平臺既相對獨立,又緊密相連。每一個平臺針對的對象不同,解決的問題不同。
數字檔案館3個平臺的組成結構可以參照OSI(開放系統互聯參考模型)來理解。OSI是國際標準化組織于1978年定義的一個描述網絡層次結構的標準模型,通過OSI保證了各種類型網絡的兼容性,互操作性。OSI說明了信息在網絡中是如何傳輸的,以及各層在網絡中的功能和它們的框架概念。3個平臺作為檔案工作來理解可以與傳統檔案管理模式相對應,作為計算機網絡來理解可以與OSI的7個層相對應,見下圖:
與OSI模型功能相似,在數字檔案館3個平臺中,當前層平臺的下一層平臺都為當前層提供服務。3個平臺的結構為傳統檔案工作向數字檔案館過渡提供了理想的結構模型。
從檔案傳統管理模式來看,網絡支持平臺對應的是檔案信息的存儲利用模式。傳統檔案工作在這個平臺上主要考慮檔案的庫房容量,檔案案卷上如何標識,檔案信息如何組織起來對外提供利用等。庫房管理和檔案案卷組織存放形式是傳統檔案工作的基礎,沒有這個基礎檔案管理無從談起。
在數字檔案館的概念中,網絡支持平臺是處于最底層的一個平臺,是所有服務的基礎。這一層平臺主要完成數字檔案館的硬件布置與連接。如:網絡配置、服務器設置、客戶端要求、實體文件和各種條目信息的組織形式、存儲容量分析等。主要對應OSI 模型中的下面4層。即:物理層、數據鏈路層、網絡層和傳輸層。這一層平臺面向檔案業務管理平臺,向檔案業務管理平臺提供服務,對數字檔案的有效存儲和安全傳遞負責。
網絡支持平臺中重點考慮的一個方面是海量數據存儲。海量數據是數字檔案館的一個鮮明特點,它既是數字檔案館對外提供利用的基礎,也是加工和處理的對象。一般來說數字檔案館可以成為一個單位最大的數字信息庫之一,存儲量以“T”計。在硬件配置時應考慮大容量硬盤或磁盤陣列,在做異地備份時可以考慮光盤。
另一個考慮的重點是保存信息的多樣性。隨著信息技術的發展,我們產生的電子信息日益呈現出多媒體化,這種趨勢將來會越來越明顯。如我們平時經常遇到的工程圖紙信息(掃描圖tif、工程CAD圖紙)、文書檔案信息(原文及批文tif、word、htm)、電子圖書(CEB)、電子期刊(CAJ、PDF)、電子版規程規范(PDF),圖片信息(JPEG、BMP、GIF)等。為用戶保存和提供多媒體信息是網絡支持平臺應完成的功能,千兆甚至萬兆以太網和高速交換機為大容量信息傳遞提供了硬件基礎。
對應于業務管理平臺,傳統檔案管理模式可以劃分為的6個工作環節,即:收集、整理、保管、鑒定、統計、提供利用。這6個環節體現了檔案的日常工作,規范了檔案信息的流向,保證了進出檔案庫的信息都是完整、準確、有效的。在數字檔案館設計中應考慮實現這6個環節的功能,以便和傳統紙質檔案的管理相兼容。
從計算機網絡角度看,這一層平臺是數字檔案館非常重要的一層,起著承上啟下的重要作用。這一層主要對應于OSI模型中的會話層和表示層。在OSI模型中,會話層主要功能是為會話實體間建立連接,表示層主要功能是為通信提供一種公共語言。這兩層的功能映射到業務管理平臺中主要通過數據庫和檔案編號體系來完成,而數據庫的管理在整個數字檔案館中起著核心的作用。檔案管理人員通過數據庫完成對數字檔案信息的各種相關操作,同時接收信息服務平臺發送過來的服務請求。所有數字信息經過檔案編號體系編碼后進入數字檔案館進行有序保管,完成一個歸檔過程。檢索出來的信息通過這一層分類排序提供給信息服務平臺,完成一個服務過程。檔案6個工作環節通過數據庫和檔案編號體系相互作用共同完成數字檔案館的系統操作及日常維護。
在業務管理平臺,數字檔案館可以和工作流程中的上一級進行對接和連通,使檔案工作得以延伸,從根本上解決數字檔案歸檔率低的難題。以設計行業CAD圖紙歸檔為例,通過和出版崗位的繪圖儀連通,構筑同一個數字化管理平臺,實現在出版CAD圖紙的同時完成歸檔,可以使CAD圖紙歸檔率達到95%以上。
在許多數字檔案館系統設計中都把業務管理平臺設計成C/S形式,系統的日常管理通過檔案工作崗位的計算機來完成。這樣做有利于數字檔案館的管理工作相對獨立,提高了系統的安全性和保密性,提高工作效率。
業務管理平臺完成的重點任務是系統管理、人員注冊、數據庫日常維護、權限設置和安全控制。從安全角度講,該層對整個系統的安全和有效負責。用戶對系統的操作都要通過該層來識別其權限屬性,判定該請求能否進入下一層平臺。系統的日志記錄也在這一平臺完成。
在傳統檔案管理模式中,信息服務平臺對應于檔案服務形式。檔案部門根據用戶的需求選擇不同的服務方式,提供給用戶不同的檔案產品。比如用戶可以用查卡片的方式檢索檔案,也可以利用計算機檢索,還可以咨詢檔案管理人員。不同的服務方式帶來了不同的操作,但結果應當是相同的。
從計算機網絡角度來看,該層平臺對應于OSI模型中的應用層。與應用層功能相似,信息服務平臺是數字檔案館3個平臺中的最高層平臺,也是最靠近用戶的一層平臺。它不同于其他層平臺之處在于它不為任何一個平臺提供服務,它只為數字檔案館以外的用戶提供服務,用戶通過信息服務平臺完成對系統的操作。該層的任務是研究用戶的需求,如何為用戶提供方便、準確、舒適的服務。
信息服務平臺對用戶負責,該層不關心數字檔案信息在哪里存放,它的組織形式是什么,它是如何傳遞等具體問題。該層對用戶提出的需求進行分析并啟動業務管理平臺的數據庫系統對館藏數據進行檢索,檢索后的結果由業務管理平臺排序后提供給用戶。該層提供給了用戶模糊檢索、跨庫檢索、全文檢索等多種檢索工具,并可以為用戶提供瀏覽下載等多種功能。
信息服務平臺最強大的功能在檢索上。模糊檢索、跨庫檢索、全文檢索等多種檢索方式的采用會大大提高數字檔案的查全率和查準率。跨庫檢索和全文檢索是數字檔案館的突出特點的體現,在數字檔案的環境下,檔案利用者不會感覺到信息存在于各個不同的數據庫中,而只是根據需要查詢索取自己所需要的信息,不管信息是被標引或是沒有被標引,系統都會自動提供所有相關信息,真正達到相當高的查全率。數字檔案館模糊了庫與庫之間的界線,對外界只提供一個統一的界面,極大地方便了利用人員查閱和使用檔案。
信息服務平臺提供能瀏覽多種媒體格式的瀏覽器,在一個界面環境下完成多媒體信息的瀏覽或下載,方便了用戶對檔案全文信息的檢索和利用。
該層平臺一般設計為B/S結構。在通常的設計中,采用數字檔案館網站來鏈接各個數字資源庫,網站上有瀏覽器插件、各種檢索工具插件等。這種設計的目的是方便用戶登錄數字檔案館,降低用戶端計算機的要求。
在3層平臺結構中,用戶對數字檔案館提出的需求是一層一層向下傳遞,在完成相關操作后信息又一層一層向上傳遞,最后提供給用戶。比如用戶要完成一個檢索,首先經過信息服務平臺接收處理并識別是什么需求,分析后傳遞給業務管理平臺。在業務管理平臺啟動數據庫的檢索,通過對網絡支持平臺中實體文件的檢索,完成需要信息的查詢,然后向上傳遞回業務管理平臺進行排序或分類,最后提供給信息服務平臺,完成一次操作。用戶最終看到了檢索結果,見圖1。

圖1 最終檢索結果
數字檔案館結構的形成經歷了一個發展歷程,它的發展和整個檔案管理軟件的發展相一致。在早期單機版的計算機輔助管理檔案階段,只能部分實現“業務管理平臺”這一層的功能。這一階段的特點是以單個的計算機為基礎,以對檔案卷冊的目錄級管理為重點,具有簡單的查詢、打印、排序等功能,沒有網絡支持平臺和為用戶服務的平臺。隨著網絡本身的發展以及網絡數據庫的出現,具有“網絡支持平臺”部分功能的第二代檔案管理軟件開始出現,但還不能保存管理檔案的全文。電子檔案的出現使得檔案管理軟件跨入第三代。第三代檔案管理軟件以網絡為基礎,以檔案的全文管理為重點,具有網絡查詢、瀏覽、下載全文等功能,初步具備了3個平臺的結構。第四代檔案管理軟件以檔案整體的數字化為基礎,以檔案管理中的歸全率、完整率為突破口,從電子文件的收集階段開始介入進行管理,實現了檔案工作的延伸和拓展,達到了確保檔案電子版全文的歸全率和完整率的目的。這些功能的完成需要3個平臺互相作用,缺一不可。

表1 檔案管理軟件發展歷史
從數字檔案館的整體結構來說,數字檔案館的建設是一個系統工程,并非一朝一夕就能完成,它對一個單位的網絡、計算機、檔案管理、電子檔案管理甚至相關部門都提出了較高的要求。對系統需求進行分析時宜從最高層入手,最底層結束。進行建設時宜從最底層入手,最高層結束。3層平臺的結構為我們研究數字檔案館提供了很好的模型,也為建設數字檔案館提供了理想的參照