望 旺
2009年6月20日,電子文件管理國家戰略國際學術研討會在中國人民大學逸夫會議中心舉行。會上,美國電子文件檔案館項目系統工程主管Dyung Le先生、加拿大圖書館檔案館政府文件管理辦公室高級主管Johanna Smith女士、澳大利亞檔案館館長助理Adrian Cunningham先生、荷蘭國家檔案館數字資源長期保存高級專家Hans Hofman先生分別作了主題演講,反映了各國電子文件管理國家戰略的現狀、特點及其發展方向。本文歸納了四位專家發言的主要內容。
1. Dyung Le:美國電子文件檔案館(ERA)項目——現狀、挑戰與教訓
1.1. ERA的歷史與背景
美國國家檔案與文件署(National Archives and Records Administration,簡稱NARA)自1934成立以來,始終將保證美國政府文件與檔案可被本國公民利用作為其主要任務之一。
NARA管理電子文件的歷史是一個漫長且不斷發展的過程。上世紀60年代,電子文件這一新的文件類型開始在政府內產生。70年代,第一批電子文件移交至NARA保管。及至90年代,電子文件的管理逐漸成為NARA關注的重點。如今,電子文件的數量呈爆炸式增長,這也極大地推動了電子文件管理的發展。
為了應對電子文件管理的挑戰,NARA作出了戰略性的回應,也即啟動電子文件檔案館(Electronic Records Archives,簡稱ERA)項目。ERA的目的是保管美國政府生成的具有獨特價值的電子文件,并提供長期利用;同時把所有政府文件的生命周期管理納入電子政府框架之中。ERA的建設應滿足三個基本要求,即持續性、真實性和可擴展性。
1.2. ERA的發展
在發展ERA的過程中,NARA以電子文件管理理論與方法的研究為先導,進行系統開發以滿足電子文件管理的要求。同時,NARA還開展組織變革管理以保障項目的順利實施。此外,NARA充分利用外部研究力量,與許多其他項目和組織建立緊密的合作關系,以保證后期研發的順利進行。
2008年6月,ERA基礎系統(ERA Base)發布,該系統實現了ERA的基本操作功能,定義了文件全生命周期管理流程,并建立了核心攝取子系統。2008年12月,ERA檢索與利用模塊發布,同時將總統電子文件的管理及喬治·布什總統圖書館的建立作為工作的重點。按照規劃,ERA系統將于2011年9月全部上線。
根據ERA的發展藍圖,系統將根據不同保管需求使用不同的保管方法和工具,公眾可通過多種在線方式利用政府電子文件信息。
1.3. ERA的挑戰及應汲取的教訓
ERA是統領眾多系統的系統,因而面臨統籌、協調不同系統目標定義、功能需求、實施要求的戰略挑戰。ERA的業務挑戰來自內部和外部兩個方面:對內需要協調多個部門的利益,建立共識,對外需要協調超過300家的用戶機構的管理機制,在模型和流程上達成共識,同時與私人企業發展增值服務。
ERA同時面臨系統基礎架構、數據模型、元數據等方面的技術挑戰,以及攝取、保存、利用和存儲等階段的技術挑戰。
經過多年發展,NARA認識到ERA的建設不可能一蹴而就,它需要全方位的努力。業務上,需要轉變傳統紙質環境的管理思維;技術上,需要尋求符合未來發展趨勢的框架與模式。NARA是ERA的承擔者,但實際上NARA不可能完全獨立地解決所有問題,它需要積極尋找與外界合作的機會,借助更多的外部力量來完成目標。
2. Johanna Smith:建立信任:加拿大政府的電子文件管理
2.1. LAC TDR的背景與文件管理的危機
2004年,加拿大國家圖書館和國家檔案館合并,成立加拿大圖書館檔案館(Library and Archives Canada,簡稱LAC)。LAC主要根據LAC法案進行管理,此外,版權法、信息利用法和隱私保護法也對LAC的業務產生影響。
加拿大政府電子文件管理的歷史可追溯至上世紀70年代機讀檔案部(Machine-Readable Archives Division,簡稱MRA)的設置。MRA制定的一整套電子文件接收和處理政策現在仍然有效,但這些政策建立在舊的檔案管理理念的基礎上,因而加拿大的文件管理正面臨數字時代公共管理的挑戰及計算機通訊技術發展帶來的危機。
為此,LAC在2006年秋就信息管理和文件管理召開了一系列副部長圓桌會議,并頒布相關指令(2009年6月生效)。該指令明確指出了加拿大政府在文件問責方面的作用及職責,使政府信息管理的治理結構得到了修正和更新。同時,為了實現加拿大政府數字資源的長期保存,LAC建立了基于OAIS參考模型的可信數字倉儲(Trusted Digital Repository,簡稱TDR)。
2.2. 數字資產的管理
TDR定義的管理流程包括預移交、移交、驗證、存檔、利用等階段。
在預移交階段,TDR通過文件處置權責方協議(Records Disposition Authority,簡稱RDA)實現文件形成者與檔案館之間的接口,提出件或對象一級的元數據要求,并開發本地數字格式注冊表(Local Digital Format Registry,簡稱LDFR)和通用數字格式注冊表(Universal Digital Format Registry,簡稱UDFR)引導文件形成者選擇首選格式。
TDR通過Web上傳、email、FTP、OAI收割、Web收割等多種渠道進行文件的移交。同時,TDR使用一種預設格式捕獲元數據,方便將其集成至檔案信息包(Archival Information Package,AIP)之中。
在數字資產成為永久文件匯集之前,需要進行特定的內容驗證,以保證其真實性和兼容性。完成驗證的文件將進行元數據描述,使其可被客戶利用。
數字資產一旦通過驗證,將被立即歸檔。TDR根據元數據編碼與傳輸標準(Metadata Encoding and Transmission Standard,簡稱METS)模式將元數據結構化,并使用LDFR和UDFR進行格式管理。
數據資產的利用通過數字保存政策進行管理。所有內容都將進行全文索引,且這些索引可被聯合搜索(Federate Search)進行利用。
2.3. 當前進展與挑戰
目前,LAC在促進政府部門合作、提升文件管理活動的重要性等方面取得了重大進展,同時建立了一系列政策和技術基礎架構。當前面臨的挑戰包括先前人工處理過程的自動化,結構化文本管理系統對移交非文本文件的限制,件級元數據審查帶來的工作量的劇增,安全分類文件的分享基礎架構,以及電力供應與物理服務器容量面對頻繁的移交活動而產生的壓力。
未來,LAC將建立數字資產的分布式保存機制,把加拿大政府看作一個整體,分擔文件管理和檔案保存的責任。同時,LAC還將致力于與文件形成者合作,保存數字資產的證據價值。
3. Adrian Cunningham:澳大拉西亞數字長期保存的合作機制
3.1. 背景介紹
數字文件保存是當前國際檔案界普遍關注的問題。為了滿足數字文件長期保存的需求,檔案部門有必要加入國家和國際標準化組織,成為文件管理和檔案管理標準的制定者。在國際范圍內,澳大利亞數字文件管理標準制定活動起步較早,也取得了一定的成績,其制定的一部分標準成為國際標準的基礎,有的甚至直接轉化成為國際標準。
之所以使用“澳大拉西亞”一詞,是因為澳大利亞和新西蘭共同提出了澳大拉西亞數字文件保存動議(Australasian Digital Recordkeeping Initiative,簡稱ADRI)。澳大利亞與新西蘭地理位置相近,兩國具有深厚的歷史淵源,具有交叉司法管轄的傳統,這些都是ADRI提出的原因。
3.2. ADRI的目標與原則
ADRI的愿景是澳大利亞和新西蘭的所有政府機構在數字文件生成、保存和利用方面采用統一的途徑,以確保重要文化遺產的長期保護。其目標包括:所有成員接受數字文件管理的指導原則;所有成員倡導適當的數字文件管理以支持政府執法;兩國政府部門都有電子政務制度;政府部門統一執行ADRI制定的標準;電子政府的證據需被捕獲、保存和利用;為數字文件管理提供專業領導和發展方向;在數字環境中,機構能有效和經濟地擔當其法律和行政職責;對有限集體資源進行最佳的戰略性利用。
ADRI的指導原則包括:擁護和協助政府檔案館的職責;設計和實施數字文件管理系統被列入重要性首位;共享權利、共擔責任,共同滿足充分支持和培訓的需求;承諾采用統一標準;明確文件管理要求的重要性;明確文件管理元數據標準化的重要性;以數字格式生成的文件應當以數字格式保存;數字文件需要積極地管理和維護;文件的保存格式不應受所有權的局限;需要建立可信的數字倉儲;借助網絡技術最大化地提供公眾利用。
3.3. 澳大拉西亞統一應對數字文件挑戰的舉措
為應對數字文件的挑戰,澳大拉西亞從標準入手采取了一系列措施。ADRI成員形成了數字文件生成與管理、保存、移交和利用等方面的公共標準,如ISO 14721、ISO 15489等。此外,ADRI成員還計劃以文件連續體理念為指導,統一使用文件管理標準、元數據標準和分類方案。不過,ADRI成員在采取統一舉措的同時還應尊重立法體制、利用體制、實施細節、進展情況等方面存在的差異。ADRI還開展了一些項目,并取得了一定成果,如數字文件輸出標準和交換規范、檔案權責方實施數字文件管理和歸檔的示范計劃等。
3.4. 澳大利亞國家檔案館數字文件長期保存的最新進展
2001年,澳大利亞國家檔案館(National Archives of Australia,簡稱NAA)啟動數字保存戰略項目。2002年,NAA制定《數字文件保存辦法》,規定使用基于XML的封裝和保存專用數據格式來規范數字文件。2004年9月,NAA發布了旨在實現數字文件規范化的開源軟件Xena 1.0,目前該軟件最新版本為4.2.1(2009年2月發布)。2005年至今,NAA還開展了數字倉儲原型/實驗室的建設。
4. Hans Hofman:荷蘭與英國的文件管理實施問題
4.1. 荷蘭文件管理面臨的挑戰
在新技術、新標準不斷革新,管理思想不斷演化的環境里,荷蘭國家檔案館及荷蘭政府都面臨著文件管理領域的挑戰。一方面,荷蘭國家檔案館需要進行重新定位,實現自身再造,同時發展數字倉儲,進行元數據協調、基礎設施自適應等工作;另一方面,荷蘭政府需要完成向電子政府的轉變,改進政府文件管理方法,并實施元數據方案,提高互操作能力。
為應對這些挑戰,需建立以政府機關、內政部、教育、文化與科學部、國家檔案館、審計總署和檔案監察部門等為關鍵成員的合作伙伴關系,同時將檔案法、信息自由法及其他信息管理與文件管理相關法律法規作為行動的基礎。
4.2. 荷蘭文件管理的歷史與現狀
荷蘭政府機關在管理政府信息方面采取了大量舉措。上世紀80年代,政府為解決紙質文件積壓問題發起鑒定與挑選項目。1996至2002年,又啟動了數字信息長期可讀項目,其成果成為保存電子文件最初的指導方針。隨著電子文件的快速發展,政府逐漸認識到電子文件長期保存方面存在的問題。為此,荷蘭政府通過提供電子服務、重組政府組織等方式應對新環境帶來的挑戰。
荷蘭政府文件管理的主要問題包括新格式文件的保存、信息孤島、紙質環境與數字環境并存、文件管理與業務流程脫節等。為改善這些現狀,政府采取了一些措施,總體上取得了一些進步。荷蘭政府在2006年啟動政府信息系統化項目,2008年發布構成文件管理基礎的高水平需求框架,力求將文件管理納入電子政府的信息架構。該架構指明了實施政府文件管理的指導原則、標準、指南、規章等。
目前,荷蘭國家檔案館正在經歷由文件保管角色向信息捍衛角色轉變的過程,同時正在研發數字倉儲。該倉儲預計將于2009年進行試運行,2010年正式運行。
4.3. 英國電子文件管理項目
英國國家檔案館于2004年啟動無縫傳輸(Seamless Flow)項目,2008年具體實施該項目。該項目采用面向過程的方法進行信息內容處理,盡可能地實現信息處理環節的自動化。實施該項目將導致人力資源成本的增加,但也會獲得文件利用方式的改善、重要文件的安全保護、移交過程的提前等可以預期的收益。
數字連續體(Digital Continuity)項目于2007年開始籌備,預計2011年具體實施。通過該項目,國家檔案館將在風險認識和評估以及如何降低風險方面對政府部門提供指導,該項目的主要目的在于保證核心政府信息的長期可用。
Web連續體(Web Continuity)項目研究Web歸檔和超鏈接管理,其目的在于保證政府信息的可持續利用,當網址不再可用時,利用捕獲到的歸檔文件為用戶提供重定向工具。同時,該項目還制定網站設計指南,為現有Web歸檔程序提供網頁快照等工具。
作者單位:數據工程與知識工程教育部重點實驗室
中國人民大學信息資源管理學院