周楓 呂東偉 鄧晶京 黃麗萍 駱建珍
摘? 要:OFD格式是我國自主可控的電子文件版式文檔格式。文章從版式文檔存在的問題著手,對OFD格式產生背景進行分析;結合OFD格式的特征,對OFD格式在檔案領域應用場景進行探討;采用SWOT分析法,對OFD格式在檔案領域應用前景進行分析,并指出應用策略。
關鍵詞:OFD;版式文檔;格式;檔案;SWOT分析法
Abstract: OFD is the self-controlled fixed layout documents format of electronic files. Firstly, the paper analyze the creation background of OFD by summarizing the problem of other fixed layout documents. Secondly, the paper discussing the application scenario of OFD format in archives by integrating the feature of OFD format. At last, the paper analyze the application prospect and point out the application strategy of OFD format in archives by using SWOT analytical method.
Keywords:? OFD;? fixed layout documents;? format;? archives;? SWOT
版式文檔是指版面呈現效果固定的電子文檔。版式文檔通過將文字、圖像、圖表等數字內容對象按一定規則進行版面固化呈現,呈現效果不因軟硬件環境、操作者的變化而變化,版面固定、不跑版、所見即所得,可以視為計算機時代的“數字紙張”。版式文檔的特點使它成為電子文檔發布、數字化信息傳播和存檔的理想文檔格式。2017年5月,國家標準《電子文件存儲與交換格式版式文檔》(GB/T 33190-2016)正式實施,該標準規定了國家版式文檔格式規范,簡稱OFD(Open Fixed-Layout Document)。然而,作為一項文檔格式的國家標準,對于OFD格式的研究主要仍局限于產品本身,因此非常有必要加強OFD格式在檔案領域的研究,從而更好地推進OFD格式在檔案工作中的進一步應用。
1.1 存檔格式多樣,造成信息孤島。在OFD格式產生之前,電子文件存檔格式并沒有統一的國家或行業標準,檔案工作中普遍采用DOC、WPS、PPTX等流式文件格式。由于其存在內容易更改、遷移過程易變異和損失等不足,因此并不符合電子文件長期保存要求。同時,部分文檔以PDF、XPS、SEP、CEBX等版式格式存檔,但不同版式文件依賴某個具體軟硬件平臺且格式技術未能完全打通,導致格式之間不能互通、傳遞不暢,文檔信息傳播利用受限。
1.2 格式應用受限,信息失存失信。由于沒有統一標準,當前文檔格式大多不易擴展,導致各領域的應用受限。有些版式文檔不能嵌入元數據信息,從前端業務系統形成的電子文件自帶的信息量太少,導致電子文件所包含的元數據信息大量減少;部分版式文檔格式不能很好地支持數字簽名、電子印章等技術認證機制,無法滿足電子文件長久保存的要求。在對不符合長期保存要求的格式進行格式轉換時,容易出現新的問題:業務系統中的流轉、簽批等信息在轉換為歸檔格式后可能會丟失;格式轉化過程的數字簽名、印章等認證信息丟失;不同格式之間的數字簽名不能互通,不能互簽互用;大批量文件進行格式轉換用時長,轉化過程不穩定,容易出錯。
1.3 現有格式壟斷,存在安全風險。一些格式依賴非自主可控技術,無法在全自主可控平臺下運行,格式的使用和服務受限于外部廠商和技術,對于文檔的發展應用始終處于跟隨狀態,而當需要對文檔格式進行擴展時,又容易受制于相關廠商。格式標準不公開,私有版式文檔的格式解析、標準解釋掌握在國外企業手中,文檔信息資源容易遭到“劫持”,也無法保證對數據解析的長期技術支持。同時,國外軟件廠商的文檔格式不支持國產加密算法應用,無法通過國密算法保證電子文檔的安全。
2009年,中央辦公廳頒布《電子文件管理暫行辦法》,明確提出“應采用符合國家標準的文件存儲格式,確保能夠長期有效可讀”。2010年5月,全國檔案工作標準化技術委員會第十八次年會提出,與工業和信息化部一同暫緩采用以美國ADOBE公司技術為基礎的《長期保存的電子文檔文件格式第1部分:PDF1.4(PDF/A-1)的使用》作為國家標準在我國的實施,并最終與國家標準委達成協議,將該標準的使用范圍限定在“涉密文檔以及作為檔案保存的文檔”[1]以外,因此,制定適合我國電子文件長期存儲和交換的國家自主可控版式文檔應運而生。
2.1電子文件歸檔格式。對于電子文件歸檔而言,采用“原生”格式歸檔,不僅可以更好地保證電子文件的“四性”,還有利于電子檔案的長期保存和有效利用。因此,在前端即采用OFD格式生成并以OFD格式歸檔,可以視為電子文件歸檔格式的前端控制,如浙江省檔案局印發《浙江省省直單位電子公文歸檔與電子檔案管理暫行辦法》,提出電子公文采用OFD格式歸檔。
2.2 元數據采集。OFD具有很強的結構化描述能力,外部系統或用戶可以通過標引的方式添加自定義的標記和信息,為在文檔中嵌入更多應用相關的結構化語義信息提供支持,同時,OFD支持語義導覽并可將內嵌語義導出為數據,從而達到與其他系統、數據交互的目的并擴展應用,而這也是OFD吸取其他格式方案發展應用中的經驗教訓而形成的獨特優勢。對于電子檔案而言,在電子公文階段利用自定義標引定義電子公文所需的元數據,構建電子公文語義樹;進入檔案部門后,可繼承電子公文中原有的前端元數據,并根據檔案管理的需要補充擴展相關檔案管理元數據,從而更好地保證電子文件全生命周期過程的“四性”。
2.3 電子文件格式轉換。采用OFD進行格式轉換有兩種情況:一是歸檔時將各種主流格式的文件統一轉換為OFD格式,實現“多頭流入,單一保存”。例如,在OFD格式頒布前的試點過程中,國土資源部將文書檔案、業務檔案、網頁等進行了OFD格式電子文件歸檔,審計署對其行政及審計公文進行了轉版應用。二是由于原先格式即將被淘汰、原格式不符合國家標準、格式多樣管理不便等原因,對電子檔案的格式進行統一轉換。
2.4 電子檔案長期保存。《版式電子文件長期保存格式需求》(DA/T 47-2009)中對長期保存格式需求進行了定義:長期保存是用一種可靠的、科學合理的方式長期維護電子文件真實、完整、有效的行為。同時,DA/T 47給出了版式電子文件長期保存格式11項需求,可以作為電子文件長期保存格式選擇的依據:格式開放、不綁定軟硬件、文件自包含、格式自描述、顯示一致性、持續可解釋、穩健、利于存儲、支持技術認證機制、易于利用。通過將OFD版式文件的內容、特性與DA/T 47要求進行對比,其完全符合電子檔案長期保存文件格式要求,是作為電子檔案文件格式的理想選擇。
2.5 電子檔案數據交換。為了維護電子檔案的完整性,數據交換一般而言并不會以單個電子文件的方式進行交換,而是以信息包的方式進行交換,包括 ASIP、TSIP、AIP、DIP等。信息包以一定的目標結構方式組織,為了交換方便的需要也會封裝成ZIP壓縮包、EEP封裝包、電子書等形式。OFD作為電子文件存儲和交換格式,采用Zip壓縮,支持以數字簽名的方式進行數據交換過程中的安全認證,可有效實現電子檔案的數據轉換。
2.6 電子檔案開放利用。隨著無紙化進程的推進,越來越多的文件利用以電子形式進行,如何確保在不同的環境下文件利用的安全和便利,并始終保持所利用文件的權威性和憑證作用,是開放利用中不得不考慮的一個問題。作為一種版式文檔,OFD能夠實現存檔格式和利用格式合一,提供給用戶相同的用戶體驗,提供全面、安全、高效的文檔呈現、交換和再利用,同時結合用戶操作習慣,提供視圖、注釋、工具等功能,滿足利用過程中的文檔處理需要。OFD版式文件基于層次文本+壓縮打包的技術機制,比同樣內容的DOC、PDF等格式文件體積更小,在線閱讀時文件加載、打開速度更快,同時用戶終端不留存副本,安全性好。此外,OFD還可根據需要實現多文檔的分類合并,更好地滿足業務需求。
2.7 自主可控檔案系統。在部分安全保密要求級別較高的系統中,OFD應該是唯一的版式文件格式,不管是保存、交換還是利用。OFD對于全國產環境(基于國產 CPU/OS的數字檔案信息系統)的支持相對于PDF格式也有明顯的優勢。OFD格式得到國產廠商的廣泛支持,其與CA認證、國產加密算法、電子印章等安全防護措施的結合比PDF更有優勢。因此,在自主可控檔案系統中,OFD格式無疑是自主可控檔案系統的最好選擇。
3.1 優勢(Strengths)分析
3.1.1 格式自主可控。隨著信息及網絡安全國家戰略的推進,相關軟硬件的國產化快速推進。從服務器到芯片,從操作系統到應用工具,OFD的推出正是這股浪潮的重要體現。OFD格式的出現,使我國第一次擁有了國家級的自主版式格式。OFD作為PDF的國內替代格式,標準自主可控,不受控于外部廠商,可階段性地實現“將自己的雞蛋籃子掛在自己樹上”的戰略需求,這也是創立自主可控的版式格式最重要的初衷之一。
3.1.2 較強技術優勢。在版式文檔格式方面,除目前國際通用的PDF外,還有其他的很多文檔格式如CEB、SEP、CAJ等在使用。相比于其他格式,OFD格式有一系列技術優勢。第一,OFD基于XML技術來描述文檔數據,格式開放,利于理解,長期可讀可用;第二,OFD支持根據各領域需要進行語義標引擴展,這已經超出了單純版式格式的功能,更加貼合應用需求;第三,OFD支持國產密碼算法,是文件具有法律效力的基本條件。總的而言,OFD具有開放性高、兼容性好、真實性好、集成性高、保存性好、成本低等特點,是一種理想的長期保存格式。
3.2 劣勢(Weaknesses)分析
3.2.1更換成本較大。經過二十多年的標準化與國際化,PDF在使用和溝通上的成本已經非常低,良好的用戶體驗已經培養了一群忠實的用戶群體,從實際情況看,PDF已在檔案部門大量使用。此外,OFD的閱讀需要專門的閱讀軟件,不同于PDF閱讀軟件的開源,OFD軟件由不同的企業開發,自然涉及不菲的成本。據調研,目前一套專業的OFD閱讀軟件將近20萬元。“OFD將不可避免地面臨與PDF直接的成本競爭,這種成本由使用成本、溝通成本、管理成本和風險成本共同組成,同時也包括其他用戶的轉嫁成本。”[2]短期來看,出于降低技術風險和成本投入的考慮,檔案部門沒有拋棄PDF而采用OFD的強烈意愿。
3.2.2 理論研究不足。作為一個嶄新格式,目前對OFD的格式研究更多地還停留在格式介紹及其與PDF的格式對比層面,對OFD格式本身的技術方案、特性分析及其應用場景研究相對欠缺,而在檔案行業的應用研究更是鳳毛麟角。理論研究的不足使得人們對其認識還停留在“PDF的替代格式”這種概念層次,無法形成對OFD應用拓展的深度支撐。
3.3 機會(Opportunities)分析
3.3.1 實踐需求強烈。隨著數字技術的快速發展,數字信息資源的可存取性卻變得極為脆弱。由于文檔格式不統一、不開放、不可控,造成文檔交換有障礙、應用擴展有困難。更為重要的是,在長期、安全保存中存在著極大的風險。調查顯示,1990年北京亞運會的部分電子文件已經無法讀取,22%的中央機關存在讀不出來的電子文件。針對該問題,一般采取三種方法:一是不斷將文件轉化為當前通用的新文件格式;二是采用獨立于任何計算機系統的開放格式存儲文件;三是將該文件與其軟硬件系統一同保存。從現實情況來看,大多數單位選擇了第二種辦法。
3.3.2 政策推動有力。早在2009年,中辦《電子文件管理暫行辦法》就明確提出“應采用符合國家標準的文件存儲格式,確保能夠長期有效讀取”;2016年11月,《國家電子文件管理“十三五”規劃》提出“鼓勵黨政機關等重點行業領域使用具有自主產權、安全可控的電子文件管理產品”[3]。2016年12月,在國標委發布的《黨政機關電子公文系列標準規范》(GB/T 33476~33483-2016)中,明確要求“電子公文的承載格式為OFD”。國家電子政務綜合試點方案提出“試點地區要推進OFD版式標準的應用,規范黨政機關電子文件管理、電子公文標準化應用”[4]。此外,電子文件管理行業也采取了切實的措施來推動OFD格式的發展。2016年11月,在國家電子文件管理部際聯席會議、工業和信息化部、國家標準委的指導下,由電子文件管理領域相關企業、院校、科研機構及用戶等組成的電子文件管理推進聯盟成立,聯盟章程第五條明確提出“推動GB/T 33190-2016《電子文件存儲與交換格式版式文檔》等標準在辦公、證照、檔案和票據等各領域的推廣應用”。
3.4 威脅(Threats)分析
3.4.1 競爭激烈,生態脆弱。經過20多年的發展,PDF已從Adobe公司的一款產品上升為ISO 32000國際標準,而PDF/Archive(PDF/A)更是被視為電子檔案保存的最佳解決方案而成為ISO/DIS19005-1國際標準。無論是Office、WPS抑或眾多瀏覽器、應用系統,均支持PDF的應用,從而形成了一個良性的生態環境。OFD則顯得“勢單力薄”,目前能夠對OFD閱讀具有支撐作用的軟硬件環境屈指可數,更別提與各種環境的“無縫對接”。因此,總的來看,OFD發展的生態環境目前還比較脆弱,若沒有強有力的支持,有可能被扼殺在幼兒期。
3.4.2 政策變更風險。當前,OFD格式主要由不具強制力的行業聯盟來進行“自上而下”的推廣,執行力度較難保障。一旦推廣效果不達預期,有可能導致政策的重大轉變,進而影響OFD格式的應用。
雖然OFD格式在檔案領域的應用正處于起步階段,更多的是個別單位的零星試點,但基于上述SWOT分析,OFD在檔案領域的應用“優勢大于劣勢,機遇多于挑戰”。從長期來看,由于OFD格式自身的優越屬性,加之國家推動自主可控格式的決心,OFD格式在檔案領域有著光明的應用前景;從短期來看,由于用戶習慣短期內較難改變,OFD在檔案領域的全面應用還有待時日,但作為集中統一地進行長久保存的機構,檔案部門可先行采用OFD作為備份和利用的主要格式,從而以點帶面地推動OFD格式的全面應用。
[1]國家檔案局、中央檔案館關于印發《全國檔案工作標準化技術委員會第十八次年會會議紀要》的通知[EB/OL].(2010-06-12)[2017-12-20]. http://cpc.people.com.cn/GB/64114/83904/83906/12155917.html.
[2]梁凱.檔案部門應用OFD格式的若干思考[J].浙江檔案,2017(1):64.
[3]中共中央辦公廳 國務院辦公廳關于印發《國家電子文件管理“十三五”規劃》的通知.廳字〔2016〕37號.
[4]國家多部門聯合開展國家電子政務綜合試點[EB/OL].(2017-12-29)[2018-02-20]. http://www.miit.gov.cn/newweb/n1146285/n1146352/n3054355/n3057656/n3057660/c5995240/content.html.