● 陜西省標準化研究院 呂 強 陜西省計量科學研究院 陳怡君
組織機構代碼是對中華人民共和國境內依法注冊、依法登記的機關、企事業單位、社會團體和民辦非企業等組織機構頒發的一個在全國范圍內惟一的、始終不變的無含義代碼標識,由9位數字和字母組成。
為了全面推進國家組織機構代碼信息化的進程,從2005年開始,由全國組織機構代碼管理中心組織,在全國范圍內推進開展組織機構代碼檔案數字化工作,即將原有的傳統組織機構代碼紙質檔案,通過掃描、標識、索引的方法,統一納入到計算機數字化管理中。并先后發布了《組織機構代碼檔案管理方法》和《組織機構代碼電子檔案管理和技術規范》,開發了組織機構電子檔案業務管理系統,對組織機構代碼電子檔案工作制定一系列工作要求和技術規范,以有效推進電子檔案建設進程。
目前,已經在全國范圍內投入使用的組織機構電子檔案業務管理系統提供了基于國家、省、市縣3級結構的、相對全面的組織機構代碼電子檔案業務管理功能,對解決組織機構代碼檔案電子化起到了極大的推動作用。通過在日常工作中的不斷改進與提升,組織機構代碼檔案數字化工作已經取得了相當的成績,全國范圍內已建檔的組織機構代碼電子檔案數量已經過億,并且通過專用網絡24小時不間斷實時更新。
作為國內較早推行檔案數字化工作的組織機構代碼電子檔案,通過多年的經驗積累,已經具備了一定的工作基礎,但隨著新技術的不斷發展,現有檔案管理系統軟件與數字化檔案管理方式的一些問題也不斷顯現,特別是在已經建立的電子檔案基礎上,維護、應用的技術短板制約了未來檔案數字化應用進程的開展。例如現有的代碼電子檔案采用數據庫信息索引與TIF圖像文件相結合的方式保存,TIF圖像依賴于微軟的Windows操作系統的文件目錄結構進行查找管理,期間一旦發生數據庫損壞,或者圖像存儲路徑被從外部修改,將直接導致所有的代碼電子檔案無法使用,幾乎不可能恢復。并且隨著圖像編輯工具與編輯技術的不斷豐富,各省、市、縣存儲于本地的TIF格式檔案圖像存在著被篡改的可能,直接影響到了數字化檔案的真實性問題,因此迫切需要一種能夠識別、鑒定、自我維護的加密技術來保障檔案數字化成果的可用性,否則將極大地制約數字化檔案的應用前景,使數字化檔案的法律效應難以得到保證。
組織機構代碼電子檔案的篡改檢測與鑒真是一種通過特定數字水印技術,將數字化資源的各類特征信息如原始信息(重心、尺寸、面積、重量、直方圖、色度、亮度、灰度、飽和度、材質、分辨率、版心尺寸,行列投影,連通度、邊緣、校驗和、存儲尺寸、創建時間、修改時間、形狀、紋理、不變距和中心距)、責任信息(責任人、產生時間、入庫時間)、版權信息(版權所有者)等進行分析和提取,以隱藏的形式嵌入到圖像載體并保存到數據庫中,不影響原數字化資源的瀏覽和使用,實現了用戶的不可感知性,一旦圖像發生篡改,則可以通過隱藏在圖像中或存儲于數據庫中的水印信息進行驗證,從而驗證原始圖像的原始性及是否被篡改。由于檔案圖像中嵌入了檔案的版權信息,對于無法聯網進行數據庫驗證的離線檔案文件也可以實現檔案的基本鑒真要求。
相對于常見的基于數字證書技術的檔案加密技術而言,在組織機構代碼電子檔案中應用數字水印防篡改技術有著以下幾大優勢:
傳統的數字證書加密技術是基于文件的指紋特征進行加密,一旦文件被修改,則數字證書也被破壞,從而實現了對逐個文件的篡改識別。而基于數字水印的組織機構代碼電子檔案防篡改技術是針對特定圖像類型文件的特征信息分析、加密的技術,分析后的圖像特征(水印)隱藏在圖像文件中,圖像本身各項屬性及應用方式完全不受影響。一旦圖像文件被修改,可以通過重新計算、比對原始文件的水印信息來具體確認圖像的哪一個位置被修改過(精確到每一個像素點),不但實現了圖像文件本身的防篡改,更實現了被篡改區域的精確識別,從而達到更進一步的、逐像素級的篡改檢測與驗證,也正是這一特性使得數字水印技術尤為適合組織機構代碼的電子檔案防篡改要求。
由于現有的組織機構代碼電子檔案由數字圖像文件和數據庫索引信息兩部分組成,其中數據庫損壞或者檔案存儲路徑被意外修改都將直接導致全部的電子檔案不可用,其脆弱性不言而喻,而加入數字水印的組織機構代碼電子檔案在生成的過程中還將一部分原始檔案的索引、版權、存儲路徑等信息一并嵌入其中,因此,很容易實現加密后的檔案圖像在脫離數據庫的環境下實現索引信息的重建,實現了只要能夠找回一份完整的圖像文件,就能夠恢復該份檔案完整信息的功能。這在某些極端的環境下,如火災、地震等自然災害面前,為組織機構代碼電子檔案提供了恢復檔案資源的技術手段,大大加強了組織機構代碼電子檔案資源的可靠性與容災能力。
由于該技術所面向的資源是數字圖像本身,因此做到了與業務系統無關,也決定了該技術在部署到組織機構代碼電子檔案環境中時可以完全實現與現有的業務系統的并行處理,幾乎不需要人為的維護與干預即可完成數字檔案的加密過程。加密后的數字檔案與原有的數字檔案分開存儲,在具體應用的環節中可根據需要來進行調用。
該技術的另一項優勢還在于其部署的靈活性,使用方可以根據自身的需要確定部署多少臺加密客戶端來處理圖像,各省代碼分中心完全可以根據自己的需要來定制相應硬件基礎設施投入,處理能力也可以隨著后期的硬件增加而擴大,真正做到了按需使用。
相對數字證書的模式,基于數字水印技術的組織機構代碼電子檔案系統只面向具體的加密與水印技術,其防篡改識別、驗證與第三方認證機構無任何聯系,有效回避了當前國內不同職能部門間條塊分割,其數字證書發放與使用均各自為政,不能互通互認的難題,而且在具體防篡改驗證的過程中可以做到離線脫機使用,不需要計算機網絡的支持,這在我國欠發達地區,“老、少、邊、窮”等地區尤為適合,避免了前期大量的基礎設施投入,是一種快速而有效的數字化檔案驗證手段。
組織機構代碼電子檔案防篡改系統將版權信息、機構信息、圖像特征等信息嵌入到圖像文件之中,在電子檔案的利用過程中通過對綜合特征信息的提取達到對電子檔案的防篡檢測、檔案鑒真的目的。通過該技術手段,數字化檔案的利用已基本具備了可供驗證的技術前提,可大大提升電子檔案利用過程中檔案的法律效力,實現數字化檔案綜合利用的最終目標。
由于使用防篡改技術的組織機構代碼電子檔案在利用活動中能夠很容易驗證其內容的真實性與有效性,因此容易獲得利用者的認可。防篡改技術還使得組織機構代碼電子檔案可以經多級多次傳遞,仍能具備與原件一致的可鑒真能力,從而使得電子檔案的跨部門綜合利用成為可能,在某些不具備專用可信網絡的環境下,很容易通過公共互聯網或者離線拷貝的形式,實現多部門檔案文件的交換和綜合利用,為電子檔案利用提供了更為廣闊的空間。
組織機構代碼中心的電子檔案采取市縣、省級、國家等3級存儲模式,各級間的資源很難做到完全一致。并且在原有的業務系統中,缺乏一套有效的技術手段來實現系統的自我維護功能,代碼數據庫中的數據和圖像本身的完整性無法進行比對,且檔案圖像的應用依賴于組織機構代碼業務數據庫。通過防篡改技術的引入,可實現電子檔案資源庫完整性檢測和本地資源的原始性定期、定時檢查,將各級之間形成版權信息的數據比對,確保在用信息和備份信息一致,從而保證全網資源的完整性和一致性。
防篡改和驗證技術是在電子化檔案采集歸檔中確保電子檔案影像原始性、合法性及完整性的有效技術手段。該技術實現了組織機構代碼電子檔案每個影像的檔案版權、身份、加工日期等水印信息的隱藏式嵌入,且不影響原有的圖像特性。使得組織機構代碼電子檔案的防篡、鑒真、篡改檢測、版權檢測成為可能,將為進一步發揮電子檔案的法律效力和數字化檔案的容災備份、共享、應用奠定堅實的基礎。