王麗芬
(哈爾濱軸承集團公司 黑龍江 哈爾濱 150000)
隨著現代信息技術的迅速發展和電子文件的大量產生,數字化檔案建設已成為我國檔案界關注的熱點問題。數字化檔案與傳統檔案相比,具有數字化資源豐富、海量存儲、檢索便捷、傳輸快速、高度開放、信息共享等優點,但同時也存在一些缺陷和不足。因此,我們應該清醒地認識到數字化檔案建設還存在著諸多問題,亟待深入研究解決。
檔案的基本價值有兩方面,憑證價值和參考價值,而尤以憑證價值最為重要,目前,人們對數字化檔案具有參考價值這一點已無異議。然而,由于一系列技術和立法問題還未解決,數字化檔案目前還不具備法律憑證效力。因此,確認數字化檔案的憑證價值就成為數字檔案館建設中無法回避的難題。
數字化檔案與以往其他載體的檔案都不一樣,從甲骨檔案到簡牘檔案再到紙質檔案,只是載體的耐久性有差別,并沒有改變其直觀性,而要確認數字化檔案的憑證價值,恐怕不僅僅是改變觀念的問題。要真正認識數字化檔案,確認其憑證價值,可能還需要走很長的路。數字化檔案不具備“白紙黑字”的直觀性,必須依賴特定的計算機設備加以讀取,它的非人工識讀性使得其與其他載體檔案有著質的區別。數字化檔案完全脫離了以往人們對檔案“原件”的認識,從而引起人們對其原始性、可靠性的懷疑,而且有些數字化檔案即使載體保存完好,內容也可能在無形中丟失,它不像紙質檔案那樣載體與內容結合緊密。
其一,數字化檔案具有易復制、易修改、易刪除的特點,使得檔案“原件”的概念變得難以確認。其二,計算機軟、硬件技術不斷更新換代,迫使數字化檔案必須不斷適應新的“生存環境”,不斷地變換載體、格式,因而無法通過載體、格式的鑒定來判斷其原始性。其三,數字檔案不再具有特定的字跡,人們可以根據需要以不同的字體、字號將其輸出,傳統的字跡鑒定技術無法分辨數字化檔案的原始性。其四,數字化檔案對背景信息和元數據具有很強的依賴性。電子文件的背景信息常常與文件內容信息相分離保存,一旦失去背景信息,文件的內容即便仍有意義,但也不再具有憑證價值。
傳統檔案之所以具有憑證價值,在一定程度上取決于嚴格的管理制度,而目前從電子文件的生成到歸檔都缺乏十分規范的程序化管理,缺乏嚴格而科學的標準體系和業務管理制度,一些標準、制度雖已制定,但全面推行、切實執行尚需時日。
數字化檔案信息的長期存儲問題是數字化檔案建設的一個具體而又棘手的難題。
現代介質的存儲設備還不可能解決計算機數據存儲問題。一般說來,磁盤的壽命是3~5年,光盤也不過30年左右,與能保存千年以上的紙質載體相比,其壽命相差甚遠,而且還要受到溫度、磁場、記錄存儲格式、硬件配置等多方面的影響,如10年前還經常使用的5.25英寸的軟盤,現在已經沒有一臺普通電腦可以讀取其內容了。
計算機語言平均每三個月就會問世一種,而語言之間的互換大部分存在問題。很難想象,若干年以后,我們用現行的機器語言描述的數據,還能百分之百地還原。
數字化檔案必須依賴于計算機設備才能讀取,這個特征對其長期存儲帶來很多問題,如設備發生故障、系統癱瘓,電子文件就讀不出來;電子文件對其它設備環境的不兼容性,使其只能在某種設備上處理,而不能在其他設備上處理;不同軟件環境形成的電子文件存貯在載體上,有時難以呼喚;電子文件加密后,不解密就無法識別;技術設備更新時,不及時解決格式轉換問題,也無法讀取等。
檔案數字化工作的生命線在于其能夠保持檔案原貌。然而,就目前的研究水平而言,還難以保質保量地完成館藏檔案數字化的任務。數字化的主要方式是掃描加工,在這一過程中造成數字化檔案失真還有以下幾個方面的原因:其一,技術參數選擇不當。針對不同色調、紙質和字跡,有時需調整不同的技術參數,如分辨率、明暗度、對比度等,選擇不當會直接影響掃描的質量,造成信息丟失、圖像模糊或產生額外信息,客觀上造成檔案原貌的改變。其二,工作失誤。檔案掃描是大量的重復勞動,難免有時失誤,如掃描檔案或打錯順序、或存錯、或在建索引時鏈接錯誤等,如不及時發現,將直接導致數字化檔案失真。其三,轉換過程中的失真。在進行數字化檔案的遷移或提供利用時,往往需要將掃描后形成的圖像文件轉換成另一種格式的文件,如果格式選擇不當,同樣會導致數據發生變化。
網絡系統中的硬件技術之一是必需有足夠的寬帶,以保證快捷地傳輸文本、語音、圖像、影像檔案,以便實現多網互連、高速互訪,實現跨平臺、跨系統、跨語種的互相轉換和鏈接。毫無疑問,足夠的寬帶條件和用戶對網絡信息傳輸的需求將是檔案數字化建設中的矛盾體。
數字化檔案是以信息源、網絡、數據庫為基礎的,其相關技術是較復雜、較先進并且不斷發展的,它幾乎囊括了計算機網絡技術所需要解決的所有問題。如數字化圖像的存儲與壓縮、數據組織技術、信息檢索技術、多語言平臺互換互訪技術、海量信息存儲與調配技術等,既是計算機網絡技術的難關,也是制約數字化檔案建設發展的難題。同時,數字化檔案的建設和運行需要解決一些特殊問題,為此必須開發應用一系列新技術,如身份認定、智能檢索、信息隱蔽、數字水印、電子簽章、操作跟蹤、信息加密等。
在飛速發展的IT業中,電腦硬件、操作系統、應用軟件及存儲載體等不斷地被新產品所替代。雖然絕大多數新產品承諾向下兼容,但其兼容的“代”數在跨越若干年后,舊的數字化信息就很難被新的硬件設備和軟件系統讀出。“技術過時”的陰影一直會籠罩著數字信息。專家們提出的解決方案是數據遷移,但遷移卻存在著一個致命弱點,就是每次遷移總會丟失一定的相關信息,這些丟失的信息積累起來會造成數字化檔案信息無法準確恢復原貌。