朱曉穎
[摘 要]檔案數字化,就是采用各種信息采集設備將不同載體形式的檔案轉換成數字方式的過程。紙質檔案數字化,就是利用掃描等信息采集設備,將紙質檔案原件的圖文信息分解為若干點陣式信息元(像素),并將光信號轉換為電信號輸進計算機內從而形成數字圖像文件。
[關鍵詞]紙質檔案;數字化;處理流程
對檔案文獻進行數字化加工處理,是在加強檔案原件保管質量的同時,提高檔案信息利用效率、完善檔案信息利用方式的一項重要手段。隨著電子政務和辦公自動化的發展,人們對網上檔案信息資源的需要也日益強烈。把傳統的檔案信息資源經數字化處理轉換成數字檔案信息資源,建立起數字檔案信息中心,將進一步完善我國以紙質檔案為主體的檔案信息資源體系,為社會各界提供更為豐富的信息資源服務。檔案數字化日益成為檔案信息化建設的一個重要組成部分。
一、數字化處理方式的選擇
將紙質檔案轉換成計算機可處理的數字格式通常有兩種方法:一是將紙質檔案掃描并以圖像方式存儲;二是利用已有的縮微膠片影像進行數字化轉換或者直接用數碼相機進行拍攝。對紙質檔案進行直接掃描的方式比較經濟和快捷。因此,紙質檔案的數字化一般應采取掃描的方法將其變成電子圖像文件直接存儲,再配合標引信息數據庫的建立,實現檔案資料電子影像的快速檢索利用。
二、數字化存儲設備的選擇
大量檔案原文的存儲管理離不開海量存儲技術。光盒存儲系統是目前海量存儲的基本手段。完整的光盤存儲系統包括光盤盤片、相應的光盤驅動器及其光盤軟件。選擇檔案信息光盤存儲系統的考慮因素如下。
(一)支持開發:訪問用戶的數量
選擇檔案光盤系統最關鍵的因素應當是其可同時支持在線并發動用戶的數量,對眾多并發訪問的支持是有效實現檔案信息庫利用價值的基本條件。否則,無論存儲容量多大,都可能因光盤系統不能有效支持眾多并發用戶而徹底崩潰,進而導致整個網絡系統的癱瘓。
(二)安全性及其安全管理體系
檔案信息確保其存儲安全十分重要,對于鏡像存放在光盤存儲系統中的重要檔案信息,系統管理員和合法用戶在任何情況下均不得對其數據做任何修改。因此,在選擇檔案光盤系統時安全性是必須考慮的重要因素。
(三)對各種網絡操作系統和網絡結構的支持
網絡環境中,網絡操作系統平臺和網絡結構千變萬化,網絡服務器和客戶機多種多樣,這就要求檔案光盤存儲器能夠適應各種復雜的網絡環境。
(四)存儲容量
必須根據本單位數字化檔案的數量及其增長情況來選定光盤塔、光盤庫可存儲光盤的數量及其總的存儲容量。存放檔案信息的光盤數量每年在不斷增加,因此選擇檔案光盤存儲系統時應考慮系統是否允許采取自行添加硬盤的方式來對光盤塔和光盤服務器進行擴容。
三、紙質文書檔案數字化步驟
(一)檔案整理階段
1.拆裝。對歸檔改革前整理的檔案,要將檔案原件的裝訂拆除,排好順序,并用夾子夾起防止散亂;歸檔改革后整理的檔案如果沒有裝訂,可直接排好順序。操作中不得對檔案原件有任何損壞。
2.修復。檔案中若有裝訂金屬物需去掉,有破損的地方需在備考表中注明,如破損程度影響了檔案內容的文件,則需進行修補:小于16開的檔案需進行托核;沒有裝訂線的檔案要另用紙加寬,操作時要注意兩點:一是補紙與檔案縫接處宜窄不宣寬,一般為l—3mm;二是如需要在檔案的四周加邊,應先加長邊,后加短邊;多份檔案粘連一起時,需在不損壞檔案載體信息量的前提下,細心分開,如實在無法分開則不分。
3.檔案及目錄的檢查、整理。妥善保管好檔案,嚴禁批注、圈劃、圈點。檔案目錄中出現繁體字或不規范的簡化字時,一律參照國家標準的簡體字補充著錄,需手寫補錄的項目要求字跡工整,并逐份逐頁地仔細檢查,不符合要求的應予以糾正。
(三)檔案掃描掛接階段
1.檔案掃描。檔案掃描過程中要嚴格執行有關檔案閱覽利用及保管保護和保密制度,注意保護好檔案。
(1)檔案掃描必須采用專業文件掃描儀,以黑白為主,對于原件不清和字跡較淡的檔案,掃描時必須用灰度或真彩模式掃描。掃描件打印效果不得比原件差,打印出的頁面比例尺寸與原件相同,同時分辨率不低于200dpi。
(2)檔案掃描一般采用逐頁手工掃描,紙張較好的檔案可以采取連續進紙方式掃描。
(3)檔案掃描中發現檔案粘連一起時,則需在不損壞檔案載體信息量的前提下分開,將可以識別的信息全部掃描。
(4)存儲格式按多頁TPF的格式進行保存,每份卷內文件為一個多頁TIFF。保存多頁HFF文件時,要注意核對好頁碼順序,不得缺漏頁。
(5)文件命名:歸檔改革前的檔案采用“全宗號+保管期限+目錄號+案卷號+順序號”命名,例如:“001(全宗號)+(保管期限)+(目錄號)+(案卷號)+(順序號)”歸檔改革后的檔案采用“全宗號+年備保管期附件號”命名。
(6)掃描完成后必須指定專人進行核查,檢查掃描效果、按文件內的頁碼順序、文件名是否正確。
2.光盤刻錄存儲。將掃描形成的圖片文件采用保存期限為300年以上的光盤刻錄,一式兩套,以作備份,并填寫詳細清單。光盤刻錄必須有專人負責檢查,檢查光盤內容是否有錯漏,光盤能否正常打開等。
3.數據檢查。有專人專機對每天完成的數據進行檢查,要求保證掃描形成的圖片文件與卷內文件一致,編號元誤,清晰度和格式符合標準。
4.數據掛按。將效描獲得的每個圖片文件對照數據庫原有的目錄數據,逐份點擊聯接導入數據庫,數據聯接必須跟掃描同步進行。在數據庫中備份導入后的數據,特備份數據用保存期限為300年以L的光盤刻錄并制作一份聯接清單。
(四)檔案裝訂、歸還階段
按檢查整理階段確定的順序將掃描完的檔案裝訂好。裝訂時必須保持檔案的原貌,不得更換卷皮,不得缺漏頁,按照檔案原有的線孔裝訂。裝訂好后要將檔案檢查一邊,看案卷裝訂是否結實、有沒有脫頁,檔案及目錄齊不齊。檢查完畢歸還檔案保管處,辦理歸還手續。
參考文獻:
[1]連華.紙質檔案數字化處理的工作流程[J].辦公自動化,2007(14).
[2]張照余.數字化檔案的文件格式選擇[J].檔案學通訊,2003(06).