于洪臻 周東超
山東省濟南衛生學校 山東 250033
在電子政務所日常工作中,機構或個人辦理業務時,需要存儲大量的紙質文檔,隨著時間推移,這些紙質文檔勢必越來越多,堆積如山。因此,如何有效地管理這些文檔,是解決電子政務業務正常開展的首要問題。隨著信息量的不斷增大,對紙質文件的管理的難度越來越大,主要表現在:難以保存、檢索困難、難以實現各省市業務單位電子檔案信息的共享和分發,長此以往,必然形成信息孤島,無法實現建立數字化管理的目標,因此建立合理的電子檔案系統,實現對電子檔案信息的管理和共享,是一件迫在眉睫的工作。
建設檔案電子化管理及信息共享與相互快速查詢,并通過互聯網實現對各相關單位的直接服務。需要遵循:①效率和實用性原則;②國家相關部門提供統一數據標準規范原則,旨在以簡潔方便的操作實現組織機構信息查詢過程的網絡化、信息化、準確化,進一步提高查詢效率。其主要實現以下目標:
(1)紙質檔案電子化管理。通過先進的高速文檔掃描儀將機構紙質文檔轉換成電子影像;然后,根據符合檔案電子化行業規范的歸檔機制建立影像索引,形成一個方便可靠而又完整的電子檔案庫。
(2)電子檔案信息的查詢利用。在已建立的機構電子檔案信息庫基礎上,為社會查詢群體提供檔案查詢服務。不同查詢用戶根據一定的查詢權限,通過Intranet/Internet并行地對檔案進行查詢及打印操作,使得電子檔案得到合理利用。
(3)查詢服務快速響應。利用先進的實時通訊技術,檔案服務器能夠對遠程客戶端進行快速響應,系統能及時處理眾多用戶的連接請求,并能通過INTERNET直接實現對遠程客戶的請求,異地查詢電子檔案的響應時間可以控制在一秒鐘以內,達到快速響應的目的。
(4)實現在全省或全國范圍的各級管理機關內部的數據共享。通過INTERNET實現各個地區的互連互通,可以跨地區跨地域查詢,真正實現了足不出戶就可以查詢遠程檔案信息,體現了信息化建設的優越性,具備作為一個面向電子商務時代應用系統所應具備的所有素質。
電子檔案系統構架如圖1所示。

圖1 電子檔案系統構架
電子檔案及快速查詢系統通過業務管理系統信息相互補充和驗證,在進行數據的核對和驗證的同時,還可以在業務管理系統中根據條件信息獲取關于業務的信息,以便進行快速檔案文件的定位。
系統不僅為終端用戶提供服務,接收其上傳的文件,而且還為互聯網用戶提供了檔案查詢的接口,只要擁有合法的用戶和足夠的權限,便可以進行檔案文件的查詢。
電子檔案系統主要分為檔案采集、檔案傳輸、檔案存儲、檔案檢索幾部分功能。
檔案文件的掃描采集以TWAIN/ISIS標準接口規范為基礎,通過調用Twain/ISIS接口,對掃描儀設備進行驅動,并通過Twain/ISIS接口,獲得掃描的檔案文件數據并對其進行處理;通過Twain/ISIS接口,屏蔽了各種掃描儀設備之間的型號差異和性能差異,以統一的模式來驅動掃描設備,以使數據掃描采集子系統得到最大化的兼容性。
3.1.1 證件類型識別
證件及其掃描件的樣式多樣性及掃描質量參差不齊,嚴重影響了對電子檔案文件的 OCR識別,另一方面,受國內外OCR識別水平的限制,尤其是對證件掃描件的漢字識別,仍無法達到一個理想的效果,無法正確的判斷證件類型及證件內容。系統采用兩種方式對證件類型分類:
(1)介入條形碼技術,對條形碼進行識別,進而更有效、更準確的判定出掃描文件的證件類型,可以快速實現文檔的分類歸檔。
(2)通過人工整理檔案,掃描后人工標識證件類型,然后再合并這樣雖然實現了傻瓜式掃描,但是后期的工作量也不少。
3.1.2 大比例壓縮存儲
對檔案文件進行壓縮,在不丟失必要信息的前提下,使圖像盡可能的變小;壓縮后的圖像,不但可以節省很多磁盤空間,而且還可以有利于檔案文件的導入、導出和網絡傳輸,大大的節省了網絡帶寬資源。
數據上報是指各終端電子檔案圖像文件上傳到中心。為了保障數據的安全性,所傳數據都經過加密,密鑰由中心統一管理。上傳方案有以下兩種。
3.2.1 分散即時上傳
檔案數據掃描采集系統在完成掃描采集、分類歸檔后,各終端立即向中心上報數據。
3.2.2 集中批量上傳
檔案數據掃描采集系統在完成掃描采集、分類歸檔后,數據存儲在各終端本地存儲系統中,之后在規定的時段向中心上傳更新的數據。
電子檔案文件傳輸子系統主要完成文件的上傳和接收,是建立在標準的 HTTP1.1協議基礎上的 C/S模式的應用程序,通過http協議完成文件內容數據的發送和接收。在中心建立HTTP服務器,進行檔案文件的接收;在終端建立HTTP客戶端,解析HTTP協議,進行文件的發送處理。
大量檔案文件的存放結構采取類似于郵件系統中郵件的存放模式,以0-9和A-Z共計36個字母進行分類,每一個類別下仍按這種方式再進行分類,其分類的層次直到滿足需要位置。
按照業務需要編制目錄路徑。

圖2 最終的存儲結構圖
如圖2所示,在證件存放的根目錄下,分別有0-9和A-Z共計36個目錄,每個目錄下依次類似,都具有相同的存儲方式;給定業務號,驗證后,只需對業務號字符串進行拆分,然后生成路徑信息,便可以在文件系統中迅速定位到該業務號的目錄,其執行效率和速度是非常迅捷的。
目錄的層次結構并非特別深,其每個目錄下的直接子目錄也并非是大量的;在每個業務目錄下,存放的是各個業務時間的子目錄,表示發生業務的時間,這樣某個業務的某個時間的某份檔案文件便可以迅速查找和定位。
電子檔案查詢管理采用B/S模式實現,允許互聯網用戶進行遠程查詢和管理,主要包含兩個功能模塊,分別為查詢模塊和管理模塊。
在電子檔案查詢時,以業務號的查詢為主導;在按給定條件查詢時,只有得到業務號,才可以對電子檔案文件進行迅速定位;根據給定的條件,該子系統可以向業務系統進行查詢,在從法人單位基礎信息數據獲取信息,再獲得相應的電子檔案文件。
電子檔案顯示經過加密處理,可以對顯示圖像增加背景或水印效果,避免了圖像非法盜用。
[1]葉晗.論轉型期的檔案信息資源管理模式[J].檔案學通訊.2007.
[2]姚磊.試論電子政務環境下電子文件中心的結構、原則和角色[J].圖書情報知識.2007.
[3]蔣冠,何振.我國電子政務環境下的檔案資源的整合與共享[J].檔案學通訊.2004.