□許 昉
上海第二工業大學成立于1960年,隨著教育事業蒸蒸日上,由一所業余工業大學發展演變成全日制大學,學校以工科為主,經、管、文、理等多學科協調發展,是以多層次職業教育為主的一所新興本科院校。學校先后經歷了“樹全國半工半讀一面旗幟”、“當代成人教育戰線的排頭兵”、“發展高等職業教育”三次歷史性的跨越,培養了包起帆、李斌等一批高技能勞模,被社會譽為“勞動模范的搖籃”、“高級技術人才深造的平臺”,是全國業余大學中最早獲得學士學位授予單位之一。學校保存的檔案,對研究我們國家上世紀六、七十年代走自力更生道路、半工半讀模式、校企合作辦學培養新知識型實用性人才等活動極具歷史研究價值。由于歷史原因,學校經歷了多次歸并,各個歷史階段檔案全宗的內在質量參差不齊,造成信息資源開發利用的不便。尤其是部分檔案由于紙張質量先天不足,已嚴重影響到利用價值。因此加快檔案數字化建設步伐,運用現代化技術手段提高檔案管理水平,適應學校各項工作發展的需要,應擺上議事日程。筆者結合本校室藏檔案數字化工作實踐,提出幾點看法供探討。
“室藏檔案數字化”是指將學校檔案室保存的傳統介質的檔案,根據需要進行數字化處理,形成數字檔案資源的過程。以紙張、錄音帶、錄像帶等為存貯介質的檔案材料,用計算機、掃描設備、圖像處理等現代化信息技術轉換產生圖片文件或影音文件,并運用數字存儲管理技術將圖片和元數據索引字段存貯于光盤庫、磁帶庫等大容量的存貯介質上,通過全文識別(OCR)等技術達到圖片或文件相匹配,使之能夠通過各種方便的查詢途徑,迅速檢索出所需要的檔案材料。數字化的檔案信息,可以通過辦公局域網、校園網實現高效便捷的提供利用。
室藏檔案數字化在高校檔案工作中,可以起到多方面的作用。一是挽救歷史檔案。高校檔案室保存了一些價值珍貴的歷史檔案,因年代久遠,出現老化甚至破損的現象,檔案數字化后,可以有效地通過信息載體將原始內容和原貌保存下來,便于流傳百世。二是可以提高檔案檢索的速度。高校檔案全宗多,門類多,案卷數量多,查找信息比較費時。檔案數字化后,查找檔案的檢索時間由原來的每次平均20分鐘縮短到十幾秒,甚至幾秒鐘,速度顯著加快,便捷高效。三是提高檔案查全率、查準率,解決信息查找困難的問題。檔案數字化后,可通過計算機進行模糊檢索,避免由于利用者提供的信息不準,導致漏查、誤查和大量調卷的現象。四是有效保證了檔案實體的安全。檔案數字化后,普通的信息查詢可在計算機上直接查閱,無需調閱檔案原件,避免翻閱案卷造成的物理磨損和復印對檔案原件的損害。五是對部分字跡已開始模糊褪變的檔案,能夠在數字化過程中,對字跡變淡部分進行局部加深,起到修復檔案的作用。
檔案數字化建設實際就是檔案資源在數字狀態下的重組和再建,磨刀不誤砍柴工,前期對檔案保管、利用情況的調查研究是做好高校室藏檔案數字化工作的重要前提。目前高校室藏檔案數字化存在的主要矛盾不是技術問題,而是數字化的成本,既包括資金成本,也包括時間成本。筆者認為室藏檔案數字化,必須結合高校實際情況,先期對室藏檔案進行鑒定,確定分期分批進行數字化的步驟,急用先“數”,“數”用結合,在滿足今后網絡環境下檔案利用需求的同時,盡可能減少成本投入,最大限度體現檔案數字化的成效和檔案工作的效益。
在調查研究的基礎上,我們主要考慮以下因素:一是從利用需求出發,依據利用率高低安排檔案數字化的順序,對平時利用比較多的檔案先期安排數字化。如改革開放以來,學生走出國門,到世界各國深造的很多,需要提供在校成績單、學籍證明,教學和學籍檔案的利用率因此逐年上升,每年的借閱量占學校全部檔案借閱量的三分之二,就要優先安排數字化。二是從檔案保護角度出發,對珍貴的歷史檔案,已經破損嚴重的檔案,盡早安排數字化,作為搶救的措施。三是從投入資金出發,對室藏檔案有所篩選,確定數字化的范圍,避免對利用價值不大的檔案數字化,浪費人力、財力。根據上述考慮因素,上海第二工業大學檔案數字化一期工程先對教學檔案中新生錄取名冊、學生學籍卡、學生成績總表進行全文數字化,二期工程再重點解決歷年重要文書檔案的數字化,體現了利用為綱和成本效益的理念。
1、電子文件格式的選擇。室藏檔案數字化的主要形式是通過計算機掃描,將檔案的紙質幅面轉換為電子圖像文件,其轉換格式的選擇是技術核心問題。
一般情況下,圖形圖像文件的保存格式以JPEG、TIFF為主,兩者各有所長,JPEG格式可用最小的磁盤空間得到較好的圖像質量,適合網絡傳輸,缺點是有損壓縮,容易造成圖像數據的輕微損傷;而TIFF格式可以實現非失真的壓縮,圖像質量好,但占用磁盤空間比較大。筆者根據檔案的特性,認為PDF(Portable DocumentFormat)格式作為檔案數字化的文件格式比較理想。主要表現為:(1)通用性強。PDF文件格式不受操作系統平臺的影響,不管是W indows,Unix,還是蘋果公司的Mac OS操作系統,都可以用。(2)集成度高。PDF文件格式可以將文字、字型、格式、顏色及獨立于設備和分辨率的圖形圖像等封裝在一個文件中,還可以包含超文本鏈接、聲音和動態影像等信息,同時支持特長文件。(3)安全性好。系統使用WORD、EXCEL等文件時,不同利用者打開文件,偶爾會發生格式改變,打印的效果與預期有出入,而PDF文件不存在這個問題,突出了檔案的原始性特點。
高校檔案中的學籍檔案數量眾多,考慮到檔案數字化后,這些檔案要掛在校園網上,會受到校園網的容量限制。實踐中,我們結合學校的實際情況,比較了幾種電子文件格式的長處和短處,選擇JPEG為圖形圖像電子文件基礎保存格式,把一個學生的幾張成績表圖形圖像文件合并后轉換成PDF格式,再掛接到檔案管理系統中,既能夠保證文件質量,又可以滿足文件上網對容量的要求,取得較好的效果。
2、電子文件的命名。高校檔案一般采用實體分類法,檔號編制方法為“年度-分類號-案卷號.文件序號”,如2008年某教學檔案檔號為“2008-JX11-20.1”。實踐中我們認為,檔案數字化后的電子文件以相應的紙質文件“檔號”命名比較合適。上述“2008-JX11-20.1”案卷,其數字化后的電子文件名稱也對應地為“2008-JX11-20.1”,關聯參見方便直觀,有利于保管和利用。
3、關注數字化工作的安全。維護檔案的安全是檔案工作的重要原則,也是高校檔案數字化工作應時刻注意的問題。一是保證檔案原件的安全。在檔案數字化過程中,要對案卷拆卷掃描、重新裝訂,要防止人為因素造成的原件污損、失竊等。二是要保證信息內容的真實性。數字化僅僅是改變檔案存在的形式,不能改變其內容,必須保持電子文件與原件內容的高度一致。三是信息利用的安全。必須采取密級設定、用戶利用權限控制、防毒殺毒、網絡防火墻等措施加強管理。實踐中我們采用的檔案管理系統,通過對用戶賬號加密、數據訪問權限控制、數據加密傳輸等手段來保證檔案信息的安全。
1、轉變觀念,增加數字化意識。現代信息技術和網絡技術的發展改變了人們對檔案利用的需求,利用檔案,需要的不僅只限于“紙質文獻”,而且還有更加利于檢索和貯存的數字化檔案信息資源。數字化的檔案信息能夠為利用者提供更加方便、快捷的服務,在進入數字時代的今天,不能再用抄抄寫寫、裝裝訂訂的老眼光來看檔案工作,各級領導,尤其是學校領導,要用科學發展的眼光審視檔案在學校發展中的地位和作用,充分認識檔案數字化的深遠意義,從與時俱進的角度和事業發展的高度,積極支持檔案信息化建設,在人、財、物等方面保障檔案數字化工作正常開展,并不斷加快步伐。
2、夯實基礎,提升人員素質。規范化是科學管理的基礎,開展檔案數字化工作的重要前提是室藏檔案管理有序,案卷整理規范。因此,必須強化學校檔案室的各項基礎業務工作,只有夯實基礎,才能插上現代化翅膀騰飛。檔案數字化工作專業性強,需要提高檔案人員自身的數字化知識和工作能力。現代信息技術在給檔案數字化建設提供技術支持的同時,也向管理手段提出挑戰,檔案人員要勇于面對挑戰,主動學習信息技術,探索信息技術與檔案學的融合與應用。要針對不同層次的人員開展系統的檔案數字化工作的培訓和指導,不斷提升檔案人員的綜合素質,適應檔案信息化建設和檔案事業發展的需要。
3、調整方法,適應網絡管理。檔案工作長期處于傳統的半封閉管理模式,“重藏輕用”傾向比較嚴重,在很大程度上限制了檔案信息的開發和利用。隨著辦公自動化和信息技術的普及,利用計算機網絡和文檔管理軟件進行文件收發、鑒定、歸檔、提供利用已成為現實,室藏檔案數字化后,要與計算機網絡融為一體,依靠網絡平臺更好地發揮數字化檔案信息的作用。檔案管理從傳統的手工操作向計算機管理轉變,整個過程快捷、準確,可以節省大量的人力物力,提高工作效率。要適應網絡化管理,傳統的工作流程要作相應調整,使收集、整理、保管、鑒定、利用的每個環節都能適應計算機管理的操作,借助計算機網絡,使檔案信息有更加開放的利用環境和更加方便的利用途徑。
4、理順職責,形成長效機制。高校檔案數字化工作是一項系統工程,涉及面廣,工作量大。隨著高校校園網和各種數據平臺的建立,檔案數字化的需求日益迫切,要充分考慮檔案數字化工作與相關校務管理工作的有機銜接,理順相關工作部門的職責,才能更好地為高校中心工作服務。
高校檔案數量眾多,檔案數字化是一項長期的任務,需要檔案工作者長期不懈的努力。要兼顧檔案工作現代化建設與檔案信息的實用性,遠近結合,制定檔案數字化工作的長遠規劃和具體實施計劃,只有建立循序漸進,持之以恒的長效機制,將檔案數字化工作放上正確的位置,抓住機遇,勇于創新,才能把這項利在當代,功在千秋的任務做實、做好。