文/李濤
我國的中文古籍數字信息專業,相對其他專業比較冷門[1]。但是,當前社會已經進入以信息為重要資源的時代,對于我國中文古籍的保護工作,也邁入新的階段,因此對于我國中文古籍數字信息專業人員,在我國將來,也會擁有良好的就業前景[2]。在國外,于20 世紀60 年代末,對信息專業作為研究方向,70 年代提出信息門類,80 年代中期,對信息作出了明確的定義,80年代末,信息專業迅速擴展;但是,當時的信息專業多為計算機信息、信息管理等方面專業,在21世紀的今天,國外也未曾有人將古籍信息專業納入其中[3]。20 世紀70 年代后期,國內將國外的信息專業概念引進學界,紛紛仿效國外建立信息專業,隨著數字技術的到來,古籍數字信息專業也隨之建立[4]。但是隨著時間的推移,對于國內建立的古籍數據信息專業,其人員就業發展方向,卻受到了一定的限制,為此提出我國中文古籍數字信息專業人員未來求職發展方向這一課題。
古籍數字信息化,是社會發展的必然成果,也是為了保護古籍的完整性、推動學術研究的必要手段。因此在采用數字化的方式,保護我國古籍時,必然會面臨格式性問題。而這個問題,就是中文古籍數字信息專業人員未來求職發展方向。
在以往,對于中文古籍的保護,多是采取掃描、識別轉換成數字文本,存儲至計算機的數據庫中,但是對于學者來說,卻存在很大的困擾,尤其是我國中文古籍,存在異同版本、不同注釋語句、人名地名讀法不一等區別[5]。所以,中文古籍數字信息專業人員,在求職發展時,可以通過規范古籍數字化的元數據標準,方便數字化中文古籍的索引。在規范古籍數字化的元數據標準時,未曾學習過古籍的人員,難以制定出讓所有學者認可的標準。而只學習古籍的人,不具有數字化信息技術,難以將古籍轉換成數字信息,因此這份工作也只有中文古籍數字信息專業人員,才可以勝任。
古籍學習人員與數字化信息人員的結合,可以直接為古籍制定統一的標準,并建立專業的元數據庫,為學者提供專業的信息資源,為與其他信息系統的對接和共享數據提供必要的接口。所以,中文古籍數字信息專業人員,可以研制統一的版本信息、收藏信息、作者信息和作品信息,并在元數據庫中,進行統一的標準,幫助學者查找、搜索所需要的古籍,為古籍的保護,提供堅實的支柱。
古籍在轉化成數字信息時,不僅需要規范古籍版本信息、收藏信息、作者信息和作品信息等,還需要在計算機上,確定相應的古籍圖片、文檔格式。且在存儲古籍的過程中會涉及產權等問題,因此更需要專業的數字化格式制定員,制定與古籍相適應的數字化格式。尤其是當前的數字格式種類多樣、名目繁多[6]。因此,更需要專業的中文古籍數字信息專業人員,根據古籍的特點,制定與古籍相適應的數字化格式。
不過,當前種類多樣、名目繁多的數字格式,對于數字化古籍的查閱,卻是一大障礙,因此,中文古籍數字信息專業人員,在制定古籍數字化格式時,還需要與相關的開發公司,研究可兼容其他文檔格式的APP,解決當前古籍由于格式信息原因不能統一查閱的問題。但是,從長遠角度來說,中文古籍數字信息專業人員,還是需要與業界主要機構相聯合,制定出適合所有古籍的文件格式,且這個格式,不僅可以儲存簡體版本,還要儲存古籍的繁體版本。除此之外,由于古籍的讀音存在大量的同音不同義、象形字等,所以,該格式還需要具有對古籍進行漢語拼音標注的功能,保證古籍的科學性、嚴謹性和規范性。
另外,數字化格式制定員所制定的古籍數字化格式,還應該具有全文搜索的功能。尤其是目前,人們之所以喜歡數字化形式的文檔,眾多原因之一就是數字化文檔搜索速度快。一旦數字化格式制定員,所制定的古籍數字化格式不具有這個特點,很難形成較大的用戶群,提高古籍的使用率和保護效果。最后,對于古籍數字化格式文檔,檢索所制定的字詞需要予以凸顯或標記,以便學者在文檔內檢索古籍時可以更加簡便快捷。上述這些,都是數字化格式制定員,在制定古籍數字化格式時,所必須具有的性質和功能。
除了上述的文字方面格式外,古籍中還含有大量的圖片,與文字相互呼應。因此,數字化格式制定員,還需要將古籍原本的圖片與數字化的古籍文字相對應,增加數字化古籍的科學性和可信賴性。當前,我國對于圖形圖像的處理,雖然發展較為成熟,且圖片格式的種類、形式,并不遜色于文檔格式,也具備較強的可壓縮性。但是,處理古籍文獻時,所需要處理的圖片是海量的,其所要面對的是計算機運行和儲存問題,將會成為數字化格式制定員,未來所需要面對重點問題,即制訂出具有較高壓縮比,且圖片清晰,可以再現古籍圖片的原始風貌。
從上述兩種未來求職發展的情況來看,僅站在古籍保護角度,在這種角度下,對于古籍資源的開發,僅僅只是比原本的圖片閱覽前進一步,存在很大的局限性。特別是針對古籍版本、句讀、偏僻字注釋、人名地名的標引等,不同的古籍都會存在一定的異同,且浩瀚的古籍資源,由于內容、歷史發展、使用方向等眾多原因,都被分散保存在許多各不相關的部門[7],在數字化的過程中,對于古籍規范化和格式化又面臨著新的問題。因此中文古籍數字信息專業人員,可以從開發數字化古籍特色資源發展發現入手,深入研究“通鑒、續通鑒等” 特色收藏古籍,并不斷與精通古籍整理專業的學者,共同商討古籍的數字化特色資源開發,突出每一本古籍自己的特色,從而為古籍的規范化和數字化格式奠定基礎。
而對于中文古籍數字信息專業人員,其所具有的現代化科技手段及其對古籍的了解都是其他合作式整理古籍、開發古籍人員所不能媲美的,只有同時掌握古籍和現代信息化知識,才能開展古籍研究和開發工作。應用統一的古籍分類法,指出開發出具有數字化特色資源的古籍。
當前,我國古籍漢字眾多,且當前的計算機所儲存的漢字不過是當前常用字,對于古籍中漢字的處理頗顯不足,這已經成為古籍數字化的一大障礙。因此,中文古籍數字信息專業人員,所掌握的古籍知識和現代化信息技術,完全可以勝任漢字字符代碼集完善這一工作,加快漢字字符代碼集完善進程。
尤其是我國眾多學者,都在致力于漢字字符代碼集的制定,從最早的《信息交換用漢字編碼字符集基本集》所具有的6763 個漢字,到現在計算機已經收錄65,531 個漢字字符,更是為當前古籍數字化奠定良好基礎。雖然,目前包含六萬余字符的超大字符集,對于古籍數字化處理仍嫌不足。因此漢字字符代碼集完善人員將會成為中文古籍數字信息專業人員,未來求職發展的眾多方向之一。
古籍數字化數據庫,牽涉到IT 和古籍研究兩個領域人才,而中文古籍數字信息專業人員,卻是兩個領域的結合,雖然所學眾多,存在研究不足、深度不夠等問題,但是對于古籍數字化的研究卻是正合適的。因此,對于中文古籍數字信息專業人員,其未來求職發展方向之一,就是古籍數字化專題分類。
在目前對古籍的研究下,古籍數字化發展已經具有專題專項發展趨勢。在學術層面,即是將與這個古籍相關的專題全部羅列出來,如目前正在建設專題分類的“《紅樓夢》研究資料數據庫”,在數字化存儲中就可以將這個領域和文獻全部網羅進來,并在此基礎上對該領域中的標點、作者簡介、時代劃分、體裁歸類等進行詳細的劃分,從而提高古籍資料查找的速度。此時,就需要中文古籍數字信息專業人員,具有研究技術標準、發展方向、選題設置、學科應用等問題的能力。將古籍數字化專題分類做出專業的規劃,促使古籍數字化交叉學科得到快速發展。
此次研究從古籍保護角度入手,以學者資料尋找和古籍資料互通角度為輔,研究中文古籍數字信息專業人員未來求職發展方向。但是,此次研究未曾深入考慮古籍數字化信息專業人員對古籍知識和數字化信息技術的掌握程度。因此,在今后的研究中,還需深入研究古籍數字化信息專業人員所需要學習的專業知識,根據學習內容,為古籍數字化信息專業人員尋找合適的求職發展方向。