——談中華珍貴典籍資源庫的建設"/>
999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?劉娉婷
(國家圖書館,北京 100081)
我國是歷史悠久的文明古國,擁有卷帙浩繁的文獻典籍。據統計,我國現存古籍總數3千余萬冊,其中善本古籍超過250萬冊[1]。這些古籍是中華文化的瑰寶,但它們具有不可再生性,因此如何保護和利用好珍貴文獻典籍,是現階段工作的當務之急。為進一步加強古籍保護工作,2007年1月19日,國務院辦公廳下發《關于進一步加強古籍保護工作的意見》(國辦發[2007]6號)(以下簡稱《意見》),對全國古籍保護工作進行總體部署,正式實施“中華古籍保護計劃”,這是我國歷史上首次由政府主持開展的全國性古籍保護工程。《意見》提出了“制定古籍數字化標準,規范古籍數字化工作,建立古籍數字資源庫”這一明確要求[2]。在此背景下,國家古籍保護中心積極地開展古籍數字化工作,于2012年啟動了“中華珍貴典籍資源庫”建設項目。
在2016年發布的《“十三五”規劃綱要》中,國務院將中華古籍保護計劃列為文化領域的重大工程,《綱要》中明確提出推動古籍原生性和再生性保護、建設國家古籍資源數據庫[3]。隨后,文化部于2017年發布《“十三五”時期全國古籍保護工作規劃》(以下簡稱《規劃》),這是我國古籍保護工作方面的首個五年規劃,《規劃》中將數字化建設列為重點任務,將“中華古籍數字資源庫”建設項目列為重點項目[4]。在國家政策的支持下,古籍數字化已經逐漸成為古籍保護的重點方向,古籍數字化工作正在全面有序地進行。筆者將闡述中華珍貴典籍資源庫的建設實踐,對實踐中存在的問題進行分析和探討,以期為古籍數字化工作提供有益的借鑒和參考。
自2008年至今,國務院先后公布了五批《國家珍貴古籍名錄》,12274部古籍入選,包括漢文和少數民族古籍、簡帛古籍、敦煌遺書、碑帖拓本、古地圖和外文珍貴古籍[2]。中華珍貴典籍資源庫,以《國家珍貴古籍名錄》為基礎,從五批名錄中遴選出1115部珍貴古籍進行數字化,優先選擇古籍價值比較大、存世量比較小、卷次比較少的古籍。
秉持古籍數字化標準先行建設的原則,國家古籍保護中心于2012年組織編制了《古籍數字化工作手冊》(試用本),并將其作為中華珍貴典籍資源庫建設的標準規范,在全國范圍內推廣執行,珍貴典籍數字化工作于2013年全面開展。隨著數字化工作的進行,針對數字化實踐中發現的問題,國家古籍保護中心于2014年推出了《古籍數字化工作手冊》(V.1修訂版),對手冊進行了修訂完善。
數字化圖像分長期保存級和發布服務級兩個級別。“中華珍貴典籍資源庫”建設項目的長期保存級采用不壓縮或無損壓縮的TIFF格式,分辨率為400DPI,出于保真原則,一般采用24位真彩圖像。為了保證圖像輸入設備、輸出設備的色彩匹配,實現不同顯示器的色彩顯示的一致性[5],在每部古籍數字化前,需要先掃描或拍照IT8標準色彩導表(以下簡稱色卡),用來準確還原圖像顏色。同時為了記錄古籍開本大小,每部古籍第一冊封面數字化時需要在原件左側放置直尺。
數字化圖像由三級結構保存,第一級文件夾為加工記錄標識號,由4位單位代碼和4位古籍流水號構成;第二級文件夾為冊號,由4位數字構成,從0001開始,按流水號命名古籍冊數;第三級為古籍圖像文件和色卡圖像文件,古籍圖像文件名由4位數字構成,從0001開始,按流水號命名,色卡圖像文件命名依色卡數字化方式而定,如果古籍使用單臺設備進行數字化,需要數字化一個色卡,色卡圖像命名為“seka”,如果古籍同時使用兩臺設備進行數字化,即古籍兩個半葉同時數字化,需要數字化兩個色卡,色卡圖像分別命名為“seka1”和“seka2”。
“中華珍貴典籍資源庫”建設項目的元數據包括文獻整理登記表、描述元數據、管理元數據3個部分,使用ACCESS數據庫來保存。文獻整理登記表包括《文獻整理登記表(全書)》和《文獻整理登記表(各卷)》,記錄了古籍原件的書況信息。描述元數據包括《書目數據表》和《卷目數據表》,記錄了書目信息和卷目信息。管理元數據包括《外字表》和《管理信息表》,記錄了古籍的外字信息和數字化加工過程中的管理信息。
為保障“中華珍貴典籍資源庫”建設項目順利進行,國家古籍保護中心共舉辦了三期古籍數字化培訓班。第一期于2012年在國家圖書館舉行,來自26個省、自治區、直轄市31個單位的53名學員,參加了培訓班。第二期于2013年在烏魯木齊市舉辦。第三期于2014年在天津圖書館舉行,來自27個省、自治區、直轄市30個單位的44名學員參加了培訓。培訓班針對各個參建單位古籍數字化的實際情況和提出的問題,從古籍數字化的工作流程、元數據著錄、實物掃描技術與方法等方面進行了培訓,同時提供了實踐機會,讓學員們從理論和實踐兩個方面了解和掌握古籍數字化的流程,為“中華珍貴典籍資源庫”項目建設奠定了基礎。
“中華珍貴典籍資源庫”建設項目的開展,極大地帶動了全國公共圖書館古籍數字化項目工作的進展,該項目具體的數字化工作是由各個古籍收藏單位承擔的,首批參建單位包括浙江圖書館、安徽省圖書館、南京圖書館等27家,截至目前已陸續收到全國21家單位約47萬拍珍貴古籍影像資源。
古籍數字化工作分為古籍數字化加工準備、古籍元數據著錄、古籍圖像數字化、數據命名、數據提交、數據驗收、數據發布利用7個部分,具體的操作流程如圖1所示。

圖1 古籍數字化操作流程
由于各古籍收藏單位的經濟實力和技術水平參差不齊、圖像采集的操作方法各有差異,導致古籍圖像成品質量相差較大。《古籍數字化工作手冊》(V.1修訂版)(以下簡稱《手冊》)中的規范要求可能并不適用于所有的古籍。下面從數字化加工準備、數字化加工和元數據制作3個方面講述古籍數字化實踐工作,并對古籍數字化過程中出現的若干問題進行探討。
本階段是指在古籍出庫后核對題名、種數和冊數,對古籍進行逐葉翻檢,詳細記錄古籍的大小、缺葉、透字、皺折、夾框等情況,統計古籍的葉數信息,編制文獻整理登記表。數字化加工準備階段一方面對古籍的現狀進行了比較全面的記錄,另一方面可以根據古籍的開本大小、裝幀形式、中縫寬度、透字等實際情況,確定數字化的方式和設備。部分古籍沒有頁碼信息,為記錄缺葉、透字、皺折、夾框等詳細信息增加了難度。
古籍的裝幀形式多種多樣,難免存在特殊現象。例如《灌頂藥師經疏》這部卷軸裝古籍,接縫處附有正反兩面的注解,而使用《手冊》中提供的圖像采集方法并不能夠完整、準確地反映出該部古籍的原貌。
2.2.1 數字化加工設備
古籍數字化的主要方式是掃描或拍照,設備為掃描儀或數碼拍照相機。為了達到圖像的分辨率要求,數字化設備的規格需要根據古籍的開本大小來選擇。從各個古籍收藏單位提交的數據來看,使用的掃描儀的最大幅面大多是A3幅面,對于開本尺寸較大的古籍不能一次性完成掃描,如果分畫幅掃描再進行拼接,得到的數字化圖像與古籍原件將有一定的出入。
部分古籍收藏單位使用了V型掃描儀,對于V型掃描儀,由于玻璃壓板是由兩塊玻璃板拼接而成,拼接處可能會遮擋古籍原件部分文字,造成部分信息缺失,如圖2所示。由于各古籍收藏單位的經濟實力有差異,購置的數字化加工設備規格參差不齊,部分早期的數字化加工設備已經不能滿足現在的古籍數字化要求,對于具有一定使用年限的數字化加工設備,存在著部件老化等現象,如果不及時進行維護和保養,將嚴重影響數字化圖像的質量。

圖2
2.2.2 數字化加工環境
數字化加工環境需要注意防護光源,避免透光或反射光影響數字化圖像。相機本身不具備光源,一般需要人工設置光源,如果光源設置不合理,容易造成數字化圖像亮度偏高或局部有陰影,影響圖像質量。掃描儀一般自帶光源,但自帶光源的位置固定、不可調節,往往也需要增加光源,否則可能造成數字化圖像色彩不均或局部有陰影。
2.2.3 數字化加工過程
古籍收藏單位中專門從事古籍數字化加工的工作人員較少,一般也沒有經過系統的培訓,數字化加工的經驗不足,數字化加工的過程并不完全符合規范,影響了數字化圖像的質量,具體的不規范現象有下面幾種。
(1)數字化時古籍沒有添加襯紙,圖像透字現象嚴重。古籍原件年代久遠,可能存在透背葉字跡、蟲蛀、局部破損等現象,這種情況下需要墊上古籍適用的襯紙后再進行數字化。添加襯紙這一項操作,一方面需要古籍相關的專業人員來進行,另一方面降低了古籍數字化的加工效率,所以古籍收藏單位通常省略這一步驟,造成數字化圖像有透字現象,如圖3所示。

圖3
(2)數字化圖像上有異物、背景雜亂。掃描儀上的玻璃壓板如果不注意保護,久用之后會產生劃痕,如果不定期清潔,玻璃壓板上會有污漬,掃描后劃痕和污漬將顯示在數字化圖像上,影響圖像質量,如圖4所示,圖像上有明顯的劃痕。古籍原件具有一定的厚度,翻開掃描時需要保證兩側葉面在同一水平線上,否則數字化圖像的中縫處容易產生黑色陰影,影響圖像質量,如圖5所示。部分掃描儀自帶的掃描背景不是純色的,如果掃描時不使用背景紙,會造成圖像背景雜亂,如圖6所示。

圖4

圖5

圖6
(3)數字化圖像沒有留白。為了盡可能地保留古籍原件的信息,圖像葉面外圍應該有一定范圍的留白,由于操作人員的疏忽,存在圖像沒有留白的現象,可能造成圖像中天頭、地腳等原件信息的缺失,不能完整地反映古籍原貌,如圖7所示。

圖7
(4)色卡上有污漬。色卡是色彩管理的重要手段,可以準確還原圖像顏色。在實際操作過程中,工作人員往往不注重色卡的清潔,多次使用造成色卡表面上有污漬,影響將來還原圖像顏色。
(5)數字化時直尺放置不規范。數字化時使用直尺是為了記錄古籍的開本大小,對每部古籍第一冊封面進行數字化時,需要將直尺放置于古籍原件左側,距離古籍0.1-1厘米。如圖8所示,直尺放置在古籍的右側和下方,右側直尺緊貼古籍,下方直尺更是墊在了古籍下面。

圖8
(6)數字化圖像歪斜較大。古籍放置的位置不規范,可能造成數字化圖像歪斜較大,如圖9所示。

圖9
“中華珍貴典籍資源庫”建設項目的元數據制作較為復雜。盡管《手冊》對古籍元數據著錄進行了詳細說明,國家古籍保護中心也舉辦了多期古籍數字化培訓班,但古籍元數據著錄不規范現象時有發生,一方面是由于工作人員對《手冊》理解不透徹,未完全依照《手冊》進行著錄,另一方面是《手冊》本身有不完善的地方,這里主要列舉《手冊》中不完善的地方。
《手冊》主要針對線裝類的古籍數字化進行了規范要求,實際上古籍的裝幀形式多種多樣,《文獻整理登記表(各卷)》中的“開本”字段是要著錄古籍原件的大小,對于卷軸裝古籍來說,開本大小如何定義沒有明確說明;“板框”字段是要著錄書葉正面圖文四邊的圍欄大小,并不是所有的古籍都有板框,對于沒有板框的古籍來說,該字段是否著錄沒有明確說明;“葉數”字段是要著錄各卷的葉數,對于卷軸裝古籍來說,葉數如何統計沒有明確說明;對于線裝類古籍,存在著上一卷卷終和下一卷卷端在一個筒子葉的現象,這兩卷的“葉數”字段如何著錄也沒有明確說明。
針對前述古籍數字化過程中出現的種種問題,筆者提出了幾個處理策略。
古籍數字化對設備的要求一直是比較高的,對于分辨率、數字化幅面、光源等都有較高的要求,部分早期的數字化設備已經無法滿足現在的古籍數字化要求,這就需要增加資金的投入,購買能夠滿足數字化要求的設備。設備在日常使用中,也應該注重保養和維護,及時更換老化的零部件,定期進行設備的校正,以保證數字化圖像符合要求,盡量避免對古籍反復數字化,以保護古籍原件。
古籍數字化是集多種知識為一體的工作,縱觀古籍數字化的各個流程,需要古籍文獻、圖像采集、圖像處理等多個領域專業人員的參與,單一領域的工作人員不足以支撐整個數字化工作,需要多個領域的工作人員相互配合,才能保障數字化工作的順利開展。
古籍數字化是一項繁雜的工作,對工作人員的要求較高,應該加強對工作人員的培訓,規范數字化的操作流程,以提高古籍數字化的整體水平。例如,在數字化加工準備階段,對于透字嚴重的古籍需要添加襯紙;在數字化加工前,需要對設備進行校準;使用色卡時,需要佩戴手套以保證其清潔;數字化圖像應該有一定范圍的留白;數字化圖像歪斜較大時,需要進行圖像糾偏處理。工作人員不但要精通專業知識,還應該具有較高的責任感,才能保障古籍數字化成品的質量。
隨著古籍數字化的全面開展,相關問題也會不斷出現。國家古籍保護中心舉辦了古籍培訓班,不僅可以對數字化工作人員進行培訓,也提供了一個很好的交流途徑,各數字化單位的人員可以相互交流數字化經驗,討論數字化中遇到的問題。與此同時,應該召集各個相關領域的專家成立專家組,以解決數字化工作人員在實際操作中遇到的問題,為其提供技術支持。
中華珍貴典籍資源庫項目打破了以往古籍數字化的一些限制,由國家古籍保護中心統一規劃并制定統一標準、全國古籍收藏單位合作共建,最終實現數字化成果的資源共享。它讓古籍數字化項目向前邁進了一大步,但中華古籍博大精深,只進行搶救性的數字化是不夠的,還有待于古籍工作者對數字圖像進行內容挖掘。同時,這種深挖掘需要基于圖像的處理,具有較強的技術性,因此從事這項工作的工作人員,不僅要有責任感和使命感,還要有較高的技術水平。