史建忠
摘 要:本文以內蒙古財經大學圖書館館藏紙質文獻數字化為例闡述了圖書館館藏紙質文獻數字化的意義,數字化過程中應注意的問題以及數字化后對本館所將帶來的影響。
關鍵詞:圖書館;館藏文獻;文獻數字化
館藏紙質文獻數字化是我校圖書館內涵改造的一個項目,作為整個項目的具體實施人員,筆者對圖書館館藏數字化建設提出了幾點自己的看法。
1 圖書館館藏文獻數字化的意義
數字圖書館就是以數字形式存儲和處理信息的圖書館。館藏文獻數字化一般有兩個含義:一是圖書館從外部通過電子圖書的購買、網絡資源的下載等方式獲取數字化文獻或信息,增強館藏數字化程度;二是在圖書館內部將非數字化館藏文獻數字化。在傳統的圖書館中,文獻形式主要是印刷品,工作人員對這些文獻很少加工甚至不做加工,而在數字圖書館中,館藏文獻通過數字化這種深度加工,形成了更為有序的信息資源,使文獻的資源價值更加顯著和突出。
1.1 有利于保護館藏文獻
通過館藏文獻的數字化可以降低原件丟失和損壞的風險。也可以擴大原始文獻的利用范圍。
1.2 有利于提高文獻的利用率
館藏文獻數字化可以滿足用對文獻的多種需求。館藏文獻數字化后對用戶的存取最為有利,它允許用戶對某些文獻或文獻的某些章節進行快速閱讀,按需瀏覽并保持隨機存取;它允許用戶自己查找、檢索、研究與處理資料;它能滿足用戶共享資源與及時存取資料。
1.3 有利于圖書館和用戶的研究工作
圖書館既是一個信息服務場所,也是一個科學研究的重要地方。而館藏文獻的數字化可以產生較原件可靠而功能性更強的數字資料,這樣就有利于圖書館和用戶從事文獻研究或科學研究,從而擴大研究對象和研究范圍。
1.4 有利于圖書館的科學管理
館藏文獻數字化可以提升圖書館的科學管理的效率和水平,為讀者和用戶提供更好的信息服務。館藏文獻數字化拷貝可以支持傳統圖書館的多種需求,為開展特色服務創造條件;圖書館既能夠用較低的費用和風險對館藏文獻進行拷貝,也可以更有效地開展館際互借等活動。
2 圖書館館藏紙質文獻數字化的基本技術
2.1 錄入技術
這是最常見的館藏文獻數字化的方法和技術,即通過各種錄入方式將書刊轉化為文本后,用HTML語言編輯上網。文本格式主要有PDF、TXT、DOC、RTF、WDL、CHM和HTML格式等。
2.2 掃描技術
這是最常用用的能夠快速將大量印刷型資料數字化的技術,是目前國內圖書館館藏文獻數字經的主要來源。掃描技術具有節省空間和便于網絡傳送的優點,但制作速度慢,成本比較高。
2.3 壓縮技術
館藏數字化文獻通常以壓縮形式存儲,特別是對于所需存儲空間巨大的圖像文件、視頻和音頻動態文件,壓縮技術顯得尤為重要。通用的圖像壓縮標準和格式包括CCITT G4-TIFF、JPEG和JPEG2000等。
2.4 光學字符識別(OCR)技術
利用計算機軟件把掃描的圖像文獻轉換成字符文本的一種信息傳述,即將一份文獻的數字圖輸入計算機,計算機取出每個文字和圖像,并將其轉換為文字編碼,從而將傳統文獻轉換為數字文本文件。轉換成文本文件的最大好處是能夠全文檢索,否則只能通過對圖像文件進行標引達到檢索的目的,標引工作往往需要專門的人員甚至專家進行。
3 館藏文獻數字化中對著作權需要注意的兩點問題
3.1 文獻數字化的著者的版權問題
中華人民共和國2010年(最新)頒布實施的著作權法第四十八條第一款規定“未經著作權人許可,復制、發行、表演、放映、廣播、匯編、通過信息網絡向公眾傳播其作品的,本法另有規定的除外”。我們與提供電子圖書和數字加工的公司簽訂合同時明確提出,由對方解決版權問題,如果出現了版權糾紛由對方完全解決。
3.2 合理的使用法律賦予圖書館文獻數字的權利
2013年最新修訂的《信息網絡傳播權保護條例》第七條規定“圖書館、檔案館、紀念館、博物館、美術館等可以不經著作權人許可,通過信息網絡向本館館舍內服務對象提供本館收藏的合法出版的數字作品和依法為陳列或者保存版本的需要以數字化形式復制的作品,不向其支付報酬,但不得直接或者間接獲得經濟利益。當事人另有約定的除外。前款規定的為陳列或者保存版本需要以數字化形式復制的作品,應當是已經損毀或者瀕臨損毀、丟失或者失竊,或者其存儲格式已經過時,并且在市場上無法購買或者只能以明顯高于標定的價格購買的作品。”由此可見,圖書館可以合理的利用法律賦予的權利,在一定范圍內,是可以數字化已經購買的文獻的。而且,筆者認為文獻被數字化后的目的是為了師生的教學和科研使用,是可以使用的。
4 選擇數據商與圖書館合作的模式及幾點優勢
我校圖書館在項目具實施過程中是采用數據商外包的模式,這樣的模式有以下幾點優勢。
4.1 圖書保護優勢
現在與我校圖書館合作的超星公司有二十年的加工歷程,并有非常豐富的圖書保護經驗。在圖書加工過程,將在書籍掃描前予以檢查,并根據圖書的具體規格與形式采取拆裝或不拆裝的掃描方法,有效的減少了圖書在加工過程中產生的損傷。同時,每一個掃描人員都經過專業的培訓,防止圖書在加工過程中受到損傷。
4.2 數據質量優勢
冷光源掃描,保證館藏數據的原版原貌;完善的圖像處理流程,對掃描數據中存在的污漬、偏斜、黑色邊框等進行處理,保證圖像的清晰度;多重檢查工序,保證圖書在順序、大小、整齊度上均達到統一標準。
4.3 過硬技術優勢
掃描數據采用標準PDG格式;在保證數據質量的同時,通過壓縮的方式減小數據的存儲容量,使網絡數據的傳輸速度,閱覽體驗都能夠達到較高的水平;同時提供一套電子書管理和發布平臺,方便圖書館管理和使用。
5 數據商在紙質文獻數字化中的執行的相關標準
5.1 總體標準
符合國家標準《紙質檔案數字化技術規范》。確保在掃描過程中不對文獻原件造成二次損傷。保證文獻掃描圖像與原件一致、整潔、清晰。
5.2 元數據著錄標準
依據CNmarc規范,元數據內容包含題名、責任者、出版單位、日期、ISBN(ISSN)號、中圖分類號、頁數、定價、版次、開本、主題詞(關鍵詞)等要素。要求元數據信息與掃描數據信息正確對應,無錯亂現象。
5.3 掃描標準
支持對文獻資源進行不拆裝掃描。可以拆裝的圖書,遵循盡可能保持文獻原貌的原則,對掃描后的文獻進行裝訂。掃描圖像要求完整、整潔、無歪斜、無黑邊、瀏覽及打印清晰。根據文獻情況,采用最為可靠的掃描設備和掃描方式完成文獻掃描,避免紙張褶皺、撕裂、破損等情況的發生。掃描圖像無缺頁、多頁、壓頁現象
6 我校圖書館中文圖書數字化后的成果
我校的館藏文獻數字化后的“成果”,是以兩個數據庫平臺呈現的,一個是數據商本身出售的以前加工好的電子圖書,另一個是與我館書目查重沒有的數字化的,后來單獨數字化的一個平臺。數據供應商可以將兩個平臺的電子圖書建立索引這后,利用檢索引擎“讀秀”就以完成一站式檢索。
截止2012年底,圖書館有中文圖書22.9萬種,114萬冊,2014年5月數據庫公司已經對館藏中文紙質圖書完成了數字化安裝。實際完成數字化的圖書有215278種(其中與超星公司以前購買的電子圖書對比上的有111352種,與書生公司對比上的有2523種,超星公司本次數字化安裝的圖書有101403種),有14145種未完成數字化,具體原因如表1分析所示。
7 我校圖書館圖書數字化的優勢
圖書館館藏數字化可以降低購書成本、增加購書的品種。以我校圖書館2014年紙質圖書支出情況為例:2014年購買新書約8000種,16000冊(每種圖書兩個復本),合計碼洋約79萬元。如果按往年的采購計劃(每種圖書4個復本),本年度的圖書購置款將是158萬元。而將圖書數字化的成本是每本平均90元(每頁0.3元×300頁),全年數字化費用是72萬元,加上以上的紙質圖書款,合計151萬元,有形成本可節省7萬元。另外,同樣的經費購置的圖書品種是往年的兩倍。
可以有效的解決我校老師在開設選修課時幾個班,上百甚至幾班學生集中到圖書館“搶借書”,無功而返的尷尬。學生可以在已數字化的圖書中任意下載,不受復本的限制。并可以選擇重要的章節打印出來。
一些線裝書,孤本,善本。在數字化后,師生可以不受讀者級別的限制在線或是下載閱讀。
將紙質圖書的MARC數據的相應字段錄入數字化后的電子圖書的鏈接地址。這樣師生在查詢館藏紙質圖書的同時也就可以知道電子圖書的所在,為借閱電子圖書節省了時間。
8 結束語
館藏文獻的數字化是我校圖書館自2012年內涵改造的一個項目,于2014年上半年完成了第一階段的任務。隨著我校圖書館每年的藏書品種的增加,數字化的工作是一個連續的過程。以后不僅是中文圖書,還會涉及到外文圖書和非紙質文獻等。作為圖書館的一員,筆者會繼續對這項工作進行研究并做出自己的貢獻。
參考文獻
[1] 王淑云. 淺析圖書館文獻數字化的法律保護[J]. 中國科技信息 ,2010 (20):175-176.
[2] 陳潔薇,陳錦波. 圖書館館藏文獻全文數字化建設探究[J]. 高校圖書館工作,2012(1):65-67.