耿文紅,陳 晨,張 莉,郭 淼
(北方科技信息研究所,北京 100089)
隨著互聯網的飛速發展,全球信息量在以井噴的速度沖擊我們的視線,一方面是圖書館數據庫,無論是紙質還是電子化記載的數據,需要收集和存儲的信息資源日益增長,另一方面,用戶想要得到最全面的數據,則需在海量的數據中層層篩選,無疑增加了工作成本和時間成本。為縮短檢索時間,需要更快捷更專業更現代化的圖書資料數據庫,提供最直接最全面的信息資源。為適應時代需求,我們不能只限于數字化一些當前信息,丟棄傳統文獻,使它們成為“睡美人”,這是一種資源的浪費,我們有責任把傳統文獻與數字資源進行元數據整合,給讀者和用戶提供系統化、專業化,網絡化的文獻服務。
傳統運行模式的圖書館里,會對圖書館內部所擁有的書籍資料名稱和存放地點進行記錄,也就是創建目錄。[1]這樣的管理模式,使用者能夠根據目錄對信息資源進行統計,快速找到想要的書籍,為使用者提供了不少的便利。但為了數字化這些傳統文獻,尤其是紙質文獻,需要投入大量的人力物力,對傳統文獻進行掃描、復印、數據加工、校對入庫。以兵器情報中心文獻館為例,從2004年開始建設數字化圖書館,每年復制掃描人員不僅要完成當年采購資料的數字化工作,還要對文獻館成立以來,所有的紙質文獻逐一掃描,幾十萬份資料無疑是個漫長而龐大的工程,費時費力,但作為數據庫的基礎工作,這項工作又是必需的。
科研人員對信息資源進行檢索時,可能輸入同樣的關鍵詞,通常情況下數據庫會為讀者推送批量元數據,科研人員要根據需求進行仔細篩選。這個檢索的過程中,數據庫元數據的加工質量,直接影響檢索結果和信息質量。元數據加工過程不僅要求掃描復制人員保證資料的清晰完整,最重要的是數據加工人員對科研論文及學術資料的理解和把握,要以最精確最專業的國防敘詞主題詞,標引資料主題,并將文獻資料做準確分類,避免出現泛泛之詞,造成檢索結果大量重復和沒有明確指向的擦邊內容,每一條文獻資源所要表達的內容都是不同的信息,要確保檢索結果與文獻資源的高度一致性。
從上世紀90年代開始,國際上已經有相當多的圖書館意識到了數字元數據整合的重要意義,開始進行數字資源與傳統文獻元數據整合的工作。有一部分圖書館從系統層入手,花費資金鋪設了一個系統。數字資源作為新的資源形式放到這個特定的系統里面,與傳統文獻資源分隔開來,等到實際使用的時候,圖書館管理人員可以通過事先搭建的相關鏈接,為使用者搜索到相要的信息資源。這樣的做法既有存在的價值,也有一定的弊端:使用這樣的方法對元數據進行整合,確實可以方便圖書館工作人員的操作,因為該方法實現的過程中對工作人員的各項能力并沒有很多的要求。這種方法的壞處就是,只創建了這樣一個系統,將數字資源和傳統文獻資源分隔開來,并沒有從數據層面對整個資源庫進行整合。[2]雖然這樣的方法可以加快元數據整合的速度,但是整合出來的質量很差,這樣的措施對圖書館未來的長遠發展沒有什么實質性的幫助。還有一點問題在于,系統只單單設置在數字資源方面,傳統文獻資源方面不能通過系統來進行規范。讀者檢索資源的時候,只有資源處于系統內時才能享受到系統所帶來的快捷便利服務,當資源沒有處于系統內時還是只能選用較為麻煩的方式搜索查找資源,這不是很符合元數據整合工作的初衷。
除了從系統層面入手外,部分圖書館還從數據層面開展工作,實現元數據整合。簡單一點的方法就是將傳統文獻資源進行標引,并將標引的相關內容上傳,將傳統文獻資源與數字資源相結合,讀者在搜索關鍵詞的時候,能夠通過上傳的數字鏈接,找到想要的資源的出處,從而找到想要的信息。[3]復雜一點的辦法就是對元數據進行分類,根據類別整合。這樣的方法相較于簡單的方法來說更加方便了讀者的使用,而且數據也更加的有條理性。而數據標引與分類相結合,則形成了數字圖書館數據庫建設最基礎的數據加工流程,需要專業、耐心、認真的工作態度,才能完成此項工作。
隨著科研一線對文獻資源的需求增大,文獻資源要開展專題數據庫服務,利用數圖的數字化資源,根據特定用戶的需求,制成網絡版、單機版或光盤版的專題全文數據庫,為特定用戶提供專題數據庫服務,定期更新,依托強大的數字文獻資源,把數字圖書館建成主動型服務型數字圖書館。
數字資源與傳統文獻元數據整合的理念是符合信息化時代的發展需求的,相關人員要努力做好這個工作。在整合的過程中,要秉持著讀者即上帝的原則,為讀者提供更好的服務,同時還要根據實際情況,努力將整合之后的信息資源有效的利用起來,更好的服務于大眾、服務于科研,使傳統文獻與數字文獻創造更大的社會效益和經濟效益。