
[摘 要]文獻傳遞服務是目前高校圖書館資源共建共享最為有效的形式之一。本文主要分析了建設文獻傳遞數(shù)據(jù)庫的必要性,并通過利用TPI平臺建設文獻傳遞數(shù)據(jù)庫的實例,指出可能出現(xiàn)的問題以及應對這些問題的措施。
[關鍵詞]TPI;文獻傳遞;自建數(shù)據(jù)庫
[中圖分類號]G250.74 [文獻標志碼]B [文章編號]1005-6041(2010)06-0077-03
文獻傳遞服務是目前高校圖書館資源共建共享最為有效的形式之一,已經(jīng)逐漸從圖書館的邊緣性服務發(fā)展成為主流的信息服務[1],是解決高校圖書館經(jīng)費不足、提高文獻保障能力的有效手段。尤其對中小型高校圖書館而言,在數(shù)據(jù)庫少、紙質(zhì)文獻缺乏的情況下,通過文獻傳遞可以彌補本館文獻不足,實現(xiàn)資源共享。同時還可以消除資源重復建設造成的浪費,促成采購分工,節(jié)約大量資金,合理布局文獻資源,從而優(yōu)化館藏。為了更好地利用通過網(wǎng)絡傳遞獲得的文獻資源,鄭州輕工業(yè)學院圖書館正在嘗試利用清華同方的TPI平臺建設文獻傳遞數(shù)據(jù)庫,以使這部分數(shù)據(jù)資源發(fā)揮更大的作用。自建文獻傳遞數(shù)據(jù)庫既能有效彌補高校圖書館館藏文獻之不足,方便讀者利用,又能節(jié)約一部分文獻傳遞費用。
1 自建文獻傳遞數(shù)據(jù)庫的必要性
1.1 豐富館藏,提高文獻保障能力
文獻傳遞是在網(wǎng)絡環(huán)境下從館際互借發(fā)展而來的,是目前實現(xiàn)電子信息資源共享的主要形式。通過開展文獻傳遞服務,不僅可以緩解高校圖書館經(jīng)費、資源不足與讀者日益增長的文獻需求之間的矛盾,而且可以對學校的教學、科研起到很好的支撐作用。目前一些高校實行了文獻傳遞費用補貼政策,使高校的文獻傳遞量大大增加。如果能將這些傳遞的文獻資料利用圖書館的設備、技術及人力資源建成文獻傳遞數(shù)據(jù)庫[2],并在一定區(qū)域內(nèi)的高校之間共享,會大大豐富高校圖書館的館藏,提高其文獻保障能力。
1.2 避免重復傳遞,節(jié)約有限的經(jīng)費
在高校圖書館提供文獻傳遞服務的過程中,同一讀者不會反復提交同一篇文獻,但由于高校專業(yè)研究人員相對集中,同一專業(yè)或研究方向的讀者申請傳遞的文獻就有可能重復,而同一城市或區(qū)域內(nèi)高校相近專業(yè)的讀者出現(xiàn)重復提交的可能性就更大,這樣就會給讀者和圖書館造成不必要的浪費[3]。通過建設文獻傳遞資料數(shù)據(jù)庫,把傳遞過來的文獻保存下來,并在校園網(wǎng)內(nèi)或同一區(qū)域內(nèi)的高校之間共享,既可方便讀者,又可減輕圖書館的工作負擔。建成的文獻傳遞數(shù)據(jù)庫在網(wǎng)上發(fā)布以后,用戶可以先在數(shù)據(jù)庫里檢索所需文獻信息,然后再確定是否需要申請文獻傳遞服務,避免提交重復的文獻需求,這樣在節(jié)約一部分傳遞費用的同時,又可以縮短讀者獲取文獻的周期。
1.3 為圖書館文獻資源建設提供決策依據(jù)
通過文獻傳遞“獲取”的文獻信息是圖書館信息資源體系的重要組成部分。文獻傳遞數(shù)據(jù)庫可以按學校專業(yè)或院系設置進行分類,增加更多的檢索字段,如文獻利用者、項目名稱、基金名稱等,方便校內(nèi)用戶使用。通過文獻傳遞數(shù)據(jù)庫的建設與發(fā)布,可以使圖書館的決策者更詳盡地了解學校高端讀者群的文獻需求方向、文獻利用狀況,以便調(diào)整文獻資源建設和服務內(nèi)容,制定新的文獻資源建設策略和重點收藏計劃,為文獻購置費用的分配提供科學依據(jù)。
2 TPI數(shù)據(jù)庫建設平臺
TPI是一套集數(shù)據(jù)預處理、數(shù)據(jù)裝載、索引建立、檢索、用戶管理和資源管理于一體的通用信息管理系統(tǒng)。用戶可以方便地使用建庫工具建立一個空數(shù)據(jù)庫結構后引入數(shù)據(jù)、建立索引,無需二次開發(fā)即可直接使用,檢索界面和管理界面均以瀏覽器方式體現(xiàn)。它采用流行的B/S瀏覽器的檢索方式和先進的3層C/S架構,能夠同時管理文字、圖片、多媒體等信息,支持網(wǎng)頁的動態(tài)發(fā)布,為高效地完成全文檢索及分類標引、方便讀者檢索利用提供了一條方便快捷的解決途徑,同時還可以和清華同方的“中國期刊全文數(shù)據(jù)庫”兼容。
2.1 數(shù)據(jù)庫建設子系統(tǒng)
該子系統(tǒng)可以用來完成數(shù)據(jù)庫資源的建設。主要包括采用電子圖書制作工具實現(xiàn)對紙質(zhì)文檔的數(shù)字化;對各種現(xiàn)有數(shù)據(jù)庫電子資源的數(shù)據(jù)轉換;把各種通用文檔轉換成統(tǒng)一格式;最后實現(xiàn)對數(shù)字對象的分類、標引,把這些數(shù)字對象加工成數(shù)據(jù)庫電子資源。
2.2 數(shù)據(jù)庫管理子系統(tǒng)
該子系統(tǒng)以管理大容量、非結構化數(shù)據(jù)對象為主,具備智能信息處理能力,支持高速全文檢索,可以統(tǒng)一訪問和管理各種異構資源。數(shù)據(jù)庫管理子系統(tǒng)主要包括兩個內(nèi)核,一個是數(shù)據(jù)庫內(nèi)核(包括數(shù)據(jù)字典、查詢分析、查詢優(yōu)化等);另一個是智能文本挖掘內(nèi)核(包括文本分類、文本聚類、自動文摘等)。
2.3 內(nèi)容管理與發(fā)布子系統(tǒng)(CPS)
內(nèi)容管理與發(fā)布子系統(tǒng)能完成數(shù)據(jù)的分布式采編入庫,實現(xiàn)網(wǎng)站信息的發(fā)布與管理,實現(xiàn)實時發(fā)布,及時生效。方便管理員對數(shù)據(jù)庫進行遠程維護,為用戶提供統(tǒng)一的全文檢索、數(shù)據(jù)下載、數(shù)據(jù)分析等功能,幫助研究人員更好地使用信息資源。
3 TPI在自建文獻傳遞數(shù)據(jù)庫中的應用
3.1 積累資源,按文獻需求者所在院系予以整理、保存
通過文獻傳遞獲得的電子資源格式不一,有Word、CAJ、PDF等格式,還有一部分通過掃描保存的圖片格式。不同格式的文件引入數(shù)據(jù)庫后,都采用PDF和CAJ這兩種格式保存文件,既方便下載,又不易被修改、復制和粘貼,有利于數(shù)據(jù)庫資源的知識產(chǎn)權保護。
3.2 設置分類導航和檢索字段
在TPI系統(tǒng)的數(shù)據(jù)庫建設子系統(tǒng)中打開“新建數(shù)據(jù)庫”,然后選擇CNKI風格的數(shù)據(jù)庫模板,這一模板是系統(tǒng)中最全面的數(shù)據(jù)模板。將數(shù)據(jù)庫命名為“文獻傳遞數(shù)據(jù)庫”。隨后在數(shù)據(jù)庫管理中添加分類導航,按學校的院系設置依次添加分類導航,并增加一個“其他”導航項目,用于存儲來自行政、教輔等部門的傳遞文獻。在CPS中打開導航分類,來自每一個院系的文獻傳遞情況便一目了然(如圖1)。
圖1
接下來要根據(jù)文獻傳遞數(shù)據(jù)庫的用途和實際需要,來選擇確定檢索字段:作者、關鍵詞、中文題名、英文題名、分類號、中文摘要、英文摘要和全文。也可以增加幾個自定義字段,如文獻來源館、文獻利用者所在院系、研究方向、在研項目、基金等字段。這些字段今后還可以根據(jù)自己的需要任意添加或刪除。
3.3 數(shù)據(jù)引入
數(shù)據(jù)引入是建設數(shù)據(jù)庫最重要的工作。掃描的圖片格式TPI無法識別,所以要在數(shù)據(jù)引入前用OCR文字識別軟件將圖片格式的文件轉換為文本格式,然后才能引入數(shù)據(jù)庫。數(shù)據(jù)檢查是指對提交數(shù)據(jù)的真實性和準確性進行質(zhì)量控制。這一操作可在TPI的“元數(shù)據(jù)加工工具”中實現(xiàn)。數(shù)據(jù)檢查是一個重要環(huán)節(jié),它起著對數(shù)據(jù)質(zhì)量特別是全文電子文檔的質(zhì)量進行嚴格把關的作用。數(shù)據(jù)檢查之后,再逐個地把PDF格式的文獻引入到數(shù)據(jù)庫。最后進行數(shù)據(jù)的標引、分類。
“標引”即指把文件的每一個檢索字段的內(nèi)容標示出來,告訴計算機每個檢索字段的內(nèi)容應該在這個論文的哪一部分。用戶檢索該字段,實際上就是檢索標引出來的字段。分類數(shù)據(jù)的“分類”是指按照《中國圖書館分類法》的規(guī)則,把論文歸納到相對應的類目里。一般來講,數(shù)據(jù)庫都有“分類檢索”,把論文分類正是為分類檢索做鋪墊。
3.4 內(nèi)容發(fā)布
數(shù)據(jù)處理完畢后,通過“內(nèi)容發(fā)布工具”進行數(shù)據(jù)庫網(wǎng)上發(fā)布的相關配置。通過該向?qū)Э梢詫崿F(xiàn)設置數(shù)據(jù)庫的版權信息、選擇數(shù)據(jù)庫發(fā)布模板、確定導航區(qū)和檢索界面等。數(shù)據(jù)庫發(fā)布模板中的期刊網(wǎng)數(shù)據(jù)庫是TPI系統(tǒng)中功能最完整的模板。
圖2
4 自建文獻傳遞數(shù)據(jù)庫需要注意的問題
4.1 按專業(yè)或院系設置分類導航
為方便讀者利用資源并實現(xiàn)快速檢索,可在建庫時按學校的專業(yè)設置或按院系設置配置分類導航,這樣進入分類導航后就可以全面了解任一專業(yè)或院系的文獻傳遞信息。
4.2 增加檢索字段
增加一些檢索字段,可以更方便讀者利用,如增加請求傳遞者的名字檢索字段,專業(yè)方向檢索字段,在研項目、基金名稱檢索字段以及每一篇文獻的請求次數(shù)檢索字段等,以使數(shù)據(jù)庫的檢索更為便捷和直觀。
4.3 數(shù)據(jù)標引
數(shù)據(jù)庫的標引是一種要求非常仔細和認真的工作,如果做得不到位,用戶在檢索時就會出現(xiàn)誤差,甚至查不到所要的內(nèi)容。所以在建庫時一定要認真細致地進行標引工作,盡可能地通過標引使讀者能順利地查看到自己所需要的資料。
4.4 數(shù)據(jù)庫的發(fā)布、推廣與維護
建設數(shù)據(jù)庫的最終目的是讓讀者利用數(shù)據(jù)庫。建成后的數(shù)據(jù)庫在網(wǎng)上發(fā)布,并采取各種方式、方法開展宣傳和推廣工作,使更多的人了解和使用數(shù)據(jù)庫。數(shù)據(jù)庫的維護與更新,是數(shù)據(jù)庫生命力的保證,數(shù)據(jù)庫建成后,及時改正其中的錯誤,并通過留言板、問卷調(diào)查等方法搜集反饋信息,及時對數(shù)據(jù)庫進行改進,以確保數(shù)據(jù)庫的質(zhì)量。新的文獻傳遞請求可以先在學校數(shù)字資源中進行檢索,對于新傳遞來的文獻數(shù)據(jù),可根據(jù)具體情況做到每工作日更新或每周更新,更新情況隨時在網(wǎng)上發(fā)布。
4.5 知識產(chǎn)權問題
知識產(chǎn)權問題是自建文獻傳遞數(shù)據(jù)庫必須要合理解決的重要問題。圖書館在建設文獻傳遞數(shù)據(jù)庫時,應充分尊重所獲的文獻傳遞資源的知識產(chǎn)權,規(guī)避知識產(chǎn)權風險。目前,高校圖書館開展文獻傳遞服務尚存在法律障礙,而利用這些資源建設數(shù)據(jù)庫就更容易涉及著作權問題。圖書館通過文獻傳遞獲得的文獻主要來自CALIS、CASHL等文獻傳遞服務組織的成員館,不可能與每個版權人聯(lián)系征得許可。雖然高校圖書館自建文獻傳遞數(shù)據(jù)庫的主要目的是為本校的教學、科研提供服務,不作商業(yè)用途,并且僅在校園網(wǎng)范圍內(nèi)使用,但在未征得著作權人許可的情況下,仍有侵權的嫌疑。高校圖書館可以充分利用《著作法》中“法定許可”和“合理利用”的規(guī)定,采取相應的規(guī)避措施,建成的文獻傳遞數(shù)據(jù)庫要嚴格限制IP地址,僅供校園網(wǎng)用戶免費使用,并以網(wǎng)上公告的方式強調(diào)不以營利為目的,如果版權人對某一數(shù)據(jù)提出異議,可以立即刪除[4]。
總之,使用TPI平臺自建文獻傳遞數(shù)據(jù)庫,使整個建庫工作更加靈活、簡便,而數(shù)據(jù)庫建成后既可以彌補館藏數(shù)字資源之不足,又可以節(jié)約一部分傳遞費用。不過,高校圖書館在文獻傳遞數(shù)據(jù)庫的建設和開放過程中一定要遵守知識產(chǎn)權相關方面的法律、法規(guī)、條例,不能超越法律底線,避免不必要的侵權糾紛。
[參考文獻]
[1] 劉 梅.國內(nèi)文獻傳遞發(fā)展不平衡性與改進途徑研究[J].農(nóng)業(yè)圖書情報學刊,2008(11):31—32.
[2] 陳 力,韓 紅.對提高文獻傳遞滿足率的一些思考——以中國科學院國家科學圖書館成都分館文獻傳遞服務為例[J].現(xiàn)代情報,2008,6(6):51—53.
[3] 劉 蓉.對提高高校文獻傳遞服務效率與質(zhì)量的思考[J].晉圖學刊,2009,2(1):36—39.
[4] 張麗芳.電子文獻傳遞過程中的知識產(chǎn)權風險及規(guī)避措施[J].圖書館學研究,2007(10):79—82.
[收稿時間]2010-07-17
[作者簡介]楊朝欽(1972—),男,館員,鄭州輕工業(yè)學院圖書館,研究方向:信息咨詢、信息服務。
[說 明]本文為2010年河南省政府決策招標課題“新興網(wǎng)絡信息傳播模式與識產(chǎn)權風險規(guī)避研究”(A388)系列成果之一。