房寶金 潘宏
〔摘要〕文章通過對天津市高校聯合書目數據庫質量的分析,探討了書目數據庫存在的質量問題及原因,并從數據規范控制、數據質量管理體系、系統改進等方面提出了控制書目質量的建議和措施。
〔關鍵詞〕聯機編目;書目數據;質量控制;Unicorn編目系統
DOI:10.3969/j.issn.1008-0821.2013.05.031
〔中圖分類號〕G25074〔文獻標識碼〕A〔文章編號〕1008-0821(2013)05-0138-05
天津市市屬17所高校圖書館于2002年組成高校圖書館聯盟,聯合引進美國Sirsi公司的Unicorn Consortia圖書館自動化管理系統,采取使用一個服務器,在同一平臺上辦公的工作模式,以實現對圖書館日常業務的全面管理和文獻信息資源的共享共建。而這個管理系統建設的關鍵是聯合書目數據庫,它是該系統安全運行的基礎和核心。
各成員館在同一系統平臺上的聯機合作編目避免了大量的重復勞動,降低了編目成本,提高了編目效率。做到了優勢互補、提高了編目的一致性、標準化和規范化。由于每條編目數據都上載了各館的索書號、文獻標識及館藏信息,它就完全支撐了圖書館全部傳統業務的正常運行,包括采訪、檢索、流通、閱覽、預約、續借等,真正實現了一館式垂直管理模式,也最大程度地實現了編目的共知共建共享。因此聯合編目的優勢與重要性就決定了聯合書目數據庫必須要以高質量的編目數據為依托。但從目前情況看,數據庫中編目數據質量仍參差不齊,存在較多問題。對數據質量問題的分析和解決,將有利于天津高校聯機合作編目的繼續開展和文獻信息資源的共建共享。
1聯合書目數據庫質量問題分析
目前,天津高校圖書館聯盟主要是用Unicorn編目系統和CALIS的Z3950軟件實現聯機編目。Unicorn聯機編目模塊采用的是書目數據三級結構管理方法,即同一種書共享一個題名和數據,各成員館在同一個書目數據上建立各自的索書號和復本信息,如圖1。
目前,天津高校聯合館90%以上的數據是可以從CALIS上下載并套錄。對于CALIS上沒有的數據大多數的圖書館通常采用兩種方式來建書目數據:一是采用書商提供的數據,即外包數據;一是圖書館自己進行原始編目。
11原始編目數據的質量問題
132對多卷書、連續出版物等集中、分散著錄處理方式不一致
對于多卷書和連續出版物,一般情況下是按照集中著錄形式進行的,但是在Unicorn系統中,這種類型的書有的集中著錄,有的分散著錄,由于沒有嚴格的約束機制和責任問責,各成員館在處理時隨意性很大,造成了嚴重的重復數據。如《中國商務年鑒》一書,從2004年卷開始,每年出版一卷,理論上應該集中著錄,但在系統中,該書就存在5條數據,分別為中國商務年卷2005年卷、2006年卷、2007年卷、一條集中著錄的數據和一條殘缺的垃圾數據。
133套錄數據時處理不當
在Unicorn系統中,經常會存在同一館同一條數據下載多次或數據下載有誤造成重復數據,直接的表現形式是一種書存在多條數據,但只有一條數據有館藏,其余都是既無館藏又無采購訂單的空數據或殘缺數據。
另外,在借用相似數據改為新數據時不按現編書修改也造成了重復數據,比如借用1版書數據改為2版時,只在新數據添加了版次,其余像ISBN號,頁數,出版年、叢書等關鍵字段都不修改,或者數據中定長和非定長字段的兩處出版年,只改一處。但是在系統中凡是需要系統自動選擇出版年時,系統對西文選擇的是上邊定長字段的出版年,對中文選擇的是下邊數據字段(210字段)的出版年,如果系統選擇的恰好是你沒改的,系統就會顯示是重復數據。
14垃圾數據問題
垃圾數據主要是指殘缺數據、空數據等書目信息不完全、缺少必要的信息點、無館藏信息的數據。人為、系統的原因都可能導致垃圾數據的產生。如有的數據是缺題名的數據,這樣的數據在題名字段統一顯示為:REQUIRED FIELD字樣(意思是說題名是必備字段,現在是空的),這種數據的產生大致有3種原因:一是對Unicorn系統的編目模塊不熟悉,對系統屬性的設置與要下載的數據格式、文種不匹配造成的;二是做數據過程中由于各種原因造成的網絡掉線或系統突然退出而產生的缺題名數據。以上原因產生的缺題名數據多數情況下顯示的其他字段也很少,這樣的數據在系統內有的永遠也檢不出來。在系統里形成了垃圾數據。
2聯合書目數據庫質量控制的措施
21書目數據的規范控制
文獻著錄規范是保證書目數據庫質量的重要因素,著錄的一致性、惟一性,可以提高讀者檢索的查全率和查準率,同時又是文獻工作標準化的基礎。規范控制是為確保標目在檢索系統及書目系統中的惟一性和穩定性而建立、維護、使用規范款目和規范文檔的工作過程。規范控制應始終如一地使用和維護統一的名稱、題名和主題等規范形式。從天津高校圖書館聯盟成立至今,先后使用過OLCC標準、自定義標準到現在的CALIS編目標準,在聯盟幾次變更編目準則的背景下,是各成員館為追求編目效率而導致的對規范控制的忽視,尤其是在對標目形式的選擇上缺乏嚴格的控制手段,這已成為進一步提高書目數據質量的瓶頸問題。
在目前聯機編目環境下,聯盟管理中心應該盡快進行規范控制、制定一系列詳盡的編目細則,特別是對年鑒、多卷書、連續出版物等特殊圖書著錄的規定。例如,現在進行編目時依據CALIS標準,所以對年鑒、多卷書等一般嚴格依據規則進行集中、分散著錄,但編目員在實際操作時發現應該集中著錄的數據已經單獨著錄時怎么做,多卷書卷冊太多時怎么做(卷冊多會產生太多索書號,在同一數據上添加太多索書號容易導致系統界面死機),碰到重復數據時怎么做,碰到問題數據時怎么做…將這些編目員平時經常遇到的問題整理成冊,給出具體的規定并發放各成員館,這樣就能解決成員館在遇到問題時無所適從或自行隨意解決的問題。只有對編目細則進行統一,才能使編目工作有章可循,使編目數據更為標準化和規范化。
22建立嚴密的數據管理和質量審核體系
在聯合編目的背景下,一條問題數據的出現將直接影響聯盟17個成員館的使用,所以其質量問題就顯得尤為重要。而對數據質量的管理和維護除了各成員館認真負責外,管理中心的全局布控和管理也不可缺少。目前,中心采取隨時檢查問題數據、向相應館反饋信息、日常業務輔導、年底評價總結等措施來控制質量,這些措施固然起到一定的積極作用,但仍未能改變數據質量參差不齊及數據重復的現象。筆者認為,這些措施不夠強硬,獎懲也不夠分明。中心在進行管理時,應首先從源頭堵住問題數據的產生,同時使用硬性的管理手段,建立嚴密的校對檢查程序,并引入獎懲機制。
221設置相應的編目權限
目前,成員館在同一個系統平臺上辦公,系統對各種數據的提交和修改沒有設置任何標準和權限限制。成員館中,就算沒有經過任何培訓的新人都可以隨便上傳和修改數據,這種對編目權限的完全放開是造成數據庫中問題數據的一個重要原因,也是中心今后應注意和改進的地方。
筆者建議效仿CALIS聯機編目的經驗,對成員館編目數據的上傳和修改作相應的等級和權限設置。給各個成員館編目人員進行培訓考核,成績合格的編目員才擁有上傳數據的權限,新人和不合格的編目員編制的數據需要經由本館合格編目員審核后方可上傳。這樣才能保證系統中原編數據的質量,也可以調動編目人員的積極性和上進心。
222建立嚴密有效的審校管理體系
要形成一套嚴格有效的審校管理體系,需要有嚴密的校對審查程序,并引入獎懲機制。使用硬性的管理手段,把質量控制量化,即把書目數據的差錯率數字化,使它與成員館編制的書目數據的質量有機結合起來,并依此來對成員館進行排名和獎懲。
對書目數據進行質量控制與評價的一個重要指標是書目數據差錯率,它反映了書目數據著錄格式是否標準、內容是否準確全面,通過計算書目數據差錯率能夠客觀、科學、公正地評價數據質量。
223建立培訓互動和反饋系統
編目人員的素質直接決定著編目數據的質量,因此,中心和各成員館應采取各種積極有效的措施調動編目員的積極性,提高其專業能力和綜合素質。加強編目人員的業務培訓、繼續教育,定期開展編目員的業務培訓和討論會,鼓勵他們多與同行進行交流和探討,以加深對細則的理解,及時傳達新信息,使數據的統一性和差錯率隨時處在可控之中。另外,也可以用網上答疑的方式加強專家和編目員之間的聯系與交流,共同提高書目數據的質量。同時建立反饋系統,在中心網站開辟專欄,對編目中產生的各種問題進行收集、整理與分析,整理成書目資料并通曉各館,從而讓編目數據的質量達到最佳。
23合并重復數據、清理數據垃圾
天津聯機編目中心到今天已經成立將近十年,由于各種主客觀原因,書目數據庫中現有很多重復記錄或殘缺不全、無法有效利用的垃圾數據,當這些數據累積到一定程度時,就會影響書目數據的質量和有效利用。因此聯編中心應聯合成員館集中處理下系統中的歷史遺留問題,并逐步將數據記錄的清理、去重、合并發展成書目數據維護工作的常規業務。
24充分利用并積極開發改進軟件系統
241設置系統編目權限
上面提到的設置相應編目上傳和修改數據的權限設置問題最終需要靠系統來解決,2013年升級前的系統對各種數據的提交沒有設置任何權限,各成員館甚至可以隨意修改他館的館藏信息。從2013年3月開始,Unicorn系統全面升級,升級后的系統增加了中文、俄文和電子資源的編目模塊,對原來中西文圖書編目模塊也進行了一些改進,如隨意修改他館館藏信息的現象已不復存在,但對編目數據仍然可以隨意修改。中心可以聯系系統開發商,對數據上傳修改的權限也進行相應的設置升級。
242完善系統自動糾錯功能
應積極開發完善軟件的自動校驗和糾錯功能,提高系統自動判重的能力。對于某些對應性字段和常見的錯誤,系統可進行自動匹配檢查,提供報錯提示服務。同時改進和完善規范控制功能,支持名稱規范控制工作的順利開展,加緊調研數據維護升級程序,從而保證書目數據庫的數據質量。
243充分利用系統報表查錯
Unicorn系統的報表模塊具有強大的統計功能。其獨特的報表實用程序可以實現傳統編目方式下編目員必須手工完成的一些技術加工項目,比如列出索書號、列出書目記錄、文獻統計等工作。根據需要設置各種選項信息后,就可以根據報表運行的結果查看最近的編目數據有無錯誤。定期對每批次編目數據進行報表統計檢查,可以很大程度上提高編目數據的質量。
3結語
天津市高校圖書館聯合書目資源共享系統采用集中式的管理方法,即由多個圖書館共同建設和維護同一個聯合書目數據庫。這是對原有的單館編目模式的變革,極大提高了圖書館編目的共建共知共享。目前,天津高校圖書館聯盟對圖書資源的共建共享部分做法是編制圖書聯合目錄數據庫,后采用館際互借的方法實現圖書資源共享這一過程,但協調采購、統一采購工作做得較少,使得各成員館重復采購現象比較嚴重,在一定程度上造成了資源浪費,也造成了編目的重復性工作。造成這種現象的原因一方面是對各館經費管理無法協調,另一方面也還沒有解決好原文傳遞困難、讀者到他館進行館際互借過于麻煩等問題。所以,圖書資源的共建共享工作要真正起到實效,必須要從管理理念、技術手段到服務范圍都有所變革,真正建立起“大圖書館”理念,使圖書館聯盟成為真正意義上的一體化圖書館,做到從采到編、從技術到服務、從實體資源到虛擬資源的全方位共建共享,更有效地促進天津市高校圖書館聯盟的建設和發展。
參考文獻
[1]黃雪梅,史永強,王南.天津市高校圖書館書目資源共享系統的模式與功能[J].河北科技圖苑,2003,(6):12-13.
[2]陳艷梅.高校圖書館書目數據的質量控制芻議[J].圖書館學刊,2007,(4):105-106.
[3]周小敏.聯機編目書目數據質量問題探析——以全國圖書館聯合編目中心數據為例[J].圖書館論壇,2010,(8):115-117,104.
[4]陳新潔.圖書館編目外包質量控制與績效評價研究[J].圖書館論壇,2011,(8):132-134.
[5]杜欣明.技術干預模式:編目業務外包的一種新嘗試[J].圖書館建設,2011,(3):108-110.
[6]王龍.數字化視域下圖書館書目數據質量控制探討[J].中國報業,2012,(4):235-236.
[7]李智.我國書目數據標準化面臨的主要障礙[J].圖書館建設,2012,(6):31-32,35.
[8]丁建勤.聯機聯合編目成員館編目績效評估及其分析[J].圖書館建設,2012,(8):21-23,37.
[9]易向軍.聯機編目環境下書目數據規范控制研究[J].中國圖書館學報,2011,(11):120-124
(本文責任編輯:孫國雷)