〔摘 要〕指出當前圖書館OPAC書目系統檢索效率低的原因主要是由于MARC數據著錄中存在問題,并對造成數據質量問題的原因進行分析,最后提出改善圖書館OPAC檢索效果的對策#65377;
〔關鍵詞〕圖書館OPAC;MARC數據;檢索效率;策略;檢索點
〔中圖分類號〕G252.7 〔文獻標識碼〕A 〔文章編號〕1008-0821(2009)08-0166-03
Strategies of Improving Literature Search Efficiency by Library OPAC SystemDong Li1,2 He Junwei2 Si Yun2 Liu Rong2
(1.School of Information Management,Wuhan University,Wuhan 430072,China;
2.Library,Dali University,Dali 671000,China)
〔Abstract〕This paper pointed out the cause of document search with lower efficiency through OPAC system and analysed the problems of MARC data,and finally put forwards the measures of improving literature search efficiency by library OPAC sys tem.
〔Key words〕library OPAC system;MARC data;literature search efficiency;strategies;access point
OPAC是英文 Online Public Access Catalogue 的縮寫,即聯機公共檢索目錄,是供圖書館讀者查詢館藏資源的聯機目錄檢索系統#65377;它改變了過去利用卡片目錄手工檢索館藏文獻的狀況,通過計算機網絡對館藏的信息資源進行檢索,是現代圖書館檢索信息資源的重要工具#65377;
OPAC作為圖書館計算機集成管理系統的核心組成部分,集中體現了圖書館文獻組織的成果#65377;它不但是圖書館開展各項工作的基礎和前提,同時也是現代圖書館向讀者提供館藏書目查詢最重要的途徑和網絡服務項目之一#65377;它的檢索功能是否強大,顯示的內容是否全面,很大程度上影響到用戶對圖書館的評價和館藏資源的利用率和保障率#65377;
但是,讀者通過OPAC進行館藏資源查詢時,檢索效果卻常常不盡人意,不是檢索出大量無關結果,讓人難以選擇;就是返還結果為“零”,讓人十分沮喪和失望#65377;造成誤檢#65380;漏檢的結果有多方面的原因,如集成管理系統本身也存在一定的原因#65377;本文則主要從MARC數據制作方面的問題來探討造成誤檢#65380;漏檢的原因,這是導致書目數據庫混亂和OPAC系統檢索效率低的最主要原因#65377;
1 MARC數據著錄中存在的問題是造成圖書館OPAC檢索效率低的主要原因
圖書館的書目數據庫是由無數條MARC記錄構成的,MARC即Machine-Readable Catalogue,機器可讀目錄,是現代圖書館利用計算機組織文獻的手段#65377;如果其數據制作中存在問題,將直接造成圖書館目錄體系的混亂和讀者的誤檢和漏檢#65377;以下是目前圖書館MARC數據著錄中存在的主要問題#65377;
1.1 MARC格式中重要字段著錄的遺漏
所謂重要字段,主要是指題名#65380;著者與主題詞等這些讀者檢索中最常用的檢索途徑[1],未在MARC格式中相應的生成這些檢索點的字段進行著錄,結果是讀者通過OPAC檢索時查不到這些書,極大地影響了圖書館文獻資源的流通和利用,降低了文獻資源的保障率#65377;
如CNMARC格式中,有的圖書館在遇到并列題名以及其他多種題名(封面題名#65380;書脊題名#65380;叢書題名#65380;原文題名等)時,僅僅只在“200題名責任”字段做版權頁的正題名,而沒有在4-5這些能夠生成檢索點字段進行相應其它題名的著錄或字段的復制,導致目錄的檢索功能大為降低#65377;例如,“英文原版教材”是一個重要的檢索詞和檢索途徑,但是在大理學院的OPAC檢索中,無論用“題名”還是“文獻名”檢索項,均不能檢出一本,其實該館有不少這方面的藏書#65377;漏檢的原因是:“225叢編項”字段是對文獻叢編的客觀性描述,它本身是不可檢索的,其檢索點形式記錄在連接款目410字段和461字段[2]#65377;如果數據中遺漏4-字段的著錄,就不能檢出以叢書名為檢索詞的文獻#65377;所以,未進行生成檢索點字段的著錄就造成了漏檢#65377;
1.2 MARC格式中字段著錄的混亂和錯誤
如翻譯者的字段著錄,有的著錄在“701人名等同”字段,有的著錄在“702人名次要”字段;還有的在著錄生成檢索點的字段701的外國著者時,人名前加上國名,或原文姓名不進行倒置等等,都導致目錄匯聚同一責任者文獻的功能減弱,造成讀者從著者途徑檢索時查不到某一著者的大量著作#65377;比如,用大理學院圖書館的OPAC檢索英國著名女作家J.K.羅琳(J.K.Rowling)(《哈利#8226;波特》系列書作者)的著作,在“作者”項進行館藏書目的查詢,返還的4個結果沒有一個是《哈利#8226;波特》系列書之一,而是中國人名為“羅琳”主編的書,或是美國的“羅琳斯”的著作;用作者原名“Rowling”檢“中文圖書”,則返還結果為“零”,其實該館收藏了不少此作家的《哈利#8226;波特》系列書,用翻譯名“羅琳”檢索不出的原因是因為在“701人名等同”,這個生成檢索點的字段,著錄為“(英)羅琳”, 加上了國名;并且因為沒有復制一個“701人名等同”字段來著錄作家的原名“Rowling”,就造成了以上漏檢的結果#65377;
1.3 MARC格式中字段指示符使用的不正確
如“200題名責任”字段的指示符1是題名檢索意義指示符,當它取值0時,表明本字段的題名信息(@a)不作檢索點,當它取值1時,本字段的題名信息(@a)才能作為檢索點#65377;但是在套錄編目時,編目員往往不注意此處的指示符,也會對檢索造成問題#65377;
1.4 多余的MARC數據
是指完全相同圖書卻有2條或更多的MARC數據,如,查大理學院圖書館的金盤書目檢索系統,《鹿苑長春》有3條MARC數據記錄,其實這3條記錄都指向同一本書,索書號也完全相同,都是I712.45/6014;有時,多余的MARC數據還存在或分類號的不同,如《藥用高分子材料學》有2個號:R94/8727和TQ31/8727;或區分號的不同,如《現代英語慣用法簡明詞典》:H316/2124和H316/2124/1982#65377;以上這些情況造成了書目數據庫的冗余龐大#65380;讀者檢索的噪聲#65380;分類查重工作的障礙以及編目員的無所適從#65377;
此外,MARC格式著錄中還存在其它問題,如錄入文字的錯誤#65380;無法調出的字忽略不著錄且不加任何說明#65380;隨意添加空格以及全角/半角#65380;英語/漢語等不同情況下不加注意的著錄等,都會影響到書目數據的規范和質量,造成讀者檢索時的漏檢和誤檢#65377;為了避免這些問題的出現和找到針對性強的解決策略,有必要對其產生的原因進行分析#65377;
2 書目數據存在問題的原因分析
2.1 突擊加工,無暇顧及MARC數據質量
比如說,高校圖書館為了迎評,要達到評估指標對紙質圖書的數量要求,必須在短期內購入大量的圖書#65377;在分編任務繁重的情況下,只能追求分編#65380;套錄工作的速度,趕進度的結果是無暇顧及書目制作的質量問題#65377;
2.2 編目規則的滯后
首先,由于我國圖書著錄標準發展滯后,致使制作編目數據的機構和書商各行其是,這是造成著錄標準不統一#65380;著錄內容不規范的主要原因之一#65377;其次,著錄規則源于編目實踐,某些具體規定只能不斷從編目實踐中總結#65380;提升[3]#65377;這樣著錄規則落后于編目實際,就導致了數據的不一致現象#65377;
2.3 編目規則的變動和缺乏可操作性
首先,為了適應科學技術發展引起的出版物變化,文獻的分編規則只能不斷的修訂#65380;改動;其次,所有的分編規則都不可能囊括實際分編工作中遇到的各種具體現象,并進行具體的操作指導#65377;此外,分編規則本身也不是完美無缺,也存在制定的規則前后矛盾或不統一等現象#65377;這在某種程度上導致了館藏書目數據的混亂#65377;
2.4 分編人員專業水平的局限和對分編規則的理解各異 實際編目中,由于各個分編人員專業知識水平高低不同,看問題的角度不同,自然對規則的理解也各不相同,往往會出現對同一文獻的描述#65380;著錄不一致#65377;
2.5 缺乏專門人員進行數據維護
從實際工作的角度說,由各類人員編制的書目數據存在問題是必然的,就是再仔細#65380;責任心再強#65380;專業知識再多的人,也不可能保證制作的數據完美無缺;加上回溯建庫#65380;突擊加工#65380;多館合并#65380;規則變動等種種客觀因素和條件限制,致使書目數據庫存在各種問題,而且這些問題只能在投入流通使用之后才逐步顯現出來#65377;如果對出現問題的數據缺乏專門人員及時修正#65380;進行維護,那么,越往后書目數據庫的混亂現象會更加嚴重#65377;
2.6 對院系資料室的共享數據缺乏指導
高校文獻資源實行共享后,各系#65380;院資料室所藏文獻的MARC數據就納入了圖書館的OPAC檢索系統#65377;因為這部分資源的書目數據一般由系#65380;院資料員制作,他們的分編知識自然不能和專業的圖書館員相比,而圖書館又常常忽略對其進行專業上的指導,所以,數據出現問題的可能性較大,這也是造成書目數據混亂的一個因素#65377;
3 提高圖書館OPAC檢索效率的策略
提高OPAC檢索效率最根本的方法,是保證每一條新做的MARC數據都以較高的質量進入書目數據庫,并且還要對歷史遺留的問題數據記錄進行修改,理順整個目錄體系,才能讓讀者通過圖書館的OPAC進行高效率的檢索,獲得較高的查全率和查準率,提高讀者滿意度和館藏資源的利用率#65377;
3.1 分編人員應牢固樹立“從讀者檢索的角度”進行文獻編目的意識 機讀目錄與傳統的卡片目錄相比,最大的優勢在于通過MARC格式的字段著錄能提供更多的檢索途徑,其強大的檢索功能是卡片目錄遠不能及的#65377;但是,要發揮好計算機檢索的優勢,前提是分編人員必須牢固樹立“從讀者檢索的角度”進行文獻編目的意識#65377;站在讀者檢索的角度對文獻進行描述要求我們:進行文獻編目時務必注重生成檢索點字段的著錄;在客觀著錄原則與讀者檢索習慣沖突時,選擇讀者檢索習慣用詞作為檢索點入口詞進行著錄#65377;
增強書目的檢索功能,為讀者增加更多更有用的檢索點,也是近年來盛行于國際編目界的觀點,如《FRBR》(《書目記錄的功能需求》)和《the Statement of International Cataloguing Principles》(《國際編目原則聲明》,俗稱法蘭克福原則)等國際編目規則條例,主張將目錄功能擴展到發現#65380;識別#65380;選擇#65380;獲取和導航[4]#65377;
3.2 制定詳細的分編規則
由于分編規則的滯后#65380;變動#65380;缺乏可操作性以及各館服務對象#65380;學科設置的不同#65380;藏書組織的具體性和分編人員的變動性等原因,制定適用于本館計算機軟件的分編細則很有必要,有助于規范來源不一#65380;質量參差的套錄數據,保證數據制作的質量#65377;
3.3 重視分編人員專業技能的培訓,提高書目制作質量 只有具備較高專業素質的人員才能保證書目制作的質量#65377;尤其是面對當今日新月異的信息技術以及國內外編目理念的變化,更應注重對分編人員進行專業技能的培訓,這是提高編目數據質量的重要保證#65377;
3.4 注重收集實際使用中的錯誤數據,并設專人進行數據維護 由于編目數據存在錯誤的不可避免以及當時不易發現,只能通過讀者的查詢和圖書館的各項服務工作來檢驗和發現,所以各服務部門應注意收集和記錄平時使用中的錯誤數據,并且圖書館應設專人進行數據維護[5],其職責是對新入庫的MARC數據進行審校和對反饋回來的錯誤數據進行修改#65377;此外,此人還負責對系#65380;院資料室的文獻分編進行指導#65377;這樣有利于達到優化數據#65380;理順目錄體系#65380;提高OPAC檢索效果的目的#65377;
3.5做好規范控制工作
規范控制(Authority Control),又稱為權威控制,是為確保標目(檢索點的形式)在檢索款目及書目系統中的惟一性和穩定性,而建立#65380;維護#65380;使用規范款目和規范文檔的工作過程[6]#65377;這是從根本上提高OPAC檢索效率的手段#65377;我國編目界這方面的工作比較薄弱,一貫重視對文獻進行客觀描述,而忽視文獻之間的橫向關聯,導致存在大量同書異名#65380;同名異書#65380;同人異名#65380;同名異人的情況[7],極為影響檢索的效率和準確率#65377;我國應盡快建立如美國LC[8]那樣供所有圖書館共享的規范記錄數據庫,這將有利于各圖書館做好規范控制工作#65377;總之,我們應充分利用計算機管理系統的優勢,不斷提高MARC數據制作的質量,盡量完善各個有價值的檢索點,確保能從每一個可能的角度和途徑檢索到文獻,為讀者提供高效率的OPAC檢索,提高圖書館文獻資源的利用率#65377;
參考文獻
[1]王紹平,湯莉華.OPAC vs搜索引擎——從上海交大看我國高校師生的信息獲取行為[J].大學圖書情報學刊,2008,(2):63-68.
[2]陳立紅.從檢索角度談410字段和461字段的著錄規則[J].晉圖學刊,2005,(6):49-51.
[3]文榕生.文獻編目再論[J].中國圖書館學報,2007,(3):103-106.
[4]胡小菁.“國際編目原則聲明”研究[J].大學圖書館學報,2005,(9):57-59.
[5]孫秀娟.現代圖書館的數據維護[J].航海教育研究,2006,(1):107-109.
[6]黃俊貴.規范控制概說[J].高校圖書館工作,1999,(3):1-8.
[7]馮亞惠.我國圖書館目錄規范控制的分析研究[J].圖書情報工作,2007,(8):102-104.