999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

MarcEdit在MARC數據庫質量管理中的應用

2010-05-03 08:50:34姚曉鋒嘉興學院圖書館浙江嘉興314001
圖書館建設 2010年1期
關鍵詞:數據庫圖書館內容

姚曉鋒 (嘉興學院圖書館 浙江 嘉興 314001)

隨著圖書館自動化水平的不斷提升,圖書館的在線服務功能也在不斷增加,越來越多的讀者選擇利用圖書館的網站來滿足自己的信息需求。然而,不管這個過程達到了何種程度的飛躍,圖書館基礎服務和在線服務的柱石依然是自身的MARC數據庫。MARC數據庫質量的優劣直接影響到讀者的檢索使用效率和數據資源共享的實現。因此,MARC數據庫質量管理是圖書館工作的一個重點。

隨著自動化建設、讀者需求和資源共享等形勢的不斷變化,原有的書目記錄已經不適應于當前的需要,如描述過于簡單、著錄不規范、標引錯誤等,這就涉及到書目質量的管理問題。這些缺陷如果得不到及時解決,將會嚴重影響到讀者的檢索和資源的共享。這樣一來,工作人員就必須面對大批量的MARC數據修改任務。雖然國內有些圖書館自動化系統已經集成了某些批處理的功能,如北京清大新洋信息技術有限公司的圖書館管理軟件“通用圖書館集成系統”(General Library Integrated System,簡稱GLIS),能夠實現一些批量修改的任務,但由于其功能不是很完善(只提供字段的添加、刪除和內容的替換)[1],很多批量修改任務無法完成。有幸的是,一個新型的MARC數據編輯工具——MarcEdit已被開發出來,它可以讓工作人員簡單快捷地完成批量修改的任務。本文主要探討如何利用MarcEdit工具完成MARC數據的批量修改任務,以有效地對MARC數據庫進行質量管理。

1 MarcEdit的背景

MarcEdit最初的構思主要是針對美國俄勒岡州立大學圖書館的電子目錄數據庫清理項目。這個項目的主要問題在于系統中有太多需要清除的無效記錄。而面對數量如此龐大的清理任務,美國國會圖書館(Library of Congress,簡稱LC)現有的MARCBreakr或者MARCMakr工具顯然已經無法勝任,必須要有一個功能更強大的工具。為此,美國著名編目人員Terry Reese(俄勒岡州立大學圖書館網絡和數字資源編目負責人)帶領著他的團隊,在MARCBreakr和MARCMakr的基礎上開發了一個新型的MARC數據編輯工具——MarcEdit,從而非常輕松地完成了數量龐大的清理任務[2]。

MarcEdit自問世以來,因其便捷的操作和強大的批處理功能在國外圖書館界受到了相當多的關注,許多圖書館已經開始將MarcEdit納入其自動化系統。俄勒岡州立大學圖書館首先運用MarcEdit完成了電子目錄數據庫的清理任務。隨后,賓州州立大學圖書館也采用了MarcEdit,從而加快了電子和縮微資源MARC數據庫的建設任務[3];密歇根州立大學圖書館也相繼采用了MarcEdit,解決了批下載MARC數據時因編碼錯誤而無法繼續操作的問題[4]129-131等。MarcEdit能在短時間內被圖書館界所接受并采用,足以證明它在批處理方面的功能是極為強大的。

2 MarcEdit的批處理功能

MarcEdit是一款功能強大的MARC數據編輯工具,專門為批量編輯MARC記錄而研制,適用于各種MARC格式,具有編輯數量大、編輯功能多的特點。其批處理的主要功能有數據有效性統計、字段核對、內容替換、字段和子字段編輯、指示符編輯、字段交換等。

2.1 數據有效性統計——MARCValidator

數據有效性統計是一個比較特別的功能,它主要用于驗證MARC數據是否有效。用戶可以自己制定有效數據的規則,比如哪些字段是必備的,哪些字段是不需要的,哪些字段是可以重復的,哪些字段是不可以重復的,哪些子字段是必備的,相應的指示符是什么,哪些子字段是不需要的,等等,然后將數據庫中的MARC數據與此規則進行核對。通過這個功能,用戶可以詳細地了解MARC數據庫的質量情況,并根據實際需要進行批量修改。

2.2 字段核對——RobertCompare

字段核對是另一個比較特別的功能,主要用于核對MARC數據中的某些字段。用戶只需制定出某個字段的標準格式,然后在書目數據庫中進行核對即可。通過這個功能,用戶可以充分了解MARC數據庫中的款目標引情況,并制定出一個標準形式對款目標引進行批量修改。比如可以將“James David Kiley”、“James D. K.”、“James D. Kiley”、“James David K.”這些混亂的個人名稱標引統一成“James David Kiley”的形式,這樣就避免了名稱標引的混亂。

2.3 內容替換——Replace

內容替換功能可以對MARC記錄中任何位置的數據內容進行批量替換。用戶只要簡單地輸入替換和被替換的文字,點擊“替換”就可以輕松地完成批量替換任務。此功能可以修改MARC數據中一些常見的文字錄入錯誤,但是由于替換面太廣,替換時必須考慮周到,以免將一些原本無需修改的內容也同時替換掉。

2.4 字段和子字段編輯——Edit Fields/Edit Subfields

字段和子字段編輯功能允許對MARC記錄中的字段進行批量的添加或刪除,也允許對子字段進行批量的添加或刪除,同時還允許批量替換子字段中的相關內容。

2.4.1 批量添加字段、子字段

通過批量添加字段、子字段,可以完善MARC數據庫中的簡編數據,使它更完整、更精確。比如可以在856字段中批量添加嘉興學院圖書館的統一資源定位地址(見圖1)。

2.4.2 批量刪除字段、子字段

通過批量刪除字段、子字段,可以清除MARC數據中一些冗余的內容,讓MARC數據顯得簡明。比如將本單位不需要的杜威十進分類號刪除,以免過多的分類號讓讀者感到困惑。

2.4.3 批量替換子字段內容

通過批量替換子字段內容同樣可以修正文字錄入錯誤,而且修改面相對比較窄,替換的結果將更加精確,能減少錯誤替換的發生率。比如將300字段的$c中的所有“CM”全部替換成“cm”(見圖2)。

2.5 指示符編輯——Edit Indicators

指示符編輯功能允許對指示符進行批量修改,不僅允許用戶批量修改某子字段的指示符,還允許用戶對某指定內容的子字段指示符進行批量修改。比如以“An”打頭的題名,排檔時應將這個詞排除在外。如果因為一時疏忽而沒有當時準確定義指示符的話,可以對這些指示符進行批量修改(見圖3)。

2.6 字段交換——Swap Fields

字段交換功能允許將某個字段的內容移動到另一個字段,實現字段內容的批量交換。利用這個功能可以修正字段著錄不規范的問題,比如西文多卷書著錄時,如果分卷題名有檢索意義的話,則不能著錄在500字段,而應當著錄在505字段。如果已經著錄在500字段,那么可以將此字段$a子字段的內容移動到505字段$g子字段,并將第二指示符定義成增強級(見圖4)。

除此以外,MarcEdit還有一些其他的功能,比如元數據的自動獲取、元數據格式和MARC格式的相互轉換[4]121-127等功能。這些功能對圖書館的在線服務而言,無疑也具有非常重大的意義。特別是將一些描述電子資源的元數據轉換成MARC數據后,同樣支持批量修改操作,以完善和修正元數據對數據的內容描述,這對于MARC數據庫建設而言也是十分重要的。

3 MarcEdit應用實例

3.1 MARC數據庫的垃圾清理

嘉興學院圖書館在清理MARC數據庫時發現,數據庫中竟然有超過1萬條的垃圾記錄需要清理。面對如此龐大的清理任務,工作人員用逐條清理的方式在短期內顯然無法完成。為了盡快完成MARC數據庫的清理任務,工作人員采用了MarcEdit批處理工具,運用其數據有效性統計功能模塊——MARCValidator,按照自己制定的有效數據規則,將數據庫中所有的垃圾數據導出并將它們刪除,僅花了幾個小時的時間,就完成了數量如此龐大的清理任務。

3.2 MARC數據庫的修改完善

嘉興學院圖書館曾幾經合并(由浙江經濟高等專科學校圖書館、金庸圖書館、浙江會計學校圖書館、嘉興衛生學校圖書館等合并而成),由于原來各個圖書館的編目規則不一致,導致MARC數據庫中的書目數據相當混亂,亟需修改完善。據MarcEdit的有效性統計發現,庫中竟有35 000多條記錄需要修改。在以往,如此巨大的數據修改任務對工作人員而言簡直是一種災難。通過利用MarcEdit強大的批處理功能,工作人員不到一個星期就輕松快捷地完成了修改任務,從而也有了充足的時間去驗證這些已修正過的錯誤數據。

3.3 建設電子資源MARC數據庫

嘉興學院圖書館的工作人員在建設電子資源MARC數據庫時發現,下載的MARC數據在導入數據庫前大部分都需要修改,如從聯機計算機圖書館中心的WorldCat上下載的數據都沒有949字段,但是自動化系統卻要求必須具備此字段,還有像排字錯誤、某些字段內容必須移動到另外一些字段、指示符的修改等,問題非常多。使用MarcEdit工具后,工作人員輕松地完成了全部MARC數據的修改工作,成功地將WorldCat上的MARC數據導入到本地的自動化系統,加快了電子資源MARC數據庫建設的進程。

4 結 語

當然,任何一種工具都不可能是完美的,MarcEdit也不例外,比如MARC數據的導入導出就比較麻煩。針對這個問題,如果能將MarcEdit嵌入圖書館的自動化系統中,那么MARC數據庫的質量管理就會變得更加簡單快捷。例如,為圖書館提供Koha[Koha是新西蘭Horowhenua Library Trust(一個社團組織)開發的整合性圖書館自動化系統]服務的美國LibLime公司就曾經應圖書館的要求提出了13項最迫切的構想,其中一項就是將MarcEdit整合入Koha[5]。相信隨著信息技術和圖書館自動化管理手段的進一步發展,一系列新型的功能更強大的工具將會被不斷地開發出來,人們對MARC數據庫的管理手段也會不斷加強和提升。

[1]劉泳潔.提高機讀目錄數據庫質量的有效途徑[J].圖書館工作與研究,2005(5):47-49.

[2]Reese T. MarcEdit——Your Complete Free MARC Editing Utility[EB/OL].(2009-04-16)[2009-05-20].http://oregonstate.edu/~reeset/marcedit/html/about.html.

[3]Mugridge R L, Edmunds J. Using Batchloading to Improve Access to Electronic and Microform Collections[J].Library Resources &Technical Services,2009(1):53-61.

[4]Reese T. Automated Metadata Harvesting: Low-Barrier MARC Record Generation from OAI-PMH Repository Stores Using MarcEdit[J].Library Resources & Technical Services,2009(2).

[5]毛慶禎.Koha在臺灣的應用——GPL授權的整合性圖書館系統[EB/OL].(2007-10-24) [2009-05-28].http://blue.lins.fju.edu.tw/~mao/works/20071024.htm.

猜你喜歡
數據庫圖書館內容
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
數據庫
財經(2017年2期)2017-03-10 14:35:35
飛躍圖書館
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
圖書館里的是是非非
去圖書館
主站蜘蛛池模板: 另类欧美日韩| 婷婷综合色| 一级黄色欧美| av无码久久精品| a级毛片免费播放| 国产青青草视频| 免费无码网站| 2021亚洲精品不卡a| 亚洲人成色77777在线观看| 亚洲国产综合精品一区| 精品人妻无码中字系列| 老司机精品久久| 色天天综合| 亚洲精品第五页| 亚洲色精品国产一区二区三区| 久久久久中文字幕精品视频| 国产午夜福利亚洲第一| AV网站中文| 91在线视频福利| 欧美一区精品| 色偷偷av男人的天堂不卡| 国产成人精品视频一区视频二区| 最新国产网站| 在线免费无码视频| 亚洲h视频在线| 九色国产在线| 日韩天堂在线观看| 视频一区亚洲| 午夜一级做a爰片久久毛片| www.亚洲国产| 国产在线精品人成导航| 欧美在线视频不卡| 综合色在线| 99久久国产综合精品2020| 国产精品入口麻豆| 日本午夜影院| 香蕉视频国产精品人| 色婷婷成人| 亚洲电影天堂在线国语对白| 2021国产乱人伦在线播放| 亚洲乱码视频| 永久成人无码激情视频免费| 色欲色欲久久综合网| 五月婷婷亚洲综合| 国产凹凸视频在线观看| 久久网欧美| 国产高清毛片| 久热re国产手机在线观看| 日韩免费毛片视频| 色欲不卡无码一区二区| 久久国产精品影院| 国产一级精品毛片基地| 91精品免费高清在线| 91久久性奴调教国产免费| 久久精品女人天堂aaa| 香蕉99国内自产自拍视频| 亚洲中文字幕无码爆乳| 全部毛片免费看| 好吊色妇女免费视频免费| 国产精品无码一二三视频| 婷婷亚洲视频| 无码一区18禁| 思思热在线视频精品| 日韩午夜福利在线观看| 热99精品视频| 国产成人综合日韩精品无码首页 | 91视频青青草| 天天操精品| 欧美日本在线观看| 欧美中文一区| 91视频首页| 91视频区| 久久精品aⅴ无码中文字幕| 欧美福利在线| 亚洲国产成人在线| 日韩av在线直播| 99精品福利视频| 国产精品va免费视频| 婷婷色狠狠干| 毛片免费试看| 中文字幕久久波多野结衣 | 日韩最新中文字幕|