文榕生
【摘要】探討CNMARC是圖書館學研究的重點與熱點之一,文章對CNMARC字段隨著修訂而不斷增設情況進行調查、分析,對某些相關觀點進行商榷,并提出在網絡環境下統籌考慮進行刪、減、改、并,達到精簡字段,易于操作,方便利用的目的。
引言
對文獻資源的收集、組織管理、開發與提供利用是圖書館的特長技能,古今中外概莫能外,也是新興的社會其他行業目前仍然無法完全取代的。不少圖書館往往把提供文獻與參考咨詢等直接面向用戶的工作比作“前臺”,而注重這方面服務的優劣是圖書館形象。那么,如果忽視對文獻資源的科學收集與組織管理等扎扎實實的“幕后”工作支撐,勢必造成“前臺”的巧婦難為無米之炊,只能想方設法推擋、敷衍。筆者檢索維普“中文科技期刊數據庫”的情況證實了這一點。
根據2000-2004年發表的“編目”類論文看(見圖1):數量持續增長,5年間就達到3.4倍,反映圖書館界對本行業特長技能的關注;論文內容相當大部分是涉及CNMARC問題,反映出這方面依然是研究的熱點之一;尤其是已有個別探討簡化機讀目錄著錄方面問題的文章出現,是值得注意的傾向。但就筆者所見,探討簡化機讀目錄著錄的文章中,也存在某些值得商榷的問題,愿拋磚引玉,作如下分析。
自上世紀90年代初我國開始應用CNMARC以來,在國內迅速普及,已經成為圖書館書目數據的主流形式之一。參考國際上各種MARC格式的發展,結合中文文獻實際,CNMARC不斷修訂,從1990年的首次、1996年作為行業標準和2004年最新修訂的3次情況看:
(1)名稱基本穩定。除了“著錄信息塊”在初版稱為“著錄塊”外,各功能塊的名稱沒有變更。
(2)字段增加的總趨勢。1990年版最初設置125個字段;1996年版成為157個字段,增加32個字段,增幅25%;2004年版達到184個字段,又增加27個字段(“前言”統計有誤,660字段初版就設置),較初版增幅47%。
(3)某些功能塊相對穩定。“責任者塊”、“國際使用塊”和“國內使用塊”在1990年版和1996年版時處于穩定狀態,而“著錄信息塊”則在1996年版和2004年版處于穩定狀態。
(4)個別調整。原設的“國內使用塊”僅有1個字段,2004年版不再作統一規定,實際上這個功能塊還是存在。取消了原設的“093 專利號(待定)”。686字段原為“其它分類號”,現專用為“外國其他分類法分類號”,同時增設對應的“696 國內其他分類法分類號”。
辯證看待CNMARC字段
由于CNMARC僅設置的字段就有184個,還有大量的子字段,而使人望而生畏,需要改革,這固然有一定道理。但某些文章提出簡化計算機編目的具體看法值得商榷:
(1)用其他元數據取代。相當一段時間,某些人將被熱炒的DC(都柏林核心元素數據集)誤稱為“元數據”,而實際上它只是元數據之一。正如“MARC”原意為美國國會圖書館始于1964年的關于機器可讀目錄的研制計劃(Machine Readable Catalogue Project),現一般被作為機讀目錄格式的簡稱,它也是元數據之一。CNMARC是MARC系列中更適宜中國圖書館以及相關機構使用的機讀目錄格式,正由于DC實際上無法取代它的優勢,并且二者各有千秋,才使得人們更加理智地認為兼容是更妥當的方式,而不能隨意采取釜底抽薪——取代做法。
(2)著錄信息的詳簡級次。對著錄采取不同的詳簡級次的作法并非新觀點,1983年發布的國家標準《文獻著錄總則》中就有所區別,國外的類似提法也都有各自具體情況。同時,我們應當清醒地認識到網絡環境下文獻資源的共建共享現實與未來。文獻檢索的“查全”、“查準”都與著錄信息的詳簡程度密切相關,我們不難在網上看到上世紀制作的一些簡單著錄信息的數據已經影響到今天的檢索、判斷,不得不要對其進行修補、維護。盡管著錄信息的多少并不等于書目數據質量的優劣,但過于簡單的著錄信息影響CNMARC功能發揮則是毫無疑義。
(3)只是存取方式先進而已。機讀目錄與傳統目錄相比,在基本著錄項目上并沒有多大變化,只是存取方式先進而已的認識是片面而膚淺的。一方面,描述、檢索、統計是書目的基本功能。比起書本目錄的固化,卡片目錄從理論上說,可以根據不同目的而靈活、機動地進行組織與組合,但往往限于人、財、物、時間、空間等而難以實現一些功能或不得不降低實現一些功能的程度。機讀目錄則可以大大釋放出卡片目錄被抑制的、便于圖書館組織管理與用戶利用的基本功能,有作者較詳盡地論述了機讀目錄的原理與功能,不復贅述。另一方面,MARC是在卡片目錄基礎上的發展,并且還有相當一段共存以致于后者逐漸隱退。為避免給用戶造成認識、使用困難,保持基于長期總結、固化的一些著錄信息的穩定性是必要的。
(4)只著錄有“實際檢索意義的字段”。有人認為著錄索書號、第二責任者、叢書名等信息意義不大,異議者則認為“這種觀點過于簡單化……會影響讀者判斷的準確性,降低其檢索效果”。索書號是組織管理圖書的重要代碼,也是讀者最終索取圖書的重要依據;利用索書號中的分類號,還便于擴大或縮小查找相關類目圖書。據調查國家圖書館,某些世界名著的不同版本就有數百種,而第二責任者則是鑒別與查準的要素之一。
(5)目錄隨著開架借閱處于次要地位。開架借閱在某種程度上確實使書目數據處于輔助作用,但圖書館員對圖書的組織管理依然主要依賴于書目數據,網絡環境下的遠程檢索更是離不開書目數據。《中國植物志》80卷126分冊,如果省略了分冊書名(按照編目規則只著錄書名頁上的信息是可以的),讀者如何識別相關植物的“門”、“綱”、“目”、“科”、“屬”等情況?
(6)期刊的著錄比圖書簡單。期刊數據庫的迅速發展,使得圖書館亦可不再重復揭示期刊中包含的各篇文獻信息,但是期刊的名稱、內容、刊期等動態變化則是絕對的,故CNMARC中為其設置的字段甚至比圖書的還要多。
(7)字段多。盡管設置有184個字段,有的可以重復使用;但是它們是立足于處置各種類型文獻的不同情況。如果按照不同文獻類型使用的字段看,相關字段的數量將大大縮小,常用字段更是屈指可數(通常不超過20個字段)。
對CNMARC字段的改革
CNMARC字段設置的不斷增加,既有與時俱進的合理性,也存在一些日益繁瑣、不利操作的現象,需要改革。
(1)歸并相似字段。如果說CNMARC有些字段是相似的[例如“010國際標準書號(ISBN)”、“011國際標準連續出版物號”、“040 CODEN(連續出版物)”與“091”],但由于它們是處理不同歷史時期或形式的標準代碼,尚有分別存在的道理。那么,“014 論文標識號”與“073 國際論文號”之間,或它們與010、011之間有所重復或交叉,宜采取歸并措施以簡化字段。尤其是結構復雜的代碼,不僅實用價值不大,而且容易出差錯。再如,“410 叢編”、“411 附屬叢編”與“461 總集”、“462 分集”是2對反映文獻層次關系的相似字段,也是容易混淆的。
(2)減少重復字段。“資料特定細節項”既不用于檢索,也不用于統計,只是承當用于識別、鑒別的描述作用,設置一個公共字段足矣(如同“題名與責任說明”通用200字段)。而CNMARC在初版207字段后,又增設206、208、230字段,是否必要?值得商榷。
(3)減少說明性字段。“附注塊”并不用于檢索或統計,主要是用于著錄一些需要說明的情況(并非必備),設置1個(在初版就明確300字段可以代替301至315任何字段)或少數幾個字段就可以處置相關信息。但是CNMARC也是一再細化、增設字段,目前達到35個字段。可否將值得說明的情況集中,字段較大規模壓縮?
(4)減少已被涵蓋或交叉性字段。“主題分析塊”所初設的字段已經比較全面地兼顧語詞、代碼方面反映文獻的主題。盡管其中“610 非控主題詞”比較穩定,但筆者還是建議將其改稱為更加明確的“關鍵詞”;因為與其對應的606字段名稱很不穩定(初版稱“普通主題”,1996年版為“學科名稱主題”,最新版又改名為“論題名稱主題”),倒不如稱為“敘詞”更明確。尤其是“616 商標主題”,往往已經在文獻的某字段中反映過了,沒必要在此重復。
(5)合并某些非統計性的檢索字段。CNMARC固然有比卡片目錄更多的檢索途徑,即使將同一檢索途徑中的內容梳理、細分成不同字段,也是殊途同歸。以題名為例,有正題名、分題名、交替題名、合訂題名、叢編題名、統一題名、封面題名、書脊題名……,都是通過“題名”這一檢索窗口而不是細分的對應窗口實現的。(6)減少或壓縮與檢索性字段重復的字段或子字段。著錄信息重復理應精簡,但要具體分析、對待。一種情況是鑒別與檢索:如200字段中$f和$g與7—字段都是著錄責任者信息。筆者認為在CNMARC中,7—字段可以突破“著錄不過三”的卡片目錄著錄常規(這正是CNMARC優勢所在),擴展檢索;200字段中$f和$g則可以只取“排名第一者”(不宜取消),用于鑒別。另一情況是一字段的功能可以覆蓋另一字段:如225與410字段都用于叢編,前者只是描述性顯示,而后者既可作為檢索點,又可生成附注。
結語
據統計,2003年我國正式出版圖書190 391種,其中新版圖書110 812種[11],使得文獻編目的工作量不斷增大。優質、高效地編制書目數據是圖書館員的責任,但這項工作涉及到多方面,并不是某些人認為的“外包”(因為總有本館特定的文獻需要編目員處置)、“改換元數據”、“只著錄有實際檢索意義的字段”等那樣簡單。
簡化編目固然是為了提高編目工作效率,但值得注意的是不能降低CNMARC的描述、檢索、統計功能,影響用戶使用。這就需要統籌考慮進行刪、減、改、并,達到精簡字段,易于操作,方便利用的目的。