●康 艷,衡中青
(1.金壇市圖書館,江蘇 金壇 213200;2.佛山科學技術學院 圖書館,廣東 佛山 528000)
年鑒是一種資料密集型工具書。新中國“年鑒熱”始改革開放后,發展十分迅速,從1980年的6種發展到2010年的3000種。[1]然而,年鑒索引發展與年鑒的發展極不相稱。據統計,目前國內出版的各類年鑒中,編制較為規范的索引的可能連20%都不到。[2]年鑒索引呈下列狀況:一是有索引的年鑒少,二是編制規范的年鑒索引更少。本文通過論文統計與分析的方法來考察近年關于年鑒索引研究的概況,包括年鑒索引編制技術、機編年鑒索引等,并對國內年鑒索引研究存在的問題提出一些看法。
據統計,1991~2010年共計發表40篇關于年鑒索引的論文(見圖)。2000年以前發表17篇,呈不均勻分布,如1998年集中發表10篇,而1992、1994~1996年卻沒有論文發表,說明在1998年前后,年鑒索引的研究曾達到一個高峰。2000年以后共計發表論文23篇,分布相對均勻;幾乎每年都有1~3篇關于年鑒索引的論文發表,其中以2010年發表最多(5篇)。可見,年鑒索引正在逐漸被重視,并開始進入穩步發展的時期,但研究的力度還需加強。
本文按照理論研究、實踐經驗、機編索引、標準制定、其他內容對研究內容進行分類統計(有的論文可能涉及多項內容)。目前國內年鑒索引還多集中于理論研究(占48%),其中部分來源于年鑒編輯在實踐過程中總結的經驗(占24%),其次是對機編索引技術的研究(占24%)。可以說,國內對年鑒索引的研究以理論為主的,同時也在不斷嘗試和探索更有效的編制技術,特別是對計算機技術的利用。
從作者情況來看,其單位性質為年鑒編輯部、圖書館、高校學者。詳見表。
從表可知,論文數量最多的來自于各年鑒編輯部,這是由于年鑒索引的編制大多是由年鑒編輯完成,他們經驗豐富,撰寫的論文數量也最多。其次是高校圖書館等科研機構的研究人員,有的親身參與索引編制,探討索引的技術,甚至開發了應用軟件;有的則是從理論角度論述年鑒索引的編制方法。然而年鑒編輯和圖情專家在索引編制上卻還沒有很好地結合,導致了在對索引的一些概念界定上兩者存在一定的分歧。如果將雙方的工作結合起來,那么前者的實踐經驗和后者受控語言及索引學的知識,將會在很大程度上提高年鑒索引的質量。
另外,論文作者主要集中于江蘇省(8)、北京(6)、山東 (5)、廣東 (5)、上海 (4)等地。這幾個省份是年鑒索引研究活躍地區。
從收集的40篇論文內容來看,年鑒索引研究主要集中于以下四個方面。
筆者以為,造成我國年鑒索引數量少、質量欠佳的一個重要原因是相當數量的年鑒編輯人員對索引的重要性認識不足,他們認為“目錄可以取代索引成為年鑒檢索工具”。其實不然,索引的編排順序不同于按頁碼排列的目錄,二者都是檢索系統的重要組成部分,缺一不可。索引相對于目錄來說具有不可替代的優勢:① 揭示隱藏主題,標引的對象是任何一種有價值的信息,能夠把隱藏的主題揭示出來;② 編制范圍寬泛,可根據需要在任何一個確定的范圍內進行編制,比目錄靈活得多;③ 索引的集合性,索引能將散見于全書各處的同一事物的信息集合一處;[3]④ 索引的連續性,索引能夠在同一位置檢索到年鑒連續記載的事物信息,而對于目錄來說,一旦年鑒的條目位置發生變化,檢索者則無所適從。[4]
針對各種年鑒的特點,應該編制不同類型的索引。年鑒索引,簡而言之,可分為單一主題索引和綜合主題索引。筆者統計的研究論文涉及的索引類型有:主題索引、人名索引、地名索引、機構索引、圖表索引、序號索引和條目索引等。現有年鑒索引多為綜合主題索引,研究論文多涉及混合主題索引,如《中國百科年鑒》 《揚州年鑒》等均采用混合型索引。[3]但也有一些單一主題索引,如《上海文化年鑒》的人名索引、機構索引。此外,還有一些年鑒根據自身特點設置索引類型,如《北京年鑒》編制區情縣情索引,《中國出版年鑒》編制篇名索引,《中國圖書年鑒》編有辭目分類索引,等等。[5]
年鑒索引的編制步驟和普通書后索引的編制步驟類似,即選擇索引類型、確定標引范圍和深度、主題分析、選取標目、排序、編制參照系統、校驗、生成索引。如何在編制索引的過程中提高索引質量,也是近年來專家學者關注的對象,其研究主要集中在以下幾個方面。
2.3.1 索引的范圍
我國年鑒索引多存在范圍不完整的問題,專家學者討論較為熱烈。
一般以年鑒的正文內容為標引范圍,同時涵蓋全書,盡可能包括一切有揭示價值的對象。專文、特載、報告、綜述、概況、法規、文獻等各種文獻類型,統計資料、表格、圖片等各種資源類型,附錄中包括的有實質性內容的資料等都應作為索引的對象。而年鑒中不具有實質性內容或缺乏揭示價值的對象,如年鑒序言、凡例、目錄和編后記、指南、名錄等一般不納入索引。[5]當然,根據實際情況還可以對一些特色年鑒的大事記中記錄的內容,甚至設計精美的宣傳彩頁和廣告進行標引。總之,索引的范圍以便于用戶查閱為準。
針對部分內容編制主題索引難度較大的問題,也有學者建議在主題索引之外建立人名索引、地名索引、機構索引、統計數據索引等專名索引,這些專名索引編起來簡單又省時,讀者使用起來也方便、快捷。[6]
2.3.2 索引的深度
索引深度決定索引的規模,反映內容的揭示程度或水平,是索引編制規劃中應加以明確的重要內容。國內測量索引深度的方法目前有兩種:①索引款目與條目總數之比;②索引篇幅與正文篇幅比例。前者反映索引涉及條目內容的深度,后者從年鑒結構上反映索引所占的份額。許家康在“第十九次全國城市年鑒研討會”上提出,當務之急是將索引比提升到1:1.5至1:1.2的水平。[7]
對索引深度規劃時,應以年鑒資源中具有解釋價值的內容作為依據。對條目或文章內的多個主題和隱含主題或輔助主題進行深入分析,并從內容分析、各種專名等不同的角度抽取索引內容,以便提供更細致更豐富的有效信息。為了保證各欄目選詞盡可能做到均衡,編制索引時要大致確定選詞的“級別”,即根據條目內容的層次或條目內容,規定一個深度,如《上海文化年鑒》。[2]
2.3.3 規范主題詞
(1)全面性與完備性。對文獻中所包含的具有實際意義的重要內容進行標引;注意挖掘隱含主題;注意某概念在不同時期的不同提法而多做一些主題詞,增加檢索入口;[4]對性質相同或相近的內容要通過建立參照系統的方式,指明事項之間的相互關系。
(2)專指性與準確性。一詞一義,不能引起歧義和誤解;復合主題拆分為單主題;主題詞應具有最大專指度。
(3)簡潔性與便捷性。內容要高度濃縮,字數控制在一定范圍內。遵從讀者的檢索習慣,主題詞的中心詞要前置或使用被動式,避免使用動賓短語。[2]
(4)規范性。[2,8]主要是細節問題,包括避免出現口語化或敘述體的標引詞;不用標語、口號和政策宣傳性語言,不用比喻、借代語言等;刪除“關于”“對于”等不確定性詞;選擇被社會和大眾經過實踐認定形成的詞語,等等。
另外,有專家學者研究并嘗試在編制過程中引入主題詞表進行規范,取得了一定成效。例如:廣州年鑒社的黃澤霖分析了按主題詞表編制年鑒索引的可行性;[9]《揚州年鑒》為了減少主觀影響,通過自建詞表的方法,將年鑒中出現頻率高的事物、概念等作出規范的全稱或簡稱,以便全文統一風格,最大限度地避免人員主觀性對工作的影響。[3]《北京東城年鑒》在編制主題詞索引時,參考了中國檔案文獻出版社的《中國檔案主題詞表》和北京市人民政府辦公廳編制的《公文主題詞表》。當然,年鑒種類繁多,且主題詞表也有其自身的局限性,因此在目前編制索引的過程中也不能完全局限于規范性主題詞的范圍內。
2.3.4 排序規則
排序這一工序已基本能夠通過計算機自動完成。常見的排序方式有漢語拼音排序法、部首筆畫排序法、分類編排法等,其中最常用的是漢語拼音排序法。漢語拼音排序法是根據現代漢語語音基本知識,確定每條索引款目的主題詞中每個漢字的聲母、韻母和聲調,再遵照24個拉丁字母順序排列,同時注上頁碼。
索引款目排序的工具主要有數據庫軟件、文字處理軟件和索引編輯軟件。但索引編輯軟件是國內專家針對索引編制工序開發研制的工具,普及率不高。一些學者提出排序技術處理方法,如:為了避免特殊符號(如《》、“”等)影響排序結果,在排序前將特殊符號的前半部(如《、“)刪掉,在完成排序后通過檢索或事前記錄等方法恢復;為了完成主標目下副標目的排序,排序前所有副標目以“一級款目,二級款目”的形式錄入,排序后保留第一行“一級款目,二級款目”的形式,刪除其余二級款目前的“一級款目”并縮進;完成漢語拼音排序后還要對多音字進行單獨處理,合并標目內容完全相同的款目。[8]
2.3.5 參照系統
參照系統是揭示概念之間關系的主要方法,即在每個標目詞下設立參照項,用參照符號指出該詞的等同關系詞、上位詞、下位詞和相關詞。參照能夠提供多檢索入口,減少篇幅,提高檢全率和檢準率。[10]而在已有的年鑒索引中,普遍存在沒有參照系統或參照系統薄弱的問題。
在現有的年鑒索引中,一般認為索引的參照通常包括“參見”和“附見”兩種,這與索引學中的參照系統有很大區別。“參見”是將分散在各處同一主題的條款頁碼,集中標注在一條索引款目之后以便檢索。“附見”是將同一主題的內容集中排列在一個主題索引下,作為這一主題索引的“附見”以便查找。《中國百科全書》就通過建立完善的參照系統形成了縱橫交錯的立體網絡,[11]是我國年鑒索引的參照系統編制的典范。
2008年11月3日,由中國索引學會主持制定的國家標準GB/T 22466-2008《索引編制規則(總則)》頒布,并于2009年4月1日正式實施。該標準為各種類型索引的編制提供有關內容、表示及其組織的一般規則和說明性的規定及實例,既適用于任何類型文獻的索引編制,也適用于人工編制的和計算機編制的各種類型的索引(包括紙質印刷索引、索引數據庫等)。有學者以該標準為據,探討了《新編地方志索引標準》的可行性并提出技術性建議。[12]
此外,為了配合在全國推廣、實施《索引編制規則(總則)》,中國索引學會還主持編寫了《索引編制手冊》和《索引編制規則(總則)應用指南》,兩書即將由中國標準出版社和國家圖書館出版社出版,其中專設“地方志索引編制法”章節,重點說明地方志索引(包括地方綜合性年鑒索引)的性質、類型和特點,編制過程及技術要點,并附有示例及其說明。[13]這標志著我國索引編制工作進入了一個嶄新的發展階段。
如何充分利用計算機輔助編制年鑒索引一直是很多專家學者關心的問題。
從1995年開始,年鑒工作者就嘗試利用FOXBASE等數據庫和WPS、Word等文字處理軟件來編制索引。具體操作是將標引結果(包括標目、頁碼)按照一定格式輸入事先設置好字段的數據庫,通過數據庫指令將索引款目自動排序并生成索引。寶山年鑒編輯部的胡新力等人對Foxpro和Word97兩種工具進行對比之后認為,Word97在編制索引上更有優勢。[14]由于標引過程必須由人工干預,因此,在整個過程中計算機參與最多的環節還是款目排序。
隨著Word文字處理軟件的出現,年鑒工作者開始利用其段落或表格排序功能實現款目自動排序。從Word97開始還提供“插入目錄和索引”功能。索引編制者可直接在doc、rtf、txt等格式下抽取主題詞,排序并生成索引,這使得計算機輔助索引又前進了一步。但該方法只適用于Word能夠識別的文本格式,且標引某一主題詞的時候會將文章中所有提到該詞的地址都添加標記,這些問題仍然需要進行人為控制。
《索引之星》是一款針對國內索引編制研制的軟件,能夠支持方正大樣文件S2、S72、S92、PS2、MPS的標引。標引人員可通過鼠標右鍵選中標目進行標引,并可對標引結果進行修改。《索引之星》能夠按照標目的拼音、筆畫和頁碼進行排序。還可以使用縮寫代碼進行標引。但該軟件一次只能標引一個詞,也不能像Word那樣隨時預覽標引結果。另外,北京市東城區地方志辦公室開發的“計算機圖書索引生成系統”,經過實踐應用,也達到了滿意的效果。
總之,機編索引技術還是今后索引編制技術研制的主要內容。隨著計算機技術的進步,充分利用計算機提高索引編制的質量和效率,是年鑒索引研究的一個發展方向。
隨著我國年鑒事業的發展,年鑒索引從無到有,從有到優,已經越來越受到社會各界的廣泛重視。很多專家學者都在致力于改進年鑒索引的編制技術,也取得了一定成果。但由于國內起步較晚,在普及程度、自動化編制水平、規范化方面和國外索引發展還存在一定的差距。總結近幾年的研究,筆者認為,主要有以下幾方面有待改善。
(1)針對年鑒索引的研究需要擴寬和加深。近幾年研究的內容以理論研究為主,且部分內容重復,建議今后從提高索引編制質量、索引標準化、索引自動化、國外年鑒索引發展等方面加強研究的力度。
(2)研究和編制人員的隊伍建設。目前研究力量主要來自年鑒編輯社(包括方志辦公室)、高校及其圖書館等單位的專家和學者。前者是編輯年鑒的主力軍,具有豐富的年鑒專業知識和實踐經驗;后者是情報檢索語言和索引學的專家。兩者應緊密配合,加強年鑒編輯隊伍建設,以促進索引的標準化和規范化建設。
(3)充分利用現代計算機技術輔助編制年鑒索引。我們的機編索引技術還主要停留在自動排序上,利用的工具基本是Word97/Word2000、Foxpro、Foxbase等已少人問津的軟件。建議在編制過程中,不斷嘗試新的工具和技術,例如研究不同版本Word中的“插入目錄和索引”功能是否有所改進;利用SQL Server、Oracale等大型數據庫強大的數據處理功能來輔助編制索引等。
(4)充分吸收國外先進技術和經驗,編制更多、更完善的索引軟件。自機編關鍵詞索引思想提出以來,國外機編索引技術發展迅速,涌現了一批著名的索引工具。Macrex、Cindex等索引軟件更是在實踐中不斷更新和完善,具有相當廣泛的用戶人群,因此通過比較國外索引軟件的功能,吸取其精華,為中文索引軟件的開發提供借鑒。
(5)年鑒索引制作的標準化、規范化。年鑒主題索引的制作存在很大的彈性,尚無明確的定量、定性標準。例如對主題詞的規范和對年鑒參照系統的解釋等。如何更好地發揮已頒布的索引標準的作用,實現年鑒索引制作的標準化、規范化,也是今后年鑒編纂的一個努力方向。
(6)嘗試按主題詞表編制年鑒索引。雖然這會涉及情報工作的專業性和年鑒出版的時間性,但已有年鑒社對此進行嘗試,并取得一定成效。因此,如何更好地將主題詞表引入,也是有待專家學者們長期研究的課題。
(7)創新。例如,嘗試實現年鑒索引的電子化(如《威海年鑒》)和網絡化,將便于讀者查檢、借閱相應年鑒,提高年鑒的利用率。另外,隨著年鑒索引質量的提高和細化,可嘗試針對不同年鑒的特點編制不同類型的索引。
[1]中國出版工作者協會年鑒工作委員會.部分在京年鑒座談會會議紀要 [J].年鑒通訊,2010(4):2-4.
[2]沈美新,等.編好年鑒索引,促進年鑒信息資源深度開發 [J].年鑒信息與研究,2004(5):39-40.
[3]李全權.編制高質量索引 打造實用型年鑒[J].年鑒信息與研究,2009(3):80-81.
[4]劉宜群.索引的定位與編制[J].年鑒信息與研究,2004(3):54-55.
[5]馬張華.年鑒索引的功能與編制特點[EB/OL].[2011-05-25].http://www.yearbook.cn/NJGongZuo TanSuoInfo.aspx?Id=404.
[6]初云峰.提高年鑒索引編制質量的幾點做法[J].年鑒信息與研究,2007(2):56-59.
[7]許家康.論年鑒的檢索性——在第十九次全國城市年鑒研討會上的主題報告[J].廣西地方志,2010(1):21-25.
[8]李洪格.談年鑒索引的制作[J].年鑒信息與研究,2009(5):113-115.
[9]黃澤霖.對年鑒索引的思考——按主題詞表編制年鑒索引的可行性研究[J].年鑒信息與研究,2004(1):44-46.
[10]趙鋒,顧海英.地方志索引基本問題思考[J].中國地方志,2006(9):33-36.
[11]邵榮霞.年鑒檢索系統的處理[J].年鑒信息與研究,1999(1):58-59.
[12]衡中青.制訂《新編地方志索引標準》的可行性分析及技術性建議[J].佛山科學技術學院學報(社會科學版),2010(6):74-80.
[13]張賢儉.制訂中國索引標準的可行性分析[J].中國索引,2006(2):2-4.
[14]胡新力,吳峰.計算機輔助編制年鑒索引比較[J].年鑒信息與研究,2000(1):56-57.