張惠君 曾麗軍 張西亞 肖小勃
摘要闡述了CALIS導航庫存在的價值和意義,對其目前面臨的困境進行了分析,并提出了CALIS導航庫可持續發展的構想。
關鍵詞學科導航導航庫可持續發展CALIS
1991年HTML及Web的創建者Tim Bemers-Lee在位于日內瓦的歐洲粒子物理研究所建立了一個關于互聯網網站/網頁的目錄系統(WWW VirtualLibrary),是迄今為止歷史最“悠久”的網絡資源導航。在隨后的20多年間,為應對網絡資源的爆炸式增長帶來的信息查找和獲取的不便,世界各地的許多機構或志愿者(尤其是圖書館和圖書館人)都建立了網絡資源門戶或導航系統。2000年4月,中國高等教育文獻保障系統(CALIS)在其一期建設中首次設立了“重點學科網絡資源導航庫”(以下簡稱“導航庫”)子項目,在之后的二期建設中,導航庫仍是重點建設的子項目之一,CALIS為此投入了相應的財力及人力。一路走來,在獲得了寶貴的建設經驗、取得成績的同時,作為導航庫子項目的承建單位,我們一直在思考著這樣幾個問題:導航庫究竟有沒有存在的必要?導航庫的存在與發展面臨的致命缺陷是什么?CALIS導航庫該如何健壯地發展?
1、CALIS導航庫的存在價值
自2000年CALIS首次為導航庫立項至今,來自業內的質疑之聲就從未間斷過:有了goodle之類的搜索引擎,讀者還需要導航庫嗎?網絡資源導航這樣的數據庫會有人用嗎?究竟有沒有必要建立導航庫?總之,導航庫存在的必要性一直是一個話題,值得我們加以討論。
1.1黑格爾說:存在即合理
“存在即合理”出自黑格爾的《小邏輯》,其準確翻譯是:凡是合乎理性的東西都是現實的,凡是現實的東西都是合乎理性的。在黑格爾哲學里,現實一定是合乎理性的,理性也只有通過現實才能實現自己,非現實的理性是空。世界上一切事物都是合乎理性的。由此,導航庫的存在也是合乎理性的。
2006年,CALIS二期導航庫項目管理組對當時因特網上的學科導航系統進行了全面摸查,截止2006年12月,網上可正常訪問且更新維護正常的學術性學科門戶有151個,主要分布在英國和美國,占80%左右,以英國的Intrnte最為突出。目前,我國還沒有建立起像Intrnte這樣的可以系統、全面地為本國高等教育服務的學科導航系統,CALIS為導航庫立項具有重要的現實意義。
學科導航系統的存在,是在紛繁的網絡世界為讀者提供一個資源檢索和推薦工具。和另一種網絡資源檢索工具——搜索引擎相比,二者具有顯著的不同。
1.2學科導航與搜索引擎:異曲不同工的網絡資源檢索工具
搜索引擎和網絡資源導航系統均可為用戶提供符合特定需求的某一主題或領域的信息資源,具有對網絡資源的檢索和過濾功能,但是它們之間又存在著顯著的差異:
首先,目標不同,搜索引擎以“全”為目的,學科導航以“佳”為目標。搜索引擎追求的是盡可能“完全”地抓取網頁,學科導航努力將網絡中最好的學科資源奉獻給用戶。
目標不同自然結果不同。搜索引擎會根據用戶的檢索要求將符合條件的網絡資源“和盤托出”,而導航庫中的資源是質量受控的。
其次,導航庫中的每條記錄都有一個“描述”字段,它是編目人員的原創信息,用戶可以據此判定是否有必要訪問某一網站或網頁,而搜索引擎無此功能,它只是從所收錄的網站(網頁)中“照搬”一些信息。
從某種意義上說,學科導航具有搜索引擎涵蓋不了的優勢和長處,它提供的不是包羅萬象的信息檢索,而是用戶在查找學科學術資源時值得信賴的便捷工具。
1.3它山之石:長尾理論的啟示
長尾理論是網絡時代興起的一種新理論,由美國人克里斯·安德森提出。長尾理論認為,由于成本和效益的因素,過去人們只能關注重要的事物,如果用正態分布曲線來描繪,人們只能關注曲線的頭部;而在網絡時代,由于關注的成本大大降低,人們有可能以很低的成本關注正態分布曲線的尾部,關注尾部產生的總體效益甚至會超過頭部。長理論提出后,引發了圖書館界對其的熱烈討論。
一直以來,圖書館都將數字資源建設的重點放在兩個方面,一是購置數據庫商生產的主流產品,二是將各自的特色館藏數字化,從而忽視了網絡免費資源的收集、整理和揭示。孰不知,身處網絡之中的我們正被一個豐饒的長尾所環繞,這條長尾中蘊藏著豐富的信息資源,它涵蓋所有知識領域,涉及種類繁多的資源類型,可謂應有盡有。雖然很多網絡資源并非主流媒體或權威人士生產,但其中的絕大多數都是業內人士的智慧結晶,只要在網絡上發布、傳播,就會有同行需要,會對其他人的學習和研究有所幫助。從另一個角度考慮,由于網絡資源在內容和形式方面有別于商業數據庫,或許可以發揮主流數據庫不可比擬的作用。
2、CALIS導航庫面臨的困境
2.1收藏質量:品質不佳必遭用戶棄用
既然我們的建設目標是將網絡中優秀的學術資源聚合起來為用戶提供服務,那么數據質量就是導航庫賴以生存的基礎,一個在收藏內容上“名不副實”的學科導航系統終將被讀者棄用,失去存在的價值和意義。雖然在導航庫二期建設中制訂了“追求質量、強調應用、兼顧數量”的建設原則,但是在建設過程中并未得到充分貫徹,目前導航庫大約有20%的學科在數據質量方面尚未達到規定的發布要求。如果數據質量不能保持在一個較高的水準,導航庫將逐漸失去用戶。
2.2維護和更新:停滯意味著走向死亡
70多年前,阮岡納贊出版了著名的《圖書館學五定律》,其中的第五定律為“圖書館是一個生長著的有機體”,認為“生長著的有機體能獨自生存,停止生長的有機體將會僵化,直至死亡”。在網絡資源日新月異的今天,“生長著的有機體”這一理念用在以收錄優秀網絡資源為目標的導航庫上似乎更加合適。網絡資源的動態性特征決定了它是CALIS子項目中最需要及時更新維護的,因為過時的資源著錄信息對任何人都沒有意義,甚至可能誤導用戶,損害用戶利益,從而“敗壞”導航庫聲譽。
從一期、二期導航庫建設的情形看,驗收后的更新維護不及時甚至停滯已經成為其可持續發展的羈絆。以二期導航庫為例,在項目處于學科驗收和學科評優前夕,平均每天收割的數據量為幾千條,一旦驗收結束,極少有數據更新,有時一周都沒有一條記錄更新,如果不及時解決這個問題,CALIS導航庫真的是難以在因特網上健壯地生存下去。
2.3項目組織管理:監管不力制約目標實現
項目組織管理是CAMS導航庫面臨的另一問題,這個問題最直接地表現在項目管理單位與參建館的信息溝通方面。在項目建設過程中,很多工作需要參建館的反饋,然而,總有少數參建館對此置之不理,可是當牽涉到利益問題時(如下撥經費),所有的參建館都反應迅速,可見信息反饋的渠道是暢
通的,只是參建館一方因為種種原因不愿配合而已。溝通不暢從一個側面說明監管方面存在著問題。
監管不力不僅影響項目進展,還關系到數據庫的建設質量。如果導航庫想在今后謀求健康發展,就必須改變現有管理模式,從根本上解決由此產生的諸多問題。
3、CALIS導航庫可持續發展構想
針對導航庫二期建設存在的問題,項目承建單位西安交通大學圖書館進行了深刻的總結和思考。要保證CALIS導航庫項目的可持續發展,必須從以下幾個方面人手。
3.1改革管理模式:解決項目管理問題的根本
我們考慮在三期建設時采用更為開放的管理模式,充分集結各方力量,調動廣大有志者的積極性,共同建設CALIS導航庫。三期可能采納的管理方式包括:
(1)調動項目管理組成員館的積極性,由他們共同分擔管理工作。
(2)可考慮吸收商業機構加入導航庫的資源建設。
(3)為確保資源建設責任到人,擬采用以個人名義申報的方式來選擇學科導航資源建設者,這將是CALIS項目申報的一次變革和嘗試。
(4)以更加開放的方式吸納建設者,不考慮申報者所在學校的大小,不限制參建者覆蓋學校的數量,充分體現CALIS“共建、共知、共享”的精神。
(5)一個學科可以由來自不同學校的多個館員參與建設。
(6)為每一位熱心的志愿者提供更加友好的推薦資源的窗口。
我們期望能夠通過上述管理模式的改變帶動導航庫項目建設的良性發展。
3.2系統升級:提升效率和服務
通過二期建設,我們構建了CALIS學科導航數據庫資源建設與發布平臺,建立了由中心系統和本地系統組成的兩級分布式建設和服務體系。整個系統采用分布式數據收集和編目、集中服務的模式。近幾年的建設實踐告訴我們,當前導航庫系統主要應從工作模式以及學科導航門戶網站這兩個方面加以完善和改進。
現有工作模式主要有兩方面不足:本地系統安裝和維護問題、本地系統和中心系統數據更新同步問題。針對這兩個問題,導航庫項目管理組正在考慮改變資源建設工作模式,即:將現有的使用本地系統進行資源搜集和元數據編目的方式改為遠程訪問操作,不再使用本地系統。改變后的工作模式具有人員分布式、編目集中式的特點。
導航庫門戶網站是下一步系統升級的重點。目前的網站具備了一個門戶網站應有的大部分功能,但在易用性和界面友好性方面還需優化,包括檢索、瀏覽、頁面設計、幫助信息的改進以及智能化等。
3.3完善標準規范:高水平數據質量的保障
CALIS二期導航庫項目管理組專門組織人力制訂了《資源選擇標準》、《元數據規范》、《著錄規則》、《資源類型表》等四個相關標準與規范。從使用情況看,前三者基本可以滿足資源選擇以及資源描述的需求,問題主要集中在資源類型表的設置。
CALIS導航庫在進行資源類型的設定時,遵循學術性、準確性、可操作性、通用性的原則,設計了一個二級體系。根據網絡資源呈現的不同屬性將其歸納為8個一級類目;每個一級類目下包含若干個二級類目,均為具體的資源類型,共29個。當時我們認為這是一個數量適中的、可操作性較強的資源類型表。
但在對資源描述質量進行評價的過程中我們發現,資源類型標引不準確、歸類不一致等現象超出預期,出現這些問題,既表明編目人員的使用經驗欠缺,同時反映了現行的資源類型表存在著某些不完善之處,造成使用過程中的困惑。資源類型表的設置和使用可以從多個方面加以完善和改進。
(1)擴充資源類型,建立完整的資源類型表。
網絡資源類型龐雜,遠非29個資源類型可以涵蓋,致使編目時很多資源無合適的類型可歸,如臨床醫學的病歷,造成資源標引工作的不便和標引結果的混亂。解決這一問題的最直接、有效的方法是:保持一級類目不變,擴充二級類目,盡可能完全地羅列現有網絡資源類型,以避免編目人員在標引時去“掛靠”或者往“其他”里面塞,用戶在查詢時也不用去猜測、揣摩。
(2)制定規則,靈活使用資源類型表。
設計一個完全的資源類型表,并不表示每個學科都要用到那么多資源類型,各學科應根據本學科網絡資源的特點來確定需要使用的資源類型種類。事實上,其他權威的學科導航系統也是這么做的,例如英國著名的Intrnte,它的資源類型為72種,但在實際使用時,每個學科為10-20種不等。
(3)適應發展,允許資源類型擴充。
網絡世界日新月異,今天還不被多數人關注的小眾資源類型,明天也許就會成為傳播學術思想的有力工具,因此應該在使用規則上允許編目人員根據實際需要擴充資源類型,同時還應改進編目系統,使之從功能上得以實現。
(4)加強指導,正確使用相關規則。
就像學科分類會遇到交叉學科一樣,對網絡資源歸類也會碰到類似情況,某些資源可能具有多個類型屬性,例如一個教學資源,它同時又是多媒體資源,這時該如何處理呢?在導航庫《著錄規則》中這樣規定:“若該資源類型符合多種資源類型,描述其多個資源類型詞組之間用‘;隔開,或以多字段的形式進行反復著錄”,只有將其所呈現的屬性全部進行揭示,才可以保證用戶查詢結果的完整性。但是,在實際中絕大多數記錄都只進行了單一資源類型標識,可見各參建館對著錄規則的內容還不夠熟悉,理解還不夠透徹,項目管理組應加強這方面工作,提高資源標引水平。
4、結論
CAuS導航庫是不同于搜索引擎的優秀網絡資源的集合,它的存在對于高校的教學和科研有著不可替代的作用。目前,導航庫已經初具規模,具備了為用戶提供服務的基本條件,數據庫更新維護已成為下一階段的工作重點。為保證導航庫的可持續發展,必須在今后的建設中理順管理模式、提高工作效率,改進系統、完善標準規范,只有這樣,才能提供更好的服務,將CALIS導航庫打造成文獻資源共建、共享的優良品牌。