文/朱本軍
圖書館如何對所在機構成員和團隊“隱性知識”的挖掘與開發可能是豐富圖書館館藏資源、提供知識服務,提高圖書館核心競爭力的一個新思路。
從近年來圖書館領域出現的全球學術資源統一組織、管理與索引的“大數據”產品(如Google Scholar,SUMMON等)的普及推廣趨勢來看,不同圖書館在學術資源建設方面越來越趨同:完全相同的一份大而全的資源被不同圖書館訂購使用。圖書館資源建設面臨著前所未有的挑戰。從應對未來挑戰的舉措來看,我們推斷:未來,不同圖書館資源建設的核心競爭力將主要放在特藏資源的建設上。應如何在數字特藏建設的同時把握未來數字特藏建設與服務的趨勢?下面我們對圖書館數字特藏系統與服務的現狀和趨勢進行審視,以期開啟國內圖書館特藏資源建設的新方向。
所謂“特藏”,大體而言有兩個層面的意思:一是相對于機構內部的其他資源而言,顯得非常珍貴、獨特,比如口述歷史、學位論文等;二是相對于同類機構而言,屬于“我有你無”,或者不同機構都有,但“我”更完整、更成體系,比如古籍孤本、善本。由于這兩個層面都是相對它物而言的,其“特色”與否完全基于所選的參照物,因此,不同的圖書館對其“特藏資源”的收錄范圍各不相同。比如,北京大學圖書館將特藏主要限定在辛亥革命之后、解放之前的民國時期的書刊資源,而將古籍單獨作為一個類目,但是,國內則有不少高校圖書館將古籍也算作特藏資源。
所謂“數字特藏”,顧名思義,就是將這些傳統意義上的特藏資源“數字化”,并提供數字對象的獲取途徑。盡管這種理解非常通俗易懂,但是,隨著互聯網技術的發展所帶來的理念的變化,這種理解顯得越來越狹隘。從全球圖書館數字特色資源建設的大環境來看,未來的“數字特藏”資源建設,不僅僅指將傳統意義上獨有、特有的館藏資源數字化,而且還將側重于對已有“非特色”數字資源的分類組織,使之成為某個方面的專題資源庫。

可能有些讀者還不大清楚我們所指具體為何。下面我們以一些典型的案例來看看全球圖書館界對數字特藏資源的建設。相信這些典型的案例不僅能使圖書館界明白新理念下的“數字特藏”所指為何,而且能直接從中找到一些開展本地特藏資源建設的靈感。
北京大學的北京歷史地理數字特藏庫(http://bjhg.lib.pku.edu.cn/)和北大名師數字特藏庫(http://162.105.138.23/bdms/)。其中的“北京歷史地理”數字特藏,其所收錄的文字、圖像、音像和互聯網資源都是已經在學術刊物上公開發表的文章,它的“特色”之處在于以“北京歷史地理”為專題,將相關資源匯總。“北大名師”數字特藏其所收錄的文字、圖像和互聯網資源,一部分屬于北京大學檔案資源(如歷史老照片),這類資源屬于北大“獨有”資源,另一部分是已經在學術刊物上公開發表的(如著作),其“特色”之處在于以曾經在國內外某個領域有一定學術貢獻的學者為核心組織資源。
美國國會圖書館開發的專題特色庫(http://www.loc.gov/library/libarch-digital.html)和美國哈佛大學圖書館開發的數字特藏專題(http://digitalcollections.harvard.edu/)。其中的美國國會圖書館專題特色庫,其內容范圍涉及美國歷史文化(American History & Culture)專題、歷史新聞(Historic Newspapers)專題、退伍軍人歷史(Veterans History)專題、表演藝術(Performing Arts)專題等,但是我們看到,其中的文字、圖片均來自舊報刊,其“特色”之處在于將不同時期散落在不同刊物上的同一專題的片段以某種邏輯或關系匯集在一起。哈佛大學圖書館的數字特藏,比較有特色的有:1907年~1927年間美國人拍攝的東亞植物和文化圖片(botanical and cultural images of Eastern Asia)專題、布萊克頓關于法律和英格蘭風俗相關論著的布萊克頓在線(Bracton Online)專題、中國拓片(Chinese Rubbings Collection)專題等。這些數字特藏也是將分散在不同刊物上的同一主題的片段以某種邏輯關系匯集在一起。
上面這些數字資源究竟是應該稱作普通的“數字館藏”還是“數字特藏”,二者之間的界線似乎還是要回到“特藏”的二層涵義中去,看它相對于機構內部的其他數字資源而言,是否顯得非常珍貴、獨特,或者相對于同類機構而言,是否屬于“我有你無”,或者不同機構都有,但“我”更完整、更成體系。比如,美國國會圖書館截至目前共有22個專題的數字館藏,而僅有8個被定為“特藏(featured collection)”。

圖1 數字特色資源形成的流程
圖書館數字特藏資源的建設,由于技術性和專業性比較強,一般以“項目(project)”的形式分批次開展。一般而言,有四種常見的項目運作方式:一是圖書館內部獨立項目,這種內部獨立運作的項目通常都依靠館內具有一定專業水準和學科背景的圖書館員完成。二是圖書館與個人、機構、學會或協會聯合做某一專題的項目,通常依托學者、機構、協會或學會的專業人士的專業知識、專項資金聯合完成。三是跨地區聯合,比如中國的CADAL項目、美國國會圖書館的International Collections項目(http://international.loc.gov/intldl/intldlhome.html),通常由政府部門、非政府組織或有相同需求的學術機構一起聯合完成。四是社會化,在專題資源項目發起后通過各種渠道吸引熱心人士捐贈素材或提供線索。
所有這些項目,從立項到形成特色資源,一般要經過資源選擇、采集、組織、提供獲取途徑和長期保存五個步驟(如圖1所示)。其中:“選擇”,指的是挑選素材(比如手稿、地圖、圖片、音頻、視頻等),并將素材歸類;“采集”,是將這些已經挑選好的素材進行數字化使之變成數字對象,以及著錄,或從其他外部系統攝取、收割或抓取數字對象元數據;“組織”,即按某種數據層次組織元數據;“提供獲取途徑”,指的是對已經數字化的數字對象(如電子書、數字照片、音頻、視頻等)按主題、時間、事件等分類整理,形成專題,并通過互聯網發布出來;“長期保存”,即對數字特藏進行存儲。通常,這五個步驟通過一套信息管理軟件系統來整合。
這里特別要提到的是,傳統意義上數字特藏資源的組織、管理與服務由于其專題性很強、數字對象格式和資源類型各異,一般都采用獨立的信息管理系統提供信息著錄、數字對象管理與服務。這種數字資源管理模式容易形成特藏資源孤島。未來,這種資源組織和管理系統將被一種基于新概念下的圖書館資源管理模式的產品所取代。這種新概念的資源管理產品,如Ex Libris的ALMA系統、OCLC的WMS系統及開源的Kuali-OLE系統,不僅采用開放的SOA架構,而且可以實現不同格式、不同類型所有資源的統一著錄與管理。
盡管前述對數字特藏的內涵和建設有了系統的闡述,但是,并不意味特藏資源的建設就止步于此。
隨著互聯網越來越成為一個學習和工作的“場所”而不僅僅是一種“媒介”,學者的工作習慣也在悄然發生變化。如何組織并收錄來自數字新媒體的數據,也成為數字特藏資源來源的一個新方向。以北京大學圖書館為例,在捕捉到過去體現學者學術思維過程的手稿、日記等現在慢慢轉向博文和微博這種變革后,北京大學圖書館開設了“北大博文”特色庫(http://bowen.lib.pku.edu.cn),專門收錄北大學者的博文,與此類似的,如美國國會圖書館則于2010年即宣布收錄來自社交媒體Twitter的數據。
除此之外,數字特藏建設還有一片尚待開發的處女地,即是對“隱性知識”的挖掘與組織。圖書館目前所做的絕大部分數字特藏建設工作,主要是對那些易于存儲、交流和共享的“顯性知識”(比如報告、文章、圖書、專利、圖形、圖像、軟件等)的建設與服務。對于那些以人為依托的、高度個人化的經驗性或隱藏的知識,圖書館較少涉足。圖書館如何對所在機構成員和團隊“隱性知識”的挖掘與開發可能是豐富圖書館館藏資源、提供知識服務,提高圖書館核心競爭力可依賴的一個新思路。理所當然,對這種高度個性化的校本學術資源的開發應該是數字特藏建設的新領域。