顧燁青,吳信嵐
更全 更新 更細*
——讀《數字信息資源的檢索與利用》(第二版)
顧燁青,吳信嵐
《數字信息資源的檢索與利用》(第二版)繼承了第一版涵蓋信息資源與信息檢索工具極為豐富的突出特點,是一部超越信息檢索教材、融資源檢索和資源建設及評估于一體的指南性工具書。文章對該書的新增亮點以及若干不足進行了評述,并認為不要過于依賴檢索而忽視了讀書思考。
數字信息資源的檢索與利用 信息資源 信息檢索 教材 書評
北京大學圖書館肖瓏主編的《數字信息資源的檢索與利用》(以下簡稱“《數字資源》”)是一部特點鮮明的信息檢索精品教材。2003年出版的《數字資源》(第一版)[1](以下簡稱“《首版》”)獲教育部第四屆中國高校人文社會科學研究優秀成果三等獎,是迄今該獎項中唯一獲獎的應用性信息檢索類教材,代表了我國該領域內教材的最高水平。十年后,繼承原有特色,又融入前沿、全面拓新的《數字資源》第二版[2](以下簡稱“《第二版》”)修訂問世。通讀完《第二版》,筆者既再次感受到該書獨特的魅力,又愛之愈深,責之愈切,結合自身檢索的體會,苛刻地列舉《第二版》的不足,以期修訂三版時以更高的水準展現在我們面前,嘉惠學界。
《數字資源》最大的特點在于涵蓋的信息資源與信息檢索工具極其豐富,同類教材中難有匹敵者?!妒装妗窌r即已經涉及數據庫兩百多個、全文電子期刊近兩萬種、電子報紙五百多種、電子圖書十幾萬種,“國內外最著名的網上中英文學術數字資源基本被其一網打盡。其涵蓋范圍的廣度、討論問題的深度,和信息量的巨大,堪稱國內之最”[3]?!兜诙妗防^承了這一特點,涵蓋了超百家數據庫商、出版商及學術團體與機構的四百余個數據庫,比《首版》近乎翻了一倍。同行們再次肯定了這一特點,“資料豐富,可謂工具書的大全”[4],認為《第二版》比《首版》具有更加豐富翔實的內容[5]。
《數字資源》展現的眾多重要數字資源并不止于簡單的名稱列舉,不乏一些深入分析和對同類資源的比較評價,這是很多只重視培養用戶信息檢索能力而忽視培養信息評價意識的信息檢索教材所欠缺的。基于此,《數字資源》同時可作為圖書館資源采訪部門的案頭參考。這是一部超越了檢索教材,集資源檢索和資源建設及評估于一體的指南性工具書,可大大拓展一大批本館資源不如北京大學圖書館等綜合性大館豐富的圖書館采訪、咨詢、文檢課教學同行們的視野,對學科館員開展學科資源推送服務也大有裨益?!稊底仲Y源》的這一鮮明特色,無疑源于主編肖瓏副館長長期主管資源建設并負責CALIS數字資源引進與評估所形成的資源先行觀。
《第二版》較之《首版》,在刪除了一些已經不提供服務的數據庫資源和基本不再使用的大型檢索工具印刷版的同時,增加了很多新興的數字資源品種及服務新模式?!兜诙妗沸抻喦把院鸵延袝u[4-5]已經提及的增加了諸如特種文獻資源、多媒體學術資源、RSS、數字資源整合服務、開放存儲資源(OA)、文獻管理軟件等內容,本文不再贅述。這里,筆者推介幾處《第二版》其他的新增亮點。
《第二版》新增了很多高價值、較珍罕及無以替代的重要資源。長期以來,我國大陸很多文科學者利用海外文獻的意識不足,影響了研究深度和廣度。其中的一個重要原因是他們不清楚有哪些可利用的域外資源,相當多圖書館也未采購這類資源。《第二版》專門介紹了一些西方的檔案類數據庫和中國主題的史料數據庫,涉及Gale公司的解密檔案參考系統(DDRS)、ProQuest的解密后美國國家安全檔案(DNSA)、美國早期印刷品(EAI)、《海外收藏的中國近代史珍稀史料文獻庫》《英國外交部檔案,中國:1949-1980》《中國:文化與社會——華生中國收藏》等,這些都是研究中國近代史、世界近代史的一手材料。由于其中很多數據庫可以進行基于全文的字詞檢索,這將快速實現以往依靠人力難以達到的某些研究目的。此外,《第二版》在介紹CASHL資源時提及的大型西文特藏,也多為一手原始檔案資料,如《傳教團文檔》《英國情報機構西藏文檔》,學術價值極高。
相較于文獻類全文數據庫,事實與數值類數據庫直接面向用戶的問題,以特定的、精準的事實或數字回答用戶的需求,針對性與專業性極強,是無以替代的一種數據庫類型。特別是隨著社會經濟的不斷發展,在商業經濟與金融領域的實踐與研究中,對商情數值與事實的需求猛增,《第二版》在《首版》只有中國資訊行數據庫這一種資源的基礎上,又介紹了七種英文和五種中文商業經濟類事實和數值型數據庫,并分別選擇若干類似的數據庫進行了較詳細的功能與特點比較分析。這不僅在培訓讀者選擇利用合適的數據庫時提供了指導,更為圖書館資源采訪提供了很有價值的評估參考。
《首版》后的十年是電子圖書與電子報紙飛速發展的十年,《第二版》與時俱進,對此進行了全面的改寫。電子圖書方面,不僅從載體類型劃分上重新分為封裝型、基于PC的網絡型、離線(移動閱讀終端)型,劃分更科學,也更符合當前的發展情況。具體內容方面,《第二版》也對中西文電子圖書(集成)服務系統的介紹在《首版》基礎上進行了大幅擴寫,特別增加了對幾種西文電子圖書集成服務系統的比較分析。此外,還專設一節介紹中文典籍數據庫,不僅擴寫了《首版》中的文淵閣四庫全書電子版等三種數字資源,又新增介紹龍語瀚堂典籍數據庫等五種古文獻資料源,極大地方便了中國古代文史領域的學者利用。電子報紙部分,《第二版》新增列舉的眾多西文報紙網站與全文數據庫最讓人稱道。國內學者可能只知道去一些大報(如《紐約時報》《泰晤士報》)的網站查找相關信息,但往往只能免費瀏覽最近幾天的新聞,并不知曉可以去一些專門的報紙全文數據庫或大型全文集成數據庫中查找。《第二版》專設一小節“代表性西文報紙”,不僅列舉了《華盛頓郵報》等獨立性報紙的網絡版,還介紹了世界各國報紙全文庫、PressDisplay報紙數據庫、全球報紙精選數據庫、美國歷史報紙數據庫等專門的報紙全文數據庫和EBSCO、ProQuest、LexisNexis等全文數據庫中的報紙數據庫,給研究者提供了指引。
此外,雖然《第二版》在前言中指出“考慮到這幾年用戶的檢索水平在不斷提高、而檢索系統也在快速變化,減少了檢索細節的指導和介紹”,但在全書中還是對一些重要的檢索技巧或不太被用戶甚至很多同行所知曉、易忽略的數據庫功能予以了細致的介紹。如在介紹A&HCI時提及的“暗引”(P77),就極少見諸其他檢索教材,即便是在WOS的help文檔中也不易快速找到?!兜诙妗方榻B的SCI擴展版、光盤版和印刷版的區別,EI Compendex核心出版物(核心數據與非核心數據)及其中國期刊等細節也能解答很多讀者甚至部分同行的困惑。
金無足赤,《數字資源》也有一些不足,令人遺憾?!妒装妗返臅u[3]中就曾建議每章增加練習題,《第二版》沒有改觀,以致又見書評[4]再次提及。筆者不揣淺陋,再談幾點,愿與編者切磋,供再版參考。
其一,盡管《第二版》涵蓋的數字資源已經非常多,但仍有一些在《第二版》截稿前已經問世的重要資源沒有介紹。例如,期刊與學位論文方面就遺漏了訂購單位的讀者可免費使用的自助型外文文獻一站式檢索與傳遞系統——超星-百鏈云學術搜索(http://www.blyun.com),涉及我國臺灣期刊論文與學位論文的商業數據庫(以華藝數位股份有限公司為代表)和部分獲得授權可以免費下載的臺灣碩博士論文資訊網(現名臺灣博碩士論文知識加值系統,http://ndltd. ncl.edu.tw或http://etds.ncl.edu.tw)。中國古籍與近代文獻方面,《第二版》遺漏的重要資源有北京愛如生公司開發的“中國方志庫”“中國譜牒庫”“中國類書庫”,以及“近代手繪畫報系列數據庫”之《點石齋畫報》與《圖畫日報》(2011年10月推出),《申報》數據庫(2011年6月發售),青蘋果數據中心的《申報》電子版(2010年完成),我國臺灣的漢籍電子文獻數據庫(瀚典全文檢索系統)等。年鑒和百科全書屬于通篇閱讀性差,但檢索性極強的工具書,而其數據庫形態則通過相關條目知識單元的標引與關聯,進一步提升了檢索和情報功能??上А兜诙妗肺茨芰信e年鑒和中文百科全書的數字化資源,如中國知網中的中國年鑒網絡出版總庫、中國經濟與社會發展統計數據庫(原中國統計年鑒數據庫),以及中國大百科全書數據庫等。對若干可免費利用的文科類西文檔案與史料研究性資源,《第二版》也疏于介紹,如互聯網檔案館(https://archive.org)和HathiTrust數字圖書館(http://www.hathitrust.org)?!兜诙妗方榻B了湯森路透的Incites這一最新科研評估產品,卻沒有介紹該公司前一款更成熟、在中國市場也已經投放多年的科研績效評估產品ESI (Essential Science Indicators)。此外,還有一些重要數據庫,《第二版》已經提及名稱,但沒有展開介紹,如Elsevier旗下的Scopus是全球規模最大的文摘和索引數據庫(含引文數據),全書僅在P225和P230兩處提及名稱。也有一些重要的分析軟件在介紹使用方法時過于簡單,如第十一章中運用SPSS分析課題“數字圖書館十年發展趨勢與熱點分析”時的示例,少了對某些操作細節的截圖與更詳細的流程描述,這往往是初學者最困惑的。《數字資源》再版時還可考慮增加介紹近來運用較多的美國華裔陳超美教授開發的免費引文分析軟件Citespace,配合實例演示基于科學知識圖譜的學科分析方法。當然,筆者所列遺漏資源很可能其中一些并非編者沒有注意到,而是出于資源的穩定性、規模、知名度以及知識產權等方面的考慮,為了確保教材的嚴謹性而有意被“忽略”了。這種類型的資源是否應該在教材中推介可能存在爭議,筆者在本文列舉,一則意在至少可供編者及同行密切關注這些資源的發展,條件成熟時或可在新版教材中收錄;二則希望讀者能對信息源與檢索工具擁有足夠廣闊的視野,熟知各種數據庫的基本信息、功用與特色?,F實中手頭可以不具備檢索使用某種信息資源的權限,但必須知道哪個信息資源可以解決自己的需求,以便定位他處可利用的信息源。諸如上述提到的《申報》數據庫,可能由于價格問題,很多單位未必購買,但如果及時編入教材,并伴隨著課堂教學,至少就將這一線索告訴給了讀者乃至同行,有需求者可以通過其他途徑去利用該資源(如青蘋果的產品還對個人開放研究試用),這樣作為工具書的指南與引導作用就突顯了出來。此外,這類資源由于計劃龐大,往往分系列逐年推出,圖書館資源采訪人員和檢索課教學人員需緊密跟蹤,還需有意識地將相關類似產品進行橫向比較。再以《申報》全文數據庫為例,在《第二版》截稿后,青蘋果推出了2.0廣告版,增加了廣告檢索功能,用戶不但能按日期和版面查閱當時的廣告,而且還可以根據內容和關鍵詞進行廣告檢索[6],這是當時愛如生公司推出的《申報》全文數據庫所不具備的(目前愛如生的A型《申報數據庫》已有廣告錄文)?!稊底仲Y源》三版時,如果加上這兩家產品的比較,參考價值就更大了。
其二,《第二版》對收錄的部分資源的特色服務,缺乏貼心提醒。如湯森路透旗下的WOS、EndnoteWeb、JCR、ESI、Incites等均開通有漫游使用功能,讀者只需在所在機構IP段范圍內注冊并登錄過一次,即可在公網漫游使用三個月。超星的讀秀與百鏈每年也在寒暑假期間推出漫游服務。也有一些數據庫出于版權考慮,對讀者利用會做出一些限制,讀者如果不知曉,或影響自身的使用效果或給自己帶來不必要的麻煩,檢索類教材也應及時予以提醒。如超星圖書現已加密處理,不僅其虛擬打印功能每月有頁數限制,已經下載到本地的圖書也有有效期,過期后必須重新下載,其注冊離線多機閱讀功能也頗繁雜,這些《第二版》都未涉及。國外諸如ACS等數據庫對過量下載非常敏感,國內機構經常遭被封懲處,《第二版》也缺乏必要的警示提醒。
其三,《第二版》仍有對相關資源的介紹存在滯后、敘述不周,與實際不符之處。如第220頁中“PDF文件由于全部是掃描制作的,……但它是一個圖像文件,字節數大,占據空間大,……沒有超文本鏈接(如內容與參考文獻之間就無法鏈接)?!捎谖淖帧D像、期刊標志掃描在一起,較難復制文字”,這完全照搬了《首版》中的文字,十年前的情況大致如此,但今非昔比,PDF格式的文件很多已經不是純掃描,而是可文字復制版本轉換而來,占據空間也不一定大,許多外文數據庫更單獨提供帶參考文獻鏈接的PDF版本下載,《第二版》修訂時未能仔細核對。還有第378頁對國際專利分類表IPC版次的敘述:“每五年修訂一次,目前使用的IPC為第八版,2005年修訂”,這個表述欠周全。第八版以后雖然未有第九版,但仍不斷修訂,且每年都修,2006年開始分基礎版和高級版,高級版IPC在分類號后標修訂的年月,2007-2008年高級版每年修訂了兩次,2009年后只保留高級版的分類表,稱為完整的IPC(full IPC),且每年修訂一次。第315頁介紹CADAL電子圖書時提到網站允許下載,這在CADAL剛上線后的一段時間內的確如此,但很快就技術加密,只能在線瀏覽了。此外還有最不應該出現的錯別字,第290頁闡述的液晶屏閱讀器優點“支持背光,在沒有外界關系的情況下可以方便地閱讀”,聯系上文介紹類紙屏閱讀器的缺點“無背光,必須依賴外界光線”,可知“關系”當為“光線”。
第四,不甚完備的書后索引?!妒装妗窌┧降摹皵底仲Y源名稱索引”和“數字資源分類索引”是該書突出的優點之一,這在當時非常少見。經過學術界、編輯出版界多年來的呼吁,在深知索引功效的圖書情報界,學術專著與工具類著作附有書后索引的情況已經漸多。這種形勢下,對于參考價值大的工具性著作,我們對索引的質量也當提出更高的要求。《第二版》仍只索引了書中的數字資源名稱是不夠的,其涉及的其他有意義的關鍵詞,如檢索術語、重要機構、人名等都應該索引。僅比《首版》晚一年出版的同類信息檢索教材《情報檢索與計算機信息檢索》(楊桂榮等,華中科技大學出版社)就在書后附有基于全書內容的“關鍵詞索引”(包括書中18個檢索實例)和“工具書索引”。同樣經過近十年打磨,修訂二版的《信息檢索(多媒體)教程(第二版)》(沈固朝等,高等教育出版社,2009年12月版)在新增的書后索引中也不僅局限于信息源與檢索工具,還包括其他關鍵詞。這些都早于《第二版》面世,提供了范例,可惜《第二版》未抓住修訂之機,將索引編制再邁一個新臺階,反而在原有水平上還有一定遺漏。如《首版》索引中有“臺灣期刊文獻資訊網”,《第二版》在相對應的章節繼續介紹了演變后的“臺灣期刊論文索引系統”,但索引卻沒有?!兜诙妗分羞€有很多正文中多次提到的資源(系統平臺)沒有在索引反映,如第225、230頁兩處提及的Scopus,第255、262、263頁等多處出現的Scitation平臺。還有一些僅提到過一次,但比較有特色、有價值的數字資源,在索引中也沒有,讀者就不容易發現,如第323頁的“世界坦克裝甲車輛手冊數據庫”“美國政府手冊”等。
在信息數字化發展的背景下,原來的工具書指南、文獻檢索類教材紛紛被數字、網絡、信息檢索類教材所取代,這是適應時代發展的需要,無可厚非。但是作為傳授讀者檢索技能,培養其信息素養的圖情專業者,必須對當前的資源形態有清醒的認識,并不是所有記錄有知識的載體都已經成為數字信息,都進入了數據庫,可以一檢而得。這種認識也必須在名為類似數字信息檢索的教材和課堂講授中予以強調。特別在文史學科,很多史料文獻都還沒有數據庫,無法全文檢索,傳統模式下的手檢仍不可拋棄。即便是已經進入數據庫的,也可能存在文字錄入或掃描識別差錯,不可盲目依賴。筆者在使用愛如生版《申報》全文庫時就多次發現文字差錯,若完全依賴其全文檢索功能則很可能造成漏檢。
此外,應避免學生患上“搜索依賴癥”,什么都靠搜索,這易變得思維簡單化,喪失應有的自我學習能力與必要的記憶儲備,“谷歌在把我們變傻”絕非危言聳聽。檢索不能代替系統性的讀書(包括電子書等新媒體閱讀),檢索關鍵詞的提出,實際考驗的是個人的學識積累。兩版《數字資源》在最后一章中的學位論文開題寫作中都有一則關于杜威的知識論研究的例子。誠如編者所言,對于這種社會科學的課題,如果僅僅以“杜威and(知識論or認識論)”或“杜威and(知識or認識)”這種關鍵詞組配來檢索,則相關結果會很少,應該從歷史和思想史出發進行研究,更多地去閱讀原著和其他一些相關研究專著(調整檢索策略,改為檢索閱讀杜威及其研究者的專著)。尤其對文科研究,必須經歷多讀書的階段,大腦中編織起自己的“知識地圖”后,有了融會貫通的悟性,才能形成敏銳的“問題意識”,從而多角度地提出合適、準確而全面的“關鍵詞”。另外,通讀瀏覽式的博覽群書還可以避免由于個人喜好或思維定式影響下的個人主觀式檢索形成的狹隘知識視野,也能增加“信息偶遇”的機會。如果沒有必要的知識積累和感悟,就會失去全局觀,雖然有可能依靠高超的檢索技能獲得許多稀見材料而出了些成果,那也是瑣碎和缺乏深度的,只見樹木不見森林,這種科研行為是功利而不可取的。筆者最后希望《數字資源》再版時能更細心地提醒讀者勿惟檢索至上而忽視了平日點滴的閱讀學習。
更全、更新、更細,不僅是筆者對《第二版》較《首版》的贊譽,更是我們對《數字資源》第三版的期許,希望以后每次修訂都能琢瑕磨瑜,沒有最好,只有更好!
[1]肖瓏.數字信息資源的檢索與利用[M].北京:北京大學出版社,2003.
[2]肖瓏.數字信息資源的檢索與利用[M].第2版.北京:北京大學出版社,2013.
[3]董小英.移天縮地,咫尺萬里——評《數字信息資源的檢索與利用》[J].大學圖書館學報,2004(3):88-89.
[4]高春玲.從海量數字信息中發現知識的鑰匙——評《數字信息資源的檢索與利用(第二版)》[J].圖書情報工作,2013(13):145-146.
[5]林佳.十年磨一劍,利器更今銳——評《數字信息資源的檢索與利用》(第二版)[J].大學圖書館學報,2014(2):125-127.
[6]青蘋果數據中心.《申報》數據庫.[DB/OL](2003-02-05) [2014-01-16].http://www.egreenapple.com/ contents/59/1330.html.
More Comprehensive,More New,More Detailed——Recommendation and Revised Expectations on The Retrieval and Applications of Digital Information Resources(second edition)
GUYe-qing,WUXin-lan
The Retrieval and Applications of Digital Information Resources(second edition) inherited the first edition's prominent characteristics that covered the rich information resources and Information retrieval tools.It is a reference book which transcend information retrieval textbook and integrated resources retrieval and resource construction with evaluation.This paper reviews the new bright spots and the shortages of the book,then thinks that not to be too dependent on retrieval while ignoring the reading and thinking.
The Retrieval and Applications of Digital Information Resources(second edition);Information resources;Information retrieval;Textbook;Book review
格式 顧燁青,吳信嵐.更全 更新 更細——讀《數字信息資源的檢索與利用》(第二版)[J].圖書館論壇,2014(7):62-66,112.
顧燁青,男,江南大學圖書館館員;吳信嵐,女,江南大學圖書館副研究員,副館長。
2014-01-13
*本文系2014年度中央高?;究蒲袠I務費專項資金項目(項目編號:JUSRP6140)研究成果之一