□ 甘大廣 蘇學 張正峰 / 北京萬方數據股份有限公司 北京 100038
科技文獻搜索引擎元數據倉儲建設實踐*
□ 甘大廣 蘇學 張正峰 / 北京萬方數據股份有限公司 北京 100038
文章分析了用戶查詢行為、行業(yè)資源出版模式等變化對數字資源整合的機遇與挑戰(zhàn),重點結合實際工作介紹了科技文獻搜索引擎底層元數據倉儲的建設過程,包括元數據采集、元數據規(guī)范、元數據整合等環(huán)節(jié)。
元數據倉儲,元數據整合,數字資源
伴隨著數字圖書館建設的進程,以網絡數據庫、數字期刊以及電子圖書為代表的數字資源數量越來越多,搜索引擎的流行及普及,行業(yè)資源出版格局及模式的變化,以及用戶信息查詢行為的變化,對元數據整合、元數據倉儲建設既是機遇又是挑戰(zhàn)。
(1)行業(yè)資源出版格局及模式的變化
隨著電子期刊以及獨家代理的出現,出版模式發(fā)生重大變化:期刊由原來的單純由出版社出版,演變?yōu)槌霭嫔绯霭妗⒋砩坛霭婧涂鐚W科的網絡出版系統等出版模式并存[1],尤其是在出版社轉制后,出版模式變化顯現得更為明顯。
(2)用戶信息查詢行為的變化
根據CNNIC發(fā)布的《第22次中國互聯網絡發(fā)展狀況統計報告》,搜索引擎是用戶在互聯網中獲取信息的重要工具,2007年12月的使用率為72.4%,規(guī)模達到15204萬人;2008年6月比重雖然有所下降,但仍然達到69.2%,用戶群人數也增長到17508萬人[2]。在另一份OCLC的報告《大學生對圖書館和信息資源的認知》中稱:89%的大學生從搜索引擎開始信息檢索[3]。……