王新
(中國農業科學院農業信息研究所,北京 100081)
在過去幾十年中,已發表的科學論文數量每年攀升8%~9%。僅在生物醫學領域,每年有超過100萬篇論文進入PubMed數據庫,每分鐘約有2篇論文[1]。然而,研究顯示20世紀70年代以來科研人員的人均每年論文閱讀數量趨于平穩[2]。芝加哥大學的社會學家evans[3]認為,大量的論文和相關的在線訪問方式導致了“科學和學術的縮小”。浩如煙海的信息遠超出了個人有效利用的范圍,但信息的序化和組織手段沒有跟上時代發展的需要。大量文獻由于缺乏有效的組織和揭示而游離于用戶視野之外。如何從文獻信息中精準挖掘主題信息,從而有效實現對文獻內容進行組織和揭示,是當前資源建設工作亟待解決的問題。
在XML主題地圖(XTM)格式規范中,文獻主題國別(country topic)被定義為一種主題類型,即國別本身是一種文獻主題。與傳統書目記錄格式如MaRc中反映文獻外在特征的“出版國別”字段不同,它從語義層面對文獻內容的國家主題進行揭示,是指文獻內容所討論的空間范疇,它既可以是研究對象(如國別報告),也可以是揭示研究對象的主題之一(如特定國家的農產品報告)。主題國別是揭示宏觀研究報告類文獻主題內容的重要屬性,對于文獻發現和縮小搜索范圍有不可替代的作用。隨著我國“一帶一路”倡議的推進,企業“走出去”的進程不斷加快,對相關報告類文獻的客觀需求量激增,對文獻主題識別與標引實踐提出了更高的要求。……