□ 張兆鋒 / 中國科學技術信息研究所 北京 100038
/ 南京大學信息管理學院 南京 210093
桂婕 張運良 / 中國科學技術信息研究所 北京 100038
劉喜文 / 南京大學信息管理學院 南京 210093
基于漢語科技詞系統的專利文獻標引及應用研究*
□ 張兆鋒 / 中國科學技術信息研究所 北京 100038
/ 南京大學信息管理學院 南京 210093
桂婕 張運良 / 中國科學技術信息研究所 北京 100038
劉喜文 / 南京大學信息管理學院 南京 210093
文章介紹了利用漢語科技詞系統的詞表及詞間關系對中文專利文獻進行主題標引的研究進展,根據專利文獻的特點設計了相應的標引策略和流程,并進行實驗及結果分析,證明了本標引方案的有效性,最后對標引結果在專利檢索中的應用特色進行了介紹。
標引,專利標引,主題標引,科技詞系統
專利作為一種科技文獻,與期刊論文相比,它提供更全面、更直接的技術信息,其內容具有廣泛性、可靠性、創造性、實用性的特點,是掌握最新技術的重要信息源之一。據研究,全世界的發明成果70%~90%出現在專利文獻中。如果充分利用專利文獻,可以縮短60%的科研周期,節約40%的科研經費[1]。專利文獻是科技創新的體現,同時又是創新的基礎。隨著十八大“實施創新驅動發展戰略”,作為創新載體的專利文獻資源的挖掘與利用必將受到越來越多的重視。
專利文獻與科技論文相比,無關鍵詞字段。因此它不能像論文一樣可通過關鍵詞準確地揭示論文的主要內容,提高檢索的準確性和效率,并基于關鍵詞進行內容方面的深度挖掘,如文獻自動分類和相似性計算等。……