□ 李鵬 朱禮軍 劉亞潔 / 中國科學技術信息研究所 北京 100038
辛之海 / 開源旗幟軟件(北京)有限公司 北京 100125
敘詞表多表聯(lián)合標注系統(tǒng)設計與實現(xiàn)*
□ 李鵬 朱禮軍 劉亞潔 / 中國科學技術信息研究所 北京 100038
辛之海 / 開源旗幟軟件(北京)有限公司 北京 100125
通用敘詞表提供了普遍意義的概念,具有普適性、協(xié)調性與兼容性的特點,而不同的專業(yè)敘詞表提供了領域內關注的不同側重點。敘詞表多表聯(lián)合標注能夠從多視角下揭示文檔的語義。文章提出了敘詞表多表聯(lián)合標注系統(tǒng)的設計方案,介紹了敘詞表文本標注等功能模塊以及設計中應該注意的問題,并以皮膚病領域下文檔標注為例進行了研討,總結了多表聯(lián)合標注可能的應用場景。多表聯(lián)合標注系統(tǒng)為挖掘不同視角下文檔的意義提供了參考,并為文檔的語義檢索奠定了基礎。
敘詞表,標注,語義
標引是對文獻的內容及其他有檢索意義的特征進行分析、描述并用檢索標識記錄下來,作為存取依據(jù)的文獻處理過程,它又分為分類標引和主題標引。標引不僅是信息過濾的必要組成部分,也是對原信息的精煉與提升,可以使檢索更有效率,更為精準。曾經一度,因為全文索引逐漸被人采用,對于標引的需求下降,導致研究減少。但隨著研究的深入,尤其是面對海量信息的檢索與挖掘,如自動摘要、文本分析、主題檢索等的需要,標引顯得愈發(fā)重要[1]。
通用敘詞表提供了普遍意義的概念,具有普適性、協(xié)調性與兼容性的特點,而不同的專業(yè)敘詞表提供了領域內關注的不同側重點。……