(西華大學數學與計算機學院, 四川 成都 610039)
· 計算機軟件理論、技術與應用·
微博知識圖譜構建方法研究
杜亞軍,吳 越
(西華大學數學與計算機學院, 四川 成都 610039)
傳統搜索引擎需要用戶從返回網頁中提煉有用知識;社交網絡搜索根據人物的社會關系、共同愛好,提供人物和興趣間的關系等方面的搜索結果。當前,社交網絡搜索主要存在2個問題:不能從語義上理解用戶查詢詞;僅局限于人物、興趣搜索,限制了查詢范圍。為解決微博搜索中存在的一些問題,并主動返回更多知識,基于微博這一社交網絡的重要平臺,研究微博社區知識圖譜構建方法,重點提出5方面的研究:微博社區中概念提取,其概念包括人物、事物、地點、事件和話題等5種類型;微博社區概念間的關系提取,其關系包括上述5種概念間的組合關系;知識圖譜是帶有語義的網絡圖譜,將概念作為頂點并將概念間關系作為邊,研究知識圖譜的構建方法;分析微博社區知識圖譜,包括構建效果、演化特征、應用效果分析;研發基于微博知識圖譜的應用系統等內容。
微博;知識圖譜;圖譜構建;概念提取;關系提取
從20世紀后期,借助關鍵詞匹配的信息檢索技術,Google、中文Baidu等世界著名的搜索引擎給人們生活、學習、工作帶來巨大變化。基于關鍵詞的搜索引擎已成為互聯網中信息獲取的主要工具。它們主要使用向量空間模型(VSM),因此無法擺脫不能滿足人們搜索精確的事實。該問題主要表現在2方面。……