999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

目標專業領域知識圖譜構建與應用初探

2024-01-23 03:22:58馬璐牛珂
現代信息科技 2023年23期

馬璐 牛珂

摘? 要:知識圖譜技術能夠將海量大數據中的信息、數據以及關聯關系匯聚為知識網絡,實現用戶智能化檢索與意圖分析推理。通過對知識圖譜構建過程中本體構建,多源異構互聯網數據的實體抽取、關系抽取、圖譜更新與維護等關鍵技術進行研究,構建了軍事目標專業領域知識圖譜,并在可視化查詢、智能問答、高價值關系推薦等方向進行了應用探索,有效提高了數據的使用效益,為軍事情報分析和知識應用提供了一種有效的工具和方法。

關鍵詞:知識圖譜;軍事目標;實體抽取;圖譜更新

中圖分類號:TP311.1? 文獻標識碼:A? 文章編號:2096-4706(2023)23-0156-06

Exploration of Construction and Application of Target Professional Field Knowledge Graph

MA Lu, NIU Ke

(Institute of Remote Sensing Information of Beijing, Beijing? 100011, China)

Abstract: Knowledge Graph technology can aggregate information, data and correlations and relationships in massive Big Data into a knowledge network to realize intelligent user retrieval and intent analysis and reasoning. The key technologies of ontology construction, entity extraction, relation extraction, graph updating and maintenance based on multi-source internet data are studied. And the military target professional field Knowledge Graph is constructed. It can be used in the visual query, intelligent question-and-answer, high-value relationship recommendations and other directions for application. It effectively improves the use efficiency of data and provides an effective tool and method for military intelligence analysis and knowledge application.

Keywords: Knowledge Graph; military objective; entity extraction; graph update

0? 引? 言

知識圖譜技術采用數據挖掘、信息分析、計量分析等方法,利用圖形將復雜的知識領域繪制并可視化,不僅能夠對知識資源和載體進行描述,同時還可以對知識以及知識之間的關聯關系進行分析和描述,實現用戶智能化檢索與意圖分析推理。

目前,知識圖譜在互聯網和一些特定行業(如音樂知識、公安系統等)得到應用推廣,但是對于軍事目標專業領域,由于數據來源眾多、數據格式復雜,且對于領域專家知識經驗具有較強的依賴性等原因,從數據到知識的轉化能力還明顯不足。具體體現在:一是雖然數據種類多、數據量大,但是蘊含在各類數據中關于目標特性、屬性狀態、環境變化規律、關聯關系沒有被有效挖掘和利用。二是現有掌握的各類資料因為領域專業性導致未進行有效整理和規范化處理,尚未形成體系化的知識組織管理模式。三是數據分析智能化、自動化水平不高。針對上述問題,本文探索將知識圖譜技術應用于軍事目標專業領域,提出了基于領域專家知識的本體構建、基于開源數據的多源異構數據的實體抽取、基于軍事目標屬性的時序多標簽關系抽取、圖譜更新與維護等解決方法和途徑,構建了軍事目標專業領域知識圖譜,并在可視化查詢、智能問答、高價值關系推薦等方向進行了應用探索,為軍事情報分析和知識應用提供一種有效的工具和方法。

1? 國內外本學科領域的發展現狀與趨勢

1.1? 知識圖譜是大數據分析與挖掘的基礎工具和有效手段

知識圖譜能夠對知識資源和載體進行描述,同時能夠對知識及其關系進行分析和描繪。通過采用大數據分析、信息挖掘等方法,利用圖譜的形式將復雜的知識展現出來,為人們提供了管理、分析和利用海量信息的手段。

知識圖譜概念首次由Google正式提出,其最初目的是為了提高搜索服務的能力,改善用戶搜索結果的質量以及搜索使用體驗。目前,隨著信息技術的不斷發展,在智能搜索、智能問答甚至商業個性化推薦等領域,知識圖譜技術已得到廣泛的應用。

1.2? 知識圖譜已成為新一代數據分析技術的發展方向

1.2.1? 互聯網等新興領域將知識圖譜用于行業數據分析和檢索

Google最初提出知識圖譜概念,主要針對智能語義檢索,目前已經十分完備;FaceBook將知識圖譜技術深化應用,構建興趣圖譜(interest graph),將人與其分享的信息等進行連接,并基于此構建了圖片搜索服務,使檢索推薦更加智能化;微軟的Probase也將知識圖譜應用于智能問答方面;Amdocs利用一個統一的圖譜進行客戶管理,通過將多種來源的數據進行整合分析,可以對用戶的信用和各種行為進行分析,并對結果進行預測,從而進行客戶關系維護管理[1,2]。

國內對知識圖譜研究起步較晚,但是目前也已經在許多行業取得重大進展。搜狗和百度分別基于知識圖譜構建了新一代智能搜索引擎智立方和知心,在語義搜索、智能問答等方面發揮出色;阿里巴巴也利用知識圖譜構建了自己的知識庫為平臺服務;科大訊飛目前將知識圖譜應用于大規模音樂知識庫構建和自動客服系統;明略數據公司將公安的數據和業務系統利用知識圖譜做了整合,通過海量數據找到嫌犯的藏身之處,為民警辦案提供巨大幫助[3,4]。

1.2.2? 美商業公司將知識圖譜推廣到軍事領域

在軍用方面,美國的Palantir公司最早幫助美國政府機構和軍方運用知識圖譜技術解決各類決策規劃問題。就軍事國防應用領域而言,其產品功能涵蓋了對在地理、空間上分散的人、裝備、環境、事件等進行大規模實時關聯和因果分析,以指導復雜戰場環境下的軍事行動。

其中較為典型的應用案例有:戰場態勢分析和預測,定位伊拉克戰場可能存在的炸彈或地雷位置,幫助美軍在巴格達規劃一條被襲概率最小的路徑,或者分析亞丁灣海盜活動的熱點區域。就其總體產品實現方案而言,除了整合美軍等多方原本孤立的數據源(如軍事情報部門和陸海空、海軍陸戰隊等組織機構的數據),Palantir公司還借助基于本體的大數據融合技術,無縫整合多源異構數據進行分析模型協同,包括各類數據模型、安全模型和本體對象的管理,其全量數據分析和知識管理能跟蹤每一個數據和模型的讀、寫和編輯、保存,以積累戰場空間的決策知識。基于這樣的通用性大數據融合和可視化分析平臺,指揮人員和調度人員能在單一系統內解決包括敵情分析(情報報告,事件行為等)、關聯分析(背景、關聯、跟蹤、反應等)、預判決策等在內的各種決策相關問題。

1.3? 軍事目標專業特定領域知識圖譜構建尚處于探索階段

知識圖譜的研究目前在國內總體上仍處于初級階段,雖然基礎理論和通用算法較多,但是僅在互聯網公司和少數特定行業(如音樂知識、公安系統等)應用推廣,在知識問答、語義搜索、規律發現等方面進行了一些探索和研究。對于軍事目標專業領域,由于數據來源的多樣性、數據結構的復雜性,包括文本、圖像、音視頻等多源數據,具有非結構化特點。特別是軍事目標需要專家知識經驗、缺少成熟的專家知識庫進行本體構建和知識抽取等特殊性原因,知識圖譜在軍事目標專業特定領域的研究尚處于探索階段。

2? 軍事目標專業領域知識圖譜構建關鍵技術

軍事目標專業領域知識圖譜構建相比于應用比較廣泛的互聯網等領域,存在知識的深度、準確性具有很強的領域性與專業性特點,因此針對軍事目標專業領域,更強調人工輔助的方式進行圖譜的構建,在此基礎上,探索以目標及目標間的關系為中心的應用方向。

2.1? 體系架構

軍事目標專業領域知識圖譜構建體系架構主要分為五個層級,分別是數據層、知識層、組織關聯層、挖掘分析層和應用服務層。知識圖譜體系架構如圖1所示。

1)數據層。實現對多源異構數據,包括圖像,文本、網頁等互聯網公開數據、基礎地理信息測繪數據以及移動通信數據等進行統一的引接和管理。

2)知識層。實現對判讀經驗/背景知識/目標知識以及文字材料等表達和抽取。

3)組織關聯層。采用目標抽取、關系抽取等技術,給數據打上時間戳和空間戳,建立時間關聯、空間關聯、屬性關聯等多種關聯體系,實現面向目標的一體化時空組織。

4)挖掘分析層。為整個技術框架的核心部分,包含了一套基于深度網絡模型的智能化框架,可以實現目標特征提取表達、目標檢測識別、規律行為分析、信息協同推薦等功能。

5)應用服務層。提供目標信息的可視化支持,滿足態勢分析、規律行為分析等不同的應用需求。

技術體系架構中每層對應相關軟件組件。其中數據管理層對應了底層的數據庫和文件系統管理系統;組織關聯層對應數據組織中間件;挖掘分析層通過統一檢索接口與算法框架進行數據交換,利用深度學習等算法分析數據,解譯目標信息;而應用服務層進一步利用可視化支持軟件,以圖形化的方式給用戶展現目標態勢和情報。

2.2? 知識圖譜構建技術流程

對于軍事目標領域的知識圖譜構建而言,其構建流程可以用圖2來進行表示,分為五個主要的流程。

2.3? 基于領域專家知識的本體庫構建

本體庫可以視為構建知識圖譜基本組成元素的模具,定義了知識圖譜中的數據模式,定義了該領域知識標準化、規范化的結構,所有外部輸入的知識必須經過到本體庫中本體、屬性和關系的映射之后,才能夠被添加到知識圖譜中去。

在軍事目標專業領域,因情報分析人員長期形成的判讀經驗分散復雜、系統性較差、主觀性強、重復性差且不易量化表達等問題,研究重點是將經驗知識數字化,將情報分析人員的主觀經驗進行規范化描述,系統性總結,形成計算機可處理的客觀知識。

在軍事目標專業領域知識圖譜的本體構建中,首選要根據專家經驗列出重要概念[5]。以飛機目標為例,對于軍事作戰來說,分為軍用飛機和民用飛機,其中軍用飛機按照作戰用途可分為戰斗機、攻擊機等。與飛機相關的重要概念的有包括飛機名稱、飛機別稱、外形尺寸、性能、研制單位、制造商、生產日期等。

在列出重要概念的基礎上,需要給出類的關系屬性。在本體中的語義關系表示類與類之間的關聯關系,如表1所示。

結合應用領域實際,列舉飛機類內、飛機類與機場類間語義關系如表2所示。

最后,采用本體表示語言OWL與Protégé工具構建軍事目標專業領域知識圖譜本體庫,成為知識圖譜的基礎和規范,如圖3所示。

2.4? 基于開源數據的多源異構數據的實體抽取

在軍事目標專業領域知識圖譜構建的過程中,從非結構化的數據源獲取實體及實體間的關系是圖譜內容的主要來源之一[6,7]。從數據結構來講,主要是文本、圖像、視頻等。本文數據來源主要為網絡上的開源數據,其包含海量多源異構的軍事領域信息,基本上都以半結構化或非結構化的形式存在,難于直接進行知識表達和挖掘。因此,針對多源異構開源信息,設計并實現了一個通用的多源異構軍事信息抽取框架,具體步驟如圖4所示。

1)利用網頁檢索工具,從互聯網中獲取可能包含軍事領域信息的網頁,通過對網頁上的鏈接進行進一步分析,獲取更多軍事信息的網頁,從而進行一定深度的爬取來獲取更多的軍事領域信息。

2)通過網頁去重避免對相同的頁面進行重復爬取。

3)通過網頁預處理,對網頁中的語法錯誤進行修復,去除文檔中的無用信息,同時將HTML格式的文檔轉化為結構化的數據格式,方便后續處理。

4)根據設定的模板規則對爬取到的網頁進行分類,剔除相關性不大的頁面,得到目標頁面。

5)從目標頁面中識別出需要的信息,利用機器學習的方法自動生成符合用戶目標的抽取規則來抽取信息。

6)將抽取出來的數據實體進行規范化處理,并將處理過的數據實體存儲到數據庫中。

2.5? 基于軍事目標屬性的時序多標簽關系抽取

在知識圖譜構建的過程中,實體關系抽取與傳統的實體關系抽取任務不同,在軍事目標專業領域知識圖譜構建的過程中,存在兩個明顯特點:一是專業領域知識圖譜需要反應軍事情報的動態特征,所以知識圖譜必須是時序的;二是知識圖譜需要反映軍事目標之間的復雜關聯,部分實體間存在著多種關聯關系,所以知識圖譜的關系類別是多標簽的。針對上述問題,設計了一種多標簽的實體關系抽取方法:

1)利用初步提取的實體和本體庫中預設的簡單關聯關系,將實體和關聯關系等價為詞匯,使用語句分類的方式對存在間接關聯實體進行關系分類,并為之賦予相應的時序標簽,進而得到帶有時序信息的多標簽式關聯關系。

2)由于軍事目標時空結構和時空關聯關系的復雜性,場景實體之間的關聯關系往往呈現出多標簽、多類別的形式。作為一個典型的案例,在同一個觀測案例中,F-16型戰斗機可能同時停住和離開內利斯機場,這樣F-16和內利斯機場之間就同時存在“停駐”和“離開”兩種類型的關聯關系。正由于這種情況,假設各實體之間關聯類型單一的傳統關系抽取方法,就無法滿足這種多類和非確定關聯關系的分析需求。針對這種情況,本文采用遠程監督的方式來完成多標簽關聯關系的分類和提取,以關系標簽的無向圖的方式來對實體之間多個關聯關系進行建模,基于無向圖的關系標簽分類以圖結構遍歷算法的方式來實現,通過尋找關系連通圖中的聯通分量的方式,對所有可能屬于當前語句表達方式的關系標簽進行搜集。

3)最后通過K-means聚類的方式完成可能關聯關系標簽的篩選和劃分。上述K-means聚類主要解決樣本中多標簽問題,具有這樣一些典型的優勢:進一步放松了遠監督啟發式匹配的假設條件,更好地利用知識庫中給出的信息,可以解決知識庫存在的實例不完整問題。這些優勢契合了軍事情報中信息時空離散性高、關系種類多樣、關聯模式不單一的特點,進而能夠更好地起到挖掘軍事情報中關聯關系的作用。

2.6? 圖譜更新與維護

知識圖譜的更新與維護是指在其構建后對知識圖譜中的實體及其屬性和關系進行增加、刪除、修改的一種方法。知識圖譜的建立是一個反復迭代長期的過程,并不是一次性就能夠實現的,需要對其實體及其屬性和關系進行常態化的周期性的更新與維護[8]。主要過程包括:

1)在軍事目標專業領域知識圖譜的更新與維護當中,首先要確定需要更新的實體與新的實體之間的關聯。通過采用Trans E推理模型,推理出在增加過程中需要補全的實體數量,作為實體的數據源進行更新操作。

2)在確定實體間的關系后,對于實體間的刪除操作應謹慎處理。首先增加時間戳判斷是否進行知識圖譜更新,如果沒有達到更新頻率,則對更新頻率進行估算,對關聯算法進行改進,以求在更新過程中對相關資源得到最優化利用。由于軍事目標專業領域知識圖譜中刪除操作有可能對原有的知識圖譜的結構產生影響甚至破壞,因此在進行實體及其關系刪除操作前,必須對其進行判斷是否造成“孤島現象”,一旦發生知識圖譜結構的變化則調用數據模式層的相關算法,否則采用關聯更新算法。其更新與維護流程如圖5所示。

3? 軍事目標專業領域知識圖譜可視化及應用

3.1? 基于視覺特征的可視化查詢

由于軍事目標種類型號劃分復雜,僅以肉眼方式進行判別需要大量的專業背景知識和長年累月工作經驗的積累,因此在知識圖譜的基礎上提供一種直接基于圖像特征輸入的目標智能化查詢結構,對提高情報分析效率和準確率具有極其重要的意義[9]。視覺特征的智能化查詢步驟如圖6所示。

本文設計了結合深度學習目標檢測識別,將檢測結果送入以上識別模塊中進行目標型號級識別,識別結果與軍事目標專業領域知識圖譜信息進行實體映射,最終可實現對圖像輸入進行目標相關信息檢索,提高情報分析人員的自動化和智能化水平。

3.2? 基于知識圖譜的智能問答

基于知識圖譜的智能問答主要由問題理解、問題求解和答案生成三部分構成。其中問題理解對輸入的用戶問題進行解析,抽取出求解該問題必需的語義信息,問題求解則將問題理解的結果轉換成圖數據庫的查詢,最終答案生成將查詢結果轉化成了自然語言形式的答案返回給用戶。由于基于知識圖譜的智能問答是在知識圖譜的基礎上進行的,問題求解也最終體現為知識圖譜上的查詢,所以問題理解模塊的關鍵是將用戶問題映射到知識圖譜上的實體,并表達出用戶的查詢意圖,這兩者即構成了問題中待抽取的語義信息[10]。

模塊的總體流程如圖7所示,用戶問題首先經過淺層語法分析進行分詞,得到的結果作為問題分類的輸入;問題的類別識別出后,問題的部分用戶意圖便已識別出,問題中的對知識圖譜的指稱也被抽取出來,指稱被鏈接到知識圖譜中具體的實體;問題理解的結果對圖數據庫查詢模板進行實例化,生成具體的查詢語句,得到的查詢結果由答案生成模板加工成自然語言形式的答案返回給用戶[11]。

3.3? 高價值關系推薦

由于情報分析人員對目標和關系的認知具有局限性,并不能完全掌握所有實體間的關系。軍事目標專業領域知識圖譜利用學習和推理算法進一步挖掘出實體與關系之間更深層次的聯系,以達到豐富和完善知識圖譜,可用于輔助發現異常癥候和進行規律分析。

知識圖譜新增實體節點和隱藏關系數據量巨大,將新增關系全部推送給情報分析員不利于情報數據的高效分析。為更好地發揮知識圖譜的使用效益,本文借鑒互聯網中常用的高效鏈接推薦和排序學習等方法,提出了一種協同過濾推薦算法:對關鍵性鏈接的價值進行排序,僅將出現頻率上較為罕見或是關聯實體較為重要的關聯關系推薦給情報分析員,本方法加入知識圖譜會得到更好的效果,提高推薦的有效性,輔助其快速準確地獲取所需知識。

4? 結? 論

本文在介紹知識圖譜技術發展現狀與趨勢的基礎上,商業知識圖譜與專業領域知識圖譜構建存在較大的區別,本文針對軍事目標的特點,提出了軍事目標專業領域知識圖譜構建的技術流程和主要實現思路,最后給出了知識圖譜的應用方向。

現階段,知識圖譜的容量不足,本體和實體數量遠遠不能滿足軍事目標領域的實際使用需求,知識圖譜的情報保障與應用服務能力還有待進一步探索。下一步,將持續對知識圖譜進行更新和維護,探索人工智能等先進方法提高知識圖譜的知識保障能力。

參考文獻:

[1] 徐增林,盛泳潘,賀麗榮,等.知識圖譜技術綜述 [J].電子科技大學學報,2016,45(4):589-606.

[2] LIN Z Q,XIE B,ZOU Y Z,et al. Intelligent Development Environment and Software Knowledge Graph [J].Journal of Computer Science & Technology,2017,32(2):242-249.

[3] 劉柳.知識圖譜的行業應用與未來發展 [J].互聯網經濟,2018(4):16-21.

[4] 劉嶠,李楊,段宏,劉瑤,等.知識圖譜構建技術綜述 [J].計算機研究與發展,2016,53(3):582-600.

[5] 張德政,謝永紅,李曼,等.基于本體的中醫知識圖譜構建 [J].情報工程,2017,3(1):35-42.

[6] 魏自強,鄭偉偉,許永康.基于百科知識的醫療數據知識圖譜構建 [J].網絡安全技術與應用,2020(10):86-88.

[7] 滕曉程.Web信息抽取框架技術研究 [D].南京:東南大學,2016:15-24.

[8] 李天宇.教育知識圖譜更新與維護的方法研究 [D].哈爾濱:哈爾濱工程大學,2018:22-36.

[9] 歐陽劍波.基于圖像語義相關性學習的視覺檢索重排序 [D].合肥:中國科學技術大學,2022:19-29.

[10] 樊美琦.基于知識動態補全的金融智能問答系統 [D].成都:電子科技大學,2022.

[11] 孔世明,馮永,張嘉云.融合知識圖譜的多層次傳承影響力計算與泛化研究 [J].計算機科學,2022,49(9):221-227.

作者簡介:馬璐(1984.11—),女,漢族,遼寧沈陽人,助理研究員,碩士研究生,研究方向:知識圖譜構建及軍事應用;牛珂(1976.9—),男,漢族,河南唐河人,高級工程師,本科,研究方向:軍事目標體系構建。

收稿日期:2023-06-28

基金項目:裝備預研項目(30503040311)

主站蜘蛛池模板: 欧美午夜精品| 国产亚洲精品91| 欧美一区二区三区国产精品| 在线看片国产| 制服丝袜国产精品| 国产精品3p视频| 国产成人夜色91| 国产91丝袜| 这里只有精品在线播放| 久久综合亚洲色一区二区三区| 亚洲天堂精品在线观看| 青青草国产精品久久久久| 人人91人人澡人人妻人人爽| 中文字幕在线视频免费| 久久香蕉国产线看观看精品蕉| 欧美中文字幕在线二区| 久久精品视频亚洲| 一级黄色网站在线免费看| 亚洲无码91视频| 亚洲综合香蕉| 国产在线自乱拍播放| 色悠久久久久久久综合网伊人| 国产欧美中文字幕| AV网站中文| 综合色婷婷| 亚洲第一极品精品无码| 亚洲妓女综合网995久久| 成人亚洲国产| 国产自产视频一区二区三区| 欧美激情视频二区| 国产菊爆视频在线观看| 在线国产你懂的| 久久香蕉国产线| 全部免费特黄特色大片视频| 日韩在线成年视频人网站观看| 久久精品91麻豆| 日韩一区二区在线电影| 久久精品人人做人人爽电影蜜月| 国产在线98福利播放视频免费| 成人国产精品网站在线看| a毛片在线免费观看| 午夜激情福利视频| 欧美性久久久久| 日韩欧美一区在线观看| 亚洲国产AV无码综合原创| 欧美黄网站免费观看| 美女内射视频WWW网站午夜| 亚洲精品另类| 日韩在线2020专区| 国产高清毛片| 国产高清在线观看| 欧美成人影院亚洲综合图| 色综合久久88| 亚洲—日韩aV在线| 色综合久久88| 92午夜福利影院一区二区三区| 999国产精品| 国产门事件在线| 欧美人在线一区二区三区| 在线va视频| 国产精品不卡片视频免费观看| 亚洲综合欧美在线一区在线播放| 54pao国产成人免费视频| 国产亚洲精久久久久久无码AV| 国产福利观看| 日本在线国产| 九九九九热精品视频| 日韩精品资源| 国产噜噜在线视频观看| 真实国产乱子伦高清| 欧美国产在线一区| 亚洲国产精品无码久久一线| 九九视频免费看| 99久久精品无码专区免费| 老司机aⅴ在线精品导航| 福利在线免费视频| 狠狠干综合| 香蕉国产精品视频| 免费观看无遮挡www的小视频| 亚洲精品手机在线| 91精品伊人久久大香线蕉| 日本精品一在线观看视频|