柳偉新,高潔
(中國人民公安大學信息技術與網絡安全學院,北京 100038)
進入21世紀,我國經濟社會高速發展的同時,出現各種社會矛盾和不穩定因素。爆炸犯罪活動以其爆炸結果危害大、社會影響惡劣、作案風險小的特點,越來越成為犯罪分子實施犯罪的手段。同時,作為爆炸物的炸藥或化學試劑,相比于槍支更易獲得,使得自制炸藥成為可能。相比于其他暴力行為,爆炸更易造成大量人員傷亡和財產損失,更易造成社會恐慌和達到對政府施壓的效果。
面對日益嚴峻的爆炸犯罪活動,防爆安檢工作得到公安部門的極大重視。其工作范圍涉及兩大方面,一是以預防爆炸犯罪活動為目的的安全檢查工作,二是關于涉爆現場的處置工作。其中,安全檢查工作是從源頭控制爆炸犯罪的關鍵性工作,具體來說,涉及對人身、物品、場地、車輛的安全檢查,以排除危爆物品。涉爆現場的處置通常指已爆現場的處置工作,指借助專業器材,按照規范流程對已爆現場進行排查搜索,發現危爆物并及時、準確地進行處置,有效避免發生二次爆炸。
知識圖譜作為一種表示認知世界和物理世界中信息和知識的有效載體,具有豐富的語義表達能力和靈活的結構。防爆安檢知識圖譜的構建工作,涵蓋了防爆安檢工作的全流程,包括防爆安檢領域實體、實體間關系、事件以及相關法律法規等。防爆安檢知識圖譜的引入,整合了防爆安檢領域相關知識,對于開展公安防爆安檢工作具有重要意義。
防爆安檢知識圖譜的構建流程如圖1,分為模式層構建和數據層構建兩條主線[1]。模式層是知識體系的構建,綜合分析了防爆安檢的相關業務、工作流程和涉及的法律法規,引領整個知識圖譜的構建。數據層是數據實例的構建,指運用數據抽取技術從各種數據源中抽取知識。知識表示提供了一種統一的方式表示模式層和數據層兩個層面的知識。知識存儲及可視化是指用Neo4j圖數據庫對構建的知識圖譜實例進行存儲及可視化查詢顯示。

圖1防爆安檢知識圖譜構建流程
基于防爆安檢領域專業知識和公安領域相關數據資源,對防爆安檢工作的整體架構進行分析,確定防爆安檢工作的核心概念,從而形成概念體系。
模式層采用自頂向下的構建方式,定義了實體、事件、文檔三大類,實體下分人、物、車、地四類,事件下分常規安檢事件、突發情況、爆炸物處置事件三類,文檔下分法律依據和處置措施兩類。圖2是防爆安檢的概念層級:

圖2防爆安檢的概念層級
依據定義的三大類,創建了四種語義關系:
(a)檢查——民警和被檢人員、物、車、場地之間的關系,指民警對其實施安全檢查。
(b)引起——被檢人員、物、車、場地和事件之間的關系,指安檢過程中,發現被檢人員攜帶管制刀具等違禁物品,引起常規安檢事件;發現被檢人員、攜帶物品、車輛、場地存在爆炸物等危爆物品,引起爆炸物處置事件;發現被檢人員、物品、車輛、場地出現突發情況時,引起突發情況處置事件。
(c)采取——事件和處置措施之間的關系,指事件的出現需要采取相應的處置措施。
(d)依據——處置措施和法律法規之間的關系,指采取的措施要符合相應的法律法規。
語義關系見圖3。

圖3防爆安檢的語義關系
關鍵實體數據屬性的定義,見表1。

表1關鍵實體的數據屬性表
依據定義的概念、概念的屬性和概念間關系,運用Protégé本體編輯軟件構建了防爆安檢本體模型如圖4所示。
數據的有效獲取是保證知識圖譜成功構建的關鍵,數據按其組織形式分為結構化數據、半結構化數據和非結構化數據,本文的數據也來源于這三類數據形式。
(1)結構化數據:具有數據結構化程度高,組織形式一致的特點。本文從網上獲取了《危險化學品目錄》,從公安數據庫中獲取了部分人員、車輛以及違禁品數據。
(2)半結構化數據:半結構化數據具有一定的數據結構,其結構化程度低于結構化數據。本文利用網絡爬蟲技術,通過關鍵詞檢索獲取了部分網絡百科數據。

圖4防爆安檢本體模型
(3)非結構化數據:即純文本數據。本文主要采用安檢與排爆領域專業書籍、相關法律法規作為數據源。
實體是構建知識圖譜的基石,對應的實體抽取技術是知識圖譜構建的關鍵技術,其抽取結果的高效、準確為后續工作奠定了根基,是知識圖譜成功構建的重要保障。本文采用神經網絡模型BiLSTM+CRF(雙向長短時記憶網絡和條件隨機場結合)[2],其中,雙向長短時記憶網絡實現將輸入的文字序列進行特征表示,具體實現方式為:對于一個輸入序列(x1,x2,…,xt,…xn),BiLSTM模型通過一個正向LSTM表示輸入序列(x1,x2,…,xt,…xn)xt左邊的信息,通過一個逆向 LSTM 表示輸入序列(x1,x2,…,xt,…xn)xt右邊的信息,最后將左右兩邊的信息拼接作為最終的表示。然后將經過BiLSTM模型處理的文字序列輸入到CRF模型[3]中,根據實體類型和BIO標簽對每個詞分類、打分,進而完成實體識別。
關系抽取采用基于特征工程的方法,通過提取具有顯著區分性的特征,將其轉化為分類器能夠識別的特征向量,進而進行關系分類,完成關系抽取[4]。例如:Lixiis the driver of BMWx5(李希是寶馬x5的駕駛人),實體“lixi”依存的單詞“driver”的詞性是 NN;實體“BMWx5”依存單詞“of”的詞性是IN。其依存樹特征為:NNP-NP-S-VP-NP-PP-NP-NNP。
本文處理的知識融合主要是指實體消歧,本文采用的方法是基于上下文的相似度計算[5],通過對比實體指稱項的上下文環境和候選實體的上下文環境,從而在一定程度上比較出二者間的相似度。對于某一個待消歧的實體指稱項A,經由詞向量模型,可向量化表示為(A)=

知識表示[6](包括模式層本體的表示和數據層實例的表示)提供了一種統一的方式表示模式層和數據層兩個層面的知識。其采用語義網中知識表示方法,包括XML、RDF、RDFs、OWL等。具體體現在知識用統一的三元組來表示,三元組中的實體表現為知識圖譜中的節點,實體間關系在圖譜中用節點之間的邊來表示,以此來存儲現實世界中的知識。本文采用OWL(網絡本體語言)作為知識表示語言。
OWL以rdfs:subClassOf表示類別的上下位關系,例如為“實體”類定義“人”子類,OWL語言表示如下:
以owl:ObjectProperty表示類別間語義關系,以rdfs:domain表示該關系的定義域,以rdfs:range表示該關系的值域。例如以語義關系“引起”為例,OWL語言表示如下:
知識圖譜的存儲結構是基于節點和邊的結構,本文選用查詢語言更加完善的圖數據庫Neo4j對知識進行存儲。Neo4j采用表現能力強,查詢效率高的Cypher語言。例如創建部分節點如下:
CREATE(李希:Person{姓名:"李希",性別:"男",出生日期:"
1984.6",身份證號:5312});
CREATE(劉倩:Person{姓名:”劉倩”,性別:”女”});
CREATE(寶馬:Car{品牌:”寶馬”,車牌:”5631”});
創建人與人、人與物的部分代碼如下:
CREATE(李希)-[:配偶]->(劉倩);
CREATE(李希)-[:駕駛]->(寶馬);
對人物“李希”進行檢索,對應的查詢語言為:
Match(p:人物{姓名:”李希“})
Return p;
查詢結果如圖5所示。通過對人物“李希“的查詢,可以獲得其屬性信息(性別、身份證號)、駕駛車輛信息及其配偶信息。因其攜帶雷管而引發治安管理處罰事件,處置措施為對雷管進行沒收,對其本人處以拘留,所依照的法律為治安管理處罰法第30條。通過這些關系的呈現,為執法人員提供了明晰的執法指導,有利于執法人員準確高效地進行處置,提高工作戰斗力。
安檢防爆主要研究對安檢對象可能存在的危險排查和發現爆炸物等危險物品的處置,實現對特定場所的安全控制和存在危險的排除。而知識圖譜在安檢防爆中的運用體現了知識的有效組織和語義關聯,相比于公安現有的關系型數據庫,具有更高效的操作性,更好地適用于公安防爆安檢工作。
(1)相關專業性人員培訓
因知識圖譜中涵蓋了防爆安檢工作中全流程的知識,對于違禁物品的全面涵蓋、處置措施的明確規定、法律法規的準確規范,可為專業人員提供各環節的科學指導,對于防爆安檢工作有了全面、科學、準確的認識。借由知識圖譜對相關人員進行專業的培訓,對于其日后開展相關工作具有重要的指導價值。
(2)智能機器人應用模式
在防爆安檢工作中,知識圖譜作為機器人的智慧大腦,可實現人員信息識別、車輛信息識別、物品信息識別以及提供事件處置流程等。通過機器人的人臉識別模式或者證件核查篩選出重點人員,對警務人員發出警示。通過在道口不間斷檢測,通過高清攝像頭對車輛車牌號、車型、車標等進行識別,將獲得的數據與公安車輛數據庫中的數據進行比對,發現被盜搶或套牌、假牌、肇事逃逸車輛的情況予以上報。檢查卡口人員和道口車輛攜帶的物品,發現違禁物品時及時上報。知識圖譜構建中,配置了大量的處置措施和相關法律依據,為警務人員提供了準確高效的指導。

圖5防爆安檢知識圖譜
本文通過構建防爆安檢知識圖譜,將防爆安檢領域相關知識關聯成一個“語義網絡”,為警務工作提供基礎數據支撐,在一定程度上提升了公安防爆安檢工作智能化水平,提高了公安機關實戰能力。作為知識圖譜在防爆安檢領域的初步探索,本文也存在一些不足,一些實體間關系的構建也不夠詳盡,希望在以后的工作中對其進行完善。同時,隨著知識圖譜在公安領域的深入發展,其對于公安工作的價值必將日益凸顯。