周 艷 李穎智
(1、湖北國際旅行衛生保健中心(武漢海關口岸門診部),湖北 武漢430070 2、文華學院,湖北 武漢430074)
隨著經濟全球化步伐不斷推進,國際貿易的迅猛發展,口岸的通關能力,直接影響著經濟發展。2016 年7 月,國務院辦公廳印發了《進一步簡化流程提高效率優化營商環境工作方案》,明確要求將通關時長壓縮為原來的三分之一[1]。2017 年7 月17日,習近平總書記在中央財經領導小組第16 次會議上要求各部門改善外貿自由化、便利化條件,切實解決進出口環節制度性成本高、檢驗檢疫和通關流程繁瑣的問題[2,3]。
可見,提升檢驗檢疫通關效率已然成為企業和政府的強烈期盼,而檢疫效率的提升有學者已經對通關監管的管理流程重組進行了研究,比如林光龍等[4]分析了自貿背景下實現出入境檢驗檢疫高效與便捷;郭永泉等[5]通過矩陣博弈設計出海關與檢驗檢疫區域通關的最佳方案;胡蓉等[6]通過建模和分析流程鏈,提出上海海關通關流程再造方案。
而隨信息技術的發展,我們還可以利用人工智能和本體知識圖譜相關技術來構造智能檢疫系統來輔助人工檢疫,提高檢疫效率。本文正是研究針對目前人工檢驗中存在的問題,通過深入研究探索,進行了相關的理論研究和技術嘗試,選擇了通過建立通關貨物本體知識庫,與物流信息管理系統、智慧國檢一體化監管系統和檢疫通關管理系統等要相關系統的深度集成,開發出基于本體理論構建貨物知識圖譜的智能檢疫輔助系統,實現檢疫人員檢前信息提醒、檢中知識庫提供的智能輔助決策功能。
該系統是以本體理論構造的貨物知識庫框架為基礎,通過互聯網對采集的數據進行傳輸與計算服務的技術體系,具體的架構圖如圖1 所示。從圖1 中可以看出智能審方系統包括接口層、存儲層、服務層這三個部分。其中存儲層包括數據庫和智能知識推理引擎。
2.1.1 接口層
該層主要通過服務注冊組件調用實時監控服務、數據提取服務,從物流信息管理系統業務系統中獲待檢疫貨物基礎數據,并調用映射規則服務和本體構建服務進行數據清理和融合半結構化的貨物描述數據,同時生成本局部本體模型。該層主要用于獲取智能系統所需的貨物數據,并轉換成本體模型。
2.1.2 存儲層

圖1 智能輔助檢疫系統架構圖
該數據庫主要包括貨物本體庫、檢驗知識庫、檢驗規則庫和審核流程庫。其中本體庫主要存儲各類貨物的OWL 描述模式;檢驗知識庫用于存儲檢驗標準的屬性描述信息和貨物的關聯信息;規則庫主要存儲各類檢疫的對應規則;流程庫主要存儲本系統檢驗審核所能提供的各類流程服務。這四類庫的獨立存儲有效的保證了貨物屬性和檢疫服務的獨立擴展。智能知識推理引擎,該層可以屏蔽系統數據存儲的復雜性,使用戶面對一個簡單而統一的數據使用環境,將注意力集中在對本體檢驗使用情境服務的應用上來。該中間件通過貨物本體生成器系統保證貨物屬性生成結構化貨物本體數據;通過負載均衡器保證平臺系統運行的穩定;通過消息隊列保證平臺運行的準確;通過輪詢器來控制數據采集的運行頻率。另外主要通過采集模塊獲取檢驗標準依據的基礎數據;通過推理模塊實現快速的貨物智能檢疫審核情境的構建;通過服務調度模塊實現基礎服務的應用。
2.1.3 服務層
該層主要將知識管理引擎所產生的結果以服務的形式提供給應用系統使用。其主要實現方式有Web Service、API、推送服務和檢索引擎等服務方式。其主要內容是通過查詢接口業務將貨物的檢疫審核結果信息傳遞給提出的應用。
智能輔助檢疫系統是一個開放系統,該流程的核心是以現有的物流管理系統中貨物基本信息為輸入源,將各種信息元數據匯集到數據中心,構建貨物本體圖譜與檢疫知識庫進行關聯實現智能輔助檢疫審核的服務,該系統具體運行流程如圖2 所示。

圖2 智能輔助檢疫系統的運行流程
從圖中可以看到從物流信息系統中獲取貨物基本信息,構建貨物本體圖譜,通過與智慧國檢一體化監管系統的深度集成,通過檢疫知識庫和規則庫的提醒與監測,形成智能檢疫審核結果,當出現風險時進行預警,提醒檢疫人員重點關注。并對通過智能檢疫的結果,人工檢疫中心結合經驗分析進行二次審核,對于確認的通過結果,可進入檢疫結果數據流轉到檢疫通關管理系統進行后續通關流程。整個系統達到充分利用現有技術和資源,提高系統智能應用效果的目的。
貨物本體構建即是對檢疫貨物領域概念對非結構化的物流信息文本進行抽取,大致可分為以下幾個過程:文件格式預處理、中文分詞及詞性標注、知識辭典構造、去掉相關停用詞、領域相關度一致性計算等過程,主要的工作內容包括:
文件格式預處理:先對處方進行文本預處理,去除與貨物檢疫指標不相關的信息。
中文分詞及詞性標注:通過開源分詞系統對貨物描述內容進行中文分詞以及詞性標注。
知識辭典構造:為了提高中文分詞的準確率,防止一些檢疫領域的專業術語被切分為多個字符串,因此在中文分詞的過程中,引入了檢疫領域的知識辭典。
去掉相關停用詞:對于處方中包含大量的結構性詞語,比如助詞、形容詞、副詞等,此類詞語大多只是一些結構性詞語,不能代表某一領域的主題,因此為了降低概念抽取處理過程中的計算量,設計停用詞表,對其進行刪除。
領域相關度一致性計算:采用統計算法和基于檢疫領域知識辭典的概念正向最大匹配算法進行領域相關度一致度計算。
檢疫知識庫包括三部分:一是政策文件庫,進境動物相關法律、法規,海關進口報關單,雙邊檢驗檢疫議定書,質檢總局規范性文件,相關檢驗檢疫行業標準,資質備案等相關資料;二是條件庫,只有當每個規則都成立且其結論的權值大于預先設定的閾值時該規則才為真;三是動態知識庫,包括用戶在系統運行中輸入的數據、系統推理用的規則、根據規則得出的結論,以及在解釋用戶提問時的運行過程記錄等。
通過對上述內容的整合,我們在知識庫中定義了Goods_desc 知識實體(如表1 所示)

表1 Goods desc 知識實體
通過上面的實體建模和實體關聯后,就可以根據知識庫向智能審核提供相應的匹配規則。就可以對種類繁多的貨物建立監控目錄,用于實現智能的檢疫審核系統,從而快速實現貨物的快速檢疫指標審核。
論文針對在人工檢疫過程中的效率問題,提出了利用專家思想的構建基于本體的貨物知識庫,并構建以此知識庫驅動的智能檢疫審核系統體系架構,同時給出了具體的應用流程和關鍵技術。該系統適用于口岸通過貨物檢疫等業務和管理部門,該系統可以極大的降低貨物檢疫的失誤風險,提高通過關貨物的檢疫效率,因此,具有較高的研究與應用價值。
在后續的工作中,我們將進一步完善本體模型的自動構建和知識庫的自我學習完善方法進行深入研究。