金郁 張建坤 范海華 施衛國 浙江省嘉興市公安局經濟開發區(國際商務區)分局
公安服務與群眾生活息息相關,隨著公安“放管服”改革持續深化,便民新舉措不斷落地落實,使得群眾滿意度不斷提升。便民服務的提升,不僅依賴機制的改革,更加依賴蓬勃發展的新技術,正是新型技術的不斷引入,使得便民服務的革新存在新的可能。
人機對話技術是近年來人工智能技術的熱點之一,其可以讓機器理解人類語言并和人自由對話[1],這與公安便民服務的大量場景匹配度非常高。但是傳統人機對話平臺存在交互呆板和程式化問題,極度影響群眾使用體驗。
針對上述問題,本文利用新一代人機對話技術,以突出的多輪對話能力、大規模預訓練對話模型帶來的快速冷啟動、低成本知識構建、自訓練的語義模型等技術優勢,借助在公安便民服務豐富場景下積累的領域經驗和應用,創新探索新型智能便民服務模式,進一步提高為民辦事的成效力度,降低警務人員工作強度,為公安“放管服”改革的持續深化提供相關參考。
人機對話技術一直以來被認為是人工智能領域的核心挑戰。國內外較多專家學者對此進行了相關深度研究。如XU J在2020年研究了開放領域中多回合對話策略的學習框架問題,LI R在2018年發表的論文中創新性采用人工標注構建出真實的對話推薦數據,使得人機對話系統可提供建議等[2]。然而遺憾的是,傳統的人機對話平臺大部分只能局限特定場景,很難適應復雜多變的公安便民服務需求。總結來說,傳統人機對話技術的技術難點主要集中在如下幾個方面:
要讓機器聽懂并理解人所說的話,那前提是機器要像人一樣預先具備大量的知識,這些知識也需要是結構化的[3]。這里的結構化知識主要包括兩類:以特定目標為中心的對話流程知識和知識圖譜。要構建圍繞給定場景的較完備的對話邏輯流程(動態知識)預計需要花費1~2周的人力,構建給定場景的Schema和知識圖譜(靜態知識)預計需要2周左右的人力,因此知識構建的成本是非常高的。
機器人從啟動到符合上線標準需要進行多批次的優化打磨,每一批次都需要收集真實情況下的對話數據、標注數據、訓練模型、調試模型、測試對話效果、分析問題背后的原因,然后再進行下一輪次的優化,前后預計需要2~3月;類似的,知識圖譜問答效果迭代優化需要2周。
機器人在成熟場景下由于有較多的真實對話數據可供加工和利用,對話體驗是可以不斷優化的。但遷移到小樣本和新場景后的對話體驗就有非常明顯的效果下降。比如目前電商的在線機器人、快遞電話機器人等運用都不錯,但在公安便民服務小場景下,傳統的機器人會出現較差的對話體驗[4]。
鑒于上文所述技術難點,新一代人機對話技術平臺主要從如下三個層面進行突破:
(1)從知識層面,采用結構化知識的半自動構建技術,降低知識構建的成本;
(2)從對話模型層面,融入知識的預訓練對話模型,從而縮短機器人從啟動到符合上線標準的優化周期;
(3)從對話引擎層面,采用具備拓展和增強對話能力的引擎,使其具備不斷學習演進能力。
新一代人機對話技術平臺技術框架的其核心主要是5層(如圖1所示):數據層、知識層、預訓練對話問答模型層、引擎層、平臺層。其中核心3層,分別為知識層提供可擴展性的知識圖譜構建;預訓練對話問答模型層包括預訓練對話模型、預訓練圖譜問答模(KGBert)、預訓練表格問答模型(TableBert);引擎層包括Dialog Studio多輪對話引擎、KBQA圖譜問答引擎、TableQA表格問答引擎、FAQ問答引擎、MRC機器閱讀引擎。

國1 平臺技術架構國
知識來源主要分為兩類,一類是人人對話日志,另一類是工作文檔。相對應的知識構建也分兩個方面,一方面是基于人人對話日志的對話流進行構建,從傳統的手工配置升級為自動挖掘意圖,從人工標注變成自動的挖掘和半自動標注;另一方面是基于文檔的知識圖譜構建。文檔本身就具備一定的結構化信息,做了結構化后可以讓問答更加精準。圍繞基于文檔的知識圖譜構建,筆者采用半結構化長文檔的預訓練文檔模型、基于文檔的粗粒度三元組抽取、針對文本的細粒度三元組抽取,設計了一套可擴展性的知識圖譜構建方案,如圖2所示。

圖2 可拓展性的知識圖滑構建
(1)文檔預訓練模型,將文檔表示分為物理結構、邏輯結構和語義結構三個層次,使用百萬級的無標文檔數據,基于其文本語義、版面信息、視覺特征來構建自監督學習任務,使得模型能夠更好地理解文檔語義和結構信息;
(2)粗粒度三元組抽取,通過輸入整篇文檔的物理組件的有序序列,再將其物理組件如標題、正文識別出來,再根據這些信息生成文檔樹,最終根據一些簡單的規則即可得到文檔的所有粗粒度三元組;
(3)細粒度三元組抽取,基于雙線性三維稀疏、損失函數等技術的細粒度三元組知識抽取,降低了模型復雜性,提高了魯棒性。
設計了半監督預訓練的方式來解決對話策略的建模難題,將對話動作預測任務改造成半監督學習任務,并設計出預訓練模型。
(1)對于理解能力,采用回復選擇作為預訓練目標,即給定對話上下文和候選回復處進行二分類判決是否是正確的回復;
(2)對于生成能力,則使用常見的回復生成目標,即給定對話上下文生成正確回復語句;
(3)對于策略部分,采用半監督學習中十分高效的一致性正則方法來建模對話動作。
最終對于模型的預訓練,筆者將整個模型的理解、策略、生成目標加在一起進行優化,整體提升對話策略的建模效率。
主要包括針對流程型知識的對話引擎,針對表格知識的問答引擎,針對知識圖譜的圖譜問答引擎等。其中,表格問答通過將自然語言直接轉換為SQL查詢語言,允許用戶使用自然語言與表格知識直接交互,從而拓展了對話機器人的能力邊界。針對表格的表格問答引擎,主要開拓并打造了從單輪到多輪的問答和從單表到多表的問答能力。
(1)關于多輪的表格問答,筆者提出了一種基于動態上下文模式圖的框架,刻畫多輪場景下的自然語言和表格之間復雜的語義鏈接關系。
(2)多表的問答,筆者利用句法關系建模了自然語言問題內部的關系,在句法距離的度量下,數據和數據的關系將被拉近,從而生成正確的SQL。
經過大量調研和分析,對人機對話技術有較大需求的便民服務場景包括如下兩個方面;
1. 便民熱線場景
當前較多地區熱線服務電話分散,基層公安缺少統一的呼叫中心坐席人員支持,熱線服務電話一般直接轉給了窗口服務的警務人員,一方面給窗口警務人員帶來了更大的壓力,另一方面群眾在非工作時間段的咨詢不能有效的承接。
2. 疫情流調場景
近年來隨著疫情常態化,各地公安民警都需要做好疫情的防范和控制。當疫情突發時,需要進行大量的流調來對相關人員進行摸排。然而常規流調的方式主要基于人工電話來實現,一方面耗費大量寶貴的人力資源,另一方面在在時效方面無法保障快速的摸排需求。
根據上文所述便民服務場景的聚焦,結合新一代人機對話技術平臺,確定如下三條技術融合路徑,即警務智能在線機器人、警務智能熱線導航機器人和警務智能外呼機器人。
1. 警務智能在線機器人
智能在線機器人基于NLP和AI技術提供智能在線對話能力,可集成到網站、APP、小程序/微信/微博等渠道中,支持7x24小時提供智能在線服務,實現在線問答、在線智能導服、業務知識庫等能力,如圖3所示。

圖3 警務在線機器人業務邏輯圖
2. 警務智能熱線導航機器人
在熱線電話人工受理方面,需考慮智能語音交互功能。通過自助語音導航能力,分流一部分人工坐席的壓力。
研究基于語音的人機交互應用,開發警務智能熱線導航機器人,如圖4所示,當群眾電話呼入后,通過系統中的語音引導,以自由說的方式提交咨詢要求,如群眾提問“我身份證丟失了怎們辦?”,機器人可識別理解用戶表達的語義并作為正確的語音引導。

圖4 警務智能熱線導航機器人業務邏輯圖
在出入境、戶籍、交警等方面,熱線導航機器人可將各個熱線座機的統一集成,由機器人提供智能化的服務指引及問題解答,同時也能支持將機器人無法解答的問題轉接到對應的窗口警務服務人員。在方便群眾快速咨詢問題的同時,也可以有效幫助減輕窗口警務服務人員的工作壓力。
3. 警務智能外呼機器人
警務智能外呼機器人具備自動呼出能力的智能語音能力,能夠根據業務方需求,在指定時間范圍內,對指定的用戶發起主動電話外呼任務。在外呼過程中,結合運用ASR、TTS語音引擎和機器人NLP能力,能夠實現包含疫情流調、反詐預警、滿意度調研回訪等在內的各種復雜場景的外呼智能問答任務,同時還需支持將外呼過程中收集的信息和數據回流到工單或者其他應用系統,形成統計數據和日志。該機器人可以在應急時快速增加同時外呼的并發路數,從而進一步提升疫情流調的摸排效率,如圖5所示。

圖5 警務智能外呼機器人業務邏輯圖
在網絡承載方面,考慮到公安應用場景數據的敏感性等,該系統建議在公安信息網內進行部署。
在部署資源設計方面,資源需要在滿足日常使用的基礎上,預留一定的資源支撐疫情防控等高峰場景使用需求。
在業務擴展方面,系統需要能支持一定的擴展性,在后續業務量增加時進行擴展;
在業務打通方面,系統需要與公安信息網內其他業務系統之前具備打通的條件,實現外呼自動觸發等場景的連通。
在某地實踐中,基于上文的技術路徑,根據各個場景的應用訴求進行統一的平臺規劃,以新一代人機對話技術構建公安便民服務場景中警務智能在線機器人、警務熱線導航機器人、警務智能外呼機器人,并以支付寶、微信小程序的形式作為面向群眾、企業、警民的用戶界面,實現智能化在線辦事、警務熱線導航、電話熱線服務以及在防疫、群眾滿意度等場景下的智能外呼等需求。
本節重點闡述各模塊分階段落地實施設計。
(1)建設警務智能外呼平臺,并先后落地實現了引導申報外呼、實名申報外呼、滿意度回訪外呼、出警通知外呼、反詐通知外呼和疫情調研外呼等。實現了常用外呼通知業務的自動化和智能化,以及疫情調研類應急外呼能力的搭建,并溝通了應急智能外呼能力的擴展機制。
(2)落地警務智能在線機器人以及智能知識庫。智能知識庫主要是為滿足智能在線機器人的知識管理需求,而搭建的一整套半自動知識構建、知識錄入、知識編輯、知識運營的系統,能夠幫助業務人員實現高效的知識管理和知識運營。知識庫中涵蓋戶籍類、出入境、流動人口、治安、小程序申報、法律咨詢等數百條公安政務知識,以及大量通用政務知識來滿足群眾日常咨詢需求。智能在線機器人的前端是基于H5技術搭建的頁面,如圖6所示,可以方便的集成到網站、APP、小程序等渠道中,通過流程引導提供對于戶籍類、出入境、流動人口、治安、小程序申報、法律咨詢等公安政務知識的智能服務,用戶可以通過直接點擊圖標按照分類查找自己想要咨詢的問題,或者直接通過文字和語音的方式向機器人進行咨詢。機器人會理解用戶輸入的問題,并給出解答,對于答案部分還能支持語音播報。

圖6 警務智能在線機器人對外服務界面
(3)建設警務智能熱線導航機器人,一方面實現多個派出所出入境、戶籍等多個服務大廳電話號碼的統一,實現一號通辦,方便群眾記錄,同時基于智能導航機器人實現了對常見業務的智能咨詢支持,目前建設覆蓋的業務場景主要包括治安、戶籍、出入境、流動人口幾大場景。
該地通過上文所述的分布建設模式,有效的構建了基于新一代人機對話技術的公安便民服務平臺,實踐成效如下:
(1)大幅降低疫情流調等場景下警務人員的人工資源消耗量;
(2)通過智能導航機器人和辦事窗口警務服務人員的有效協同,實現群眾咨詢100%響應或接聽,服務好評率95%以上;
(3)真正實現了7×24小時不間斷提供熱線、在線等多渠道智能服務能力;
(4)提升服務效率,降低行政成本,節約辦公成本,更有效引導群眾“掌上辦”“網上辦”,實現公安政務服務全方位提升群眾辦事獲得感和滿意度。
本研究將下一代人機對話技術應用于公安便民服務場景中,通過對警務智能在線機器人、警務智能熱線導航機器人、警務智能外呼機器人三種技術路徑的探索,構建出體系化的公安便民服務平臺,實現了新一代人機對話技術在公安工作中的真正落地,提升了公安便民服務的智能化和在線化水平,切實為基層民警工作減負提供了有效的技術支撐。
在可預見的未來,人機對話會逐步從受限場景拓展到半開放場景,從單模態升級到“語音+語言+視覺+情感融合”的多模態,對話能力從預定義跨越到具備一定終身學習的對話機器人[5]。筆者將繼續研究其與反電信詐騙、案件偵辦等場景高效結合,進一步提升數字化轉型對基層工作的賦能力度。