張 彬
當前公安信息化建設快速發展,各省市積極推進基礎信息化工作,采集獲取了公安業務、社會管理和互聯網等數據資源,建立公安大數據云平臺,解決了“平臺孤島”等一系列問題,形成了從數據到知識轉化的數據治理理念,促進了多警種業務協同和信息共享,在實戰中積累了一定的經驗,發揮了重要價值。面對復雜的國際國內形勢,如何利用大數據思維充分挖掘大數據平臺蘊藏的海量數據價值,武裝“互聯網新一代”民警的智慧警務大腦,全面提升公安隊伍的警務實戰應用能力,成為智慧公安建設工作的重大問題。
(一)從“流程”為核心轉變為以“數據”為核心。智慧公安時代,業務流程“軀體”不斷升級改造的情況下,作為核心“血液”的數據在其中扮演愈來愈重要的角色,基于數據的分析研判已經滲透在各個環節中,警務實戰工作要從以“流程”為核心轉變為以“數據”為核心[2]。
(二)從“抽樣”分析轉變為以“全量”分析。受制于傳統業務系統數據存儲和計算的限制,民警只能在有限時間范圍和有限維度條件下分析公共安全態勢和事件,得到的結論一般不具備普適性和復用性;而在大數據時代,基礎設施建設能夠滿足警務實戰工作對于全量數據存儲和計算的需求,基于全量數據樣本得到的模型真實性也較高,并能夠在較大范圍內復用[3]。
(三)從“不能預測”轉變為“可以預測”。除了少數黑天鵝事件外,對于當今社會風險趨勢預測,在借助大數據、機器學習和深度學習等能力條件下,已經成為可能。現在的預測類模型,已經從上一代“專家系統”轉變為海量數據機器學習模式,構建成本已經大幅度降低,并隨著增量數據不斷學習完成迭代,預測精準度不斷提升。
(四)從“人找信息”轉變為“信息找人”。從人找信息到信息找人,是交互時代的一個轉變,也是智慧公安建設的要求。“信息找人”這四個字,預示著大數據時代可以讓信息找人,原因是平臺懂風險,機器懂用戶,各級民警需要什么信息,平臺和機器提前知道,而且主動提供他們需要的信息。
(一)從以信息化角度進行數據治理,到以業務需求角度進行數據治理。當前標準的公安大數據處理工作(廣義的數據治理),首先要接入公安數據、政府數據、行業數據、互聯網數據以及其他數據;其次要針對不同業務系統中的同類數據按照統一規則進行轉換,也就是數據標準化處理過程;再次,通過業務抽象融合,從標準數據中提煉出有價值的業務信息,通過提煉人、事、地、物、組織等五大業務實體,構建業務實體之間的關系,標明業務實體之間的內在聯系和內在的業務規則。以科信部門為主導進行的數據治理,實現了從數據接入、數據處理、數據組織、數據服務到數據治理的完整技術流程,但治理后的數據不能與業務緊密結合,導致數據不可取、數據不可聯,應用能用數據,但往往效果不理想。
總結來說,以業務警種需求為核心的業務庫、知識庫、業務要素索引庫等數據組織工作難以通過標準數據治理工作實現,這是因為警種的業務需求分散在各業務部門,無法以中心化數據倉庫方式進行構建。由此可嘗試進行以業務警種需求為核心的深度數據治理,可基于標準庫和主題庫構建數據各警種的業務數據空間,業務數據空間可包含業務知識庫、業務資源庫、業務標簽庫、業務關系庫等,也可基于警種實際需求構建其他業務庫。
(二)從手動采集數據進行局部數據分析,到從自主建模進行全量數據分析。目前,常規的基于案件的數據分析以手動采集數據為主,數據廣度較窄、數據維度有限、數據時限受限,很難從全業務流程入手進行分析。而基于大數據平臺的自主建模可打破以上限制,完成從數據獲取、數據匯聚到數據建模、數據可視化的全流程分析。
(三)從案發后滯后打擊研判分析,到案發前預先人工智能預警。傳統的打擊研判分析模式,在于案件發生以后,在應對以實地現場為中心的傳統犯罪尚具有優勢,而在面對模糊現場甚至無現場犯罪案件時就會顯得局促無力[4]。人工智能利用大數據技術、機器學習技術,根據公安的業務特點進行建模。通過對已知的重點人員、重點組織、犯罪行為等樣本進行模型學習以及訓練,結合公安民警經驗總結,從人員的基本信息、組織機構的基本信息、軌跡信息、關系網絡、犯罪記錄、網絡輿情等內外部數據中,利用機器學習算法,自動抽取模型特征,并根據此模型對隱性風險進行預測。
(四)從遍查業務信息孤島獲取無關聯信息,到構筑業務知識圖譜主動推送網絡關聯信息。近年來各地公安已構建了一系列的分析工具,但彼此之間不能分享模型成果,也做不到對公安業務需求的全覆蓋,在挖掘數據價值、探索智能應用方面,遠未達到“智慧”的目標。而知識圖譜綜合運用大數據、分布式計算、文本挖掘和圖數據庫等前沿技術,實現海量多元異構數據的實時匯集、處理與分析。知識圖譜作為全量數據關系分析挖掘的載體,可以快速、準確、高效地為各警種提供關系查詢、關系分析、關系挖掘等服務,將原來需要去不同的系統通過反復查詢數據、人工關系發現、人工關系研判等工作進行優化,大大減少了“汗水警務”。
基于公安知識圖譜應用,支持在全警范圍內開展主動訂閱服務,由大數據中心將訂閱結果主動推送給訂閱者,以豐富面向公安實戰應用的全鏈路通用服務。基于公安知識圖譜應用,亦可在全警范圍內開展智能分發服務,通過各民警的需求,由大數據中心將各民警的所需結果精準推送給具體單位或者個人。
(一)部分省市業務警種已基于主題庫等構建業務數據空間,并在業務實戰中發揮作用。以地市級治安警種業務數據治理為例,通過匯聚治安自有數據源和地市大數據平臺數據資源,共同加工形成面向治安管理全要素,以治安業務原始庫、資源庫、知識庫和實戰專題庫為主的治安管理信息資源體系,支撐社會治安防控體系建設。其他各警推進以治安為代表的業務數據個性化治理,最終可構建全警應用、眾創共享的警務知識管理體系,實現各取所需、各盡其責、精準匹配的對象需求與突破條線的大數據交互應用的業務需求,即以業務職責任務為中心,突出業務警種數據應用需求,推動各業務警種向大數據智能化方向發展。
(二)基于大數據平臺的自主建模已經在部分省市成功運營,深受科信和業務警種信賴。面對近期多變的疫情,全國絕大部分地區的公安科信、大數據、情指、刑偵等部門均深度參與了疫情防控數據分析工作,依托公安大數據平臺強大的接入能力,快速整合公安、工信、公共衛生和大數據局等數據,利用自主建模工具快速構筑確診病例全流程軌跡、密接人員關系挖掘和風險社區健康監測等一系列模型,在態勢評估和個體監測等關鍵環節上,發揮了定海神針的關鍵作用。每座城市的安危化作了一塊又一塊零散紛亂的數據拼圖,亟待精準還原出未知的全貌,讓每一級黨委政府心中有數,讓每一個處在危險中的市民有底,公安大數據自主建模分析的業務邏輯與疫情分析的需求完全吻合。
(三)在風險人員預測和案件預測等場景下,人工智能已初露鋒芒。典型的預測場景有風險人員預測和重點案件預測。基于歷史案件數據分析侵財類案件的特征,包括犯罪分子的身份特征、生物特征、作案手段特征、作案對象特征等,結合大數據中心數據和運營商數據,進行犯罪嫌疑人特征畫像、行為畫像以及關系圈分析。同樣的,可利用歷史案件數據分析侵財類案件發案時的時間、地點、背景等數據,分析這類案件的作案人員的特征或涉案車輛的特征,從而預測出某重點案件在某段時間,或某個位置發生的可能。
(四)業務知識圖譜主動推送,讓犯罪風險無處遁形。公安知識圖譜將公安中各類數據,匯總融合成為人、事、地、物、組織、虛擬身份等6大類實體,根據其中的屬性聯系、時空聯系、語義聯系、特征聯系等,建立相互關系,最終形成一張由人、事、地、物、組織構成的關系大網,關系網根據數據的接入可自動更新。公安知識圖譜構建的三方面技術為關系發現、語義模型、知識推理,可用于情報分析、情報挖掘和情報積累等方面。公安業務知識圖譜常見應用場景包括資金流向分析、話單分析、群體分析、隱性人員挖掘分析和潛在團伙分析等。
隨著公安大數據建設不斷深入,大數據思維在數據治理、數據分析、人工智能和知識圖譜等方面的應用也會越來越廣,廣大科技民警和實戰業務警種需要不斷學習掌握新的大數據思維模式以及典型的應用場景。首先,數據治理不是一蹴而就的工作,是一項長期持續的工程,科信部門要持續獲取內外部資源,不斷進行資源整合,完成核心六大庫的完善和升級;而各警種在標準治理結果之上,也要不斷挖掘內部業務痛點,在數據層面尋找痛點的“藥方”,完成業務知識體系建設和優化。第二,基于這些高價值密度的數據知識資源,科信和各業務警種還需要不斷學習建模方法論和工具技能,并在實際工作中不斷應用,才能夠實現自主建模式的全量分析,保證研判分析的準確性和可復制性。第三,隨著業務應用的不斷深入,在一些有規律可循的場景中,可以嘗試通過機器學習等人工智能技術實現犯罪預測等場景,一方面可以驗證前期建模中特征提取的科學性,另一方面,還可以發掘未曾意識到的風險特征點,在規則模型和機器學習模型的互相促進中實現業務實戰思路的升華。最后,基于實體、關系、事實、原理等要素構筑的知識圖譜,需要數據治理、數據建模、機器學習、自然語言處理、業務場景挖掘等多方面助力,才能夠在語義搜索、智能問答、語言理解、決策分析等多個領域為公安業務帶來強大助力。
總體來講,大數據思維在警務實戰中將會持續發揮巨大作用,從根本上提高公安機關風險預測預警預防能力和維護穩定、打擊犯罪、管理社會的水平,推動公安風險管控工作由傳統粗放管理模式向現代精細管理模式轉型升級。