劉冬
關鍵詞“智慧公安” 大數據 數據建模
隨著“智慧公安”建設的推進,各地公安機關依托“大數據”“云計算”“物聯網”等新技術,積極推動警務模式從傳統“粗放型”向“精準型”轉變。在此過程中,以數據建模和分析為核心的智能分析研判無疑占有突出重要的位子。以上海公安機關為例,目前上海公安機關已開發了七百多個數據模型并投入到公安實戰應用中,但是在模型的建設和應用過程中仍有一些問題和薄弱環節。
一、當前數據模型建設過程中存在的主要問題
(一)數據質量不高
如果說蛋白質、淀粉、維生素是人體不可或缺的養料,那么數據就是“智慧公安”的生命之源。數據建模作為一種應用數據進行的警務生產活動,數據質量的高低直接決定了數據建模的成敗。正所謂正確的數據不一定能得到正確的結果,但錯誤的數據一定會得到錯誤的結果。
1.數據標準不統一。在“智慧公安”的建設推進過程中很多公安機關采用“眾籌”理念,包括建設眾籌和技術眾籌。建設眾籌,即采用相關地方政府部門和社會力量參與建設,實現多方共建共享。在社會面智能安防方面采用這一模式比較多,由政府引導,安防企業出資建設擴展服務,居民僅承擔安裝費。雖然這一模式解決了資金和運維問題,但不同地區的政府機關引進的安防企業各不相同,各家企業采用的前端感知設備比如門磁、煙感、窨井蓋、車牌識別、人臉識別也沒有統一標準和規范數據結構,對后續全市的數據匯集整合帶來了不小的難度。
2.數據更新不及時。公安機關一直都很重視數據的采集和使用,也較早的出臺了數據匯集和共享方面的考核政策。但在過去較長的一段時間內,只注重大數據4V中的volume(數據量大),片面地追求數據量多,導致的結果就是公安數據匯集庫中積淀了大量的數據,但數據種類少、數據更新也不及時。
3.數據共享有限。過往公安系統內部存在著較多數據壁壘和數據煙囪現象,各個業務警種對數據共享多持有“索取多,共享少”的態度。隨著智慧公安的建設,打破數據壁壘,實現數據融合共享,充分發揮大數據的威力已經成為了共識。但是,有一些重要的數據由于法律法規和歷史原因,往往掌握在少數業務部門中,仍未實現實時、全面共享。特別是在數據建模應用比較多的外賣、快遞、網站會員信息等數據共享程度很低,直接影響了模型的分析質量。
(二)數據模型層級比較低
1.數據使用水平不高。目前公安數據模型對數據的使用還處在依據民警過往公安業務經驗將數據進行關聯、比對、碰撞和查詢階段,只是將傳統需要手工完成的公安業務自動化,距離結合機器學習算法與多源異構數據的大數據分析和智能預測還有較大的差距。
2.使用的數據結構形式單一。隨著智慧公安建設的全面開展,各類感知神經元安裝到位,公安大腦中的數據呈現“多源異構”化特征:既有傳統公安數據庫中獲取的文字、數字類的結構化數據,還有從智能攝像頭、智能門禁獲取的圖像、視頻等非結構化數據。目前公安數據建模中還是在應用結構化數據為主,文本、圖像、視頻等非結構化數據目前還不能很好地處理和應用。
3.公安數據模型數量少。阿里巴巴公司有320萬個數據模型,而目前上海公安只有七百個數據模型,差距十分懸殊。模型開發和業務需求聯系緊密,有限的模型數量嚴重影響了“智慧公安”在實戰中的作用發揮。
(三)數據建模與應用的流程不完善
1.建模需求不充分。公安大數據建模不僅僅是將傳統的民警業務經驗數字化工作,更是一種結合業務思維、數據思維和算法思維的創造性工作,建模的過程中需要集思廣益,廣開言路,集各業務單位所長。但由于知識壁壘、權限壁壘(數據和建模工具權限)和配套獎勵機制等原因,數據建模只是集中在少數部門和個人手中的“特權”活動,并沒有在全警和所有業務部門中有效推廣開來。因此建設的模型大多只是聚焦在各自業務上的單一模型,缺乏跨警種、跨部門、系統和全面的綜合類模型。
2.模型結果推送的多,反饋的少。比較常見的數據模型建設組合是由業務部門提出建模需求,科信部門進行模型開發,再由基礎業務部門去核查檢驗模型結果,三者互相配合。在實際模型開發初期推送的結果往往與實際情況有較大的偏差,再加上很多模型的結果只是概率和可能性,并不是明確的情報線索,基層業務部門面對大量的推送結果,沒有能力也沒有意愿花費大量的人力和時間去核查驗證這些“似是而非”的推送結果,容易出現敷衍了事的現象。沒有了及時和準確的結果反饋,模型開發部門就不知道自己的模型是否準確、是否需要迭代升級,從而無法形成模型開發-應用-迭代的數據模型生命周期閉環。
二、相關對策和建議
(一)強化數據治理,健全數據共享機制
1.加強數據采集的標準化建設工作,統一數據格式標準。相關部門應當抓緊制定前端采感知設備采集數據的標準,明確所需的字段和數據標準格式,統一數據傳輸協議。確保不同廠家生產的同類型感知設備采集的數據能夠順利匯集到警務上并進行數據融合。
2.加大數據治理力度,開展數據融合。一是打破數據壁壘,將分散在各個業務警種手中的公安內部數據統一納入公安警務云,實現數據物理層面的互聯互通。二是將不同來源的同一數據開展整合治理工作,在統一字段、數據標準并去除臟數據后進行合表,不再讓數據建模人員為選擇哪一張數據表而發愁。三是開展數據融合,將不同維度的數據表整合成各類主題表。比如根據身份信息構建數據主題庫,將關于個人的有關信息(如衣食住行等)整合到一張數據表中。數據建模時如需對某一個違法犯罪人員進行人物畫像時,直接調用這一人員的人員數據檔案表就可以了,無需再從底層數據關聯工作開始。
3.健全數據共享機制,讓數據共享成為常態,不共享成為例外。一是建立數據資產編目系統,厘清數據資產,讓民警能夠根據編目輕松找到自己所需的數據表。二是建立數據分類分級制度,將警務云上的數據根據分級制度確定數據密級,不再讓籠統的“涉密”兩字成為不共享的萬能理由。三是進一步完善數據共享審批流程,根據數據密級開發不同的共享審批流程。如低密級的數據可以走快速審批流程,沒有特殊理由不得拒絕共享。而高密級的數據必須一事一申請,逐級審批,做到誰使用誰負責,誰審批誰監督,確保數據的安全。
(二)重視民警的教育訓練,完善配套激勵機制
1.開展數據建模的職后培訓班,培養民警數據思維和算法思維。數據建模,數據是生產資料,算法是生產工具,解決公安業務問題是目的。目前我們的公安民警有較豐富的業務知識,而數據庫基礎和算法應用能力相對比較薄弱,表現在建模過程中就是需要外聘公司人員配合公安條線業務專家一起建模。因此急需開展數據建模的培訓班,補上公安民警在數據應用和算法上的短板,讓民警能夠自己開展數據模型建設。培訓班課程可以與社會上知名的大數據公司和大學一起舉辦,并結合公安民警的特點做適當調整。
2.完善參訓選拔和激勵機制,從“逼我學”轉變為“我要學”。數據建模作為一項具有創新性的工作,其背后需要較為深厚的數理基礎和計算機知識。如果單純的由上級指派一些業務骨干去參加數據建模培訓,那么很有可能出現部分基礎較差的同志聽了一會“天書”后便放棄了繼續學習的念頭,參訓變成了一種沉重的心理和生理負擔。因此,我們必須要建立一套與培訓難度相適應的選拔機制和激勵機制,并根據參訓學員參加的培訓難度和所取得的成績對其進行物質(工資待遇)和精神(榮譽)上的獎勵,讓想學者能夠去參訓,學成者有所收獲。
3.舉辦模型大賽,讓數據建模高手有交流的舞臺。有關部門可以參照社會上的開放數據應用大賽,每年拿出一些脫敏后的數據,讓民警自由組隊參加比賽。比賽的題目可以是開放的,只要是跟公安業務相關的就行,由民警自己選擇。題目也可以由組辦部門指定,并根據問題的難度設置問題獎勵,當民警通過數據建模解決問題后就可以獲得相應的獎勵。這樣讓數據模型高手們既有了表現的舞臺又有相應物質的回報。
(三)完善數據模型開發流程,規范數據模型應用和數據反饋,推動數據流和業務流的融合
1.根據一線業務需求開發數據模型,堅持模型服務實戰的理念,完善模型開發流程。應當堅持數據模型的開發需求由一線實戰業務部門提出,模型建設部門配合建設的理念,建立和規范公安內部模型建設需求征集流程,堅決杜絕模型開發由少數部門“拍腦袋”而產生的脫離實際、自娛自樂甚至“科技疲警”的現象。讓數據模型能夠真正急一線之所急,想一線之所想,把一線民警從簡單、不確定、重復勞動中解放出來。
2.模型的生命在于迭代升級,沒有了實戰應用和數據反饋的模型也就失去了其存在的意義和價值。首先,完善對模型建設單位的考核方式,在對其績效考核的時候不僅要計算模型建設的數量,更要統計其模型產生的戰果和推送結果的準確性。這樣在模型結果推送的時候,模型開發單位不僅要考慮推送結果的數量,更要確保模型結果的準確性和可操作性,避免讓基層一線部門疲于奔命。其次,加大對基層模型應用的獎懲機制,對通過數據模型完成的警務工作在原有考核分之上再給予一定的獎勵分數,同時對無反饋的部門進行扣分,增加各單位的積極性。
3.推動警務流程再造,實現數據流和業務流的融合。建立和完善扁平化的指揮體系,將指揮體系從原本以行政審批流程為核心的“千層餅”模式升級為以大數據分析研判為核心的“中臺”模式,減少指揮層和處置層中間的環節,提升處置反應速度。其次,整合原本分散的街面處置力量,所有一線處置力量由“中臺”進行科學統一的安排,避免“各管一段,互相扯皮”的現象,提升處置的效率。將數據流和業務流在“中臺”融合,實現公安指揮和處置體系的“秒級”響應。