黃祥勝 汪清 楊樂 江蘇省南京市公安局
近年來,全國公安機關都在認真貫徹中央有關大數據智能化建設的相關決策,加快推進智慧警務建設工作。公安智慧警務建設緊跟大數據、人工智能等技術發展趨勢,涉及警務工作方方面面,但各類智慧警務應用都需要以一個“架構合理、技術先進、特色鮮明”的公安“智慧大腦”為基礎和核心。“智慧大腦”的能力輸出將直接決定警務現代化的成效與發展。本文以公安“智慧大腦”建設為主線,研究探討其技術架構、功能組成及設計實踐等方面內容。
“智慧大腦”是開展智慧應用的“神經中樞”,是核心基礎設施、海量數據資源、強大信息化能力的總集成。它需要構建相當規模的存儲、運算、自學習、創造等多種能力,具備“可用、可擴、可思考”的智慧特性。“智慧大腦”是一個龐大且復雜的體系,其外延往往涵蓋網絡傳輸能力、運營運維能力、安全防護能力等。談到公安“智慧大腦”建設,從網絡運算、存儲、數據、算法等方面都已具備日趨成熟的技術條件。
公安“智慧大腦”作為“神經中樞”,是開展大數據智能化和智慧警務建設的基石。筆者綜合公安“智慧大腦”的層級范圍、地域屬性、建設模式、應用規模等各方面因素,建議在地市級以上公安機關構建“智慧大腦”。本文主要研究如何開展地市級公安“智慧大腦”建設。
建設總目標是按照“六統一”原則和“四化”要求,依托新一代公安信息網,構建以統一調度的計算能力體系、全網融合的數據資源體系、安全共享的資源服務體系為一體的公安核心智慧能力支撐平臺,實現集約化建設、融合式發展、扁平化服務的目標。具體涵蓋以下四方面內容:
1. 構建數據匯聚的網絡節點
依托“新一代公安信息網”,充分利用網絡基礎,基于IPv6,建成結構精簡、智能運維的數據匯聚節點,實現用戶數據分離、多業務承載。
2. 建設一定規模的警務云計算平臺
按照分層解耦、異構兼容、靈活可控的原則,建設能夠支撐本地公安大數據智能化應用的警務云計算平臺。
3. 搭建架構合理的大數據平臺
針對本地數據資源體量和智能化應用需求,建設組件豐富、靈活擴展的大數據平臺,為全警智慧應用提供統一的服務資源支撐。
4. 提升警用算法模型支撐能力
開展包括可視化建模、模型共享等各類模型智力工具的建設,為業務應用提供強大的算法模型支撐。
1. 網絡架構
按照公安部大數據智能化的建設要求,公安“智慧大腦”應運行在“新一代公安信息網”的數據節點中,提供各項云平臺基礎設施服務(虛擬化資源池服務、物理資源池服務、GPU資源池、大數據資源池服務、存儲資源池服務等),網絡架構如圖1所示。

2. 技術架構
公安“智慧大腦”總體技術架構采用分層模塊化體系建設,具體如圖2所示。

它應該是一個物理分散、邏輯統一、業務驅動、云管協同的能力支撐體系。自下而上,包括基礎設施服務、平臺服務、模型工具三部分內容。
其中,基礎設施服務部分包括基礎資源提供、資源池管理、資源服務能力建設;平臺服務部分包括數據存儲服務、數據計算服務、應用中間件服務以及應用開發服務;最上層模型工具部分包括可視化建模工具、模型共享工具、跨區域警務協作系統以及各類算法引擎工具等。
公安“智慧大腦”囊括了豐富的建設內容和功能組成,主要涉及網絡、機房、計算、存儲、數據、模型算法等幾方面。
在網絡建設方面,公安“智慧大腦”應構建在“新一代公安信息網”數據節點上,建設分別負責業務、存儲、集群管理的核心交換機,連接各類服務器。同時,建設獨立的帶外設備管理網,完成主機虛擬化、設備管理等功能。還應包括流量控制、IP地址、網絡安全、授時服務、域名解析等內容。
在機房建設方面,“智慧大腦”機房建設根據各地實際情況差異,內容不盡相同。從網絡帶寬、傳輸能力、運算要求、存儲方式等各方面綜合考慮,建議選擇建設或租賃獨立機房的方式。
在計算能力建設方面,在分布式架構下,服務器是“智慧大腦”基礎設施層的主要計算設備。按承載的應用服務類型不同,可分為通用型服務器、計算I/O型服務器、計算存儲型服務器等。
在存儲建設方面,“智慧大腦”應能提供海量存儲資源池。一方面構建一定規模的存儲服務器作為云計算平臺存儲節點;另一方面提供滿足小照片或文件的對象存儲和實現非結構化數據存儲的歸檔數據存儲這兩種類型的分布式存儲。
在數據資源建設方面,海量數據資源是“智慧大腦”的基礎。“大腦”數據資源層按照公安部大數據平臺建設規范建設,包括數據接入、數據處理、數據治理、數據組織、數據服務等部分。
在算法模型建設方面,“智慧大腦”重點建設滿足智慧警務應用的算法模型體系。以可視化數據挖掘為抓手,強化機器學習算法在公安實戰場景的推廣應用,建設場景化的可視化關系挖掘分析模型。
南京市局作為全國公安科技信息化先進地市之一,一直在科技強警和信息化建設方面創新求進。面對艱巨的公安大數據智能化及智慧警務建設任務,逐步開展了相關建設應用探索,并被公安部列為全國公安大數據智能化建設應用地市級試點單位。在公安“智慧大腦”建設方面,南京公安已具備了一定的實踐經驗,并取得了初步應用成效。以下是具體的做法和經驗。
市局按照統一管理、分層解耦、雙活備份等原則,統一規劃全局機房建設工作。從城市規模來測算,2019年新租用專業機房,提供400個機柜,用以搭建新一代公安信息網數據節點,構建公安“智慧大腦”機房環境。
專用機房整體采用橫向擴展能力強的Spine-leaf網絡架構,支持未來業務演進。劃分為核心交換區、數據域訪問控制平臺、計算資源池、存儲資源池、運維安全管理區。網絡拓撲如圖3所示。

其中,網絡平臺主要包括防火墻、入侵防御、沙箱、WAF。防火墻和入侵檢測采用雙機熱備,串接在出口路由器和DCN網絡之間。Spine為核心轉發節點,采用高性能路由交換設備。Border-leaf是邊界接入交換機,通過數據域訪問控制平臺接入用戶域網絡。Service-leaf是業務接入交換機,接核心防火墻及負載均衡、核心防火墻。Serverleaf為服務器接入交換機,接各種物理服務器及虛擬化服務器。FI-leaf接采集器和分析器集群,實現大數據智能運維。
“智慧大腦”支持對異構基礎資源統一調度,通過物理服務器、KVM、VMware以及Docker等低損耗容器技術實現統一計算能力支撐。南京公安計算資源池根據業務場景劃分為虛擬化資源池、物理機資源池、容器資源池和大數據資源池。
南京市局構建的計算資源池總共381個節點,其中50個MPP數據庫節點、57個實時計算節點、125個離線計算節點和149個全文檢索節點。同時,還建設了能夠提供1000臺虛擬機的虛擬化資源池。包括:(1)虛擬化資源池,應對會話量小、復雜度低的業務。“智慧大腦”中大部分輕量級應用服務場景構建在虛擬化資源池上。(2)由實時、離線計算節點組成的物理機資源池,應對部分對服務器運算性能要求特別高的智能化應用。(3)由實時、離線計算及MPP全文檢索節點構建的大數據資源池,應對分布式架構的數據存儲和計算能力需求。(4)由虛擬機組成的容器資源池,主要用于Web應用場景或者移動警務終端上的App應用。
南京公安“智慧大腦”為滿足不同業務場景需求,配置多種形態的存儲系統,主要包括分布式云存儲和集中式SAN存儲等,云平臺存儲系統需要支持多種存儲形態的融合管理,如圖4所示。

1. 分布式云存儲
南京公安結合不同類型的存儲應用場景,提供分布式塊存儲、分布式對象存儲能力。分布式塊存儲滿足虛擬機、OA辦公、OLAP分析型數據庫、開發測試云等場景的塊存儲需求;分布式對象存儲應用于備份、歸檔和海量文件共享應用。
2. 集中式存儲
南京公安搭建了基于光纖或IP的SAN和NAS(網絡附加存儲)的集中式存儲環境。許多大并發、低時延的核心業務系統(如警綜平臺等)部署在集中式關系數據庫上。
南京公安“智慧大腦”實現數據資源的搜集、獲取、加工、存儲、使用、共享等一系列流程,不斷夯實全局數據資源基礎。
1. 統一數據匯聚
近年來,市局以警務大數據工程、“空中三道防線”建設為依托,獲取政府部門、行業單位、互聯網企業等數據資源,形成統一的數據資源池,為警務大數據智能化應用提供多維度、全方位的數據支撐。目前,匯聚數據資源千余類,約1.5萬億條。
2. 構建數據治理體系
市局嚴格對標公安部大數據處理技術標準,開展數據融合治理,建設原始庫、資源庫、主題庫、知識庫、業務庫、業務要素索引庫等六大庫,實現對人、地、事、物、關系的全面刻畫,為上層應用提供統一的數據支撐。現已建成人員主題庫3億條、車輛主題庫786萬條、案件主題庫2807萬條、關系專題庫47億條、軌跡主題庫20億條。
3. 完善數據處理流程
開展標準化數據處理,對匯聚的各類數據資源進行注冊、授權、發布,提供統一、標準數據服務。南京公安數據資源處理流程如圖5所示。

同時,南京公安“智慧大腦”數據資源層還實現與PaaS層能力需求解耦設計和對SaaS服務能力解耦設計。此處不再詳細闡述。
南京市局持續推進可視化建模平臺“數模空間”系統建設,不斷完善“智慧大腦”模型算法。該系統基于分布式、云計算、大數據等技術,實現海量警務資源的縱橫聯通、共建共享、深度融合,采用組件化建設模式,為警種智能化應用提供統一標準化環境下的組件支撐。系統架構如圖6所示。

系統主要功能包括可視化數據建模功能、數據采集與管理工具、模型共享發布、數據挖掘分析算法、智能圖形化數據比對等。其中,數據挖掘分析算法充分體現“智慧大腦”價值能力。南京公安結合實戰場景,開展了基于人工智能技術高級數據挖掘分析算法應用的探索。
1. K-means聚類算法實踐
使用聚類+統計分析對侵財類前科人員探索式數據挖掘,發現該類人群的隱性特征。
2. 邏輯回歸算法實踐
應用水電氣數據和節假日天氣等數據,通過使用邏輯回歸建模,提前預判房屋內人員在位情況。據測算,判斷準確率在80%以上,大幅度提高管控效率。
3. 線性回歸算法實踐
選取一段連續時間接警量數據,做時間序列處理后,快速使用線性回歸建立基于時間序列的線性回歸模型,預測下一日的接警數量。
4. 貝葉斯分類算法實踐
使用樸素貝葉斯分類算法對犯罪趨勢預測,提取主觀因素(性別、年齡、心理因素等)和外界因素(時間、地點、文化程度等),再以出所原因為分類標簽,預測不同人的犯罪結果,準確率可達到80%。

同時,為最大限度發揮公安“智慧大腦”價值,南京市局已經嘗試建立跨區域智力共享平臺,重點解決跨區域交互協作程度低、公安行業經驗無法有效分享等問題。平臺采用去中心化、分布式數據存儲的體系框架,如圖7所示。
系統實現了計算架構、服務模式以及數據融合安全三方面的內容:(1)構建跨區域警務協作計算架構。地市跨區域警務協作是對公安大數據中心集中式服務模式的有效補充和完善。(2)建立模型驅動的跨區域警務協作和知識共享模式。系統支撐各地市差異化的異構平臺和應用以及個性化靈活協作模式,同時確保跨區域警務協作高可用、負載均衡以及動態部署。(3)提高跨區域數據融合安全機制。基于管道的模型碰撞實現安全的跨區域數據融合,實現跨域數據不落地。
經過以上機房網絡、計算能力、存儲能力、數據匯聚、模型算法、智力共享能力的建設實踐,南京市局基本構建了公安“智慧大腦”的初步體系,并持續規劃拓展。市局依托600多公里主干光纜信息網絡高速公路,逐步建成800多節點、1.8萬核、200多TB內存、30PB存儲裸容量的支撐能力,面向上層數據和應用提供計算、存儲等基礎設施服務和分布式文件系統、關系型數據庫、分布式并行數據庫、離線計算、實時計算、流式計算等平臺服務,同時,匯聚千余類、1.5萬億條海量數據資源,搭建智力共享、跨區域警務協作等智聯系統,為全局核心智慧應用(警綜平臺、信息資源服務平臺、大數據實戰應用系統等)提供全面支撐,順利打造集“運力、存力、算力、智力”于一體的“智慧大腦”,為南京市局“一網一中心三平臺”的智慧警務總體架構夯實基礎。
智慧警務整體建設成為公安機關未來發展的趨勢。各地公安“智慧大腦”已經在悄然孕育,并逐漸強壯起來。它將伴隨著技術的不斷更迭,持續發展,并在廣大公安科技工作者的不懈努力下,為公安信息化實現跨越式發展提供重要支撐。