張 穎,劉 輝
(1.南京藝術學院信息化建設管理中心,南京 210013;2.網絡通信與安全紫金山實驗室,南京 211111)
金盾工程實施以來,公安系統已經形成了相對完善的基礎設施、網絡平臺以及各類應用系統。經過多年的業務沉淀,數據種類日益豐富,數據數量每日以TB級速度遞增,但同時也帶來了一系列問題:各類數據信息來源復雜,數據質量參差不齊,異構數據增多,數據重復、跨警種/層級/地域的數據資源無法有效共享[1],各業務條線實戰能力有待進一步提升。大數據和云計算技術的發展為構建統一的數據治理和綜合服務平臺,形成資源和服務共享的體系,實現公安業務部門間的“打、防、管、控、服”一體化聯動提供了可能,全面提升公安協同作戰能力,構建智慧警務體系的理念逐步在公安部門形成共識。
本文正是基于此背景,在公安大數據平臺的基礎上,重點探討如何通過可視化技術構建智慧警務大屏一體化指揮調度系統,提升快速科學決策和統一協同作戰能力。
數據可視化技術可以理解為一門利用計算機圖形學、用戶心理學、數據建模和挖掘、交互設計學等綜合學科的知識對數據進行圖形化表達以增強用戶認知,提高信息溝通效率的一門綜合性應用的技術和方法。在大數據時代,數據可視化是不可或缺的工具和手段,其過程和步驟一般分為數據源明確、數據采集獲取、數據清洗和過濾、數據入庫和存儲、數據建模分析、數據展示以及人機交互等。目前常見的數據可視化工具有Google Chart API、Float、Gephi、Raphael、D3等,地圖可視化工具包括Modest Maps、PolyMaps、OpenLayers等[2]。2018年底美國工業安全部門出臺了一份針對新興技術的出口管制名單,其中就包括了數據可視化技術[3]。因此,針對數據可視化技術的研究與應用迫在眉睫。
大數據背景下智慧公安的建設旨在提升公安警務效率和各部門協同作戰能力。但目前在智慧公安建設的過程中存在以下幾個方面的痛點。
公安數據體量大、增長快,數據資源非常豐富,不僅存在八大資源庫、警務綜合應用庫、情報、刑偵等業務警種的情報信息庫[1]和來自各業務平臺的數據,也有來自電信、物流、金融、水電煤氣等相關機構的信息數據,同時這些數據結構不一,涉及結構化、半結構化和非結構化數據,如數據庫表、XML、文件、各類文檔、文本、音頻、視頻、圖片等[3]。且數據質量參差不齊,加大了數據綜合利用的難度。
在長期信息化建設的過程中,由于公安各業務條線的系統在建設之初都是單獨建設的,一方面這些業務系統在建設過程中并未充分考慮未來數據交換和服務的需求,或者即使考慮了但預留的數據服務接口也非常有限,因此各系統之間并不能很好地提供數據相互調用服務。此外部分緊急業務處理需求過程中即使臨時增加了新開發的數據服務接口,也帶來了運維成本增高的問題;另一方面由于各種業務數據如警情、重點人員、情報、刑偵、經偵、技偵等業務信息并未實現充分共享,信息之間存在壁壘或者孤島,導致在警情研判和綜合決策指揮調度時各類數據資源的整合和利用率低。
在公安實際業務過程中,警情案情的監測、分析和研判本質是一項綜合性的決策工作,需要依賴來自各業務部門的數據支撐,但目前并沒有能夠有效支撐決策的能提供時空化、直觀化、可視化、便捷化的綜合研判工具,由此造成了決策效率相對低下,各部門協同作戰能力有待提升。
大數據平臺的建立部分解決了數據異構和數據共享的問題,但在支持公安業務快速研判和決策方面,仍需要依賴大數據平臺發揮其獨有的數據價值。在實際過程中,往往基于大數據平臺的數據共享服務層之上再建立數據應用層,并提供數據查詢、搜索、比對、信息布控以及數據挖掘和分析服務。同時基于數據應用層建立可視化展示的大屏,以此來提高數據的可視化研判決策和指揮調度能力,實現態勢分析綜合化、研判決策實時化、指揮調度可視化,也能提升各部門警務效率和協同作戰能力。
公安大數據的可視化通常是基于各類數據服務和應用的綜合展示。從業務的角度公安數據可以劃分為以下幾個類別。
(1)PGIS數據:主要是地圖相關的數據。
(2)反恐維穩類數據:包含六個類別,涉恐人員數據、事件類數據、情報類數據、重點管控數據、重點車輛數據以及視頻感知數據;
(3)打擊犯罪類數據:包含警情類數據和案件類數據;
(4)安全監管類數據:主要展示道路交通、消防火災事故數量、地區分布及比較分析;
(5)勤務執法類數據:包含勤務監督數據和執法類數據;
(6)危險物品數據:主要展示區域重點危化企業和?;飞a、運輸、使用企業,以及民爆物品、槍支彈藥、劇毒化學品、放射性同位素等數量及地區分布;
(7)交通運輸數據:如機動車保有量及地區分布,駕駛員數量及地區分布;
(8)消防安全數據:主要展示消防重點單位、重點部位數量及地區分布,以及與消防管理、滅火救援相關的數據等;
(9)人口管理數據:如全市常住人口、暫(居)住人口數量及地區分布;
(10)警務資源數據:如全市民警、警務輔助人員數量及地區分布等;
(11)其他數據:如政府部門、企事業單位、社會相關數據等。
從數據特點來看,數據可以分為時空數據和非時空數據。其中,時空數據主要涉及地理信息數據和空間標量數據,如轄區地圖、警力分布圖、攝像頭的分布、網格單元示意圖等。非時空數據占比較大,包含各項業務分析綜合指標,如從時間維度分析的案情趨勢情況、實有人口統計;重要文本信息,如實時案情展示;層次關系和網絡關系數據,如重點任務關系圖譜;以及多維度關聯數據,如結合不同業務指標對某一轄區派出所的多維評估等。業務數據類型多樣而繁雜。從數據展示的維度,可視化可以通過熱力圖、地圖、散點圖、雷達圖、柱形圖、餅圖、條形圖、折/曲線圖、南丁格爾玫瑰圖以及組合圖形等展示不同分析角度的數據。具體來說,結合業務需求和數據本身的特點,其展示方式可總結如下:
(1)地理信息數據:公安某派出所所管轄區重要安全檢測點信息等。常見涉及的業務數據包含:如警務資源數據、人口資源數據、危險物品數據中跟區域部分相關的數據,可用地圖+標注等形式展示。如圖1所示。
(2)空間標量數據:主要是統計類數據,如犯罪類數據按照時間維度統計的分布情況、展示方式有:散點圖、熱力圖等。
(3)綜合分析指標:如常見交通警情類別分析,全市駕駛車輛和駕駛人員統計以及同比分析等,此類數據常常是基于基礎業務數據之后的二次統計和分析的結果??捎弥螆D、條形圖、餅圖等統計圖形展示。
(4)直接文本數據:如案情、警情實時播報;安全監管類數據中的實時安全檢測情況播報;交通運輸數據中的實時交通狀況播報;反恐維穩類數據中的實時情報等。展示方法如基于詞頻統計,標簽云技術等,直接對信息進行精簡之后滾動播報展示。
(5)層次關系或網狀關系數據:全年案情類別統計以及案情關聯分析,重點人員和重點車輛關系分析等。此類數據往往不是單一來源,是多個不同數據源通過數據挖掘而得到的數據結果集。展示方式如上下層次樹、網絡拓撲圖結構、關系圖譜。
(6)多維度關聯數據:重點人員、涉恐人員等信息多維度展示等。展示方式有雷達圖、堆疊面積圖、多維立體坐標圖等。
從海量數據中發現案情線索的蛛絲馬跡或找出布控對象的關聯,是公安業務中常見的應用場景。傳統的辦案過程中民警本身的經驗和素質起著舉足輕重的作用。依托于大數據平臺的可視化建模分析工具,民警可以將自己的辦案思路和經驗形成流程化的研判模型,通過條件碰撞、比對、數據查詢、合并、分類等操作從而找出數據中的關聯,這一系列過程的可視化展示可以極大地降低民警學習的成本。一般來說基于業務模型的動態流程可視化過程可分為:①明確業務需求;②確定原始數據庫;③建立分析算子或模型;④選擇可視化展示組件;⑤數據轉化和展示。其中步驟③可以對此迭代,形成中間模型和中間數據結果,并在此基礎上進行二次分析。圖7為某公安局重點人員同住分析的可視化建模過程。
數據可視化最關鍵的一環在于可視化的設計,在實際應用過程中由于存在業務場景不同、使用對象不同、展示客體不同等因素,往往需要多維度綜合考慮和衡量。一般來說,至少需要從以下幾個角度考慮。
3.3.1 數據特點和業務使用場景
數據的特點主要考慮數據的更新頻率,一次數據傳輸的大小,數據交互時增量傳輸的數據量等。而業務場景主要考慮三個方面:①查詢和過濾:在實際業務使用的過程中是否需要進行條件過濾,以及對應過濾時進行數據選擇所涉及的時間和數據傳輸成本,需要盡可能讓用戶交互時的延遲感最低。如采用預先加載技術或增量數據傳輸技術等;②圖形的放大或縮?。河脩粼诋斍安僮黜撁媸欠翊嬖趫D形縮放的需求,當從整體切到部分布局的時候是采用彈窗還是屏幕縮放,一般彈窗適合針對整體中部分指標的詳細信息進行二次瀏覽,而普通情況下僅對當前數據的查看采用縮放圖形即可;③圖形之間的聯動以及下鉆問題:圖形之間的聯動可以更好地探究業務之間的關聯,在考慮圖形之間聯動的時候,存在圖形的重新加載或數據切換,如果數據量較大,可采用分步加載的方式,在不影響用戶體驗的情況下將次要數據放在后面加載;而下鉆最重要的是如何進行返回以及確保在下鉆的時候不丟失原有上層信息的問題,可在下鉆的時候將部分上層數據帶入。
3.3.2 用戶習慣和交互心理
不同的用戶其使用習慣存在一定差別,但從格式塔視覺心理上講,可視化的設計需要遵循以下幾個原則。
原則一:簡單原則。大屏是對信息的綜合展示,因此在顯示的時候必須有所側重、分清主次。只對跟業務密切相關的重要指標數據進行簡單展示,才能夠讓用戶一眼抓住關鍵,從而避免信息過載;
原則二:對比和近似原則。心理學研究發現,與間距較遠的元素相比,位置彼此接近的元素會被看作是一個整體的一部分,因此在進行可視化設計的時候要注意對于內容相似或風格相似的數據和圖形在布局上需要安排更靠近,從而讓用戶產生整體聯系感。同時如果要突出相似數據之間的差異性,則要在兩者之間關鍵不同點的色彩、風格上有所區分。
原則三:視覺焦點原則。在進行可視化設計的時候需要和業務人員進行多次溝通,如有必要,跟隨業務人員進行實際場景的體驗,從而進一步弄清楚不同場景主要關注的指標和數據,在設計的過程中將這部分數據突出顯示,以便用戶第一時間抓住視覺焦點。
3.3.3展示方式和風格
首先需要考慮的是展示客體的分辨率和尺寸,同一張圖在手持終端、電腦屏幕以及大屏上展示的需求和效果都有一定的差異。特別是當下流行的多信號源輸入大屏,往往需要用16∶9或16∶10的比例小屏拼接為大屏以達到最佳視覺效果[4]。
其次要考慮的是整個大屏的布局和劃分。在公安業務系統中常見的大屏布局劃分包括:以中央為主題,左右兩側為輔助的左中右型;上下左右四分型;上2/3下1/3的不對稱型;九宮格型等。但不管是哪一種布局,都需要分清主次,其基本原則是將用戶最關心、最核心的數據放在用戶視覺焦點進行展示,同時適當弱化次要信息,保持整體風格一致。
其他需要考慮的因素還包括具體圖形展示的位置、方向、形狀、顏色、紋理、灰度等級等[5]。在公安環境中,大屏展示以深藍色系為主,建議使用公安標準色,同時結合紅黃橙不同的等級數據展示關鍵預警或警示信息。具體可關注《GA/T 2000.260-2019公安信息代碼第260部分:視頻圖像關注對象標注顏色代碼》《T/CICC 16001-2018一體化指揮調度業務資源圖形符號技術要求》。
隨著大數據技術的發展,可視化技術在智慧公安系統中已得到廣泛的應用并取得了良好的效果。各類技術和工具也是層出不窮,但基于公安業務的可視化技術并未形成體系化的理論,實戰過程中也存在諸多需進一步解決的問題,主要體現在如下幾點。
由于存在多源數據或異構數據,導致數據在進行展示前需要經過數據清洗和數據質量提升[6]。這個過程的效率直接影響到最終數據展示的效果,特別是針對實時流數據,如何能夠做到實時可視化展示,在技術上仍需要加強和提高。
在實際應用中可視化展示的大屏往往有限,可謂“寸土寸金”,而當前大部分的統計分析軟件在面對多維度數據有效展示時能力往往不足。如何在有限的可視屏幕中更有效地展示多維數據,使信息更加立體和全面值得進一步研究。
如果數據從源頭發生結構上的改變,或者從業務的角度增加了新的維度,往往需要可視化相關聯部分重新編碼或設計,造成前期投入和資源的浪費,可視化圖形可配置性不高或修改代價較大[7],因此需要從原子粒度的角度對可視化組件和業務數據進行建?;蚰K劃分,提升可視元素的可重用性,節省成本。目前模塊化可配置的可視化組件方面的研究已取得一些進展,如專利2017113975588提出了《一種基于可配置控件的輕型應用程序創建方法》,但如何更合理科學地進行原子粒度組件的劃分仍值得進一步探究。
本文基于智慧公安建設的大背景,在介紹大數據平臺的基礎上,結合實際經驗重點探討了可視化技術在構建智慧警務大屏一體化指揮調度系統中的應用原則和技巧,并對下一步值得深入研究的問題提出了初步探討,為后續可視化技術在公安行業的進一步發展提供參考。