李寓星
(貴州警察學院,貴州貴陽 550005)
面對屢禁不止的公路販毒運毒案件,如何采取行之有效的科學方法打擊防控是當前禁毒工作的一個重點,如何運用好先進的科學技術整合現有資源,研究打造符合實戰要求的應用平臺是推動這項工作的有效著力點和突破口。
(1)存在大量吸毒背景的駕駛人。《道路交通安全法》和《機動車駕駛證申領和使用規定》都有相關規定,對于正在執行社區戒毒、強制隔離戒毒、社區康復措施,或者長期服用依賴性精神藥品成癮尚未戒除的,車管所應當注銷其機動車駕駛證,但目前公安交通管理駕駛證業務辦理系統尚未實現自動注銷功能。截止2019年底全國社區戒毒社區康復30萬人次[1],并且這部分駕駛人的證件很有可能屬于正常狀態。通過歷次運毒販毒和“毒駕”查獲現場發現,這一部分駕駛人大多數都有吸毒歷史,在駕駛時往往隨身攜帶毒品、管制刀具甚至還有槍支等危險武器,機動車成了他們用于運送毒品,偷盜搶劫的轉移、運輸工具。對社會治安造成極大的危害。
(2)查緝方式是多警種聯合設點查處。目前查緝方式基本上是組織禁毒、交警、治安等相關警種,在部分省際或市際入口設置固定查緝點,雖然點位上配備人員、裝備齊全,但是位置很容易被提前知曉,從而有效躲避開檢查[2]。受到警力的限制,查緝點也不可能做到全時空全時段的覆蓋各個省際、市際入口,因此設置固定點的方式除非取得有效線索的支撐,否則收益甚小。
(1)已建設大量視頻監控設備。整合公路視頻監控資源,不僅能對車輛軌跡進行監控,通過軌跡分析獲取情報線索,還可以為構建一個從路到車、從車到人、從人到事(案)的邏輯架構提供基礎保障,確保車牌號碼、人員身份準確,做到人車合一的唯一性、準確性,實現透過視頻關聯到車牌后面人、事關系,對各類違法犯罪人員事前有效甄別和管控提供有利手段。
(2)實時產生大量有價值的業務數據。近年來各個公安警種大力發展信息化建設,信息化應用的水平得到不斷提高,應用過程中產生和累積了大量有價值的業務數據。應用大數據技術清洗共享這些業務數據,有利于提升數據質量、增加數據價值,實現大規模情報研判分析,快速響應業務需求。
為切實提高緝毒工作效力和公路涉毒案件的破獲率,以精準的情報線索作為支撐,改變“盲查”模式為精準打擊防控模式,形成對涉毒犯罪行為的強大震懾。引入大數據技術,用以整合公路防控體系的監控卡口、電子圍欄、手機探針等采集設備資源,共享禁毒、交警、技偵、網安、治安、刑偵等多警種業務數據,通過對各類數據的碰撞比對,得到精準的分析結果,從而實現精準打擊[3]。
利用大數據云計算新型技術,著力解決緝毒管控工作中存在的難題,適應新業態緊密結合公路防控體系,增強公路防控系統與緝毒工作的系統性、整體性,完全形成閉合,建立以車輛為基本信任根,同其他公安資源的大整合,高共享、深應用,對涉車、涉路的人員背景全網匯聚、關聯共享、形成軌跡,建立融合WIFI探針、電子圍欄、視頻卡口信息的人、車、碼模型,實現情報準確推送,對人、車、路實現匯總研判、挖掘分析、比對碰撞,提高管控效能。
(1)緝毒防控數據:結合貴州公安信息化建設現狀,數據資源情況,平臺應用功能,對防控體系要素中的靜態數據:包括通過技偵和禁毒信息關聯分析出的駕駛人或同車人員基本涉案背景信息、通過交警和禁毒信息關聯分析出的機動車主涉案背景信息和關系數據等的接入內容和接入方式、數據共享、數據上云進行設計,以促進緝毒防控體系中以車輛為基本信任根,同其他公安資源的大整合,高共享。
(2)可視化研判:結合案件研判實際需求,基于圖像化的表達方式,將全省卡口、WIFI探針、電子圍欄等資源匯聚在地圖上,實現全省數據資源“一張圖”。以圖形化的方式展示車、人的關聯方式,幫助民警將大量的、未知的信息轉換成易理解、高關聯性、高價值的情報,從而為分析研判工作提供幫助支撐。
(3)卡口數據:基于全省卡口過車數據共享原則,采取同一接入規范及標準,應用分庫分表、結構化與非結構數據異步處理、讀寫分離技術保障過車數據實時上云,匯聚9個地州市及88個縣級單位天網治安、交通電警、高速公路、收費站、環黔、環筑各類卡口資源,預估全省匯聚過車數據及過車圖片在8000萬條/天,不僅可服務于緝毒管控工作,同時也可為治安防控,刑事偵查等公安行業共享提供全省范圍實時過車軌跡及圖片。
充分考慮基于目前緝毒防控的需要,以及要求應用未來的可擴展性,如:有可能增加的各業務警種的數據源,形成新的數據專題庫,由各警種不同的分析研判側重點而形成的應用模型,制訂出的總體架構如圖1所示,架構中主要包含如下三個層面的核心組件:

圖1 防控體系總體架構Fig.1 Overall framework of prevention and control system
(1)基礎設施層,主要負責實現跨數據中心的計算/存儲集群,并實現容災備份,實現統一的總控,包括如下核心組件:
1)物理上分散的多個計算集群,對上層應用完全透明。形成部省兩級數據中心的多集群模式。
2)數據收集和存儲:采用批量同步、實時消息推送、接口調用的方式獲取公安各警種共享數據,根據數據的類型和應用場景存放在不同的數據存儲中。
(2)數據管理和分析處理層,提供ETL工具和管理手段完成數據集成和數據倉庫的構建,支持結構化數據處理、非結構化數據處理以及半結構化數據處理,支持實時和離線數據處理,包括如下核心組件:
1)多類型數據處理:對各警種的結構化數據、卡口過車消息半結構化數據、圖片等非結構化數據進行處理。
2)數據倉庫整合區:業務數據抽取到數據倉庫,根據業務對各類數據訪問的時效性與基于特定主題分析的需求,集中構建可支持不同業務主題的動態數據倉庫。
3)實時應用區:采集卡口識別和WIFI探針、電子圍欄實時上報的數據,構建動態數據倉庫,包括存量數據和實時增量數據,用于支持各類在線數據分析。
(3)支撐服務層,主要實現對業務需求支撐的基礎應用組件,包括數據集成、算法調用、調度服務、PGIS地圖服務、全文檢索、消息推送、數據授權等。
建設基于實戰應用的平臺,滿足涉毒防控動態要素的應用架構:
(1)數據層集成機動車、駕駛人、吸毒人員、重點人員、PIGS系統等各類公安數據資源,融合卡口資源與WIFI探針、電子圍欄采集數據,支撐實戰應用。
(2)業務應用集成車輛全息主題,情報預警,可視化研判,信息服務等模塊,集成功能有車輛基本信息、車主基本信息、車輛活動特征、手機碼畫像、車輛畫像、手機碼活動特征、車輛布控、情報預警、人車云關系、人車云軌跡等各類實戰需要的應用建設。
基于云平臺的建設,通過虛擬化技術形成統一的虛擬資源池,承載所有的PaaS與SaaS服務,實現計算的彈性擴展與資源的動態分配,并形成統一的運維管理體系[4]。其中:
(1)云平臺的IaaS服務實現計算資源、存儲資源與網絡資源的虛擬化,并通過虛擬資源的云化管理與統一調度,為部署在平臺上的各種服務提供了支持彈性計算和負載均衡的基礎運行環境。提供大數據的離線計算、實時計算、流式計算、圖計算多種計算模式。
(2)云平臺的PaaS服務主要包括數據服務與應用支撐服務,是大數據處理的核心內容。PaaS服務基于分布式服務框架和開放式API,支持海量高并發事務處理、圖片處理等核心應用,并提供標簽管理框架和統計分析類、機器學習類等分布式算法。
(3)SaaS層基于PaaS層提供的應用服務和數據服務構建車輛研判等應用。
根據天網工程整體規劃,大數據支撐平臺所需數據進行接入時需分別通過視頻專網邊界接入區域、互聯網邊界接入區域、以及公安信息通信網進行。
卡口視頻、及車輛圖片資源通過視頻專網接入云平臺,提取結構化特征用于后續的分析研判。
由WIFI探針、電子圍欄進行數據采集后,通過3G/4G網絡接入陣控平臺進行數據歸集及數據預處理、清洗,通過互聯網邊界接入公安信息通信網內大數據支撐平臺做深度加工處理。

圖2 技術架構圖Fig.2 Technical framework
4.1.1 數據資源池建設
本系統數據主要采集兩部分數據:第一部分數據是卡口監控數據,電子圍欄和WIFI探針采集到的偵控數據,卡口數據和偵控數據都是通過視頻專網接入,并最終接入公安網;第二部分數據是貴州公安內部能夠采集到的各警種業務系統的數據,包括但不限于禁毒、交警、技偵、網安、治安、刑偵等數據。公安業務數據經過數據加工、處理和整合之后,形成一整套完整的、全面的、有序的數據綜合區。根據公安業務對各類數據訪問的時效性與基于特定主題分析的需求,在數據綜合區中集中構建可支持不同數據規模的數據倉庫或者數據集市,例如機動車庫、人員庫、關系庫等。圍繞公路、機動車、人員。WIFI探針、電子圍欄獲得手機數據,結合卡口數據,把機動車、手機和交通參與人員有機的連接起來,通過人車合一算法,把路車人全鏈路打通。基于路車人數學模型,結合不同的業務警種分析需求,可以建設不同的業務主題:車輛全息主題庫、人車合一主題庫、重點人員主題庫、車輛軌跡主題庫等。
4.1.2 車輛全息檔案
車輛全息檔案對車輛進行實行“一車一檔”全面信息管理,匯集機動車數據、駕駛員數據、違法違章數據、事故處理系統、劇毒品運輸數據、交通卡口數據、吸毒人員數據、重點人員數據等各警種數據,結合偵控、軌跡等數據,經過大規模加工處理分析和計算,匯聚與車輛和駕駛人全方位的立體化信息,集中體現貴州省所有機動車的信息、駕駛人、軌跡信息、管控信息、活動特征等全息內容,面向全警提供高性能實時數據分析處理、多數據源關聯查詢檢索、研判支撐。
4.1.3 情報預警
情報預警根據車輛、人員的匹配度設定評分模型,利用大數據計算模式完成評分運算,實現對背景車輛、背景人員不同級別的預警。
人車路大爆發時代,每個人都會駕駛和乘坐多種交通工具,建立車碼合一模型,通過對車輛車牌識別、車輛數據分析、電磁信號的多次交叉判定多個交通工具上的人的ID身份,智能分析車輛、人員之間的關聯;高效地實現多身份映射的歸一化,全面分析車人的ID身份或者虛擬身份。刻畫人員的身份信息及人員的特征標簽,實現數據關系拓撲結構可視化。
針對全省數據匯聚的要求,進行平臺架構設計,設計應遵從多層體系模型,采用三層體系結構,包括接入層、服務層、轉發層。
第一層為接入層,接入層主要負責下級平臺數據的接入和圖片的接入。
第二層為服務層,服務層是軟件平臺系統的核心,采用高性能的應用服務器、中間件、各種智能引擎和系統管理工具,按照所提供的服務來管理和調度信息資源,并同時負責對采集到的數據進行處理、規整服務。針對圖片和數據采用異步分發、下載。
第三層為轉發層,轉發層主要負責對數據進行分發上傳至云平臺關系型數據庫和文件存儲。
受限于帶寬,市縣級過車記錄與圖片無法實時同步上云,容易造成安全邊界平臺堵塞。在卡口過車記錄匯聚的過程中,采取結構化數據與非結構化數據分離的方式,結構化數據優先,非結構化數據其次,保障結構化數據實時性,過車圖片的完整性。數據處理和圖片處理應使用不同的處理集群進行處理。平臺設計應充分考慮到可能出現的各種異常情況,針對數據及圖片處理的流程進行設計,若操作失敗,進行相應的日志記錄。
實戰過程中,由于車輛的流動性較大,流動速度較快,針對車輛情報預警及布控短信發送需要在較短時間內生成,為滿足車輛預警、布控推送≤30s的性能要求,在數據層與應用層之間增加數據緩存層,將過車記錄加載到內存當中,在內存中計算完后,直接將預警推送前臺,大大減少數據庫往返次數,從而實現車輛實時預警。在應用服務器上采用緩存技術可實現頻繁讀取操作所造成的數據庫負荷瓶頸的要求,通過犧牲應用服務器的內存來換取數據庫的頻繁I/O操作以降低預警生成及短信發送時延[5]。
給機動車、駕駛人打標簽的主要目的是讓基層民警在研判的時候可以快速找到嫌疑車輛或人員。如,可以快速查詢今天活動在管轄范圍內的涉毒人員有多少,也可以做情報挖掘工作:利用人車置信度高中低,毒駕行為高中低等信息可以快速篩選出活動區域存在毒駕行為的駕駛人,機動車與駕駛人標簽體系,即通過對機動車、駕駛人基本屬性、行為特征、事件、時段、地域等重要信息,抽象出一個機動車、駕駛人信息全貌,為基層民警提供通過模型分析而來高度精煉的特征標識信息。如車牌:貴XXXXX,車主年齡段:18-35歲,活動地域:貴陽,歸屬:本省,毒駕行為:高。這串描述即為平臺車輛畫像的典型案例,即機動車信息標簽化。標簽體系通常是人為規定的高度精煉的特征標識,如駕駛人年齡標簽:18-35歲,活動地域標簽:鐘山區。制定的標簽規則,能夠通過標簽快速讀出其中的信息,給基層民警展示一種樸素、簡潔的方法用于描述機動車與駕駛人。車主吸毒且處于社區康復或社區戒毒期間,且人車綁定度較高的車輛,即為毒駕標簽。按照高中低三個層級展示車輛與車主的綁定關系,以車輛與車主是否在同區縣出現,本人處理違章占比,人像比對三個維度加權求值,即為人車置信度標簽。
人車合一分析模型是利用ID-Mapping技術建立人車同一模型,通過過車數據分析、車牌識別、電子圍欄采集手機IMSI碼和IMEI碼的多次交叉判定多個交通工具上的人的真實身份,智能分析人員各種車牌、人員之間的關聯,全面分析車人的各類身份與關系特征。通過相應的關系圖表現出人與車的關系密度,從而判斷出相應人與車的關系。
實戰中運用布控—預警—攔截的查緝機制,精準有效的查獲嫌疑車輛及人員。由云平臺計算得出的預警信息,可以推向各層級公安機關單位,公安機關單位根據預警信息中的車牌號碼,在緝查布控系統中布控車牌號碼。車輛經過已共享到的卡口設備時,卡口將識別到的號牌實時推送至查緝布控系統,系統匹配號牌成功后會實時向車輛行駛前方的攔截卡點發出預警,攔截卡點根據預警信息可有效組織實施攔截車輛,從而在不干擾大多數車輛正常行駛的前提下,準確查獲嫌疑車輛和人員。
基于云平臺構建的緝毒防控系統,通過車牌、MAC、IMSI碼和IMEI碼的反復碰撞、比對分析,可以極大的提高毒駕研判的精準性,解決“盲查”的弊端,保證有限警力管控的有效性。由于平臺架構具有良好的可擴展性,下一步可接入其他警種,如治安、刑偵、反恐的在逃人員數據、案事件數據、犯罪人員數據、涉恐人員數據、被盜搶車輛數據等信息,進一步豐富標簽畫像的維度和標簽類型,增加車碼分析模型,發展出多車、多人相互之間的時間、空間伴隨等更多模型種類,必將為更多警種的業務精準分析研判提供有力支撐。