翁孫哲
(浙江警察學院,浙江 杭州 310053)
計算機科學技術、大數據技術、互聯網技術在社會生活中作用日益顯現,警方也充分利用這些技術來預防與打擊犯罪,采用預測警務系統就是其中的典型。美國預測警務系統的采用與發展已經有二十多年的歷史,使用預測警務系統的警察機關在增多,開發預測警務系統的公司也在增加,學術界對預測警務的研究也日益增加。實務部門側重于預測警務對警察機關打擊犯罪與維護社會治安的效果。國內學術界對預測警務產生的風險已經展開了相關探討,但缺乏全景式的研究,對預測警務的最新進展缺乏深入研究,也缺乏從多學科多視角來看待預測警務的風險。本文對預測警務的最新進展、存在的風險以及規則路徑進行了系統的研究。
對于何謂預測警務,學術界和實務屆并沒有形成一個權威的定義,但是預測警務包含警方的一系列戰略與行動,是一個客觀事實。
有學者認為,預測警務是指運用統計技術,聚集犯罪受害人、犯罪發生的時刻等信息以及其他詳細信息,通過統計預測為警方預防和打擊犯罪,或預測已發犯罪案件最可能的目標的警務[1]。該觀點指出了預測警務的技術基礎、目標定位,并指出它是警務而非技術層面的應用系統,殊值贊同。
預測警務的實踐需要以相關的預測警務系統為基礎,如美國紐約警察局采用Compstat 系統進行預測警務。該系統包括以下幾個原則:一是使用服務、犯罪和逮捕的數據,產生及時準確的情報,這些情報用于生成地圖、趨勢及其他產品。二是基于過去成功運用資源有效應對類似問題的智慧與有效策略來解決問題。三是快速部署到已經識別的問題,以防止未來的犯罪活動。四是持續跟進和評估,其中的成功結果通常是通過減少或替換犯罪行為[2]。可以看出,Compstat 系統依賴歷史數據,同時在一定程度上提高了警力資源配置的準確性。
Compstat 系統的開發與使用,得益于計算機技術與數據處理技術的發展。在其推行之后,紐約市的犯罪率下降。雖然對犯罪率下降是否歸因于該系統的采用有爭議,但是Compstat 系統受到其他一些城市的支持與采用,如洛杉磯市、圣克魯茲市。由于預測警務的市場潛力巨大,形成了幾家比較知名的設計開發預測警務系統的公司,如Predpol 和Hunchlab。
預測警務的產生具有以下理論支持:一是犯罪生態理論,犯罪生態理論包括日常犯罪理論和情境犯罪預防理論。日常犯罪理論用三個基本元素來解釋犯罪的組成:可能的罪犯;合適的目標;缺乏有能力的看護人。這三個元素在時間、空間匯聚時,犯罪機會就會存在。情境犯罪預防理論認為犯罪是犯罪者的理性選擇,犯罪者在考慮一系列情境變量后,決定情境是否構成犯罪機會[3]。這些理論表明,犯罪總是與一定的時空背景相聯系,一些區域和場所,由于特定的地理位置、經濟條件、安防設備配比、居住人員構成等因素容易造成犯罪機會,成為犯罪的溫床。而一旦這種客觀環境條件難以改變時,犯罪行為也難以消除。因為這些區域發生的犯罪模式會重復發生,因而能夠被預測。二是犯罪的慣技因素[4]。從事犯罪活動時需要特定的方法,一些類型的犯罪行為或一些特殊人群的犯罪,有著共同或類似的方法,被稱為慣技,產生慣技原因是多方面的。一些已經存在的慣技,被潛在的犯罪分子學習與運用;一些場所的特定地理結構促使特定作案方式的形式;犯罪團伙甚至黑社會組織在傳授與強制中形成共同的作案方式。在美國的實踐中,幫派犯罪、黑社會組織犯罪、有色人種聚集地出現的犯罪甚至非法移民犯罪等存在著一些類似的作案手法。上述理論說明,犯罪并非孤立的、偶然的現象,通過對犯罪產生的時空背景進行干預,能在一定程度上減少與預防犯罪。這些理論能從不同側面說明了預測警務產生的背景以及其存在的可行性與必要性。
預測警務發展具有以下特點:一是私人企業、高校與科研院所在系統的設計、開發與運行中發揮積極作用,統計學、計算機科學和犯罪學的專業人員積極參與;二是預測警務有選擇性地對犯罪進行干預,它只面向特定的犯罪類型、犯罪區域和犯罪行為人,受制于資源約束以及成本效益考慮,無法履蓋全部犯罪類型、犯罪區域和犯罪行為人;三是預測警務的外延在不斷擴寬。最初,對預測警務的探討局限于系統的使用上,隨著互聯網、人工智能與大數據的迅猛發展,數據的流轉與共享十分便利,不同平臺間的數據匯集會顯示可能的犯罪行為與犯罪嫌疑人,及時作出預判與預測,能有效地防止犯罪行為發生。
預測警務的實踐離不開預測警務系統的開發與應用,而預測警務系統根據預測警務的運用效果、大數據技術的發展以及參與公司的增加不斷推陳出新,使預測警務不斷迭代發展。在過去二十多年的時間里,美國警方先后應用幾種不同的預測警務系統,并形成了幾種具有特定目標導向的預測警務。
第一種預測警務以財產犯罪的位置為目標[5]。以洛杉磯市運用預測警務系統為典型,該系統關注三類犯罪:入室盜竊、盜竊汽車和從車里盜竊。之所以首先選取這三類犯罪,因為這些犯罪,受害人容易感知到損失,也容易引起社會關注,同時其發生與環境脆弱性有關,警察出現在這些區域可以減少其發生。區域的范圍通常精確到500×500 平方英尺,并預測特定犯罪的類型。
第二種預測警務以暴力犯罪的位置為目標。這些暴力犯罪包括搶劫、嚴重毆打、槍擊和幫派犯罪。其中以犯罪風險地形建模技術(RTM)為代表。RTM 開發數字化犯罪風險地形圖,識別與特定犯罪相關的特定因素。已經識別的因素在計算機地圖上有分層,以突出特定區域的風險強度。RTM并不關注過去的犯罪,而是聚焦于產生犯罪風險的現在的環境風險因素[6]。
第三種預測警務以參與犯罪活動的行為人或受害人為目標。其背后隱藏著這樣的邏輯,消極的社會網絡與環境脆弱性類似,也能鼓勵犯罪行為,如特定幫派成員受幫派影響就從事幫派的犯罪行為,恐怖主義分子通過互聯網也會形成犯罪網絡。這個階段,警方會通過歷史犯罪數據、社交媒體等多種途徑分析具有較高犯罪風險的人員名單,并對這些人采取相應的預防措施,以減少犯罪風險的發生。以美國芝加哥警察局推行的“戰略對象清單”(Strategic Subject List)為典型,根據參與槍擊或謀殺的可能性,將有犯罪記錄的個人列為受害者或罪犯[7]。
第四種預測警務以犯罪行為模式為目標。以紐約市警察局應用Patternizr 系統進行預測警務為代表。該系統主要針對三種比較頻發的犯罪:搶劫、入室盜竊與重盜竊。雖然這三種都是財產犯罪,并非是預測可能的犯罪發生地或可能實施犯罪的人。警方將已經發生并已經辦理完結的案件錄入系統,案件發生后,警察將該案件作為種子訴狀輸入系統。從中篩選出十個案件,并賦予0—1 之間的分數。分值越高表明兩個案件的匹配程度越高,兩個案件有共同的作案模式[8]。數據庫中的案件已經有特定犯罪者的身份信息,包括姓名與地址,因此警方推定種子案件可能的犯罪實施者,并根據數據庫中的身份信息展開進一步的偵查行動。Patternizr 的核心是分析與查找不同案件間存在著共同的作案手法。它基于以下假設:許多犯罪行為有相同的作案手法,但不同犯罪模式的作案手法不同。如果不同犯罪模式的作案手法都相同或大同小異,會使種子案件同時與許多案件相匹配,無法預測到具體的犯罪行為人,但這在實踐中不可能。不同犯罪模式的作案手法也是動態變化[9],這說明種子案件匹配時,也需要考慮匹配分值排序靠后的犯罪模式,因為同一犯罪行為人也可能改變其行為,即使是匹配分值不高,也可能是由同一人實施。
預測警務不僅適用于有關犯罪行為沒有發生,但特定區域很可能發生犯罪或者特定人很可能從事犯罪行為的場景,也適用于犯罪行為即將發生,即警方已經觀察到特定時空環境下犯罪人行為的場景。需要說明的是,警察憑借其自身多年的工作經驗來推斷某人即將從事犯罪行為,也是預測警務。但是這種經驗習得需要長期實踐,經驗難以復制與推廣,因此具有個體意義。預測警務是充分利用大數據算法,利用統計學分析各變量間的相關性,只有基于大數據的預測警務,才能提供關于特定區域或特定人更多信息,應用更加廣泛。
一是使警方樹立預防在先的理念,并把這種理念落實到實踐中。諸如搶劫、入室盜竊等犯罪大量發生,侵害公民的財產權,如果警察無法及時偵破這些案件,并對犯罪嫌疑人予以制裁,就無法發揮威懾作用。而預測警務使警方從引發犯罪的環境等方面入手,消除犯罪發生的條件,通過預防減少此類案件的發生。
二是減少犯罪者從事重復犯罪的可能性。通過預測警務系統的分析,識別一些高風險的人,將這些人納入重點關注,采取一定的措施,如為其提供教育培訓機會,加強社區監管等使其有機會融入社會,獲取收入,從而弱化甚至消除其從事犯罪的激勵。
三是能提升警務資源的使用效率。預測警務利用大數據運算,減少了統計與分析潛在犯罪地點與犯罪行為人的人力資源,并能實現重復統計與分析。
四是符合反恐與國家安全等特定目的需要。911 事件后,美國加強了反恐的預防與打擊力度,通過整合航空業、酒店業旅客的數據,甚至運用監控攝像設備從個人行為、動作還有社交網絡來監測可疑活動[10],從中發掘具有高風險的潛在恐怖分子,并先發制人采取措施。在美國邊境,出于維護國家安全與打擊非法移民的需要,美國憲法第四修正案所要求的關于攔截、搜身與扣押的正當程序標準有所放松,一個區域被主要用來從事非法目的,再加上其他非常寬泛的因素,就強有力地支持了合理懷疑的存在[11],強化了對非法移民的執法力度,而法院也會支持執法機關的決定。
五是預測警務在迭代升級中推進警察機關組織變革。一些警察機關成立了專門從事預測警務工作的內設機構,由專門人員從事數據分析等工作。由于預測警務引導警務資源向高風險區域派遣,從而減少一些犯罪率較低區域的警力配置,使得這些區域原有的機構被撤并,有利于減少警力資源的浪費。
如前所述,警方推行預測警務產生了積極的效能。預測警務的運行需要相應的預測警務系統作為基礎,警方需要為預測警務系統的設計提供思路、為預測警務的運行提供數據,并且警方依賴預測警務系統給出的建議進行警力資源的配置和警務組織變革。預測警務包括從前端的預測警務系統設計到后端的警務活動的全過程,在這個過程中,由于數據質量、系統設計等等問題,使得預測警務在實踐中產生的風險不容忽視。
在預測警務實踐中,警方將歷史數據作為訓練數據錄入算法系統后,算法在描述性特征與目標特征之間建立關聯,得出特定區域、特定群體、特定種族的犯罪率較高,警方將資源有針對性地投向這些區域、群體與種族,從而使這些區域、群體與種族的犯罪被發現與查處的概率更高。如紐約市的盤查與搜身項目,從2004 年至2012 年的數據顯示,83%的被盤查者是黑人或西班牙裔,只有10%的被盤查者是白人。但是,紐約市的人口中有52%是黑人或西班牙裔,白人占33%。這表明,黑人或西班牙裔被盤查的比例高于其人口比例。這也使得算法系統將黑人或西班牙裔的特征與導致犯罪預防的盤查聯系起來[12]。又如奧爾良的預測警務系統將暴力或幫派犯罪的受害者或實施者確定為絕大多數年輕的非洲裔美國人、男性、受教育程度低下與就業不足等[13]。實踐中,警方也會以這些群體作為執法的對象,增加警力資源,相應地發現這些群體更多的犯罪行為,進一步強化了這些群體高犯罪的形象。
對特殊人群或特殊區域的區別對待,會產生不當的威懾效果。從經濟分析的視角而言,犯罪者在打算從事犯罪行為時,也會進行成本收益的權衡,只有違法收益大于違法成本時,其才會著手進行違法犯罪活動。從社會的角度而言,對犯罪者的最優制裁是等于其對社會造成的損害,一方面能夠制裁犯罪,對犯罪者形成威懾,另一方面也無需額外增加資源,如果犯罪者缺乏經濟能力,就需要通過監禁方式對其施加制裁。政府對違法犯罪的制裁水平體現為兩個維度:發現犯罪的可能性以及懲罰的嚴厲程度[14]。在懲罰嚴厲程度不變的情況下,發現犯罪的可能性增加,也會增強對犯罪者的制裁,更多的人被逮捕與定罪。在懲罰嚴厲程度不變的情形下,利用算法發現與查處犯罪的概率會增加,從而形成過度威懾[15]。
預測警務不僅會導致威懾過度的問題,會產生威懾不足的問題。由于預測警務主要面向一些發生頻率高、受社會公眾關注的犯罪類型,并且警察將大量資源投放在這些領域。由于在一定時期內,警察機關的預算無法持續增加,甚至受制于經濟形勢的影響,出現預算削減的情況。其他各種犯罪類型不會隨著預測警務的使用而消失,這表明警方投放在其他犯罪上的資源相對減少,這些犯罪包括白領犯罪,由于挪用資金、職務侵占、商業賄賂、偽造證明文件等犯罪隱蔽性較高,受公眾關注度沒有搶劫罪那樣顯著。從美國預測警務的現實經驗來看,也少有專門針對白領犯罪的預測警務系統,即使一些白領犯罪的非法所得要高于一般的財產犯罪。警察將較少的資源投放在這些犯罪上,導致這些犯罪被發現的概率降低,即使在懲罰嚴厲程度不變的情況下,依然會導致威懾不足的問題。
所謂認知偏向,是指警務人員在辦案時的思維模式與思考問題的方法受到限制而產生的偏見,包括自動偏見和確認偏見[16]。自動偏見是指人們傾向于相信計算機所作出的判斷要優于人自身作出的判斷。由于計算機代表復雜精巧的科學設計,其儲存能力與計算能力也不斷增強,而單個個體確實在信息儲存與計算能力上與計算機無法比擬,使得人們會認為計算機作出的推斷與判斷更科學更準確。確認偏見是指算法所作出的判斷與推薦,人們會積極尋找證據去證實該判斷與推薦的合理性與準確性,而不會從反方向尋找證據去否定該判斷與推薦的合理性與準確性[17]。確認偏見與自動偏見密不可分,由于算法也是復雜與精巧的設計,人們基于自動偏見接受算法判斷與推薦,并加以鞏固與強化。自動偏見反映出人們對科學過于樂觀的傾向,也是大數據技術、預測警務技術能順利被警方所采用的心理因素。
自動偏見與確認偏見會削弱執法激勵的消極后果。一是使警務人員失去從執法實踐中提升判斷能力的機會。一旦預測警務被順利使用,警務人員會產生對其依賴的心理。較長時間利用算法系統內判斷可能的犯罪區域或違法犯罪嫌疑人,使得警務人員失去在街面巡邏、現場執法中通過言行等方式判斷犯罪嫌疑人與犯罪行為存在的能力,而警務執法本身是一種需要實踐理性的活動,這種實踐理性經由長期執法積累而得來。特別對新入警人員,沒有這種長期街面巡邏與現場執法養成的素養,對其并非有利,而一旦對預測算法過于依賴,在面對復雜多變的情境時,也不愿去行使自由裁量權。二是無法糾正數據與算法的錯誤。由于數據采集中的輸入錯誤、采集對象錯誤、犯罪嫌疑人謊報數據、數據經過人為處理等原因,預測警務所依賴的原始數據本身錯誤。算法依據這些錯誤數據所作出的判斷與推薦,被警務人員接受,由于自動偏見與確認偏見的存在,其缺乏激勵去發現與矯正其中的錯誤。三是自動偏見與確認偏見會強化種族偏見。警務人員在執法中的種族偏見客觀存在,在現有的犯罪記錄數據中,拉丁裔和非洲裔等有色人種所占比例相對較高。依賴這些原始數據所得出的算法判斷與推薦,警務人員會加大對這些有色人種的執法力度,從而發現更多的違法犯罪行為,又會提高其犯罪比例。警方將過多的資源分配到針對有色人種的執法中,強化種族歧視。四是警務人員尋找其他嫌疑人和其他證據的激勵大大弱化。一旦算法作出判斷與推薦,由于自動偏見與確認偏見的存在,警務人員需要花費大量的時間與精力去收集證據來推翻與否定算法的判斷,普通執法警察囿于時間與精力的限制,無法實現這一目標。即使一些警務人員發現算法判斷的失誤,也可能由于利益或其他考慮而不愿意揭發。
預測警務依托大數據,其對數據的要求應當是充分的、客觀的、正確的。充分是指應當盡可能將更多犯罪類型的數據,而不是選擇部分犯罪類型的數據,但在預測警務運行的實踐中不充分、不準確、不客觀的骯臟數據客觀存在。骯臟數據是指源于腐敗的、偏見、非法實踐的數據或受偏見與非法實踐影響的數據,包括有意被操縱的數據以及被個體和社會偏見所扭曲的數據[18]。同時骯臟數據也包括因逮捕無辜者而產生的數據,這些無辜者身上被植入了栽贓證據或受到其他虛假指控。
在目前的實踐中產生骯臟數據的理由有多個,一是警方缺乏關于收集、存儲、評估與使用數據的標準與程序規定,使得數據收集等環節存在隨意性,甚至在錄入數據時,對數據進行人為處理與加工。二是警方在接到報案并到達現場時,對現場當事人行為的性質認定存在一定的自由裁量權,同一行為可能存在犯罪、摩擦與非犯罪行為的分類,警察有意將某類犯罪行為當作非犯罪錄入或將非犯罪當作犯罪錄入,無法客觀地反映行為的真實情況。三是種族與偏見形成的反饋回路無法消除。預測警務的運行需要歷史的犯罪數據,已經記錄在案的歷史犯罪數據,并非真實客觀。特別是在美國執法實踐中,特定種族、特定低收入群體、特定居住地的人,其犯罪率相對較高。這與執法機關長期以來的種族歧視有關。據實證研究,美國芝加哥市與奧爾良市警察執法的種族歧視引起關注。在民權組織提起訴訟期間,美國司法部展開調查的期間,他們與企業合作開發預測警務系統[19]。這些帶有種族歧視的歷史犯罪記錄,就被作為預測警務的訓練數據,沒有跡象表明這些數據由于錯誤與違法行為而被刪除。以這些數據為基礎的預測警務也產生了相似的反映種族偏見的預測結果。四是操作上的失誤。警察在錄入有關犯罪行為的信息時,錯誤地輸入姓名、地址、種族,由于數據庫的龐大,微小的錯誤就可能引發匹配上的錯誤而影響預測的準確率。
骯臟數據的問題客觀存在,但難以在短期內加以有效克服,其原因也是多方面的。首先,警察執法受民主監督較少,自由裁量權大。警察執法中的種族歧視是一個長期存在的問題,美國并沒有建立起一套抑制警察種族歧視的有效制度,也很少對警察執法的種族歧視進行監督,即使在一些引發高度關注的案件發生后,警察也沒有實質性改進執法。很多警察機關并沒有設立專門的審計和監督機關,對執法中的種族歧視和不當行為進行監督。雖然美國有信息公開法,但是多年后的信息公開無法消除歷史犯罪數據中的種族歧視問題,一些警察機關也不愿意公開相關數據。其次,預測警務系統的開發企業缺乏動力也缺乏能力去篩查與刪除骯臟數據。出于追求利潤的需要,系統開發企業一方面會標榜自身是客觀的無偏見的,另一方面也會服從警察機關的要求,在一些種族歧視濃厚的區域,警察機關是不會同意刪除這些具有種族色彩的歷史犯罪數據。系統開發企業也難以將所有骯臟數據與好的數據區分開來。一些骯臟數據由諸如種族、性別等直接的變量指代,系統開發者已經明確將這種變量從算法中刪除,但是諸如低收入、失業、特定居住地等變量也能反映特定種族或特定性別。預測警務系統無法將收入、職業、居住地這些變量刪除。預測警務系統的算法也無法解決反饋回路問題,預測警務系統的算法依據變量間的相關性得出相關推斷,而不是分析因變量與自變量間存在的因果關系,因此即使某人隸屬于某種族或居住在某地,現實中并沒有從事犯罪行為,但算法依然會對其賦予較高犯罪風險的數值。只要輸入的數據包含種族偏見等信息,算法依然會強化反饋回路。
區別對待使特定區域或特定群體更容易成為警察執法的對象,違反平等原則。但是區別對待的產生與美國社會根深蒂固的種族歧視存在直接關系,因此實踐層面是減少區別對待發生可能性,而難以根除。具體的措施有:
一是在預測警務的采購環節向公民公開信息。就采購的具體系統、采購對象、采購所要實現的目標以及系統可能存在的風險等詳細說明,以便使公民掌握警方的采購行為。為使公眾更好地了解預測警務系統的使用狀況,警方有關預測警務采購、審批、運用的相關資料,應當允許公眾查閱。由于預測警務系統存在的復雜性與專業性,普通公眾難以理解其運行機理,有必要采用通俗易懂或可視化方式。
二是強化算法透明原則。算法透明原則應用于算法設計、運行的全過程。根據算法透明原則,應允許第三方對算法代碼和決策標準進行審查。美國聯邦貿易委員會專員斯威尼(Sweeny)提出了“設計責任”這一概念。根據這一概念,算法設計者在開發算法階段應當接受第三方審查,從而發現算法可能存在的歧視和偏見[20]。如種族或膚色等變量容易被識別,在算法透明原則下,算法設計者應當剔除這些能直接反映與體現歧視的變量。
三是建立預測警務算法影響評估制度。2018 年10 月,美國紐約市率先頒布《算法問責法》,該法明確規定行政機構以及慈善團體應用自動化決策系統時應當接受自動化決策系統工作組在公正性、可問責性和透明度等方面的評估。華盛頓州和加利福尼亞州的相關立法也要求進行算法影響評估[21]。一些城市的執法機構在引入預測警務系統時,需要經過城市議會的同意與批準。在批準前,會成立一個算法影響評估委員會,對算法的風險評估后,該委員會出具報告并作出是否應當允許采購的建議。舊金山市議會頒布了《禁止秘密監視條例》,該條例還要求該市的各部門采購任何類型的監控技術,或者簽訂協議接受通過監控技術取得的信息時需報監督委員會(Board of Supervisors)批準[22]。算法影響評估制度是一種事前的風險預防機制,如果評估后禁止采用預測警務系統,其存在的區別對待風險也將不會出現。經過評估,也可能對算法的變量設計、代碼運行規則等進行相應修改,也能減少區別對待的風險。
四是建立算法審計制度。在預測警務系統使用的過程中,應當定期向獨立的審計機構報告或委托第三方進行審計。美國審計制度比較健全,有著堅實的法律基礎。非盈利組織“為了人民”對美國刑事審判中的再犯風險預測算法Compas 開展審計,撰寫了《機器偏見》審計報告。該報告引發了美國社會廣泛關注,直接推動了算法偏見和算法歧視相關立法的出臺[23]。由獨立審計機構作出是否存在種族歧視、數據錯誤等情形。一旦審計確認存在上述問題,就需要中止預測警務系統的使用。由警方進行整改并出具整改報告。如果無法完成相應的整改,就應當終止使用該系統。由于受到社區壓力以及缺乏證據來證明預測警務系統對犯罪率的實質影響,洛杉磯警察局于2020 年取消了與Predpol 公司的預測警務運行合同[24]。雖然實踐中,終止預測警務運行合同出現較少,但停止算法系統運行作為一種警示或威懾手段,對于算法開發者、系統運行者和警方都構成一種約束。即使警方主動取消預測警務運行合同,其也需要面對合同產生的責任問題以及地方政府和代議機構對公共資金使用效率的審查問題。
一是發揮司法審查的作用。對警方僅僅依賴預測警務系統作出的判斷和決策,司法機關作出否定性評價,能在一定程度上抑制認知偏見,有助于警方在收集更多信息的基礎上作出決策。
警方基于預測警務而實施的攔截與搜身,可能會侵犯公民的人身權利與財產權,也會引發相對人通過司法程序對警察行為的合理性提出挑戰與質疑。最為典型的是美國最高法院審理的Illinois V.Wardlow 案,該案中,Wardlow 出現在一個麻醉毒品交易猖獗的區域,其看到警察后就逃跑,警察對其攔截與搜身。警察在現場并沒有發現Wardlow 從事麻醉毒品的交易,Wardlow 認為警察的行為侵犯其正當程序權利。美國最高法院認為,Wardlow 出現在被標簽為高犯罪的區域以及其看到警察后就逃跑的事實,足以形成合理懷疑。最高法院的判決確認了該案中警察行為的合理性[25]。當然最高法院的判決也明確,僅僅出現在某一被標簽為高犯罪區域,這一因素不足以構成合理懷疑。該案的判決可以提醒警務人員,對預測警務的自動偏見不必要也不可靠。警方應在預測警務系統提供的信息外收集更多的信息,結合現場執法判斷作出相應的執法措施,而不是想方設法去證明預測警務系統的正確性。
二是加強對使用預測警務系統的警察培訓。這種培訓不僅讓警察學會如何應用預測警務系統,更為重要的是讓警察能夠了解預測警務系統所存在的局限與問題,包括數據錯誤、算法歧視等,從而使他們盡可能用一種批判的思維來評估預測警務系統所得出的推薦結論與建議,而不是盲目地全盤接受,特別是能將預測警務系統推薦建議與執法場景相結合來作出決策[26]。
三是強化預測警務系統推薦方案與備選方案的比較。一些警察局規定,警察需要列明采用預測警務系統推薦的理由,并提出可供選擇的備選方案,由上級或同行進行分析比較。這種做法有助于減少對預測警務系統的依賴,但這種做法本身可能會增加決策過程所消耗的人力物力。當然,并非預測警務系統所作出的所有決策、任何推薦都需要與備選方案比較。
四是建立獨立的第三方審查制度。由于適用預測警務系統的警務人員已經存在的確認偏見,讓其重新來思考手頭的案件十分困難,因此沒有接觸該案件的獨立第三方相對比較容易來分析與判斷預測警務系統所提供的推薦方案。由于各種心理和組織原因,外部同行評審員更容易注意到錯誤和遺漏,也更容易指出錯誤和遺漏[27]。
首先,重視數據來源問題。2017 年1 月,美國計算機協會發布《關于算法透明性與可責性的聲明》,并提出反歧視意識、回饋與救濟、算法可問責、算法可解釋、數據來源、算法可審計及驗證與檢測七項原則[28]。這表明數據來源問題已經受到重視。實踐中,對數據采集方式、程序、采集的范圍以及數據質量標準,一些行業和執法機關都已經在積極探索和應用中。而在預測警務的設計環節,一些算法系統已經剔除關于種族和膚色的變量,以盡可能減少種族因素對預測警務系統產生的消極作用。如費城和芝加哥所使用預測性警務程序的供應商決定在創建警務模型時不再強調一些逮捕數據,特別是與毒品相關和滋擾犯罪有關的數據,以避免系統性偏見[29]。因為根據這些犯罪的歷史記錄,有色人種的犯罪者比重較高。
其次,數據公開。數據公開能使公眾了解與掌握警方的執法情況,也使一些公民與組織能夠針對執法情況提起公益訴訟,通過這種機制能使警方規范數據的收集與使用。美國44 個最大的警察部門約有23 個要求警察收集每次攔截與搜身的具體數據。在紐約市,盡管多年來警方要求警察對攔截執法進行記錄,但直到1999 年,在紐約警察殺害一名手無寸鐵的黑人男子的抗議活動持續數周后,紐約總檢察長下令紐約警察局交出兩年的數據。盡管紐約警察局繼續記錄有關攔截執法的信息,但該部門也一直拒絕公布他們的記錄,直到2008 年,一名州法官命令他們公開電子數據庫,以回應紐約公民自由聯盟提起的訴訟[30]。
由此可見,并非所有的警察局都要求收集和記錄攔截與搜身等執法數據,沒有原始數據記錄,為警方偽造數據、篡改數據提供了可能;而一旦警方需要開發預測警務系統時,這些偽造數據、篡改數據就可能成為訓練數據,從而得出不正確的結論。因此要求警方數據公開,能促使警方在日常執法中做好數據的記錄工作,規范數據的保存,減少偽造數據、篡改數據發生的可能。特別是因逮捕無辜者而產生的數據,通過數據公開能比較容易地識別出,減少無辜者被植入了栽贓證據或受到其他虛假指控的可能性。
警方自己主動公開數據的動力不足,需要民眾、非政府組織、檢察官與法官等外在力量的推動。美國聯邦信息公開法賦予公民向政府部門申請公開信息的權利。有學者向包括邁阿密、圣路易斯、林肯、費城四地的警察局申請公開關于預測警務系統HunchLab 的使用狀況。林肯警察局提供了HunchLab 的一組數據輸入樣本,包括一個三十天滾動的警察事件報告窗口。每一份報告都包含所報告犯罪的街道地址、緯度和經度;犯罪類型以及犯罪的時間和日期等[31]。警察局愿意提供信息,表明其對數據質量比較有信心,通過這種信息公開的方式,也能督促警方提高數據的質量,規范數據的收集。
針對預測警務系統司法案件的出現,反映出預測警務系統對公民權益的侵害已經成為犯罪嫌疑人可以抗辯的理由,也使警方對預測警務系統使用的具體情況暴露在法院的司法審查之下,對抑制預測警務的消極影響有一定作用,但是司法審查也存在以下問題:
一是司法審查標準不統一。Illinois V.Wardlow 案留下幾個懸而未決的問題。一是最高法院并沒有明確定義何為高犯罪區域。二是最高法院并沒有提供關于如何證明高犯罪區域的證據的任何指南。缺乏明確與可操作性的標準,使得下級法院在判定高犯罪區域上比較隨意。有法院將毒品活動區域標簽為高犯罪區域,也有法院將受警方監控的區域標簽為高犯罪區域[32]。
二是司法審查的效果有限,司法審查只是在個案中解決相對人的權利受侵犯的問題,對預測警務系統本身錯誤與偏見等問題,無力審查與救濟。
三是司法審查反而在某種程度上賦予預測警務系統的合法性。司法對警方結論的遵從會促進和強化警方對預測警務系統的使用,并使得警方對預測警務系統的不足視而不見,這不利于相對人權利的保護。
四是司法實踐對較高犯罪風險的人是否構成合理懷疑并沒有明確的立場。警方能否僅僅依據預測警務系統推斷出來某人具有較高風險,而對其實施攔截與搜身?芝加哥的戰略對象清單,根據歷史犯罪記錄對較高犯罪風險的人賦予較高的分值。但是預測警務系統并沒有告知警方該人是否真的會從事犯罪以及何時從事犯罪,警方也不是通過其自身的觀察來判斷較高犯罪風險的人。相比較于較高犯罪風險的區域,其主觀性更強。如果僅僅因為預測警務系統推斷出來某人具有較高風險,就構成合理懷疑,會使得警方更加沒有約束地利用該預測警務系統來判定高風險的人,無法為警方執法的規范化提供指南。
無論是美國聯邦層面還是州層面,都沒有制定規制預測警務的專門立法,有關規制措施分別規定在《算法問責法》《禁止秘密監視條例》等法律當中。雖然警方已經使用預測警務系統多年,但是隨著技術的發展,警方采用的新技術、新系統越來越多,包括預測警務在內的多種系統既存在優勢,也或多或少存在一定的不足。針對這些系統制定專門立法,既有可能導致立法的重復,也可能導致立法資源的浪費。沒有專門立法,也存在不可忽視的局限性:
一是與預測警務的應用狀況不相適應。預測警務的應用范圍廣,應用時間長。多年來,一些警察機關已經將預測警務作為配置警力資源和設置警察機構的重要依據,警察的干預行動和勤務設計不再是固定、滯后的,而是根據數據分析的結果動態調整,警務資源的配置更為合理,一定程度上緩解了警方資源不足與任務過載之間的矛盾[33]。
二是預測警務所產生的負面影響已經不能忽視。預測警務應用對一些高犯罪風險區域或高犯罪風險人產生過度威懾的效果,對其他一些犯罪威懾不足。這說明警方希望通過應用預測警務來打擊犯罪、維護社會秩序的目標無法完全實現,現有的分散式立法中的一些規制手段,對于抑制預測警務的負面影響能發揮作用。但是一些規制手段不具有強制性,而且警方在應用預測警務系統時也處于非公開狀態,社會公眾不一定知情。
三是預測警務的應用與犯罪率變化的相關性并沒有科學統計方法,甚至兩者間的相關性都存在疑問。這種情形下,即使立法規定影響評估制度、公眾參與制度等,也會由于上述原因而大打折扣。
四是分散式立法規制對象有局限。美國有關預測警務系統的立法主要以城市條例為主,這些城市條例僅僅從某個方面進行立法,一個城市也少有從多個方面制定多個條例,甚至還有許多使用預測警務系統的城市并沒有制定相應的立法。這種立法局面既可能使預測警務系統的應用處于缺乏規制的真空地帶,也可能處于監管不足的狀態。如目前美國針對執法機關委托第三方公司設計開發系統,僅有個別城市立法禁止執法機關與第三方公司寫入非披露條款[34]。第三方公司主張預測警務系統屬于商業秘密,但是預測警務系統應用關乎公共利益,第三方公司主張其實是將其商業利益凌駕于公共利益之上。
雖然美國已經制定聯邦信息公開法,各州也已經制定類似法律。但是這些法律明確規定,商業秘密或政府執法信息可以豁免公開。由于政府委托第三方開發算法系統,在政府與第三方的合同中都會有政府不得向他人泄露商業的條款。雖然該條款有助于第三方公司開發系統的積極性,卻以犧牲公眾知情權為代價;執法機構也經常會以執法活動涉及國家秘密等理由,反對信息公開。
預測警務系統將一些人列入受關注名單,當事人并不知情,即使知情后也可能缺乏相應的救濟渠道。在Union Leader Corp.v.U.S.Department of Homeland Security,美國法院拒絕披露名單,因為披露名單將會揭示這些人的特征以及對這些人監控的后果[35]。該案對預測警務有負面作用,因為預測警務系統也會產生可能參與犯罪行為的人員名單,而該案卻認為對基于個人的算法產生的結果進行保密是合理的。不僅如此,警方也可能會依據美國聯邦信息公開法中第7 條E 款的例外進行抗辯[36]。雖然如此,透明度對于警務系統的有效運轉意義重大,能增加社會公眾對警方的信任感,減少警方與系統開發公司之間的共謀。
預測警務系統的使用目的在于打擊犯罪,降低犯罪率。如果僅注重某特殊區域、特殊人群的犯罪率以及某幾種類型的犯罪比例降低,不是最優結果。即使預測警務系統的使用導致對某幾種類型犯罪的威懾水平增加,從而降低這幾類犯罪率,也會導致其他由于威懾不足的犯罪行為發生可能性增加。同時受預測警務影響的犯罪者,可能會轉向從事其他的犯罪行為,從而導致其他類型的犯罪增加,整個區域的總體犯罪率并沒有下降,甚至可能會上升。這種情況出現違背預測警務系統采用者的初衷,無法實現警察的職能,應當及時中止預測警務系統的使用,就預測警務系統對社會治安狀況、對總體犯罪率影響作出有效的評估后,再決定是否繼續使用該系統。這個過程中,應當充分邀請犯罪學者、社區領袖、律師及政府官員參與,廣泛聽取意見與評論,并做出是否繼續使用預測警務系統的決定。經過審慎評估后,認為預測警務系統對于降低總體犯罪水平作用有限,就應當及時終止使用。
美國實踐中,中止甚至終止預測警務系統的案例較少。這并非表明預測警務系統都十分有效,而是警方在終止預測警務系統使用時存在多重約束:一是預算批準機關的約束。使用預算資金的項目不能說停就停,要有充分的理由,一旦警方表明預測警務系統效果不明顯,反而表明其事前分析研究不足,無論是出于政治考慮還是出于繼續獲得預算支持的考慮,警方都不愿意讓自己形象受損。二是預測警務系統采用都與供應商簽訂長期合同,中止甚至終止預測警務系統可能需要承擔違約責任,對警方而言也是不小的負擔。三是中止或終止預測警務系統使用會使公眾形成警方能力不足的印象,使公眾對警方打擊犯罪、維護治安的效能產生質疑,不利于構建和諧良好的警民關系。雖然警方自身難以中止或終止預測警務系統的使用,但是城市政府特別是批準預算的城市議會可以發揮監督的作用,必要時可以中止或終止預測警務系統的使用。
人工智能、大數據技術應用于警務實踐的趨勢不可阻擋,其所產生的積極效能也是顯而易見的。但是人工智能、大數據等技術也是一把雙刃劍,其潛在的風險也不容易忽視。但我們不能采取極端策略,就因為預測警務系統存在風險而完全放棄使用。我們需要享受技術紅利的同時,積極面對技術可能的風險并采取對應的規制措施,美國對預測系統風險規制的實踐就體現了這種思維,雖然美國預測系統風險的規制實踐還存在一些需要完善的空間,但是畢竟已經付諸行動。