朱 明
(南京森林警察學院信息技術學院,南京,210023)
為了維護生物多樣性和生態平衡,推進生態文明建設,我國專門制定了《野生動物保護法》,我國《刑法》也對破壞野生動物資源的有關行為規定為犯罪。2020年2月24日,全國人大常委會通過了《關于全面禁止非法野生動物交易、革除濫食野生動物陋習、切實保障人民群眾生命健康安全的決定》,規定了“全面禁止以食用為目的獵捕、交易、運輸在野外環境自然生長繁殖的陸生野生動物”;各級人民政府及其有關部門應當“嚴格查處違反本決定和有關法律法規的行為”。
對野生動物非法交易案件的信息進行分析,可以把握案件發生的規律,提供決策者參考,以便有針對性預防和打擊犯罪,更好地保護野生動物資源。
隨著科技的發展和網絡的普及,人們每天面臨著多樣、豐富和大量的數據,這些數據也包括與野生動物交易有關的,如何對這些數據進行分析,使之產生價值是使用者關心的話題。本文主要采用大數據分析的方法對國內有關野生動物非法交易案件的信息進行結構化處理與分析,找出本類案件的統計特點,為研究和執法提供參考。
本文所研究的野生動物非法交易犯罪案件,以我國《刑法》所規定的“非法收購、運輸、出售珍貴、瀕危野生動物、珍貴、瀕危野生動物制品罪”為研究樣本。
從現有文獻來看,對于野生動物非法交易案件的研究,有圍繞《瀕危野生動植物種國際貿易公約》進行展開,從野生動物非法貿易的性質及其影響,以及對國際協定和條例的理解與執行進行探討。Pires等[1]認為野生動物非法貿易是一個日益嚴重的問題,主要原因在于生存、替代藥物、附屬品和寵物貿易,對非法野生動物產品的高需求正威脅著許多最瀕危物種的生存,正所謂有需求就會有貿易。Ayling[2]認為《公約》雖然在執行,并采取了一系列措施,但是野生動物的非法交易仍在繼續,原因在于這種貿易非常有利可圖。減少野生動物非法貿易的政策需要了解驅動野生動物犯罪的個人和團體,具體到地理位置區域和物種。作者專門針對犀牛角貿易及各種網絡進行了探討。駱家林等[3]認為野生動物資源犯罪具有行為鏈條化,作案團伙化,手段專業化,犯罪跨區域化和非法貿易網絡化等特征。
從中國知網,以主題詞“野生動物”和“非法貿易”(或“非法交易”)檢索出的文章進行計量可視化分析,去除相同或類似主題詞,可以看出討論比較多的相關主題是生物資源、象牙貿易、犀牛角、CITES、野生動物犯罪和犯罪調查等。
從國內對相關案件的研究來看,未見有對本類案件的所有判決書數據進行整理和分析,也未見對此類案件的信息特征進行較為全面的梳理。
對于大量案件的分析,需要對文本特征進行分析,根據文本特征通過自建詞庫和編程提取到有價值的信息,這個過程也就是數據的結構化處理。
本研究從開放法律文書平臺下載了2013年至2020年5月的全部“非法收購、運輸、出售珍貴、瀕危野生動物、珍貴、瀕危野生動物制品罪”案例,經過數據去空和去重后得到3 346例。按照《最高人民法院關于人民法院在互聯網公布裁判文書的規定》,裁判文書的上網為本文研究本類案件2014年以來的已判決案件全部數據提供了方便。
在本案案件的信息特征處理中,應用自然語言處理的方法,對數據進行結構化處理。
一是建立了民族、文化程度、職業、被侵害動物等詞庫,編寫了提取這些關鍵詞的程序,給案例自動打上了上述標簽。
二是利用Python中的工具包和正則表達式,編寫了提取侵害人居住地、起訴地、出生日期和作案時間等特征信息的程序,并自動打上標簽。
三是對判決書中“當事人”字段中的被告人進行分列處理時發現了重復的數據,以判斷同案號并且同姓名的方法,專門編寫程序將重復提取到的“被告人”進行去除。
四是為了在全部案例中通過已經知曉的關鍵詞關聯出其他相類似的關鍵詞,筆者應用Python中的gensim工具包針對收集案例中“庭審過程”所描述的內容,進行了word2vec訓練,專門建立了word2vec模型。
人、事、物、時間和空間構成了一個事件的基本要素。本研究從這5個因素出發,根據3 346份刑事判決書能夠提取到的信息做了以下信息特征的統計分析。
根據判決書的文本信息,首先對每個案件中的被告人信息進行了提取,經過去除重復數據、空數據等共計得到4 379名被告人,提取了被告人的性別、民族、年齡、職業、文化程度、居住地等信息。下述統計在去除缺失數據后,最低仍占整個數據的59.67%以上,具有統計學意義。表1列舉了每個特征所提取到標簽的比例,以及前5個標簽的比例。本文用詞“以上”、“以下”含本數。

表1 侵害人信息特征
收購、運輸和出售是本類案件的主要行為特征。其中,收購占63%,出售占57%,運輸占24%。收購、出售中的交易方式有當面進行的,也有相當多的案例通過網絡進行。
隨著網絡通信工具的成熟,作案行為中的聯系、支付手段有很多采用網絡進行,其中涉及的聯系和交易平臺主要有國內的微信、支付寶等;國外的Whatsapp。國內被利用作為銷售的網站或平臺還包括:閑魚、淘寶、貼吧、微博和抖音等。
利用網絡聯系后一般以快遞的形式寄到買家手上,交易雙方都不用直接謀面,減少了交易風險,也給偵查帶來了困難。例如,2018年5月云南省森林公安破獲的“4·10”專案中,犯罪嫌疑人蔣某通過網絡平臺發布銷售野生動物的視頻信息,私下談成后,由在廣西邊境城市活動的上家于某,通過物流寄遞野生動物活體完成買賣。
從關鍵詞淘寶、微信、支付寶、閑魚、貼吧和微博的統計來看,案件涉及最多的是微信839例,其次是支付寶135例,再次是QQ128例。此外筆者還應用word2vec模型關聯出一些平臺,如快手、天下、58同城等。
從收購、出售等行為來看主要涉及的野生動物或其制品包括亞洲象(Elephasmaximus)、穿山甲(Manisspp.)等。表2列舉了前10種所占的比例。

表2 侵害動物或制品占比
上述動物的統計中亞洲象所涉及的是其制品,因一般法律文書為說明制品屬于什么動物,機器在判斷時自動提取而得到。
應用為此類案件建立的word2vec模型,查找相關動物制品的名稱或叫法。結果從“象牙”關聯出犀牛角、平安扣、紅珊瑚、羚羊角、硨磲、河馬牙、盔犀鳥、象牙雕牌;從“象牙雕牌”關聯出象牙珠、象牙筒珠、盔犀鳥喙制品、雕牌、虎牙、吊墜;從“吊墜”關聯出吊牌、牌子、觀音、圓珠、掛件、佛頭、筆筒、手鏈、珠鏈、手環;從“雕牌”關聯出圓牌、方牌、掛牌、扳指、掛墜;從“掛墜”關聯出煙嘴、戒指等。
由此看來動物制品豐富多樣,此種word2vec的訓練可為執法人員在市場或交易等的可能動物制品檢查中提供較為明確的思路。
美國國際開發署的報告表明,走私者通過航空運輸的方式非法販運象牙、犀牛角、爬行動物、鳥類、穿山甲、海產品和其他哺乳動物,這些物種占所有被走私的野生動植物的81%[4]。這也與我國此類案件的動物制品統計有相似之處。
以檢察機關指控的首起案件的作案時間進行分析統計,比較了2014—2019年各年度的趨勢,從圖1中可以看出此類案件具有明顯的季節特點;此外,2019年看上去有明顯下降趨勢,但因為法院判決時間有滯后的情況。筆者在2019年收集統計之前的數據時也發現有此種類似的情況,而且今年還受到疫情的影響。
根據所收集到的案例統計,各省涉及野生動物非法貿易(含收購、運輸、出售等行為)分布情況主要集中在沿海省份如廣東、福建、江蘇,以及與東南亞國家接壤的云南、廣西等。從城市排序來看,排前5 的城市(自治州)分別為天津市、上海市、北京市、廣州市和德宏傣族景頗族自治州。而作為上游犯罪的非法獵捕、非法殺害等犯罪行為,筆者也做了統計,發現排在前5的分別是呼倫貝爾市、西雙版納傣族自治州、三明市、阿壩藏族羌族自治州和重慶市。顯然兩者從區域和經濟水平來看有顯著差異。此外均出現了云南所屬的自治州。
交易的具體場所包括家里、店鋪中、路面、市場等。同樣應用上述所建立的word2vec模型,查詢“市場”關聯到菜市場、地攤、批發市場、魚蟲、農貿市場、廣場、花鳥、流動、魚市。此外通過某文玩店關聯到了很多餐飲店、農家屋,甚至還有服飾店。
關聯規則挖掘,也稱市場籃子分析,起源于市場營銷領域,目前在其他領域得到有效應用,如生物信息學、核科學、藥物流行病學、免疫學和地球物理學,也被運用于管理領域[5]。構建關聯規則的目的是發現隱藏在大數據之間的關聯關系。其主要衡量指標包括支持度、置信度和提升度。本研究應用Python提供的pymining進行關聯規則的構建,在設置最小支持度0.1;最小置信度0.9后得到如表3所示的11條關聯規則。

表3 生成的關聯規則
從上述關聯規則來看,有以下特點:
一是前件有收購、運輸動物行為,具有初中文化、漢族、農民、30歲以下特征的,主要與性別男性相關聯;二是前件有出售、運輸行為的,主要與收購行為相關聯;三是前件是亞洲象的,主要與動物制品相關聯;四是前件為居住于云南省的,起訴地主要與云南省相聯系。
《國家林業和草原局關于加強野生動物保護管理及打擊非法獵殺和經營利用野生動物違法犯罪活動的緊急通知》(林護發〔2019〕21號)從深刻認識野生動物保護的重大政治意義;強化組織協調;全面部署實施從源頭、流通到市場各環節的監管舉措;加強宣傳教育;強化監督檢查等5個方面對打防涉及野生動物保護的違法犯罪提出了要求。本文從前面的數據特征統計分析、word2vec模型和關聯規則所挖掘出來的聯系,建議采取以下較為具體的對策進行防范。
從前述6年的數據分析來看,本類案件的發生從總體上看具有明顯的季節性特點。案例數量從3月開始往上走,至8月達到最低點,9月后又開始出現高峰,10月到高點。根據這一特點,野生動物執法部門可調整執法力量配置,在高發時段進行有針對性的重點防控。
從侵害人的特征統計以及數據關聯分析來看,40歲以下占了一半以上,并且大部分為農民、個體戶或無固定職業者。實際上個體戶中也有很多來自農民。法律意識淡薄也是造成這類群體在案件中占大多數的原因[6]。從關聯到的場所來看,有各類市場、店鋪和網絡等,因此很有必要在菜市場、地攤、批發市場、魚蟲市場、農貿市場、廣場、花鳥市場、文玩場所、流動路口張貼宣傳告示,開展普法宣傳,提高公眾保護野生動物的法律意識;執法部門與電商網站、新媒體網站合作進行法律宣傳。
《國務院辦公廳關于有序停止商業性加工銷售象牙及制品活動的通知》要求2017年12月31日前全面停止商業性加工銷售象牙及制品活動。但本研究仍然提取到2018年、2019年涉及象牙制品交易案件100余例。這說明仍然有人無視象牙禁令,為了利益而作案。這說明一方面要強化檢查打擊,另一方面也要對于象牙銷售的禁令加強有針對性的宣傳。
熱點分析理論將犯罪的區域劃分為產生地、吸引地和促進地,并分別給出了相應的對策[7]。通過前面的統計分析,找出了案件高發的省市,但這不足以說明這些省市就是熱點區域的中心,因有些省份本身野生動物資源豐富,打擊力量的水平高、力度大。熱點分析理論主要是針對一個城市的犯罪區域。對于以消費為主的野生動物非法貿易犯罪,也就是分析前面歸納的市場、古玩等交易場所,根據犯罪率確定犯罪的因子。如果是產生地,則重點要加強監督、檢查;如果是吸引地,則還要進行路線的干預;如果是促進地,則要增加防衛力量[7]。
對于野生動物,收購、出售的前提是有人獵捕或殺害野生動物;對于野生動物制品,收購、出售的前提也存在獵捕、殺害,只是某些野生動物制品因其收藏功能而無即時的獵捕、殺害。在現實檢查中有發現無合法來源憑證的情況[8],因此應落實監管責任,做好源頭管控。對于來源不明的野生動物或野生動物制品應追根溯源,追查是否涉及其他違法行為,在源頭上進行治理。
從前面特征分析中發現,很多案件通過微信等網絡手段進行聯系或交易,如何及時發現網絡涉及侵害野生動物信息,應納入網絡監管部門的范圍,督促互聯網企業做好相關違法行為的監管工作,依法實行執法部門、網站,甚至包括公益組織在內的多部門聯合防范。
在打擊防范中,應充分應用現代人工智能的科技成果助力執法部門打擊防范野生動物違法犯罪行為。應用人工智能技術識別涉及野生動物的圖片、視頻和文字。據報道,國際愛護動物基金會(IFAW)聯合百度大腦飛槳團隊合作開發的一款名為“瀕危物種AI守護官”對象、虎(Pantheratigris)和穿山甲3個物種相關制品圖片識別準確率已達到75%左右,準確識別出3 348幅目標野生動物制品圖片[9]。
研究野生動物或其制品名稱的網絡語言也有助于打擊防范此類違法犯罪行為。因并非屏蔽了“象牙”兩字,網上就不存在發表象牙制品交易的信息。如何發現這些網絡語言(或稱犯罪黑話),可構建網絡語言方面的模型。筆者上述訓練的word2vec也是這方面的成果之一,也愿意無償為相關執法部門服務,合作打擊和防治野生動物犯罪。
上述采用大數據的方法整理了案例,并分析了野生動物非法交易犯罪案件的特征,進行了關聯規則的數據挖掘。統計數據占全部數據的大多數,具有統計學意義,分析結論具有合理性。隨著打擊販賣野生動物活動的深入開展,以及人們法律意識的提高,這類犯罪現象有所收斂,但不排除會采用更為隱秘的方式進行交易,對于野生動物的保護需要綜合治理,對于大數據背景下的情報信息分析,可從自然語言的處理,包括專用詞庫的建設,以及圖片、視頻的人工智能識別進一步開展研究,以深入挖掘犯罪現象,更好地保護生物多樣性和生態文明建設成果。