聶圣東,劉 嫻,武帥文
(江西理工大學 土木與測繪工程學院,江西 贛州 341000)
2016年2月,今日頭條發(fā)起了“頭條尋人”公益項目。字節(jié)跳動提出“互聯(lián)網(wǎng)+”在公益事業(yè)方面所具有的效果巨大這一說法。更是提出了“信息公益”這一理念,將信息作為公益事業(yè)的起點;公益事業(yè)發(fā)起與信息,更借用信息作為載體,提高公益事業(yè)的效率與價值。只有立足于信息技術的優(yōu)勢,才能促進尋人尋親項目的實施[1]。本系統(tǒng)基于GIS 技術的尋親大數(shù)據(jù)分析方法的互聯(lián)網(wǎng)+公益尋親系統(tǒng)結合了Web 端和移動端的技術,充分發(fā)揮互聯(lián)網(wǎng)在社會資源配置中的優(yōu)化和集成作用,將互聯(lián)網(wǎng)信息技術與公益進行融合對接,介入人口失蹤問題,針對性的解決了以往尋人方式途徑單一、效率不高、尋回失蹤人口成功率較低等問題[2]。Web 端主要是實現(xiàn)尋親基礎數(shù)據(jù)的獲取、歸類、分析、可視化,記憶尋找、在線交流等功能。移動端是基于微信公眾號模式進行二次開發(fā),主要實現(xiàn)的是尋親隨手拍、即時尋找、預警消息推送、尋找路線推送、在線交流等功能。
我們通過網(wǎng)絡爬蟲這個程序,根據(jù)既定的目標,選擇性訪問與目標相關的網(wǎng)頁鏈接,獲取有效信息。尋親數(shù)據(jù)來源于網(wǎng)絡上的傳統(tǒng)尋親網(wǎng)站,這里以“寶貝回家”為例[3]。我們使用基于.Net 的第三方類庫HtmlAgilityPack 對寶貝回家的數(shù)據(jù)進行爬取。從寶貝回家獲取的失蹤位置數(shù)據(jù)是以地址格式存儲的,我們需要將其重新編碼,使地址信息轉化為更為直觀的經(jīng)緯度坐標信息。將爬取的批量地址編碼后的數(shù)據(jù)導入ArcSDE 空間數(shù)據(jù)庫當中,并在ArcMap DeskTop 中進行展示(見圖 1)。
(1)尋親大數(shù)據(jù)的時空集聚性分析。依據(jù)時間和地理位置對尋親大數(shù)據(jù)做時空集聚性分析,在地圖中構建熱力圖,分析出尋親的熱點區(qū)域。基于GIS 技術的尋親大數(shù)據(jù)分析方法采用heatmap.js 進行實時熱點圖的構建,heatmap.js 可以使用canvas 畫出來一張漂亮的heatmap。

圖1 算法流程圖
(2)時空關系的尋親大數(shù)據(jù)關聯(lián)分析方法。對從尋親網(wǎng)絡中獲取的尋親數(shù)據(jù)進行分析,對尋親雙方信息中的基本信息、時間、空間、特征、進行算法匹配,再通過記憶地圖匹配推薦出相似的尋找人,其算法流程如圖2 所示。
a.初級匹配,首先處理尋親大數(shù)據(jù)中的基本信息,通過信息與描述相比較,進行篩選。
b.權重匹配,對失蹤地點、籍貫、特征關鍵詞進行權重匹配。利用GIS 技術,通過對輸入的信息與系統(tǒng)中的數(shù)據(jù)進行匹配,距離與權重成正相關。然后再通過對特征關鍵詞進行檢索,再與系統(tǒng)中的詞庫進行對比,關鍵詞的出現(xiàn)頻率的高低決定權重大小。
c.記憶匹配,尋親的父母可以將孩子丟失的時間信息與空間信息數(shù)據(jù)上傳到系統(tǒng)中來,然后系統(tǒng)會進行信息的自動比對,然后通過初級匹配和權重匹配,系統(tǒng)會推薦一份相似度較高的列表可供用戶查看尋找。
(3)尋親大數(shù)據(jù)影像識別方法。系統(tǒng)中搜集了數(shù)十萬張尋親照片,我們通過影像識別技術對尋親大數(shù)據(jù)中的照片做智能匹配,推薦出相似度較高的圖片。使用的人臉識別系統(tǒng)是由Face++提供的,該系統(tǒng)通過提取圖片的面部特征,包括面部表情、年齡、性別、眼睛、鼻子等在臉部的位置信息,然后上傳至服務器,然后服務器會把這些面部特征以及標識通過json 數(shù)據(jù)響應,與尋親父母提供的照片相比對,相識度達到一定高度即認為是同一人。
(4)即時尋親最優(yōu)尋找路徑推薦。為了在web 端實現(xiàn)即時尋找路線推薦這一功能,我們使用ArcGIS Server 發(fā)布復雜的空間運算模型,對服務區(qū)路網(wǎng)進行分析,以章貢區(qū)路網(wǎng)為例,將其路網(wǎng)的網(wǎng)絡數(shù)據(jù)集作為基礎,以兒童的失蹤時間為判定條件,分析出在黃金救援時間內(nèi)以步行、騎行、開車能到達的位置,然后再將分析所得的路線結果推送給該服務區(qū)內(nèi)的志愿者,讓其加入即時尋親。
系統(tǒng)主要實現(xiàn)了如下功能:
(1)家尋寶貝。系統(tǒng)中使用的人臉識別系統(tǒng)是由Face++提供的,使用關鍵點檢測技術,精準定位人臉的大小、特點、表情等特征,可以自動識別出照片中的人臉身份[4]。通過1:N 人臉識別技術,可以實現(xiàn)尋親過程中的照片識別。并建立大數(shù)據(jù)平臺,尋親父母和被拐兒童都可以根據(jù)自己的記憶信息在系統(tǒng)中根據(jù)數(shù)據(jù)庫中的數(shù)據(jù)進行時空關系匹配,得到結果列表,有助于被拐多年的人員找到親人。
(2)微信即時尋親。該功能主要利用微信公眾號的形式,在微信公眾號中設置了尋親指南、即時尋親、關于我們等三個功能欄。涵蓋了防范措施、尋親技巧、找回故事等常規(guī)公益網(wǎng)站的宣傳內(nèi)容以及基于GIS 技術的家長和志愿者的即時尋親功能。
(3)后臺管理。即時尋親監(jiān)控平臺是對微信端的即時尋親的家長和志愿者的監(jiān)控,這里是以贛州市章貢區(qū)為例進行分析監(jiān)控,右側區(qū)域依次有預警區(qū)域、查看志愿者、查看信箱、解除預警功能。

圖2 記憶尋親算法流程圖
繼電影《親愛的》之后,由劉德華主演的電影《失孤》再度喚起人們對打拐問題的關注,一個兒童丟了,就是一個家庭崩塌的開始,再加上傳統(tǒng)的尋親社會關注度低,尋親渠道少,群眾參與度不高等問題,極大地降低了尋回丟失兒童的幾率[5]。本系統(tǒng)是基于互聯(lián)網(wǎng)+GIS 技術的公益尋親系統(tǒng),以智能手機為主要平臺,通過網(wǎng)絡爬蟲獲取當前網(wǎng)絡上失蹤和尋找信息,并采用地理信息空間技術對這些數(shù)據(jù)進行可視化管理,構建失蹤人員的時空數(shù)據(jù)庫,在此基礎上,建立基于時空關系的失蹤與找尋匹配模型,提高匹配的精準性。未來,還可以嘗試利用大數(shù)據(jù)等現(xiàn)代互聯(lián)網(wǎng)技術對公益開展更深層次的改造,共同構建一個和諧、美好、充滿愛心的社會。