孟東霞 陳剛 許美玲
【摘要】 我國流動人口呈現出規模持續擴大,人口結構日益復雜化的趨勢,但是目前的流動人口統計方法明顯滯后,不能滿足各級政府和社會各界對流動人口數據的需求,亟待結合大數據分析方法進行改進。而隨著智能手機等移動終端的普及,電信運營商獲取了用戶身份、通訊記錄、地理位置等海量客觀數據,本文將結合電信運營商獲取的數據信息分析流動人口所表現出的數據特征,為統計流動人口提供判定思路。
【關鍵詞】 電信大數據 流動人口 價值分析 判定
一、引言
流動人口指離開戶籍所在地的縣、市或者直轄區,以工作、生活為目的異地居住的成年育齡人員,對某個城市而言,包括流入人口和流出人口,人口的流入和流出情況在一定程度上反映出當地的經濟發展情況,也對當地造成一系列的社會經濟影響,包括人力資源的分布變化、對公共設施配備的需求增加、對城市建設的影響等。目前常用的流動人口統計方法主要包括人口普查、人口抽樣調查、構建流動人口信息平臺等方法,缺乏實現快速動態監測、短周期內流動人口規模測度統計的有效方法和策略。若要對某城市實現以上統計目標,需實時獲取城市范圍內所有人員有關原戶籍、現所在地等個人信息,傳統方法很難在短時間內獲取相關數據,而這對電信運營商來說卻是易于反掌,原因在于移動的基站系統和實名制注冊要求。據工業和信息化部統計,截止2015年4月,我國移動用戶數總規模接近12.93億戶,而全國總人口為13.6億人,移動電話普及率已達95.07部/百人,接近人手一部手機。對于流動人口而言,無論其流動方向而言,總會通過移動通信與家里留守的親人保持聯系,這使得流動人口的統計特征與移動通信數據保持基本一致,為應用電信大數據統計流動人口提供了較強的理論和數據支持。
二、電信大數據的類型分析
電信運營商的數據具有十分寶貴的研究價值,包括用戶身份信息、設備終端數據,出于對在網客戶進行服務計費的需要,運營商實時記錄用戶上網數據、所在位置數據、通信數據等內容。
(1)用戶身份信息:包括用戶姓名、年齡等個人信息,業務訂購,積分獲取等數據。在逐步實施用戶實名制之后,運營商擁有了較為準確全面的用戶個人資料,身份證號信息提供了用戶的出生地信息,是進行流動人口統計的主要數據基礎。(2)設備終端信息:主要記錄用戶終端的數據信息,包括品牌、型號以及手機終端的性能信息。(3)用戶行為數據:記錄用戶的通話、數據上網、收發短信等行為,以通話為例,記錄是否主被叫,通話時間、時長,是否漫游,對方號碼歸屬地等信息。由于流動人群大多數存在頻繁與戶口所在地進行通信的現象,因此通話行為數據可被用來作為統計流動人口的依據。(4)用戶位置數據:為保證用戶能接打電話,手機終端需要與移動基站不停地進行呼叫通信,運營商可根據通信基站確定用戶所處的大致范圍,而隨著用戶位置的改變,網絡會進行基站切換和位置更新,這就形成了特定時間內用戶位置的移動軌跡。研究檢測用戶在某個時間范圍內的位置變化也是流動人口研究的統計依據。綜上所述,電信用戶入網登記的身份信息,在網期間所產生的行為數據和位置數據對統計流動人口有重要的應用價值。
三、流動人口電信數據的表現特征
對某一特定區域而言流入人口和流出人口,在身份信息、行為數據和位置數據方面表現出不同的數據特征,以下將分別進行分析:(1)流入人口的數據特征分析。1、身份信息:實名認證客戶的身份證信息中前六位所對應的出生地區域代碼與電信運營商所在地不一致,可根據其統計流入人口的來源地區分布;2、位置信息:在春節、五一或國慶等節假日期間,出于與親友團聚的目的,運營商檢測到的流入人群所處基站位置信息發生明顯變化,顯示區域與身份信息所在地一致;3、用戶行為數據:流入人群與其身份證記錄的外地區域客戶有頻繁的長途通話、收發短信等行為。節假日期間,流入人群在身份證顯示區域有漫游通話的情況。(2)流出人口的數據特征分析。1、位置信息:流出人口的身份證出生地信息顯示為本地;2、位置信息:在春節等節假日期間,流出人口有回流情況,即所在基站位置與出生地一致;3、用戶行為數據:流出人口與本地區域客戶有較高頻率的長途通話;節假日期間,客戶漫游地區與本區域一致。
總結:電信運營商在提供移動通信業務的過程中, 獲取了海量真實的客戶歷史數據, 客觀反映了用戶的真實身份信息、位置信息和消費行為,結合流動人口的消費、移動等行為特征,本文研究分析了流入、流出人口電信數據的特定表現特征,為進一步應用電信大數據統計流動人口數量提供了參考依據。
參 考 文 獻
[1] 智勇,盛昭翰. 基于移動通信信息資源的人口流動趨勢研究[J]. 山東社會科學, 2009(11).
[2] Liu P. 電信行業中的大數據. 電信網技術[J], 2013(8).
[3] 趙時亮, 高楊. 基于移動通信的人口流動信息大數據分析方法與應用[J].人口與社會,2014(3).