張云佐,董 旭,呂芬芬,郭亞寧,郝永澤
(1.石家莊鐵道大學 信息科學與技術學院,河北 石家莊 050043;2.河北省體育局運動技術學校,河北 石家莊 050011)
據人事局統計,2019年底,雄安新區企、事業單位、黨政機關各類專業技術人才共計10 448人,其中80%以上人員供職于事業單位,并且現有專業技術人才的專業技術職務分布與區域經濟結構發展不匹配,高級專業技術人才尤其缺乏,無法支撐區域經濟發展戰略[1]。更為甚者,雄安新區還面臨著專業技術人才流失的問題,職務等級越高,人才流失的概率就越大。專業技術人才作為一類特殊的人才群體,一直備受社會各界的普遍關注,其顯著特征是高流動性[2]。專業技術人才隊伍的供需平衡和結構均衡在區域發展中占著舉足輕重的地位,雄安新區承載著北京非首都功能的疏解,對專業技術人才隊伍建設的需求已然迫在眉睫。
當前,很多學者開展了大數據、雄安新區人才隊伍建設方面的研究,取得了一些可供參考的成果。劉莎莎[3]從供需均衡角度出發,搭建了服務精準化供給機制的解釋框架,受制度環境、技術驅動、需求牽引等因素的影響,不斷深化服務精準化供給變革實踐,從前端、過程、后端優化政務服務精準化供給機制的各個維度,促進供需兩端均衡發力。Michele Ianni[4]等人基于聚類實現了快速、高效的大數據分析策略。C.Shi[5]等人給出了挖掘網絡微博、論壇信息,分析情感的方法。李曼琪[6]從動態平衡的視角出發,研究了湖北省衛生監督隊伍建設。蓋宏偉[7]等人通過引力熵模型研究雄安與京津冀地區的融合發展。
總體而言,當下雄安新區專業技術人才數量偏少,專業技術人才隊伍的結構和分布不合理,直接應用上述成果難道達到理想的效果[8-9]。深入認識專業技術人才流動,樹立專業技術人才資源全社會共享的新觀念,使專業技術人才流動形成最佳組合,才能發揮最大效益,保持專業技術人才隊伍的活力[10]。
為此,本文擬從大數據視覺出發,研究雄安新區專業技術人員隊伍建設,一方面通過研究雄安新區專業技術人才流入的意向、吸引專業技術人才的區域分布、專業技術人才流動的全貌,建立精準供需預測模型,另一方面,在互聯網文本大數據分析和挖掘的基礎上,從雄安新區專業技術人才的學歷結構、地理結構、年齡結構等方面進行研究,探索人才結構均衡發展策略,以期為雄安新區的專業技術人才隊伍建設提供理論支撐和技術支持,為經濟和社會發展服務。
本文基于大數據研究雄安新區專業技術人員隊伍建設,建立精準供需預測模型,探索人才結構均衡發展策略,研究過程中涉及到的理論包括:系統管理理論、知識管理理論和公共信息資源管理理論。具體研究時,廣泛收集、梳理專業人才發展信息資源方面的政策文件、新聞、專題報道;針對專業人才發展信息資源進行公共管理學、計算機科學及信息學等多學科關聯;對比分析雄安新區專業人才發展信息資源方面的特點,以期從專業人才發展信息資源中找到客觀存在的規律,為專業技術人員隊伍建設提供依據。
精準的人才供需預測需要獲取充足的歷史數據以及數據之間的關聯關系。雄安新區建設作為一個全新的、頂層戰略設計,現存的數據基礎不足以支持對專業技術人才需求的預測。與城市發展和產業戰略同步展開,也使人才需求分析面臨更多挑戰。因此,本文基于大數據分析,從雄安新區專業技術人才流入意向、吸引專業技術人才地域分布以及專業技術人才流動全景三方面展開研究,建立精準供需預測機制。
通過科技人才搜索行為數據測算科技人才搜索指數,分析并研究科技人才對雄安新區的話題熱度和積極情緒。資料來源于微信、微博、論壇、博客等互聯網數據,通過比對數據發布時間、地域、標題、內容、網站類別、網址、新聞欄目與版塊等維度的科技人才所表現的積極情緒和滿意度,分析科技人才對雄安新區的關注度、持續關注熱度和重點關注領域,研究科技人才流入雄安新區的意向,得出現有雄安本地專業技術人才不足以支撐雄安新區發展,有哪些潛在的支持雄安發展的人群,通過對三類大數據的整合有了一些新發現。
高學歷人才持續關注雄安發展機會。分析采集的2017年4月至7月互聯網主要渠道中與雄安新區話題直接相關的信息3 976萬條,以及2017年7月至9月相關的信息206萬條,分析互聯網文本數據的情感特征。根據身份標簽識別,建立了高學歷人才對雄安新區搜索行為模型。通過文本分析與數據挖掘發現:關注雄安新區的大學及以上專業技術人才沒有隨新聞熱度釋放而衰減,他們關注雄安加強土地和房地產管控、推動創新要素集聚等政策,對雄安路網建設、產業定位、生態環境及城市地下管網建設抱有很高期待。說明這些人很有意愿參與到雄安新區發展和建設中來。
雄安新區吸引人才地域分布研究。通過專業技術人才搜索行為數據預測科技人才搜索指數,分析推斷雄安新區吸引專業技術人才關注的區域分布。網民搜索指數是指以網民在搜索引擎的搜索量為數據基礎,通過線上檢索(時間維度)和線下到訪(人口變量),以關鍵詞為統計對象,科學分析并計算出各個關鍵詞在搜索引擎中搜索頻次的加權和。內容通過百度以搜索引擎進行,以“雄安”作為關鍵詞,通過專業技術人才搜索行為的IP地址預測用戶地理位置,以各大高校、研究機構和產業園區等科技人才常駐地 IP庫作為科技人才限定標準,進行搜索數據過濾篩選檢索關鍵詞,研究雄安新區吸引科技人才地域分布[5]。
由流動人口來源圖1可以得到:雄安引才重點應放在河北省內、北京和廣東。對雄安感興趣的人才分布在哪里?如何通過大數據挖掘比較精準地找到他們?通過科技高學歷人才搜索 IP地址估算用戶地理位置,通過各大高校研究機構和產業園等人才常住地作為比照過濾篩選,建立了省級人才關注指數分布圖。數據分析結果表明:河北、北京關注指數最高,其次為山東、江蘇、浙江和廣東,四大沿海省份為第二梯隊,山西、河南、陜西、湖北等中部地區次之,其他省市的關注不高。自雄安新區提出后,河北、北京、廣東連續八個月搜索行為位列前三,未來極有可能成為雄安新區持續穩定供應的人才蓄水池,天津、山西、遼寧等省份近一年排名持續向前,屬于專業技術人才儲備的潛在省份。

圖1 流動人口來源圖Fig.1 Sources of floating population
雄安新區科技人才流動全景研究。根據中國電信提供的用戶移動出行數據,分析研究科技人才在雄安地區的流動情況。基站地區選擇雄安新區三縣(雄縣、容城縣、安新縣)全域,時間維度選擇4~11月的數據。根據中國電信科技人才使用的數字標簽(年齡、性別、終端、興趣),詳細分析雄安新區吸引人才地域分布,即科技人才進入和離開雄安新區的人數,從而得到雄安新區人才流動全景圖。可以得到:
青年男性是流入雄安新區的主力。利用電信出行數據分析流入科技人才來源地,新區成立以后,有74%的科技人才來自河北省內,省內日均流入近200人次;26%的科技人才來自河北省外,以北京、山東人數居多,河南、山西次之。作為推動京津冀協同發展的重大舉措之一,新區的成立引起京津冀地區科技人才的高度關注。大數據分析結果顯示,雄安新區流入專業技術人才中,京津冀地區的人數占比超90%,遠高于長三角地區。在去過雄安新區的專業技術人才中,69%為男性,年齡多分布在 23~40歲之間,41~50歲的中年人占近兩成。這說明年輕人為主體,一部分有積累有想法的人可能是把握雄安機會的先鋒隊。
2019年,雄安新區人口特征發生了很大的變化。除去周期性因素外,通過大數據統計可知:雄安新區人口總量在穩定增長,如圖2所示。2019年人口總量較 2018年同比增長9.5%。深度分析可知:雄安新區流動專業技術人才的占比較2018年同比增長了31%,說明明雄安新區對專業技術人才的吸引力在持續增長。

圖2 雄安新區人口總量變化圖Fig.2 Map of total population change in Xiong'an New District
通過對雄安人口的教育水平變化進行專項跟蹤,分析發現,雄安新區大專及本科以上學歷人群占比呈持續穩定增長趨勢,常駐人口大專及本科以上學歷人群同比增加了9.7%,流動人口大專及本科以上學歷人群同比增加了 26.4%,這說明雄安新區正在持續吸引越來越多的優秀專業技術人才加入。如圖3所示。

圖3 城市吸引力Fig.3 City attraction
雄安新區建設專業技術人才結構不能過于單一,一個新興城市如果只建設特色產業,即使是高科技為主導產業的特色之城,城市發展的可持續性也會面臨較大挑戰,單一的人才結構會限制城市的功能和活力。為此,本課題基于互聯網文本大數據分析與挖掘,從雄安新區專業技術人才的學歷結構、地緣結構、年齡結構三方面展開研究,探索人才結構均衡發展策略。
學歷是衡量專業技術人才能力和知識的重要標準,不同學歷層次人員在人才群體中的比例構成狀況稱之為學歷結構。雄安新區專業技術人才的學歷結構主要分為四個層次,第一層次為其他的一些勞動者,第二層次是大專及以下學歷,而這一層次人才主要負責一些基建,第三層次為本科,第四層次為碩士生和博士及以上。其結構如圖4所示。

圖4 學歷結構占比圖Fig.4 Percentage chart of education structure
雄安新區大專及本科以上學歷人口的占比持續穩定增長,具體數據表明,常駐人口大專及本科以上學歷人群同比增長9.7%,流動人口大專及本科以上學歷人群同比增長26.4%,印證了雄安新區吸引專業技術人才所取得的成效。如圖5所示。

圖5 流動人口高學歷人群比例圖Fig.5 Proportion of Highly Educated Floating Population
圖6給出了地緣結構完整的分析框架,地緣結構分析框架包含五部分,分別是作為構成物的物質結構、理念結構和空間結構,作為過程的各種相互依存關系,政治、經濟、軍事、文化結構系統,中觀和宏觀兩個層次,因果和建構兩種機制。

圖6 地緣結構框架圖Fig.6 Geo-structur e frame diagram
雄安新區地處北京,天津,保定三地腹部,其規劃范圍涉及河北省雄縣,安新,容城三縣以及周邊部分區域,其起步區面積約為100平方公里,中期發展區面積約為200平方公里,遠區控制區面積約為2 000平方公里,如圖7所示。

圖7 雄安新區地理圖Fig.7 Geo-structur e frame diagram
從地緣結構分析可知,雄安新區與北京副中心優化了北京空間格局。北京副中心坐落在北京東部的通州,與燕郊和國貿相鄰,這種地緣結構有助于市政府遷至通州,帶動整個東向和北向的發展。雄安新區位于雄縣、安新、容城,緊鄰北京、天津,可帶動河北南部、華北腹地的發展,優化華北地區的空間城市格局。
年齡結構是指一定時點、一定地區各年齡組人口在全體人口中的比重。又稱人口年齡構成。通常用百分比表示。人口年齡結構是過去幾十年、甚至上百年自然增長和人口遷移變動綜合作用的結果,也是人口再一次變動的起點。人口年齡結構不僅影響著未來人口發展的速度和趨勢,還影響著今后社會經濟的發展。
截至 2017年 6月底,雄安新區常住人口104.71萬人,遠期規劃人口為200萬至250萬,人口密度為每平方公里1 000到1 250人左右。而截至2019年底,雄安新區的人口整體年齡結構中擴張型和靜止型的人口占據百分之85左右。如圖8所示。

圖8 人口年齡占比Fig.8 Population age ratio
綜上所述,根據雄安新區對于專業型人才隊伍建設的需求,大數據體系理論基礎知識和體系設計出的人才精準供需機制整體框架如圖9所示。

圖9 人才精準供需機制框架Fig.9 Framework for precise supply and demand of talents
人才結構均衡發展模型框架如圖10所示。

圖10 人才均衡發展架構Fig.10 Talent balanced development framework
本文將大數據分析與專業技術人才隊伍建設結合起來,一方面通過研究雄安新區專業技術人才流入的意向、吸引專業技術人才的區域分布、專業技術人才流動的全貌,建立了精準供需預測模型,另一方面,在互聯網文本大數據分析和挖掘的基礎上,從雄安新區專業技術人才的學歷結構、地理結構、年齡結構等方面進行研究,探索人才結構均衡發展策略。最后,給出了大數據下人才精準供需預測和結構發展的整體框架。研究成果可以為政府部分制定相關政策提供參考依據。