999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人才流動的時空模式:分析與預測

2019-07-15 12:11:52於志文
計算機研究與發展 2019年7期
關鍵詞:模型

胥 皇 於志文 郭 斌 王 柱

(西北工業大學計算機學院 西安 710072)

人才是指具有一定的專業技能,能進行創造性工作的勞動者,是推動社會經濟發展的戰略資源.隨著經濟全球化的發展,不同國家或地區間的人才交換日益頻繁,人才流動的規模與方向均呈現出動態化和多樣化的特點[1-2].一方面,人才流動對社會發展有一定的積極作用,例如相關研究表明:不同地區間的人才交換可促進知識和創新的傳播,進而刺激地區經濟和文化的發展[1].另一方面,過度的人才流失可能出現消極影響.例如相關研究發現:若發展中國家(或地區)的人才大量流向發達國家(或地區),易造成更廣泛的發展不平衡現象[3-4].由此可見,人才流動對地區發展的影響較大,但自發的流動具有高度不確定性.因此,對人才流動進行觀察、引導和調控,避免過度的人才流失,吸引亟需人才,促進人才結構平衡,是政府決策部門的重要職責.例如國家通過發布《國家中長期人才發展規劃綱要(2010—2020年)》[5],為人才引流、調控和引進提供基本政策指導.

理解地區間人才流動的規律,是實現準確地觀察和分析的前提.而精確地人才流動量預估,是制定和評估人才戰略和干預政策的理論依據.因此,與人才流動問題相關的研究成果十分豐富[1-4],相關文獻一般通過人口普查數據開展特定國家或地區范圍內的人才流動分析.但人口流動與人才流動數據差異較大,因此分析結果一般無法直接反映人才流動規律.此外,人口普查數據更新周期長、時效性較差,基于該類數據開展的研究易缺乏準確及時的數據支撐.近年來,在線職業網絡(online professional network, OPN)平臺的發展,收集了大量職業變遷數據[6],其數據分布不受地理位置限制,為研究用人單位和地區間的人才流動提供了機會[7].OPN平臺中的職業變遷數據包含平臺用戶的工作地點和時間信息,是較準確的人才流動數據樣本.同時,OPN平臺用戶中的活躍群體對其職業信息的持續更新維護,也使得該數據樣本相對人口普查樣本有更好的時效性.

本文基于OPN平臺中的職業變遷數據,研究地區間人才流動的模式分析和流動量預測問題.其中模式分析的目標是實現(定量的)地區間人才流動的空間和時間模式挖掘.流動量預測的目標是根據地區間歷史人才流動量數據,預測未來地區間的人才流動量.模式分析和流動量預測均是人才流動研究的基礎問題,但利用OPN數據解決這2個問題時面臨著2方面挑戰:

1) 數據稀疏性高.若地區數為n,則地區對數為n2.設有1 000個地區,則有約100萬個(潛在的)人才流動方向,每個方向僅收集100人次流動量,即需約1億條數據.此外,由于發達國家的大城市人口基數大且吸引力強,占據了主要人才流量,實際中約80%的地區間沒有人才流動數據.稀疏性提高了大部分中小城市數據的方差,為分析和預測中小城市的人才流動量引入了不確定性.

2) 預測模型計算復雜度高.若地區數為n,給定時間長度為T(如5年)的歷史數據,對于預測問題,共有Tn2個因變量和n2個預測目標,傳統回歸模型一般包含Tn4量級的參數.大量的參數使得模型易出現過擬合,模型訓練的計算復雜度高.

為解決這2個挑戰,本文利用參數重用的分析和預測方法,在緩解數據稀疏問題的同時降低模型復雜度.具體而言,本文構建了全球各地區間的人才流動網絡,并用流動矩陣序列表示.基于流動矩陣序列,利用流量向量克服矩陣元素稀疏問題,分析各個地區的人才流動特點以及地區間人才交互的空間和時間模式.進一步分析該流動網絡隨時間動態改變的趨勢,提出基于深度神經網絡的人才流動預測模型,利用參數復用的卷積和循環神經網絡結構,降低模型參數規模,預估未來時段地區間的人才流動量.本文的主要貢獻有3個方面:

1) 提出了一種人才流動模式分析方法.本文用人才流動矩陣序列作為地區間人才流動的定量表示,為分析和預測提供數據結構支持,且提供了人才流動分析的一種量化的方法,并利用流量向量描述地區人才流動的特點,避免數據稀疏問題.

2) 提出了一種人才流動量預測模型.在人才流動矩陣序列的基礎上,本文提出基于卷積和循環神經網絡的預測模型,復用模型參數,分別提取靜態和動態流動模式,對地區間人才流動進行預估.

3) 在大規模數據上,對所提出的模式分析和流量預測方法進行了實驗驗證.實驗表明:本文提出的方法在預測問題上具有良好的性能.

1 相關工作

人才流動的相關文獻主要關注人才流動現象的調研與分析,已有數十年研究歷史.相關文獻一般通過人工收集的調查數據來開展研究,如人口普查或問卷調查數據.相關研究內容包括:分析人才流動對社會的宏觀影響,如知識和創新的傳播[1-2];分析全球高技能人才交流的特點,并研究這類人才流動的定性問題,如是否應定性為人才流失或人才交換[3];提供應對人才流動的人才吸引政策、方案制定[4]等;分析科學技術人才的流失現象[6];研究發展中國家(如中國和印度等)的人才流動和區域發展之間的關聯[8].這些研究或局限于定性分析,缺少定量研究成果,或受限于數據采集方案,可擴展性較差.

近年來,已有相關文獻利用OPN數據開展人才流動相關研究.例如相關工作利用OPN數據分析美國對各行業專業工作者的吸引力[9-10].由于OPN數據規模大,不適合人工分析,因此相關工作一般利用機器學習技術來開展.例如針對網絡的聚集特性,研究利用OPN數據為用人單位提供招聘指導[6-7],或利用人才數據分析企業特性[11]等.相關工作較關注為OPN平臺運營方或其用戶提供服務,而利用OPN數據對宏觀模式的研究相對較少.

另一方面,交通流量預測問題[12]與人才流動預測問題相似.若將交通網絡中的節點對應人才流動網絡中的地區,則2個流量預測問題具有一定的相似性.近年來,深度神經網絡在多個應用領域的成功[13],對交通流量預測領域產生了廣泛影響.如相關研究利用多層稀疏自編碼器(stacked auto encoders, SAEs)[12]預測一個時段的交通流量,取得了較好效果.交通流量的特點是空間上接近且互聯的節點,其流量具有強關聯性.與交通流量不同的是,人才流動不完全受空間位置限制,因為地緣接近關系一般只是促進工作變動的因素之一,而福利待遇、發展前景、文化和政治環境等對人才流動有較大影響.本文借鑒交通流量預測問題中采用的線性、非線性以及深度學習模型,作為所提出模型的性能評價基準.

2 人才流動的表示和模式分析

為形式化地表述人才流動模式分析及流動量預測任務,本節首先引入人才流動矩陣的概念,并在此基礎上進一步詳述人才流動的空間模式和時間模式分析方法.

2.1 人才流動矩陣

Fig. 1 Number of talent flows among several cities圖1 部分地區間人才流動量

Fig. 2 Illustration of talent flow among cities圖2 人才流動示意圖

Fig. 3 An element of talent flow matrix圖3 人才流動矩陣示意圖

對于給定的地區,其流量向量攜帶了該地區與其他地區間直接人才交換的完備信息.此外,由于流量矩陣稀疏,分析給定2個地區間的人才交互往往因缺乏數據而不可行,但對于給定地區,其流量向量平均含有約20%的非零項,其稀疏性相對較低,可以作為其人才吸引和流失的特征向量.因此,2.2節、2.3節通過分析流量向量的特點及向量間的關系,研究地區間人才流動的時空模式.

2.2 空間模式分析

2.2.1 地區人才吸引力模式

表1是OPN數據中2016年凈收益度最高以及最低的10個地區.從表1中可見,10個最大凈流失地區中,有3個(Mumbai, Pune, Bangalore)來自發展中國家,其余地區多為發達國家的中小城市.10個最大凈收益地區則均為人口密度大、工業發展水平高的城市.該結果說明凈流入量是衡量人才吸引能力的一個良好指標.

Table 1 The Cities with Top Brain Drain or Gain in 2016表1 2016年最大凈流失和流入地區

除流量總量外,流量分布同樣攜帶了有助于刻畫地區人才吸引力的信息.具體而言,流入向量的零值越少、分布越均勻,則該地區人才流入渠道越豐富,即該地區的人才吸引力的區域多樣性越強.同理,流出向量反映出地區人才供給多樣性.本文引入流量分布的信息熵來刻畫吸引力的多樣性.

人才流入分布的信息熵定義為

流入或流出分布的熵值越大,表明該地區流入或流出人才多樣性越大.表2為OPN數據中2016年人才流入和流出多樣性最高的10個地區.

從表2可見,高流出多樣性地區和高流入多樣性地區有明顯的重疊,說明人才流失目標地區的分布與人才引入來源地區的分布有一定的對稱性[8],這種對稱性一般由地區的人才規模決定,規模大的地區傾向于更大的多樣性.

Table 2 The Cities with Top Flow Diversity in 2016 表2 2016年流動多樣性最大的城市

Fig. 4 The distribution of entropy difference圖4 熵差分布

2.2.2 流量模式的地區差異

2.2.1節分析表明地區的流量向量包含地區人才吸引力的特點,因此,通過比較流量向量,可以分析不同地區間人才吸引力的異同.

文獻[7]根據人才交互進行用人單位間的關系分析.該研究工作應用在地區人才流量問題中,即根據地區i,j互相輸送的人才類別和數量,對地區關系進行建模.與該文獻不同,本文提出另一種地區間關系的度量方法,即通過比對地區間的人才流量向量的異同,分析地區間人才吸引力的差別.

由于地區流量向量可視為地區人才吸引力在一個時段內的空間分布,而具有相似吸引力空間分布的2個地區,在人才供需上有一定的共同點.因此,基于流量向量的相似性定義地區間關系,反映的是地區人才供需和地區人才吸引力方面的相似程度,即相似性大的地區間具有近似的人才吸引力.本文分別定義地區間的人才流入相似性和人才流出相似性為

(1)

(2)

Fig. 5 Exchange the zero-elements in flow vectors圖5 不同流量向量的置零位置值交換示意圖

Fig. 6 Heat-map of similarities among cities圖6 城市人才流動量相似性熱圖

圖6是根據2016年OPN數據計算的部分地區相似性的熱力圖,圖6中矩形的上三角區域為根據流出向量計算的相似性,下三角區域為流入向量相似性.

從圖6可以看出,流入和流出相似性存在一定的對稱性,即存在部分地區對之間的流入相似性和流出相似性相同.例如London與Houston的流入和流出相似性均相對較低(圖6中第2行和第2列),而與其余城市相似性均較高.但大部分城市對間的流入和流出相似性不完全一致,說明對應城市間的人才競爭力不均衡.因此,地區間相似性的對等程度是發現地區間吸引力相對強弱的方式之一.

2.2.3 基于人才流量的地區聚類

本節基于流量向量的地區間相似性,對地區進行聚類.該聚類與基于人才交換強弱關系的聚類[7]不同之處在于:聚類的結果中同一聚簇中的地點是具備類似人才吸引力模式的地區,而不是互相進行頻繁人才交互的地區.該聚類結果是定位地區人才吸引力水平的一種方式,聚類結果具備潛在應用價值.一方面,求職者可以參考該結果,選擇比當前所在地區吸引力更強的地區;另一方面,政策制定者可根據該結果選擇合適的目標地區集合,以該目標地區集合中人才政策較優的地區作為本地區政策制定的參考.

算法1.基于人才流動量的地區聚類.

輸入:地點間的距離d(i,j);

輸出:聚類結果C.

① 初始化歸并隊列l=?,聚類隊列C=?;

② 將各個地區i∈(1,2,…,m),視為1個簇,加入l,C;

③ 計算每一對簇間的距離;

④ 選擇l中距離最小的2個簇i,j,形成1個新的簇u,該新簇與已有簇v的距離定義為d(u,v)=(d(i,v)+d(j,v))2,將i,j從l中刪除,并將u添加至l,C的隊尾;

⑤ 重復步驟④至l中的簇總數小于2;

⑥ 在C中,假設所有聚簇對間的最大距離為dm,將距離大于β×dm,(0<β<1)的聚簇分裂,得到聚類結果;

⑦ 算法結束.

算法1中超參數β∈(0,1)控制最終聚類的個數,其取值越大,聚類個數越少.圖7是β=0.8時的聚類結果.觀察該結果可知:聚類結果與地區的地緣關系存在差異性,可以歸納成3點:

1) 對一些發展中國家的城市而言,若城市在地緣上接近,則人才流量模式接近.例如印度(圖7中的F類)和巴西(圖7中的G類),不同城市人才流動模式互相接近,所以大部分出現在同一個聚類中.

2) 發達國家的大型城市與其他發達國家的大型城市更近似.如美國和北歐的大城市,盡管地緣上不接近,但均聚集在相同簇中.

3) 發達國家的中小城市與發展中國家的大城市更相似.如圖7中的E類,是美國的普通中等城市,與北京等城市聚集在同一類中.

Fig. 7 Clustering results of several cities圖7 部分城市聚類結果

2.3 時間模式分析

本節基于人才流動矩陣序列,分析地區間人才流動呈現的時間模式.

圖8和圖9分別是OPN數據中10個典型城市流出和流入人才基數在1995—2016年的趨勢曲線.需要指出的是,2016年的OPN數據由于采集過程中的干擾導致數據不完整,因此圖8和圖9中曲線在2015—2016年有下降趨勢.整體上,從1995—2015年(除2009年外),流入和流出人才基數整體均逐年呈現上升趨勢.一方面,由于這一趨勢受OPN用戶構成的影響,因此并不精確反映地區人才基數;另一方面,城市間的趨勢對比可以反映競爭力的變化趨勢,在同一時間窗口中,上升速度相對慢的城市,其競爭力相對下降.

Fig. 8 The trend of out flow of several cities圖8 地區流出人才基數趨勢圖

Fig. 9 The trend of in flow of several cities圖9 地區流入人才基數趨勢圖

圖8和圖9中,人口基數在2008—2009年出現了明顯不符合增長趨勢的下滑,但在2010年后繼續保持增長.事實上,受2008年左右經濟危機的影響,2009年全球就業市場表現低迷[15],其中大型金融和科技公司影響顯著,所以代表性大城市的人員流動出現明顯的下降.

流量分布的熵差是人才吸引力空間多樣性的表征,而該熵差的變化則反映了這一多樣性的變化趨勢.圖10是典型城市的熵差序列,其中的地區為圖4所示的熵差中差值最大和最小的10個城市(地區).圖10中圓點和叉點分別表示人才凈流入地區(即si>0)和凈流失地區(即si<0).

Fig. 10 The relation between entropy difference andtalent flow圖10 1995—2015年熵差與凈流失

從圖10可見,在1995—2015年間,凈收益地區大部分保持較大的熵差,僅有小部分地區的熵差略有波動,反之亦然.這說明在人才競爭方面,具備競爭力的大城市其競爭力趨向保持高競爭力,而競爭力的弱小城市則長期不具備競爭優勢.這種人才競爭力強者益強的現象,也是當前全球人才競爭力格局的體現.

3 人才流動量預測模型

本節首先定義人才流動量預測問題,然后詳述預測模型設計的原則,以及基于卷積和循環神經網絡的預測模型.

3.1 問題定義

人才流動量預測問題定義為:利用地區間人才流動量的歷史數據,預估未來一個時間段地區間的人才流動量.借助人才流動矩陣,該問題可形式化地定義為:給定人才流動矩陣序列{Xt|t∈(1,2,…,K)},預估XK+1.

3.2 預測模型

從2.2節的分析可知,在單個時間片中,與人才流動模式相關的信息包含在流量向量中.同時,流動模式隨時間逐漸演化,演化信息包含在連續的流量矩陣序列中.因此,一個良好定義的流動量預測模型應具備3個功能:

3) 可根據流量模式及其演化趨勢對未來流動量進行預測.據此要求,設計輸出映射O(φ1,φ2,…,φK):RKl→Rm×m預測下一時段人才流動矩陣XK+1.

對于滿足上面3個功能的模型,由于有Tn2個因變量和n2個預測目標,模型一般包含Tn4量級的參數.但由于流量矩陣的稀疏性,流量模式在單個矩陣元素上表現不明顯,因此在定義在流量向量上的流量模式規律性更強.本文提出在流量向量的基礎上設計上述3類映射,同時在不同的流量向量上復用同一組模型參數,在利用流量向量攜帶的模式信息的同時縮小參數規模.

具體而言,對應上述3類映射,本文采用卷積神經網絡(convolutional neural network, CNN)[16]實現映射f和g,采用循環神經網絡(recurrent neural network, RNN)[17]實現映射φ,并采用全連接神經網絡(full-connected neural network, FNN)[13]實現映射O,對XK+1進行預測.模型結構如圖11所示,其中包含CNN部分(f,g)、RNN部分(φ)和全連接(O)部分,簡記為CNN-RNN模型.

Fig. 11 The proposed model consisting of CNN, RNN and FNN圖11 CNN-RNN模型示意圖

CNN模型利用較小的卷積核矩陣對流量矩陣做卷積.為實現從流量向量中提取流量模式的目標,本文采用與流量向量同型的矩陣作為卷積核,因此一個卷積操作對應從一個流量向量中提取模式.同時,同一卷積核作用在不同流量向量中實現了參數復用,減小了參數規模.RNN模型在時序上采用循環輸入的策略,即當前時刻輸出作為下一時刻輸入的一部分.本文將CNN在矩陣序列中提取的流量模式序列作為RNN的輸入,使流量模式在時序上具備連續性.FNN綜合RNN在各時段的輸出,經過全連接層后得到預測結果.

本節分別詳述模型的CNN, RNN, FNN部分的計算細節.

其中,Wf∈Rm×k是卷積核,k為卷積核數目,bf∈Rk是偏置項,二者均為可學習參數.σ(z)=1(1+e-z)是Sigmoid激活函數.該卷積依次作用在Xt的每一行,得到卷積結果.該結果經過最大池化(max pooling)操作后得到空間模式向量R(m2)×k,池化操作定義為

其中,Wg∈Rk×m是卷積核,bg∈Rk是偏置項,均為可學習參數.對該卷積結果進行最大池化操作得到流入模式表示

2) RNN部分.該部分以pt為輸入,實現φt+1(pt,γt)映射,實現時序循環結構.具體而言,RNN采用GRU(gated recurrent unit)結構,其計算過程:

zt=σ(Wzpt+Uzγt+bz),rt=σ(Wrpt+Urγt+br),ht+1=σ(Whpt+Uh(rt⊙γt)+bh),γt+1=(1-zt)⊙γt+zt⊙ht+1,

其中,W*∈Rl×mk,b*∈Rl分別為連接權重和偏置項參數;zt,rt是為防止參數學習過程中出現梯度消失問題[18]而設置的連接機制;初始化γ0=0.

3) FNN部分.該部分以拼接的γt為輸入,并連接線性輸出層,得到與Xt維度一致的輸出,作為預測結果.具體而言,首先拼接RNN的輸出γt得到γ=[γ1,γ2,…,γK],然后計算:

d=σ(Wdγ+bd),O=Wod+bo,

其中,Wd∈Rd×Kl,bd∈Rd,Wo∈Rmm×d,bo∈Rmm均為可學習參數.

模型的輸出即為O∈Rmm,重新排列其維度為Rm×m,為下一時刻流量矩陣的預測值.

模型的目標函數為最小化預測結果O與實際流量矩陣XK+1的均方誤差,即:

其中,θ為模型中可學習參數的集合,包括所有的連接權值和偏置,通過隨機梯度下降方法訓練[13].

3.3 模型復雜度分析

模型訓練和預測時的計算量與可學習參數規模直接相關.本文提出的CNN-RNN模型中包含的可學習參數包括:網絡層間連接權重項矩陣Wf,Wg,Wz,Wr,Wh,Uz,Ur,Uh,Wd,Wo等,共2mk+3mkl+3l2+dkl+dm2個參數,此外還包括偏置項bf,bg,bz,br,bh,bd,bo共2k+3l+d+m2項.其中k,l分別為卷積核個數和RNN神經元數,實驗中設置為3,16,數值較小.而m為地區數量,約為1 200,因此m主要決定模型參數量,總參數量約為m2量級.

CNN-RNN的模型參數相對基準模型的參數規模較小.以線性擬合為例,有m2個預測目標,分別預測一對地區間的流量.模型包含Km2+1個輸入項,對應K個歷史矩陣,每個矩陣m2個參數和一個偏置項.因此,總參數個數為m2(Km2+1),約為m4量級,參數規模約為CNN-RNN模型的m2倍.

4 實驗結果

4.1 實驗數據

本文的實驗數據來源為某大型在線職業平臺[6],包括來自約6 000個用人單位的約500萬就業記錄,用人單位包括企業、高校和政府部門.數據中共包含1 200個地區,其中“地區”一般為對應國家的第3級行政區域,根據國家不同,分別為市、城鎮或區,地區的空間分布如圖6所示.本文采用這一數據集展示模式分析結果(見第3節),并評估人才流動預測模型的性能.

4.2 基準模型性能比較

本文共采用3個基準模型,包括絕對值約束的線性回歸算法LASSO[19]、非線性回歸算法SVR[20]以及多層稀疏編碼器(stacked autoen-coders, SAEs)[12]模型.其中LASSO是有絕對值正則項的線性回歸模型,在線性回歸模型中性能表現較好且能較好地防止過擬合.SVR是有平方正則項的非線性回歸模型,采用的核函數是徑向基函數(radial basis function kernel),SVR是較先進的非線性回歸模型.LASSO,SVR的正則系數通過在訓練集中進行10折交叉驗證進行選擇.SAEs是由神經網絡構成的自編碼器,通過加入懲罰項來達到稀疏自編碼的目的.訓練好的SAEs模型在編碼器后端加入前饋神經網絡層來實現回歸,該模型在交通流量預測問題中取得了較好的效果[12].LASSO, SVR, SAEs的輸入均為實例向量,因此本文將輸入(X1,X2,…,XK)展開為長度為Km2的向量,將輸出展開為長度為m2的向量.此外,本文采用SVR的單目標變量模型,為實現多變量預測,分別為目標矩陣的每一個值項訓練一個模型,共有m2個模型.

CNN-RNN模型的超參數通過在訓練集中進行10折交叉驗證進行選擇.在本實驗中,模型CNN部分的卷積核數k=3,RNN部分神經元數l=16,全連接層神經元數d=512.

本文采用的誤差評價指標為實際流量和預測流量間的均方根誤差(Es)和平均絕對值誤差(Ea).分別定義為

此外,由于流量矩陣是稀疏矩陣,在實際應用中關心的預測目標是非零位置的預測值,因此本文另外選擇在非零元素上的均方誤差(簡記為Esn)和非零元素上的絕對值誤差Ean作為評價指標.Es,Ea,Esn,Ean這4個指標均表示預測誤差,誤差值越小,表明模型預測效果越好.

圖12為K=5的年度流量預測,即采用5年的歷史數據,對下一年的流量數據進行預測的結果.

Fig. 12 Prediction errors of baselines圖12 基準模型預測誤差

從圖12中可見,CNN-RNN模型相對其他基準模型的4類誤差均更小,其中Es,Ea,Esn,Ean相對最佳的基準模型SVR分別降低約20%,3%,24%,15%.此外,最佳的Es在1.0人次左右,Esn在2.5人次左右,即平均預測誤差在1~3人次,而地區間人才流量平均約在50人次左右,因此預測結果較準確,較易滿足一般預估任務的精度要求.最后,非零值位置平均誤差絕對值相對較大,因此CNN-RNN模型在非零值位置的誤差降低相對全局平均誤差的降低幅度更大.該結果表明,本文提出的CNN-RNN模型的預測性能相對基準模型而言有明顯的提高,且模型的絕對預測誤差較低.

4.3 模型變體比較

CNN-RNN模型由多個部分組成,其中各部分均可獨立作為模型完成預測任務.為評估模型各部分的預測能力,本節分別去除模型的CNN部分和RNN部分,利用剩余部分進行預測.各模型變體的實驗設置與4.2節中的設置相同.為方便表述,本節分別用RNN表示去除CNN部分后的模型,用CNN表示去除RNN部分后的模型,用FNN表示同時去除RNN和CNN部分后的模型(即僅保留全連接部分的模型).

圖13展示了各個模型變體的性能,其中RNN和CNN模型性能較相近,FNN模型性能相對較差.CNN-RNN模型的誤差最小,相對變體中最佳的CNN降低約15%,2%,20%,13%.該結果表明CNN-RNN模型預測性能相對各模型變體單獨預測的性能較好,但由于該模型復雜度更高,因此在實用中若考慮計算復雜性并不要求最小預測誤差,則可用變體取代原模型.另一方面,模型的計算量集中在訓練階段,預測階段計算量較小,因此在可離線訓練的應用場景中CNN-RNN模型更具優勢.

Fig. 13 Prediction errors of basic deep neural networks圖13 3種模型變體預測誤差

4.4 數據歷史長度影響

人才流動矩陣序列是預測模型的輸入,所以不同的序列長度對模型的預測效果有直接影響.在實踐中,數據收集成本隨序列長度增加而增大,且收集大規模長時間的數據往往不可行.本節評估不同的數據歷史K對結果影響,受數據集長度限制,實驗中K分別取值為2~7,即采用2~7年的歷史數據進行預測.

Fig. 14 Prediction error of models with different input lengths圖14 不同歷史數據長度下的誤差

圖14是不同歷史數據長度下的預測誤差.圖14 (a)~(d)分別表示4個評價指標的結果.該結果說明,CNN-RNN模型及其變體的預測誤差隨著歷史數據長度的增加而呈現減小的趨勢.預測誤差在歷史長度為2~4年時下降較快,在4~7年趨于穩定.此外,序列長度為2~3年和序列長度為5~6年的誤差下降超過50%.該實驗可以作為歷史數據收集過程中的指導:歷史數據長度至少需要達到一個最小的閾值,該閾值可以通過實驗確定(如4年),更長的歷史數據對于誤差的減小效果較小.因此若收據收集的代價較高,則使用合適長度的歷史數據即可.

5 結論與未來工作

本文提出人才流動矩陣序列,挖掘地區間人才流動的時空模式,并提出基于卷積和循環神經網絡人才流動預測模型,通過大規模數據進行了模型性能驗證.本文提出的模型可用于人才流動監控和分析,以及作為制定人才調控政策的參考.進一步,本文提出的方法可擴展應用在不同用人單位間的人才競爭模式發現任務等.此外,本文提出的基于矩陣序列的分析和預測模型,在類似場景中有一定應用潛力,如地區旅游人數建模與預估、區域商品供應量分配預估等.

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲欧洲自拍拍偷午夜色无码| 亚洲一欧洲中文字幕在线| 亚洲色图欧美一区| 欧美视频在线不卡| 韩国福利一区| 日本伊人色综合网| 91外围女在线观看| 国产亚洲精品自在久久不卡| 啪啪免费视频一区二区| 天天干天天色综合网| 成人午夜福利视频| 国产精品无码久久久久久| 波多野结衣在线一区二区| 午夜无码一区二区三区在线app| 亚洲欧美综合精品久久成人网| 国产91视频免费观看| 国产91小视频| 免费看的一级毛片| 国产精欧美一区二区三区| 免费不卡视频| 久久男人资源站| 亚洲视频二| 露脸国产精品自产在线播| 毛片免费观看视频| 在线国产毛片| 国产18页| 国产精品自在线天天看片| 亚洲无码精品在线播放| 亚洲最猛黑人xxxx黑人猛交| 免费一级毛片在线观看| 亚洲欧美成人在线视频| 丁香五月婷婷激情基地| 麻豆国产在线观看一区二区| 无码内射中文字幕岛国片| 国产91导航| 中国一级毛片免费观看| 亚洲天堂日本| 久久精品这里只有精99品| 亚洲VA中文字幕| 91精品日韩人妻无码久久| 国产精品成人观看视频国产| 99成人在线观看| 久久国语对白| 国内精品自在欧美一区| 亚洲无码高清一区| 日韩在线第三页| 国产成人综合网| 久久精品欧美一区二区| 免费国产不卡午夜福在线观看| 国产精品va| 国产91小视频在线观看| 日韩欧美国产三级| 欧美三级日韩三级| 欧美日韩在线亚洲国产人| 视频二区欧美| AV天堂资源福利在线观看| 国产鲁鲁视频在线观看| 亚洲国产天堂久久综合226114| 亚洲人成网站观看在线观看| 国产在线麻豆波多野结衣| 在线国产毛片| 国产浮力第一页永久地址| 婷婷色中文网| 9久久伊人精品综合| 在线观看精品自拍视频| 亚洲无码高清一区二区| 热这里只有精品国产热门精品| 国内精品伊人久久久久7777人| 欧美区一区二区三| 夜夜操国产| 精品国产www| 中文国产成人久久精品小说| 国产精品欧美亚洲韩国日本不卡| 青青草国产精品久久久久| 久久99热66这里只有精品一| 日韩成人午夜| 久久这里只精品国产99热8| 婷婷六月激情综合一区| 欧美另类精品一区二区三区| 中文字幕佐山爱一区二区免费| 精品久久777| 久久综合伊人 六十路|