熊露露 年 梅 張 俊
(1.新疆師范大學 烏魯木齊 830054)
(2.新疆鐵道職業技術學院 烏魯木齊 830000)
(3.中國科學院新疆理化技術研究所 烏魯木齊 830011)
高職學生的就業率是高職院校學生培養質量的重要體現,而就業預測指對未畢業的學生能否就業進行預測,提前對可能就業困難的學生進行有效的指導,提高學生的就業率,促進高職院校學生擴招工作良性循環發展。
近年來,國內外很多學者對影響學生就業的因素和就業預測模型進行了研究。李琦[1]運用互信息和權重相結合的特征選擇算法HMIGW 以及XGBoost 分類預測算法,對本科畢業生就業情況和就業類型進行預測;馬茂源[2]利用半監督自訓練方法解決就業預測樣本不均衡使分類器精度低的問題;李想[3]采用灰色模型和神經網絡對大學生就業數進行預測;程昌品[4]等利用決策樹算法對本科畢業生就業進行了預測。從以上文獻可知,現有的就業預測研究主要面向本科生進行,高職學生就業預測的研究成果較少;此外現有的就業預測模型大多基于平衡數據集的機器學習算法,對于類別樣本不平衡的數據集,分類器傾向于將所有的樣本預測為樣本數目較多的類別[5~6],預測結果沒有實際意義。而就業預測的目的是找出數目較少的未就業學生,并基于其存在的問題進行針對性的就業指導,從而提高學生整體的就業率。以上研究成果均無法解決上述問題。圍繞如何解決非平衡數據集下的高職學生就業預測問題,本文的主要貢獻如下:……p>