999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于智能數(shù)據(jù)信息分析的就業(yè)評估方法研究

2021-08-20 10:28:54趙瑞丹
電子設(shè)計(jì)工程 2021年16期
關(guān)鍵詞:信息質(zhì)量模型

趙瑞丹

(西安航空職業(yè)技術(shù)學(xué)院,陜西西安 710089)

傳統(tǒng)的就業(yè)數(shù)據(jù)來源于調(diào)查問卷(紙質(zhì)或網(wǎng)絡(luò)),以及高校的官方統(tǒng)計(jì)信息。但這兩種方式均存在各自的問題,前者得到的數(shù)據(jù)較為有限,難以涵蓋全部學(xué)生,后者保證了數(shù)量,但無法顧及每個學(xué)生的就業(yè)質(zhì)量[1-3]。事實(shí)表明,即使在畢業(yè)時有確定的就業(yè)崗位,但仍有大批學(xué)生對職業(yè)有了充分了解后,在一年或更短時間內(nèi)更換工作。因此,合理地評估就業(yè)質(zhì)量也是需要關(guān)注的重要問題[4-5]。

在高速發(fā)展的信息化時代,新的行業(yè)不斷產(chǎn)生,對人才的需求也迫切增加。學(xué)生就業(yè)質(zhì)量的優(yōu)劣,不僅能反映社會行業(yè)的發(fā)展趨勢,且可以及時地反饋給高校,從而適當(dāng)?shù)卣{(diào)整專業(yè)分布,提高教育水平[6-7]。

面對大量的就業(yè)數(shù)據(jù),不僅缺少從事質(zhì)量評估的專業(yè)人員,且因評估人員的水平不足導(dǎo)致評價結(jié)果因人而異。近年來,興起的人工智能與數(shù)據(jù)分析方法尤為適合應(yīng)對此類問題。人工智能采用深度學(xué)習(xí),可以模仿人腦對信息做出邏輯判斷,評估隱藏在數(shù)據(jù)背后的就業(yè)質(zhì)量[8-9]。文中采用智能信息分析,將采集到的就業(yè)數(shù)據(jù)通過層次分析方法和單層感知器,確定每種信息每次的相應(yīng)權(quán)重,最終產(chǎn)生對就業(yè)信息的質(zhì)量評估。

1 數(shù)據(jù)采集

1.1 第一階段數(shù)據(jù)采集

數(shù)據(jù)采集包括兩個階段,第一階段采集學(xué)生畢業(yè)前的就業(yè)信息,主要內(nèi)容包括6 個大類:學(xué)生個人信息(編碼A)、就業(yè)信息(編碼B)、檔案寄送地址(編碼C)、就業(yè)單位性質(zhì)(編碼E)、工作性質(zhì)(編碼F)、個人滿意度(編碼G1)。每個大類均包含若干小類,除填寫類信息外,選擇類信息均對應(yīng)著具體的數(shù)值。

第一階段的個人滿意度取值范圍為0~100,表示學(xué)生對就業(yè)方向的滿意程度,第一階段的滿意度占比為40%。

1.2 第二階段數(shù)據(jù)采集

考慮到學(xué)生還未參與到實(shí)際工作中,對工作和前景的認(rèn)知尚不充分。在就業(yè)12 個月后再采集一次就業(yè)數(shù)據(jù),作為第一階段數(shù)據(jù)的修正與補(bǔ)充。第二階段的滿意度由學(xué)生了解實(shí)際工作內(nèi)容及行業(yè)知識后打分,具有更高的可信度,取值范圍為0~100,占比為60%。從數(shù)據(jù)量化可以看出,第一階段的數(shù)據(jù)主要用于建立就業(yè)信息資料庫;第二階段的數(shù)據(jù)用于輸入信息分析網(wǎng)絡(luò)訓(xùn)練集,估計(jì)出每一層數(shù)據(jù)的權(quán)重,從而實(shí)現(xiàn)就業(yè)質(zhì)量的評估。

2 數(shù)據(jù)預(yù)處理

實(shí)際采樣到的數(shù)據(jù)無法達(dá)到理想的采樣狀態(tài),不能直接進(jìn)入訓(xùn)練集中參與運(yùn)算。首先對采樣數(shù)據(jù)進(jìn)行預(yù)處理,其過程包括:數(shù)據(jù)提取、相關(guān)性分析與離散化、數(shù)據(jù)清洗、數(shù)據(jù)集成4 個步驟[10-13]。

2.1 信息提取

考慮采集到的原始信息為3 種格式:文本格式、表格格式和圖片格式。對于文本格式,使用Python自然語言處理,提取第一節(jié)中所述的類別信息。信息提取的基本過程,如圖1 所示。

圖1 文本類信息提取

表格類型的原始信息,多來源于院校發(fā)布,已極為接近理想的采樣狀態(tài),直接進(jìn)入下一步信息處理。

對于圖片類型的采集信息,利用Python構(gòu)造信息提取算法,先調(diào)用文字識別軟件,提取圖片中的文本和圖形信息。再進(jìn)一步提取和目標(biāo)相關(guān)的數(shù)據(jù),轉(zhuǎn)換為表格類型的文件。信息提取過程如圖2 所示。

圖2 圖片類信息提取

2.2 相關(guān)性分析和離散化

對于采集所給類別之外的信息,按照相關(guān)性強(qiáng)弱的關(guān)系將其歸納到該系統(tǒng)的類別中,使用互信息來衡量這種相關(guān)性,互信息的計(jì)算公式如下:

互信息可對文本特征值的相關(guān)性進(jìn)行度量,將互信息值在(0.9,1)范圍內(nèi)的兩種數(shù)據(jù)視為一類數(shù)據(jù),進(jìn)行合并。并將其具體值按類別的范圍歸納到相關(guān)的子類[14]。

文本類信息僅保留A、B、C 類,其余數(shù)據(jù)均將舍棄文本,保留具體的數(shù)值。大多數(shù)類型要求采樣到詳細(xì)的數(shù)值,對于單個如“好”、“差”等語言描述類的采樣數(shù)據(jù),根據(jù)對應(yīng)的取值范圍,離散化為相應(yīng)的數(shù)值。

2.3 數(shù)據(jù)清洗

按A~M 的順序,檢查數(shù)據(jù)集中的數(shù)據(jù)。刪除重復(fù)項(xiàng),計(jì)算數(shù)據(jù)集中的各個子類的均值和眾數(shù)。當(dāng)數(shù)據(jù)集的該項(xiàng)缺失在30%以下時,用眾數(shù)補(bǔ)全缺失的數(shù)據(jù);當(dāng)缺失率達(dá)到50%~80%時,用均值補(bǔ)全缺失的數(shù)據(jù);當(dāng)缺失率達(dá)到80%以上時,從訓(xùn)練集中刪除該子類[15]。數(shù)據(jù)的補(bǔ)全操作不包括A、B、C 項(xiàng)。

2.4 數(shù)據(jù)集成

每位學(xué)生的數(shù)據(jù)按照一個標(biāo)準(zhǔn)模板存放,稱為標(biāo)準(zhǔn)數(shù)據(jù)包。以A 項(xiàng)數(shù)據(jù)為每個數(shù)據(jù)包的總類,存放下屬的B~M 類樣本數(shù)據(jù)及每個樣本的值。對每個類別只保存一個子類的數(shù)值,例如H 項(xiàng)僅保存H1~H5 五項(xiàng)數(shù)據(jù)中的一項(xiàng),及其對應(yīng)的具體數(shù)值。

通過數(shù)據(jù)預(yù)處理可以計(jì)算出學(xué)校的就業(yè)率、升學(xué)率信息,計(jì)算公式如下:

3 質(zhì)量評估模型的構(gòu)建

3.1 層次分析法模型

層次分析算法包括3 個層次:最高層、最低層和中間層。最高層為要解決的問題,最低層為決策時的備選方案,中間層為決策要考慮的因素及決策的準(zhǔn)則。基于這三層的質(zhì)量評估模型如圖3 所示。

圖3 層次分析法模型

3.2 構(gòu)造判斷矩陣

使用一致矩陣法構(gòu)造各類對就業(yè)質(zhì)量的判斷矩陣。判斷矩陣的元素由1~9 標(biāo)度法給出,表示兩個準(zhǔn)則層的因素對于就業(yè)質(zhì)量評判的重要性對比,如表1 所示。

表1 1~9標(biāo)度含義

圖4 依據(jù)重要性對比構(gòu)造的判斷矩陣

3.3 類別權(quán)重因子計(jì)算

為了使判斷矩陣是成對比較陣,對判斷矩陣的列求和,并將每個元素歸一化,其公式如下:

計(jì)算所有元素的和,并對每行歸一化。得到各指標(biāo)對目標(biāo)的權(quán)重,計(jì)算公式如下:

考慮到更換工作次數(shù)與就業(yè)質(zhì)量成反向關(guān)系,且更換工作次數(shù)越多,說明就業(yè)的質(zhì)量越低。因此對更換工作類單獨(dú)建立二次項(xiàng)模型,參與后續(xù)計(jì)算。計(jì)算得到的各類別的權(quán)重因子,如表2 所示。

表2 各類別的初始權(quán)重

更換工作類參與質(zhì)量評估的選定為:

3.4 使用BP算法降低誤差

使用單隱藏層前饋網(wǎng)絡(luò)模型來降低質(zhì)量估計(jì)的誤差,神經(jīng)網(wǎng)絡(luò)由兩層神經(jīng)元組成。輸入層接收8 個類別的采樣信息,隱藏層和輸出層為M-P 神經(jīng)元,模型如圖5 所示[16]。

圖5 單隱藏層神經(jīng)網(wǎng)絡(luò)模型

模型的隱藏層和輸出層神經(jīng)元的激活函數(shù)均采用Sigmoid 函數(shù),公式如下:

對于訓(xùn)練集(xk,y),神經(jīng)網(wǎng)絡(luò)的輸出為:

其中,β為輸出層神經(jīng)元的輸入,θ為其閾值。隱藏層神經(jīng)元的輸入為wj,閾值為bj,而β可表示為:

該網(wǎng)絡(luò)共有8×2+8×8+1=81個參數(shù)待定,BP算法在每一輪迭代中對參數(shù)進(jìn)行更新估計(jì),更新公式為:

其中,η用于控制算法中每一次迭代的更新步長,η∈(0,1]。

BP 算法的流程總結(jié)如下:

1)輸入訓(xùn)練集和學(xué)習(xí)率;

2)使用3.3 節(jié)得到的各類權(quán)值初始化w1,w2,…,w8。v1,1,v1,2,…,v8,8均初始化為0.5;

3)根據(jù)式(7)計(jì)算每個訓(xùn)練樣本的神經(jīng)網(wǎng)絡(luò)輸出;

6)根據(jù)式(13)~(16)更新神經(jīng)元的連接權(quán)值及閾值;

7)重復(fù)步驟2)~6),以達(dá)到停止條件。

停止條件為使訓(xùn)練集上的累計(jì)誤差最小,如式(19)所示。

4 模型仿真

文中使用Python 編寫層次分析模型和單層感知器模型,仿真的訓(xùn)練集采用武漢大學(xué)發(fā)布的2019 屆畢業(yè)生就業(yè)質(zhì)量報告,并加以精簡。學(xué)習(xí)率η設(shè)置為0.6,當(dāng)神經(jīng)網(wǎng)絡(luò)輸出達(dá)到穩(wěn)定時,得到神經(jīng)網(wǎng)絡(luò)的各神經(jīng)元連接權(quán)值和閾值。

使用構(gòu)造的質(zhì)量評估模型,評估2019 年某航空職業(yè)院校的3 492 名畢業(yè)生的就業(yè)質(zhì)量。其中未就業(yè)137 人,就業(yè)率為96.08%,將已就業(yè)學(xué)生的數(shù)據(jù)分兩次進(jìn)行采集,經(jīng)過量化和預(yù)處理以后輸入到質(zhì)量評估模型中,得到如圖6 所示的專業(yè)評分?jǐn)?shù)據(jù)結(jié)果。

圖6 基于該模型的某高校專業(yè)評分結(jié)果

5 結(jié)束語

文中結(jié)合機(jī)器學(xué)習(xí)和信息分析技術(shù),為高校的就業(yè)質(zhì)量評估提供一種新的方法。基于文中構(gòu)建的質(zhì)量評估模型得出的專業(yè)評分?jǐn)?shù)據(jù),與實(shí)際高校專業(yè)質(zhì)量情況進(jìn)行比較,結(jié)果基本一致,證明了該模型的可靠性。與傳統(tǒng)一次性信息采集不同的是,文中選擇時間間隔一年的兩次就業(yè)數(shù)據(jù)采集,且就業(yè)質(zhì)量的分析主要取決于第二次數(shù)據(jù)采集。實(shí)際操作過程中,遇到了樣本較少的問題,但隨著高校對畢業(yè)生的就業(yè)信息跟蹤調(diào)查的力度加大,這一問題也將得到解決。

該系統(tǒng)的優(yōu)點(diǎn)在于,采用人工神經(jīng)網(wǎng)絡(luò)可做出接近人類思維的決策,從而降低人力成本、時間成本。且隨著樣本數(shù)據(jù)的增多和訓(xùn)練集的擴(kuò)展,會使評估結(jié)果更加可靠,系統(tǒng)的升級與誤差修正也遠(yuǎn)比傳統(tǒng)質(zhì)量評估系統(tǒng)方便、簡潔。

猜你喜歡
信息質(zhì)量模型
一半模型
“質(zhì)量”知識鞏固
質(zhì)量守恒定律考什么
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
做夢導(dǎo)致睡眠質(zhì)量差嗎
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
3D打印中的模型分割與打包
質(zhì)量投訴超六成
汽車觀察(2016年3期)2016-02-28 13:16:26
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 国产成人亚洲综合a∨婷婷| 四虎永久免费在线| 无码电影在线观看| 青草精品视频| 日日噜噜夜夜狠狠视频| 国产欧美综合在线观看第七页| 青青热久麻豆精品视频在线观看| 国产欧美高清| 国产乱人伦AV在线A| 午夜久久影院| 国产精品午夜福利麻豆| A级全黄试看30分钟小视频| 5388国产亚洲欧美在线观看| 亚洲精品无码不卡在线播放| 国产成人亚洲无吗淙合青草| 在线精品自拍| 91亚洲精选| 婷婷色中文| 亚洲一区二区成人| 亚洲美女视频一区| 欧美色综合网站| 欧美日本在线一区二区三区| 日韩毛片基地| 五月天丁香婷婷综合久久| 亚洲美女视频一区| 成人在线观看一区| 亚洲国产日韩欧美在线| 一级一级一片免费| 日本精品影院| 欧美五月婷婷| 亚洲 欧美 偷自乱 图片| 在线无码av一区二区三区| 亚洲二区视频| 免费高清a毛片| 国产粉嫩粉嫩的18在线播放91 | 国产麻豆福利av在线播放| 青草91视频免费观看| 亚洲国产中文综合专区在| 中文字幕1区2区| 色亚洲成人| 一级毛片免费播放视频| 国产欧美日韩资源在线观看| 97青草最新免费精品视频| 91 九色视频丝袜| 久久香蕉国产线看观| 免费国产高清视频| 一区二区三区在线不卡免费| 永久在线精品免费视频观看| 国产精品主播| 永久毛片在线播| 亚洲人妖在线| 午夜日本永久乱码免费播放片| 亚洲一区二区黄色| 精品欧美视频| 国产精品亚洲一区二区三区在线观看| 四虎在线观看视频高清无码| 国产91视频观看| 999国产精品| 中国一级特黄视频| 青青草原国产av福利网站| 日本免费一区视频| 99激情网| 日本AⅤ精品一区二区三区日| 无码不卡的中文字幕视频| 高潮爽到爆的喷水女主播视频| 欧洲一区二区三区无码| 久久久久亚洲av成人网人人软件| 制服丝袜国产精品| 99热国产在线精品99| 日韩无码视频播放| 久久9966精品国产免费| 精品国产香蕉在线播出| 国产00高中生在线播放| 超级碰免费视频91| 无码专区国产精品第一页| 看你懂的巨臀中文字幕一区二区 | 日韩欧美亚洲国产成人综合| 一级毛片免费的| 国产成人高清精品免费软件| av在线手机播放| 国产又色又爽又黄| 国产人妖视频一区在线观看|