999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)視域下網(wǎng)絡(luò)招聘數(shù)據(jù)信息挖掘的研究

2021-04-26 04:13:12張長華
科學(xué)技術(shù)創(chuàng)新 2021年10期
關(guān)鍵詞:詞匯信息研究

張長華

(河北建材職業(yè)技術(shù)學(xué)院,河北 秦皇島066000)

信息技術(shù)的快速發(fā)展,改變了傳統(tǒng)崗位招聘模式,從線下招聘逐漸向網(wǎng)絡(luò)招聘方向發(fā)展,大部分企業(yè)的招聘信息均借助網(wǎng)絡(luò)平臺(tái)發(fā)布[1]。隨著時(shí)間的推移,網(wǎng)絡(luò)招聘數(shù)據(jù)越來越多。目前,部分高校通過對(duì)招聘數(shù)據(jù)信息進(jìn)行統(tǒng)計(jì)分析,設(shè)計(jì)人才培養(yǎng)決策方案[2-3]。為了加深對(duì)招聘數(shù)據(jù)信息的剖析,各大高校陸續(xù)引入數(shù)據(jù)挖掘技術(shù)展開探究。本文以數(shù)據(jù)分析類崗位為例,對(duì)該崗位招聘特征信息挖掘進(jìn)行研究。

1 數(shù)據(jù)獲取

本研究對(duì)我國多家招聘網(wǎng)站進(jìn)行調(diào)研,選擇網(wǎng)站在招聘行業(yè)的權(quán)威性、崗位招聘相關(guān)信息數(shù)據(jù)量、數(shù)據(jù)抓取難度等指標(biāo)作為指標(biāo)進(jìn)行綜合對(duì)比,最終確定本次研究數(shù)據(jù)來源,包括前程無憂、獵聘網(wǎng)、智聯(lián)招聘、拉勾網(wǎng)。采用數(shù)據(jù)挖掘技術(shù),在這4個(gè)網(wǎng)絡(luò)平臺(tái)中挖掘與崗位招聘特征相關(guān)的信息,如果某條信息符合特征信息標(biāo)準(zhǔn),則立即抓取,并生成信息抓取統(tǒng)計(jì)表[4]。該表中含有崗位所在城市、工作經(jīng)驗(yàn)、全職/兼職、最低學(xué)歷要求、崗位領(lǐng)域、福利待遇、崗位標(biāo)簽、職位描述等關(guān)鍵詞及其相關(guān)信息。

2 研究方法

本研究根據(jù)數(shù)據(jù)字段特點(diǎn),對(duì)崗位描述文字進(jìn)行劃分,形成多個(gè)分詞詞集,經(jīng)過聚類分析和詞頻統(tǒng)計(jì),為TF-IDF 計(jì)算和數(shù)據(jù)可視化處理提供可靠數(shù)據(jù)。如圖1 所示,為崗位招聘特征信息挖掘研究思路。

圖1 崗位招聘特征信息挖掘研究思路

3 實(shí)驗(yàn)設(shè)計(jì)

3.1 數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理是決定了數(shù)據(jù)挖掘結(jié)果精準(zhǔn)度的重要環(huán)節(jié),為了盡可能提高挖掘結(jié)果精準(zhǔn)度,本研究在此環(huán)節(jié)構(gòu)建了詞匯庫,將設(shè)定的信息挖掘關(guān)鍵詞匯添加到這個(gè)詞匯庫中,從而避免數(shù)據(jù)在預(yù)處理期間分解。以下為數(shù)據(jù)預(yù)處理具體流程:

第一步,添加自定義停用詞詞典。根據(jù)崗位招聘調(diào)整情況,在詞典中定義已經(jīng)停止招聘的崗位、企業(yè)等相關(guān)信息對(duì)應(yīng)的詞匯,在自定義功能欄中完成。

第二步,添加自定義詞典。根據(jù)崗位招聘調(diào)整情況,在詞典中定義新增加的崗位名稱、企業(yè)等相關(guān)信息對(duì)應(yīng)的詞匯。

第三步,分詞去停用詞。根據(jù)崗位招聘調(diào)整情況,去除崗位描述修改詞匯,避免專業(yè)短語在分詞過程中出現(xiàn)詞匯分解情況。

第四步,根據(jù)詞性不同,分別標(biāo)注。

3.2 崗位福利待遇權(quán)重

本研究在分析崗位描述性關(guān)鍵詞在文本集中的重要程度時(shí),選取TF-IDF 算法作為研究工具,通過數(shù)據(jù)計(jì)算,得出結(jié)論。其中,TF 計(jì)算數(shù)值為詞頻,一般情況下,對(duì)此部分?jǐn)?shù)據(jù)采取歸一化處理。假設(shè),關(guān)鍵詞為ti,則任一詞匯對(duì)應(yīng)的TF 數(shù)值計(jì)算方法如下:

公式(1)中,mk,j代表中文經(jīng)過分詞處理以后出現(xiàn)的頻率總和;mi,j代表關(guān)鍵詞出現(xiàn)的頻率。模型中,IDF 數(shù)值表示反文檔頻率,該項(xiàng)指標(biāo)計(jì)算公式如下:

公式(2)中,|{j:ti∈di}|代表文件數(shù)目,且文件中含有關(guān)鍵詞;|D|代表文件總數(shù),其中文件來自文本集。

利用公式(1)和公式(2)計(jì)算獲取TF 數(shù)值和IDF 數(shù)值以后,計(jì)算崗位招聘關(guān)鍵詞對(duì)應(yīng)的TF-IDF 數(shù)值,計(jì)算方法:兩數(shù)值的乘積。

采用上述計(jì)算方法完成數(shù)據(jù)預(yù)處理,分別統(tǒng)計(jì)崗位招聘福利待遇字段相關(guān)信息,在詞頻統(tǒng)計(jì)端輸入這部分信息,而后計(jì)算TF-IDF 數(shù)值。按照數(shù)值大小排序,選擇排名前21 名關(guān)鍵詞作為分析指標(biāo)。為了掌握各個(gè)招聘網(wǎng)站崗位招聘特征基本情況,創(chuàng)建4 個(gè)文件,用來存儲(chǔ)各個(gè)招聘網(wǎng)站信息,形成福利待遇基本信息文件系統(tǒng)。

3.3 網(wǎng)絡(luò)招聘崗位描述

本研究對(duì)招聘崗位描述的探究,以相似性原理作為研究基礎(chǔ),綜合對(duì)比多種崗位描述方法,最終選擇K-means 算法,主要原因是該方法的描述結(jié)果比較客觀,支持文本向量化處理。

K-means 算法在本次研究中的應(yīng)用,主要用于崗位需求詞匯的聚類分析。在應(yīng)用之前,構(gòu)建Word2Vec 模型,量化文本。而后,按照關(guān)鍵詞向量值不同,開啟崗位需求詞匯聚類分析模式。

依據(jù)相似性原理,選擇各個(gè)關(guān)鍵詞之間的向量間距作為判據(jù),對(duì)相關(guān)詞匯進(jìn)行聚類分析。其中,向量間距的計(jì)算,本研究應(yīng)用歐式距離計(jì)算方法,設(shè)計(jì)以下計(jì)算公式:

分類中心的定位決定了聚類分析精準(zhǔn)度,為了盡可能精準(zhǔn)定位,本研究增加了迭代處理次數(shù),采用動(dòng)態(tài)迭代方法加以處理。其中,下一次迭代處理建立在上一次迭代聚類計(jì)算結(jié)果基礎(chǔ)上,依據(jù)調(diào)整后的mean 數(shù)值,確定分類中心。關(guān)于類簇中心的計(jì)算公式如下:

公式(4)中,Ck代表編號(hào)為k 的類簇,該類簇?cái)?shù)據(jù)總和記為|Ck|。

當(dāng)算法應(yīng)用達(dá)到一定迭代次數(shù)以后,需要停止迭代。目前,應(yīng)用比較多的方法有兩種:一種為設(shè)置固定的迭代次數(shù),在已知迭代處理次數(shù)需求情況下應(yīng)用,不適合應(yīng)用至本研究。另外一種迭代方法集準(zhǔn)則函數(shù)、誤差平方為一體,通過構(gòu)建以下函數(shù)模型:

公式(5)中,K 代表類簇?cái)?shù)量。利用此公式計(jì)算聚類數(shù)值時(shí),向設(shè)定參數(shù)σ,對(duì)比數(shù)值σ 與數(shù)值ΔJ 數(shù)值大小,如果ΔJ<σ,那么當(dāng)前公式(5)計(jì)算結(jié)果為最終聚類計(jì)算結(jié)果。依據(jù)此計(jì)算數(shù)值,準(zhǔn)確劃分崗位描述詞匯的類別。

4 實(shí)驗(yàn)結(jié)果分析

4.1 崗位福利待遇統(tǒng)計(jì)

關(guān)于崗位福利待遇信息的挖掘,采用TF-IDF 統(tǒng)計(jì)法挖掘數(shù)據(jù)并計(jì)算,從而掌握崗位福利待遇在權(quán)重分布情況。本次研究選取21 個(gè)關(guān)鍵詞作為信息挖掘指標(biāo),利用公式計(jì)算TF-IDF數(shù)值,結(jié)果如表1 所示。

表1 福利待遇權(quán)重統(tǒng)計(jì)表

4.2 崗位聚類分析

本次應(yīng)用測試,在操作界面上自定義詞典,分詞去除停用詞,對(duì)“數(shù)據(jù)分析崗位”詞頻進(jìn)行統(tǒng)計(jì),選擇頻率出現(xiàn)比較高的關(guān)鍵詞作為分析指標(biāo),輸入K-means 算法中,有效劃分崗位需求類型。其中,類別數(shù)量設(shè)定為5 類,同時(shí)在數(shù)據(jù)挖掘界面展示高頻排名前15 關(guān)鍵詞。如圖2 所示為聚類分析結(jié)果。

圖2 中,第一類聚類分析結(jié)果涵蓋了崗位業(yè)務(wù)能力,以產(chǎn)品運(yùn)營能力為首,對(duì)分析報(bào)告、需求分析提出了一定要求。第二類聚類分析結(jié)果以學(xué)歷、專業(yè)、專業(yè)課程為主。第三類分析結(jié)果以崗位技能掌握情況作為招聘核心。第四類和第五類分析結(jié)果分別統(tǒng)計(jì)了個(gè)人能力、招聘企業(yè)信息。

5 結(jié)論

大數(shù)據(jù)時(shí)代的到來,為招聘數(shù)據(jù)信息統(tǒng)計(jì)提供了有利工具,利用數(shù)據(jù)信息挖掘軟件,開發(fā)招聘數(shù)據(jù)信息統(tǒng)計(jì)方案,使得數(shù)據(jù)信息得以最大化利用,幫助各大高校明確當(dāng)前市場招聘情況。本文以“數(shù)據(jù)分析崗位”招聘信息為例,提出招聘信息統(tǒng)計(jì)研究。統(tǒng)計(jì)結(jié)果表明,此類崗位對(duì)從業(yè)經(jīng)驗(yàn)1 年至3 年的人才需求量較大,福利待遇方面,當(dāng)前公司給予的條件與人才需求基本相符,對(duì)求職者的業(yè)務(wù)能力、個(gè)人綜合素質(zhì)、崗位技能等要求較高。

猜你喜歡
詞匯信息研究
FMS與YBT相關(guān)性的實(shí)證研究
遼代千人邑研究述論
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
本刊可直接用縮寫的常用詞匯
EMA伺服控制系統(tǒng)研究
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會(huì)信息
本刊一些常用詞匯可直接用縮寫
主站蜘蛛池模板: 99九九成人免费视频精品| 亚洲久悠悠色悠在线播放| 国产综合精品一区二区| 好紧好深好大乳无码中文字幕| 免费人成黄页在线观看国产| 国产精品视频观看裸模 | 制服丝袜在线视频香蕉| 草草影院国产第一页| h网址在线观看| 久久这里只有精品23| 日本不卡在线播放| 91精品久久久无码中文字幕vr| 88av在线| 成人av手机在线观看| 国产成+人+综合+亚洲欧美| 国产成人精品2021欧美日韩| 色吊丝av中文字幕| av大片在线无码免费| 色一情一乱一伦一区二区三区小说| 亚洲精品无码抽插日韩| 精品久久久久久久久久久| 农村乱人伦一区二区| 欧美亚洲国产日韩电影在线| 成人91在线| 欧美狠狠干| 国产视频欧美| 一级毛片视频免费| 亚洲成aⅴ人在线观看| 国产精品福利一区二区久久| 一本一道波多野结衣av黑人在线| 国产一级做美女做受视频| 五月婷婷综合在线视频| 亚洲三级电影在线播放| 99九九成人免费视频精品| 尤物午夜福利视频| 亚洲成人精品久久| 97国产成人无码精品久久久| 久久久精品无码一二三区| 亚洲天堂自拍| 久热中文字幕在线观看| jizz亚洲高清在线观看| www.youjizz.com久久| …亚洲 欧洲 另类 春色| 美女扒开下面流白浆在线试听| 91视频首页| 中文字幕亚洲综久久2021| 综合色天天| 久久精品中文字幕免费| 国产美女无遮挡免费视频网站| www中文字幕在线观看| 国产欧美精品一区aⅴ影院| 久久精品无码一区二区国产区| 欧美精品成人一区二区视频一| 亚洲动漫h| 老司机久久99久久精品播放 | 2020国产精品视频| 9966国产精品视频| 无码人妻免费| 国产毛片基地| 久久99蜜桃精品久久久久小说| 4虎影视国产在线观看精品| 国产办公室秘书无码精品| 欧美成人怡春院在线激情| 伊人蕉久影院| a级毛片免费网站| 九色国产在线| 亚洲人成人无码www| 日韩欧美国产成人| 国产国模一区二区三区四区| 亚洲成a∧人片在线观看无码| 国产丝袜无码精品| 国产微拍一区| 欧美19综合中文字幕| 四虎国产在线观看| 91九色国产porny| 国产成人精品在线| 丁香六月激情综合| 视频二区中文无码| 乱系列中文字幕在线视频| 亚洲青涩在线| 日本少妇又色又爽又高潮| 久久免费观看视频|