999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文本挖掘的互聯(lián)網(wǎng)企業(yè)崗位對比研究

2022-08-12 01:54:28袁莉
現(xiàn)代信息科技 2022年7期
關(guān)鍵詞:能力

袁莉

(北京郵電大學,北京 100876)

0 引 言

2021 屆高校畢業(yè)生規(guī)模909 萬,同比增加35 萬,2022 屆高校畢業(yè)生規(guī)模預計1 076 萬,首次超過1 000 萬人,我國高校畢業(yè)生將創(chuàng)下“畢業(yè)生人數(shù)最多”“畢業(yè)生人數(shù)增長幅度最大”的雙高歷史。受新冠肺炎疫情影響,在相當長的一段時間里,世界經(jīng)濟都將處于調(diào)控和恢復之中,就業(yè)市場用人需求仍然存在著很大的不確定性。自2022年3月起,全國疫情再次反復,給就業(yè)市場帶來又一波的沖擊,百度、快手、騰訊、字節(jié)跳動等多家互聯(lián)網(wǎng)大廠相繼傳來裁員消息。新冠疫情之下,一方面是求職基本盤擴大,競爭人數(shù)增長,另一方面是市場需求收緊,企業(yè)縮減成本批量裁員,就業(yè)形式將更加緊張。

根據(jù)獵聘大數(shù)據(jù)研究院發(fā)布的《2022 春節(jié)后開工一周中高端人才就業(yè)數(shù)據(jù)報告》,IT/互聯(lián)網(wǎng)、生產(chǎn)制造、企業(yè)服務成為今年春節(jié)后開工一周新發(fā)職位最多的前三個領(lǐng)域,其中IT/互聯(lián)網(wǎng)招聘平均年薪位居第三,為28.14 萬元,IT/互聯(lián)網(wǎng)也是開工一周求職者投遞簡歷最多的領(lǐng)域,占比達到17.85%。拉勾招聘發(fā)布的《2022年互聯(lián)網(wǎng)行業(yè)春招薪酬報告》顯示,2022年以來,互聯(lián)網(wǎng)行業(yè)平均薪資為18 500 元,較去年同期增長7.5%,比2021年6.9%的增幅還高出了0.6 個百分點。互聯(lián)網(wǎng)大廠的高水平薪資不僅對高校畢業(yè)生有極大的吸引力,對于想跳槽的職場老人的吸引力也是可想而知的。獵聘大數(shù)據(jù)研究院的報告顯示,僅有8.4%的受訪者表示對跳槽互聯(lián)網(wǎng)大廠毫無興趣。高薪資、優(yōu)福利成為求職者擠破頭也要進大廠的重要因素。

2021年政府工作報告明確指出,強化穩(wěn)崗擴就業(yè)政策落實,扎實做好高校畢業(yè)生等重要群體的就業(yè)工作。要推進高校畢業(yè)生高質(zhì)量充分就業(yè),不僅需要政府出臺一系列政策措施,完善保障制度,提供全方位的就業(yè)服務,高校完善系列人才培養(yǎng)制度,豐富實踐平臺,提供精準就業(yè)指導,還需要畢業(yè)生強化自身就業(yè)能力,增強個人在就業(yè)市場中的競爭力。互聯(lián)網(wǎng)就業(yè)日益嚴峻,對想進入互聯(lián)網(wǎng)企業(yè)就業(yè)的高校畢業(yè)生或者希望跳槽到互聯(lián)網(wǎng)大廠的求職者來說,關(guān)注并深刻了解互聯(lián)網(wǎng)行業(yè)不同崗位的職責要求和技能要求,從而有針對性地提高其個人就業(yè)競爭力至關(guān)重要。本文運用爬蟲技術(shù),抓取互聯(lián)網(wǎng)企業(yè)的人才招聘廣告數(shù)據(jù)作為數(shù)據(jù)來源,借助文本挖掘算法進行數(shù)據(jù)分析,識別互聯(lián)網(wǎng)企業(yè)不同職位的職責要求,揭示不同職位與任職要求的內(nèi)在聯(lián)系,為互聯(lián)網(wǎng)企業(yè)求職者提供決策指導。

1 數(shù)據(jù)來源與研究方法

1.1 數(shù)據(jù)來源

本研究選取互聯(lián)網(wǎng)行業(yè)的典型企業(yè),通過Python 爬蟲的方式獲取了字節(jié)跳動、阿里巴巴這兩家公司在第三方招聘網(wǎng)站上發(fā)布的招聘信息,從字節(jié)跳動官網(wǎng)爬取7 226 條信息,從阿里巴巴招聘官網(wǎng)爬取9 111 條信息,從第三方網(wǎng)站爬取655 條信息,對數(shù)據(jù)進行去空值、去除無關(guān)變量等處理,最終保留崗位名稱、工作地點、學歷要求、工作年限、工作薪資、職位描述、職位要求等字段數(shù)據(jù),最終獲得約17 000 條有效數(shù)據(jù)。對兩家企業(yè)提供的崗位名稱進行對比和統(tǒng)計分析,將工作重點聚焦于研發(fā)、運營、產(chǎn)品和市場四類崗位。

1.2 研究方法

獲取互聯(lián)網(wǎng)企業(yè)的招聘信息后,本研究將針對職位描述和職位要求這兩個字段的內(nèi)容進行文本挖掘,具體研究過程如圖1所示。

圖1 研究方法和過程設計

在預處理環(huán)節(jié),首先利用Python 對數(shù)據(jù)進行清洗,去除所分析字段中的空值,以保證后續(xù)文本分析的質(zhì)量;然后利用jieba 對文本進行分詞和去停用詞處理,并結(jié)合本次研究問題的具體特征,分別創(chuàng)建針對職位描述和職位要求文本的專用分詞字典和停用詞表,將特定于任務的停用詞添加到原始的中文停用詞表中,得到比較干凈的分詞數(shù)據(jù)。

在構(gòu)建詞向量的環(huán)節(jié),對所得到的分詞語料進行匯總,將完整的數(shù)據(jù)分詞結(jié)果輸入到Word2vec 模型中進行訓練,得到每個詞的詞向量模型(詞向量是后續(xù)生成聚類模型的主要依據(jù))。運用K-means 算法對職位描述和職位要求的關(guān)鍵詞進行聚類。

聚類將得到每個類別所對應的關(guān)鍵詞,為了比較不同崗位類型在聚類中所獲得不同維度的側(cè)重程度,對不同崗位類型下出現(xiàn)的聚類關(guān)鍵詞進行計數(shù)。即某一維度關(guān)鍵詞在某一類型的職位描述或職位要求中出現(xiàn)的次數(shù)刻畫了該類型職位對這一維度的側(cè)重程度。根據(jù)得到的結(jié)果通過雷達圖的方式可視化能力畫像,做進一步的對比分析。

2 數(shù)據(jù)分析與結(jié)果

2.1 詞向量的二維展示

將不同類型職位所對應的職位描述和職位要求分別存儲在txt 文件中,并基于得到的分詞結(jié)果利用TF-IDF 特征工程得到關(guān)鍵詞,將完整的數(shù)據(jù)分詞結(jié)果輸入到Word2vec 模型中進行訓練,得到每個分詞的詞向量模型。將TF-IDF 得到的前100 個關(guān)鍵詞所對應的詞向量降維到二維空間中進行可視化處理,經(jīng)可視化處理后可以觀察到100 個關(guān)鍵詞的大體分布情況,如圖2所示。

圖2 TF-IDF 得到的前100 個關(guān)鍵詞所對應詞向量的二維展示

由圖2可知,TF-IDF 得到的關(guān)鍵詞在空間中分布均勻,底部主要是有關(guān)計算機技能要求的關(guān)鍵詞,左下角是有關(guān)算法和編程的關(guān)鍵詞,右下角則是與信息系統(tǒng)設計及搭建有關(guān)的關(guān)鍵詞。中間部分的關(guān)鍵詞與產(chǎn)品密切相關(guān),上面的關(guān)鍵詞則與用戶緊密相關(guān)。從下到上反映了產(chǎn)品從設計研發(fā),到落地實施,再到走向市場吸收用戶的完整過程;從上到下反映了根據(jù)市場分析發(fā)現(xiàn)用戶需求,籍此進行產(chǎn)品設計與研發(fā)的過程。

2.2 聚類效果對比

K-Means 算法是以距離作為相似度的評價指標,用樣本點到類別中心的誤差平方和作為聚類好壞的評價指標,通過迭代的方法使總體分類的誤差平方和函數(shù)達到最小。其核心思想是根據(jù)距離的不同將樣本聚成個簇,使得簇內(nèi)樣本的相似度高,簇間樣本的相似度低。

數(shù)據(jù)預處理得到職位描述和職位要求的完整分詞結(jié)果,進行詞向量訓練后,得到每個詞的詞向量,計算詞向量之間的歐氏距離作為詞向量樣本間的相似性度量值。具體的運算步驟為:

(1)從所有詞向量中選擇個詞向量作為初始聚類中心。

(2)計算各個詞向量到每個聚類中心的距離,并將各個詞向量劃分到距離最近的聚類中心的類別中。

(3)根據(jù)各個詞向量所屬的類別重新計算每個聚類中心。

(4)當新的聚類中心與之前的聚類中心相重合或計算結(jié)果小于閾值時,運算結(jié)束;否則重復步驟(2)和(3)。

K-means 算法的關(guān)鍵是確定分類數(shù),本文采用輪廓系數(shù)(Silhouette Coefficient)和誤差平方和相結(jié)合的方法來確定最佳分類數(shù)。

輪廓系數(shù)適用于實際類別信息未知的情況,用K-means算法將待分類的文本數(shù)據(jù)分成個簇,對于簇中的每個向量,分別計算它們的輪廓系數(shù)。

對于其中的一個點來說,分別計算:

得到向量的輪廓系數(shù):

由(3)式可知,輪廓系數(shù)的取值范圍為[-1,1],越靠近1,說明聚類效果越好。對所有點的輪廓系數(shù)求平均值,得到總的輪廓系數(shù)。

誤差平方和(sum of the squared errors, SSE)是所有樣本的聚類誤差,用于衡量聚類效果的好壞。誤差平方和越小,聚類效果越好。

對得到的詞向量計算歐氏距離,進行K-means 聚類,對聚類參數(shù)分別取2 ~9,輸出聚類結(jié)果和對應的輪廓系數(shù)、誤差平方和SSE。發(fā)現(xiàn)當=7 時輪廓系數(shù)、誤差平方和SSE 發(fā)生較大變化,出現(xiàn)“拐點”,得到職位描述和職位要求的誤差平方和與分類數(shù)的關(guān)系圖,分別如圖3、圖4所示。另外,此時得到的類別關(guān)鍵詞更合理,故選擇=7作為聚類數(shù),得到每個聚類所對應的關(guān)鍵詞。

圖3 不同聚類數(shù)下職位描述的聚類效果

圖4 不同聚類數(shù)下職位要求的聚類效果

2.3 聚類結(jié)果分析

在職位描述和職位要求的文本聚類結(jié)果中均含有英文文本類,這是因為所獲取的數(shù)據(jù)中含有少量的英文職位描述和職位要求,但出現(xiàn)次數(shù)較少,故將此文本類略去,最終分別獲得職位描述和職位要求的六個聚類。根據(jù)這六個職位的關(guān)鍵詞,本研究總結(jié)出六類崗位特征和職位所要求的能力維度,如表1、表2所示。在互聯(lián)網(wǎng)企業(yè)招聘信息的職位描述中,六類崗位特征分別是市場推廣、行業(yè)布局、組織統(tǒng)籌、產(chǎn)品分析、技術(shù)研發(fā)和新媒體運營,職位要求方面,招聘信息反映的六個能力維度分別是:學歷及能力要求、行業(yè)經(jīng)驗要求、市場運作能力要求、組織統(tǒng)籌能力要求、技術(shù)能力要求和個人品質(zhì)要求。

表1 職位描述聚類得到的六個崗位特征維度

表2 職位要求聚類得到的六個能力維度

2.4 雷達圖對比展示

雷達圖便于對比同一種招聘類型下不同職位的職位描述差異,本研究考慮高校畢業(yè)生通過校招進入互聯(lián)網(wǎng)和求職者通過社招途徑進入互聯(lián)網(wǎng)兩種不同情況,因此將招聘類型作為補充內(nèi)容,對比互聯(lián)網(wǎng)企業(yè)在社招和校招中,針對同一職位招聘信息的職位描述和職位要求是否有所區(qū)別。

具體計算時,按照招聘類型的不同,對某一崗位的職位描述或職位要求中出現(xiàn)的六個維度的分詞進行計數(shù),分別得到社招和校招的崗位-崗位特征/崗位-能力要求計數(shù)結(jié)果。分析某一類崗位下校招和社招對職位描述的影響,可以采用卡方檢驗的方法來判斷社招和校招之間是否存在差異。但由于目前樣本量較大,卡方檢驗的效果欠佳。根據(jù)列聯(lián)表分析,可以對比不同維度關(guān)鍵詞出現(xiàn)的期望頻率與實際頻率。因此本研究將不同維度關(guān)鍵詞出現(xiàn)的實際頻率作為輸入值,制作成雷達圖進行對比。

對比圖5和圖6的校招和社招職位描述雷達圖,可以看出,對于市場崗位來說,校招時對行業(yè)了解、組織統(tǒng)籌等職位內(nèi)容的描述更多一些,而在社招時更強調(diào)市場推廣,說明社招時企業(yè)可能會在職位描述中直截了當?shù)乇憩F(xiàn)出盈利目的。對于研發(fā)崗位來說,校招時對技術(shù)研發(fā)的描述相對較多,有很強的針對性。但在社招時,除了技術(shù)研發(fā)的工作描述外,產(chǎn)品、推廣等方面的描述也頗多,體現(xiàn)出綜合性和拓展性。對于產(chǎn)品崗位來說,校招時的職位描述沒有很強的指向性,沒有設立很高的職業(yè)門檻。相反,社招崗位對產(chǎn)品分析、市場推廣等工作內(nèi)容的描述更具針對性。對于運營崗位來說,校招和社招的職位描述差異在于,社招時對市場推廣的描述更多。

圖5 互聯(lián)網(wǎng)公司校招職位描述雷達圖

圖6 互聯(lián)網(wǎng)公司社招職位描述雷達圖

對比圖7和圖8的校招和社招職位要求雷達圖,可以發(fā)現(xiàn),對于市場崗位來說,無論是校招還是社招,對個人品質(zhì)的要求都是頭等重要的,但社招還會對市場運作能力提出要求,相對而言,校招對學歷的要求更加明確。對于研發(fā)崗位來說,校招和社招最顯著的差異是,社招時對學歷的要求放寬,但對個人品質(zhì)的要求相對提高。對于產(chǎn)品崗位來說,社招時對學歷的要求相對寬松一些,但對個人品質(zhì)的要求較高。對于運營崗位來說,同樣出現(xiàn)社招時學歷要求放寬、個人品質(zhì)要求提高的現(xiàn)象。

圖7 互聯(lián)網(wǎng)公司校招職位要求雷達圖

圖8 互聯(lián)網(wǎng)公司社招職位要求雷達圖

3 結(jié) 論

通過對互聯(lián)網(wǎng)企業(yè)發(fā)布的招聘信息進行文本分析,研究了互聯(lián)網(wǎng)企業(yè)針對不同招聘類型、不同職位類型的人才需求特點。結(jié)果顯示:互聯(lián)網(wǎng)企業(yè)的招聘職位描述可以分為市場推廣、行業(yè)了解、組織統(tǒng)籌、產(chǎn)品分析、技術(shù)研發(fā)和新媒體運營六大維度;招聘職位要求可以分為學歷要求、行業(yè)經(jīng)驗要求、市場運作能力要求、組織統(tǒng)籌能力要求、技術(shù)能力要求和個人品質(zhì)要求六個維度。

在職位能力要求方面,互聯(lián)網(wǎng)企業(yè)進行校招時,無論是市場、研發(fā)、產(chǎn)品還是運營崗位,都特別注重個人品質(zhì)(如工作主動性和溝通能力),其中市場崗位最看重個人品質(zhì),研發(fā)崗位對個人品質(zhì)的要求最弱,也是四類職位中對技術(shù)能力要求最高的崗位,運營崗位則是四類職位中最看重學歷的崗位,產(chǎn)品崗位在六個維度中要求中等。在進行社招時,四類職位仍然關(guān)注個人品質(zhì),但從整體上來說對學歷的要求有所降低,而是更加關(guān)注求職者的組織統(tǒng)籌能力、市場運作能力和行業(yè)經(jīng)驗。相形之下,市場崗位在市場運作能力和個人品質(zhì)兩個維度的要求較高,產(chǎn)品崗位對行業(yè)經(jīng)驗和組織統(tǒng)籌能力要求較高。

猜你喜歡
能力
消防安全四個能力
“一元一次不等式組”能力起航
培養(yǎng)觀察能力
幽默是一種能力
加強品讀與表達,提升聽說讀寫能力
培養(yǎng)觀察能力
會“吵架”也是一種能力
大興學習之風 提升履職能力
人大建設(2018年6期)2018-08-16 07:23:10
能力提升篇
你的換位思考能力如何
主站蜘蛛池模板: 18禁影院亚洲专区| 四虎免费视频网站| 无码专区国产精品一区| 欧美精品在线看| 天天婬欲婬香婬色婬视频播放| 亚洲国产成人久久77| 欧美成人午夜在线全部免费| a级毛片免费播放| 2022国产无码在线| 一本色道久久88| 91在线高清视频| 国产原创第一页在线观看| 一本久道热中字伊人| 欧美笫一页| 日韩精品中文字幕一区三区| 久久频这里精品99香蕉久网址| 亚洲无码免费黄色网址| 亚洲无码在线午夜电影| 色一情一乱一伦一区二区三区小说 | 99精品在线看| 四虎永久在线精品影院| 国产福利一区在线| 欧美精品亚洲二区| 国产在线视频自拍| 中文字幕亚洲精品2页| 国产chinese男男gay视频网| 青青网在线国产| 亚洲浓毛av| 久久精品日日躁夜夜躁欧美| 无码免费视频| 免费三A级毛片视频| 国产精品午夜福利麻豆| 国产拍揄自揄精品视频网站| 欧美人与牲动交a欧美精品 | 天天综合天天综合| 亚洲视频二| 国产精品毛片一区视频播| 亚洲AV成人一区国产精品| 在线视频亚洲欧美| 欧美一级夜夜爽www| AV不卡在线永久免费观看| 伊人色在线视频| 在线看片免费人成视久网下载| 啪啪永久免费av| 欧美亚洲另类在线观看| 久爱午夜精品免费视频| 免费看a级毛片| 91精品国产一区| 一本色道久久88综合日韩精品| 国产在线啪| 亚洲网综合| 国产精品女主播| 国产精品成人观看视频国产 | 无码精品一区二区久久久| 国产主播一区二区三区| 91精品国产91久久久久久三级| 高清久久精品亚洲日韩Av| 免费看的一级毛片| 日韩第九页| 免费无码又爽又刺激高| 色婷婷亚洲综合五月| 99热最新网址| 精品亚洲欧美中文字幕在线看| 91香蕉国产亚洲一二三区| 国产精品私拍在线爆乳| 亚洲人成网站18禁动漫无码| 91欧美在线| 又粗又大又爽又紧免费视频| 久久国产精品娇妻素人| 五月婷婷中文字幕| 婷婷99视频精品全部在线观看 | 欧美午夜小视频| 国产精品免费福利久久播放| 亚洲精品人成网线在线| 国产在线无码一区二区三区| 毛片免费在线视频| 久久午夜影院| 亚洲福利视频一区二区| 夜夜操狠狠操| 午夜国产小视频| 国产高清不卡视频| 国产美女精品在线|