999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺談大數據技術在招聘崗位分析中的應用

2021-06-03 04:55:22連壯
科學與信息化 2021年14期
關鍵詞:可視化信息

連壯

廈門城市職業學院 福建 廈門 361008

就業是民生之本,是人民改善生活的基本前提和基本途徑。政府工作報告指出,“做好高校畢業生、退役軍人、農民工等重點群體就業工作。”就業是最大的民生,是“六穩”“六保”之首。2021屆全國高校畢業生人數將達909萬人,再創歷史新高,加上往屆待就業畢業生和歸國留學生,實際需要就業人數預計超1000萬人。但大學生就業的結構性矛盾仍然存在,畢業生就業難和用人單位招工難現象并存,一方面高校畢業生就業期望值越來越高,另一方面相關用人單位難以招到合適的人才[1]。

大數據已成為IT界最炙手可熱的名詞,在全世界引領新一輪數據技術革命的浪潮。在各方面深刻影響著當今社會。大數據是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能處理具有更強決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產[2]。近年來互聯網數據呈現出爆炸式指數級的增長,招聘網站的崗位數據也不例外,大部分的用人單位都是通過互聯網招聘網站發布單位的招聘崗位需求。這些海量的招聘崗位信息要如何采集、存儲?如何處理計算處理?如何從繁多招聘崗位數據中統計分析并挖掘出有用的信息?如何對信息進行展示?解決這些問題不但有助于解決大學生等就業群體就業難的問題,而且也有助于就業群體高質量就業,有助于高校改進課程內容,培養出更多貼合社會需要的人才。互聯網上的招聘崗位信息多為非結構化的數據,筆者采用Hadoop為核心的大數據技術從大數據平臺構建、采集崗位信息、數據清洗及挖掘、大數據可視化展示等方面對上述問題進行應用研究。

1 構建Hadoop大數據平臺及招聘崗位信息的采集和存儲

Hadoop是一個開源軟件框架,可編寫和運行分布式應用,處理大規模數據。Hadoop 框架的核心是HDFS和Map Reduce。Ambari是基于Web的Apache Hadoop集群管理工具,提供對集群部署、監控和管理。同樣也支持對HDFS、Hadoop Map Reduce、Hive、Mahout、HBase、ZooKeeper、Oozie、Pig以及Sqoop等工具的創建和管理。它提供了一個查看集群工作狀態的控制面板,可以通過控制面板來瀏覽Hadoop應用程序的當前狀態以及遇到的錯誤[2]。筆者采用3臺CentOS7服務器通過Ambari構建Hadoop分布式集群,從而構建出大數據平臺。其中一臺服務器為master節點,另外兩臺服務器為slave節點,并且可以通過動態添加的方式擴展節點。Ambari的圖形界面也非常有助于平臺管理員去管理維護和監控Hadoop集群。如圖1所示。

圖1 Ambari部署、監控、管理Hadoop集群

互聯網上的招聘崗位信息眾多,筆者使用java編程語言,利用Web Magic開源靈活的Java爬蟲框架,快速開發出一個高效、易維護的爬蟲[3]。借助Web Magic 爬蟲框架從招聘網站采集就業崗位數據,配置爬蟲數據萃取表達式,對采集到的HTML內容提取出csv 格式,數據內容包括崗位、公司、月薪、福利、職位描述、職位要求等。對采集數據進行簡單的篩選,保留有價值的信息。HDFS是一個分布式的海量文件存儲管理系統,可以將超大文件分布式存儲在不同服務器節點上,筆者將采集的崗位數據信息存儲到Ambari大數據平臺的HDFS中。

2 崗位數據的處理、統計和挖掘

由于招聘網站上招聘信息編輯工作是由各個公司自主完成發布的,因此存在著數據信息的多樣性,即使在抓取環節過濾掉了大量的“垃圾”崗位信息,依然存在各種各樣的崗位名稱表述方式。因此采用Map Reduce計算框架,定制個性化的清洗規則(例如規范化崗位名稱等),高效地對大量崗位文本信息進行處理。Hadoop Map Reduce是一個軟件框架,程序員可以通過該框架將應用程序分布運行在不同的服務器節點上,并以可靠的、具有容錯能力的方式并行處理海量的崗位數據集。

Hive是Hadoop項目中一個重要的子項目,也是Apache項目基金會下的一個開源項目。Apache Hive將數據存儲在HDFS文件系統中,并在該文件系統中進行大數據分析。Hive是基于Map Reduce計算框架的,可以使程序員采用和SQL相似的操作,將類SQL語言轉換為Map Reduce任務進行運行,從而快速實現Map Reduce統計,不需要開發專門的Map Reduce應用[2]。通過Hive使用Java語句和類SQL語句可以對崗位的地點、發布時間、薪資待遇、學歷等進行處理并統計出相應的結果,這些結果可以給就業群體提供幫助,也可以給高校提供參考。Hive讓有數據庫基礎的開發者不需要了解底層的Map Reduce過程,就可以讀寫并統計大量的崗位數據。

通過上述對崗位數據統計后,還可以進一步地對數據進行挖掘,筆者采用K-means 文本聚類的方法來進行數據挖掘出不同崗位對應的技能,利用Mahout自帶的方法將文本信息轉換為<詞ID,詞頻>的向量形式[2],通過聚類的方式可以挖掘不同的崗位所需要的技能點和技能點對崗位的重要性程度的量化。通過學生的技能成績和崗位分析得到的技能權重進行相似度匹配,從而給不同的學生個性化推薦不同的崗位。

3 大數據可視化展示

在對崗位數據分析處理、統計挖掘之后,需要借助數據可視化工具將分析結果直觀地展現出來。可以選用電子表格(Excel)和ECharts來進行崗位數據的可視化展示。Excel 是微軟公司開發的辦公套裝軟件的組成部分,它可以對各種數據進行處理、統計分析和輔助決策操作,廣泛地應用于眾多領域,具有簡單易用的特點。ECharts是一個使用 JavaScript 實現的開源可視化庫,可以流暢地運行在PC和移動設備上,兼容當前絕大部分瀏覽器(IE8/9/10/11,Chrome,Firefox,Safari等)。底層依賴矢量圖形庫 ZRender,提供直觀,交互豐富,可高度個性化定制的數據可視化圖表[4]。ECharts 提供了常規的柱狀圖、折線圖、餅圖、散點圖及地理數據可視化的地圖等豐富的圖表,可以對崗位數據進行可視化操作。如圖2所示。

圖2 Echarts對崗位數據可視化展示

本文闡述了通過Ambari構建Hadoop大數據平臺、使用Web Magic采集招聘崗位數據,使用Hadoop的組件HDFS實現崗位招聘數據的海量存儲、Map Reduce實現海量招聘數據的計算處理、Hive實現類SQL語句對海量招聘崗位的統計、通過Mahout的聚類和相似度計算實現崗位數據的挖掘和個性推薦,使用ECharts對崗位數據進行可視化展示。全面說明了大數據技術在招聘崗位中應用,相信通過大數據技術可以在一定程度上幫助解決就業難的問題,從而讓大學生等群體實現高質量就業。

猜你喜歡
可視化信息
自然資源可視化決策系統
北京測繪(2022年6期)2022-08-01 09:19:06
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然資源可視化決策系統
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 亚洲中文字幕97久久精品少妇| 国产jizz| 四虎永久在线| 成人欧美日韩| 制服丝袜在线视频香蕉| 亚洲青涩在线| 久久视精品| 69国产精品视频免费| 亚洲国产中文欧美在线人成大黄瓜 | 老司机精品久久| 无码aⅴ精品一区二区三区| 免费啪啪网址| 狠狠躁天天躁夜夜躁婷婷| 婷婷六月在线| 欧美另类图片视频无弹跳第一页| 亚洲无线观看| 亚洲免费毛片| www.亚洲色图.com| 91色在线观看| 波多野结衣无码AV在线| 免费女人18毛片a级毛片视频| 在线无码av一区二区三区| 亚洲日韩AV无码精品| 在线国产91| 欧美中文字幕在线视频| 久久人体视频| 精品无码人妻一区二区| 67194成是人免费无码| 福利片91| 永久免费精品视频| 国产福利观看| 亚洲人在线| 亚洲视频四区| 白丝美女办公室高潮喷水视频| 5555国产在线观看| 国产欧美日韩视频怡春院| 午夜欧美在线| 六月婷婷精品视频在线观看| 67194在线午夜亚洲| 91视频国产高清| 亚洲日本www| 久久无码av三级| 911亚洲精品| 一本一本大道香蕉久在线播放| аⅴ资源中文在线天堂| 国产精品香蕉在线| 热伊人99re久久精品最新地| 国内精品久久久久久久久久影视| 四虎精品黑人视频| 99re经典视频在线| 欧美精品色视频| 日韩精品中文字幕一区三区| 国产精品综合色区在线观看| 日本不卡视频在线| 国产乱子伦精品视频| 精品一区二区三区中文字幕| 精品视频一区在线观看| 91在线精品麻豆欧美在线| 国产无遮挡裸体免费视频| 国产91视频观看| 毛片免费观看视频| 亚洲成人黄色在线观看| 性色一区| 欧美人在线一区二区三区| 国产在线拍偷自揄拍精品| 亚洲六月丁香六月婷婷蜜芽| av在线无码浏览| 国产微拍一区| 精品国产成人三级在线观看| 全部免费特黄特色大片视频| 久久精品亚洲专区| 全部无卡免费的毛片在线看| 午夜欧美在线| 中文字幕欧美日韩高清| 人妻中文字幕无码久久一区| 色视频国产| 十八禁美女裸体网站| 视频二区国产精品职场同事| 欧美日本在线观看| 青青草原国产精品啪啪视频| 72种姿势欧美久久久大黄蕉| 福利姬国产精品一区在线|