梁亞玲,高 銘
(江漢大學 商學院,武漢 430056)
信息技術的發展帶來了數據量爆發式的增長,“互聯網+”模式逐漸成為主流,如今大數據應用已經滲透到各個行業的各種業務模式之中。中國互聯網絡信息中心(CNNIC)發布的《中國互聯網絡發展狀況統計報告》顯示,截至2020年12月,我國網民規模達9.89億,較2020 年3 月增長8540 萬,互聯網普及率達70.4%。
新冠疫情進入常態化以來,大數據技術幾乎應用于全球范圍內各個領域與各個行業中,進一步擴大了市場對于數字化人才的需求。根據領英人才報告庫發布的《全球數字人才發展年度報告(2020)》顯示,歐洲有將近一半的數字化人才流向亞太地區,這也間接表明了亞太地區數字經濟的發展活力。在“第十四個五年規劃”提出之后,政府也陸續出臺了相關政策推進大數據行業的發展與傳統行業的數字化轉型,導致不同領域對數字化人才需求的側重點與要求出現了非常大的差異。
中國信通院《2021 年中國數字經濟就業發展研究報告》指出:產業數字化領域招聘人數占總招聘人數的75.8%。數據經濟大力發展的同時,進一步擴大了數字化人才的需求缺口,目前國內大數據產業主要集中在東部沿海地區,與之相比中西部地區的數字化經濟發展則相對落后。數字經濟發展的不平衡也說明了整個大數據行業缺乏明確的發展方向與規劃,而根本原因是已有人才在數量與質量上都不能滿足數字化發展的需求,制約了數字經濟的發展。
一般認為掌握ICT(信息與通信技術)相關技能并能夠運用的人就是數字化人才,但這樣的定義是不充分、不全面的。本文認為,2019 年怡安翰威特咨詢公司提出的“數字化人才”概念對數字化人才的定義是比較符合企業需求的。該公司認為,僅有優秀ICT技能的技術人員并不足以滿足企業的數字化變革需求,在企業中一般要求員工具有真正匹配數字化時代的勝任力——由于職能的不同,未必需要其掌握數字化的技術,但必須具有數字化的思維與特質。怡安翰威特咨詢公司發布的數字化勝任力模型指出:數字化人才有三大勝任力,即學習能力、靈活性與好奇心,以及八大輔助勝任力即成功的意愿、數據處理能力,解決問題的策略、商業敏銳度、遠程協作、數字化溝通、毅力以及樂于助人的品質,這些,都是數字化人才的“軟實力”。
數字化人才不僅需要懂得相關的技能,同時還要掌握統計學、管理學等方面的知識。數字化人才培養過程漫長,同時又會涉及多個學科交叉的過程,而企業的培養模式通常都不夠成熟和系統。不少企業員工都是邊工作邊學習相關的培訓課程,而且企業培訓的進度安排較為緊湊,沒有考慮到員工能否掌握。同時,大數據相關的知識體系非常復雜,對員工開展在職培訓也很難收到實質性的效果。
目前大多數高校大數據專業是新設立的,對于使用的教材與教師講授的內容沒有明確的規劃。同時在講授過程中也不夠注重實踐,課堂上缺乏項目來引導學生的興趣,學生往往在結課時才能有系統的實驗課程來練手,導致許多大數據專業的學生往往對于相關理論概念有印象,但是對于企業中真正的大數據處理與分析的具體流程與相關技能要求一知半解。事實上,學生在缺少實際應用場景的學習模式下,通過書本去學習大數據本身就是一個問題,從而導致高校培養的畢業生往往不能滿足企業的用人需求,企業需要進行漫長的二次培養。
本文綜合考慮招聘網站的權威性、抓取難度后,以“大數據”為檢索關鍵字從51job 上搜索招聘信息。本文的研究方案主要從以下五個方面進行:第一,對獲得的數據進行清洗,去除無效、非結構化數據;第二,再對招聘信息的崗位描述進行文本整合,通過python 進行分詞處理,提取出頻率最高的關鍵詞;第三,運用數據挖掘技術對相應關鍵詞進行詞頻統計并以K-means算法對關鍵詞進行聚類分析;第四,運用FineBI 數據可視化工具進行數據可視化;第五,對上述結果進行相應分析。
本文為保證數據量的可靠性,通過自己編寫程序抓取了51job 上59 222 條原始數據,通過Excel 對所得信息進行清洗,保留按“月”顯示的工資信息;工作地點為具體城市;工作經驗為:年、無須經驗、在校生/應屆生;學歷要求為:博士、碩士、本科、大專、高中、初中及以下的數據,最后對重復值進行刪除,保留清洗后的44 663 條數據。
對清洗后數據“崗位描述”字段進行文本整合,將整合好的文本內容進行預處理,包括更新詞表、分詞、詞頻統計等過程,保留詞頻大于100 的關鍵詞81 個。
采用K-means 聚類算法進行聚類分析,在使用該算法進行分析之前需要將文本進行向量化處理,所以本文使用TF-IDF(逆文檔頻率)算法來實現文本信息的向量化,例如,tf 代表詞頻,對于某一關鍵詞t來說,它的詞頻計算公式如下:

逆向文本頻率idf 如果包含詞條t 的文檔越少,idf 越大,說明詞條具有很好的類別區分能力。其中|D|代表劃分的文件總數,|D|代表包含關鍵詞ti 的文件數目,公式如下:

最后計算出t的權重,公式如下:

對于K-means 算法,其中K 的值代表聚類的數量,本文設置為4,分別為:業務能力、技能要求、專業及學歷要求、個人素質相關要求。
目前來說,大數據的主要應用領域依舊為計算機軟件行業,占比大致為27.16%,但是對比以前,占比已經大幅度下降。電子商務、房地產、網絡通信、金融類、教育、零售業等行業對于數字化人才的需求大幅度增加,其中金融類行業占比達到2.37%,對高校商學院畢業生來說也是一個新的就業方向,如圖1 所示。

圖1 招聘行業分布圖
同時,在疫情的影響下,教育、醫療、電子商務、金融等行業對于數字化人才的需求增加。疫情期間,線上辦公、學習使得線上作業成為一種常態;疫情后像京東等大型企業也開始進軍“互聯網+”醫療領域;而電子商務在這次疫情中充分發揮了自身優勢,許多新用戶開始網上購物,用戶數量的激增加速了電子商務數字化的發展;對金融行業來說,由于疫情原因,90%以上的業務都需要通過線上的渠道完成,進一步推動了行業的數字化轉型。
數字化崗位在全國的分布不是非常廣泛,全國大數據發展中心集中在長三角、珠三角地區,其中人才需求數量最多的8 個城市為:上海、深圳、廣州、北京、南京、成都、武漢、杭州。由于國家對受疫情影響企業的扶持以及“十四五”規劃的實施,在2020 年,武漢借助國家與湖北省的支持,大力發展新興行業,提供了大量的數字化就業崗位,同時通過降低畢業生的生活成本與創業成本,使得更多武漢畢業生愿意留漢工作創業。
本文繪制在不同工作經驗區間的薪資分布圖來分析大數據崗位招聘對于工作經驗的偏好,如圖2、圖3 所示。數字化相關崗位對于應聘者無經驗數量占比為31.4%,薪資主要分布在6 000~ 15 000 元/月,良好的薪資待遇一定程度上說明了疫情之后全國范圍對于數字化崗位需求的迫切程度。而對于需要經驗的崗位,需求主要集中在3~ 4 年工作經驗,同時薪資10 000~ 20 000 元/月之間的人數占比超過一半,從用人成本上來說,3~ 4年經驗人才也更容易令企業接受。工作經驗在5~ 7 年的需求人數大幅度減少,但是相應的薪資也是遠遠高于其他工作經驗區間,其中最高能達到40 000 元/月。總結來說,數字化人才的需求缺口非常之大,導致對于工作經驗的要求不是很看重的同時薪資福利非常可觀。

圖2 數字化人才工作經驗與薪資分布圖

圖3 數字化相關崗位經驗分布圖
在學歷方面,大專和本科的需求數量占據了整個需求的93.9%,其中對大專學歷的需求達到32.94%,對互聯網行業來說是罕見的,說明企業往往難以招聘到足夠的人才。但其對于人才也具有一定的技能性要求和學習能力的偏好;而碩士與博士僅占3.31%,主要集中在涉及算法的崗位,其對于專業技能的掌握程度有更嚴格的要求。如圖4 所示。

圖4 數字化相關崗位學歷要求占比
總結來說,數字化人才的缺口導致企業對招聘學歷的要求不像以前一樣嚴格,企業更加看重人才的綜合能力。
3.5.1 數字化人才整體技能要求
本文通過自定義分詞的方式對招聘描述文本信息進行分詞處理,選取了英文詞頻數前28 個與中文詞頻數前53個關鍵詞通過FineBI生成詞云圖,如圖5所示。數字化崗位更加看重人才是否具備經驗,包含學習、工作經驗,以及生活中的人際交往與團隊協作等方面的經驗。同時,對于“開發”能力也有一定要求。總的來說,數字化相關的崗位不僅僅只看專業技能,也注重個人綜合素質。

圖5 數字化相關崗位整體能力要求
3.5.2 數字化崗位高頻率的技能需求分析
使用技能分類關鍵詞生成詞云,如圖6 所示。其中數據庫出現的次數最多,說明對于數據處理、分析方面的要求比較高,除了SQL 相關基礎技能外,對于hadoop、python、spark、redis 等大數據處理工具也要求掌握。在編程語言方面,對人才的編程能力要求不高,工作中大多使用java 與python,但是對于算法方面會有一定的要求。總結來說,數字化行業進入門檻不高。

圖6 數字化相關崗位高頻技能
3.5.3 數字化崗位綜合素質需求分析
通過對綜合能力類的關鍵詞生成詞云,如圖7 所示。大多數企業更加喜歡招聘具有相關經驗的人才來減少企業的用人成本;同時要求應聘者能夠通過團隊合作溝通來快速完成崗位工作;硬性要求具備相應的分析能力,需要對公司的業務與客戶的需求能深度理解,能夠通過分析、處理、團隊協作來解決相應的問題。

圖7 數字化崗位綜合素質要求
大多數企業對數字化人才的專業技能掌握程度要求不高,更多聚焦在綜合素質方面。在2016 年中國首次設立大數據專業時,僅僅只有3 所高校設立該專業,到目前全國大部分高校都相繼設立了大數據專業,足以看出大數據未來的發展趨勢。但目前企業招聘的數字化人才中大部分都是計算機類專業的學生,讓他們通過短期的崗前培訓來填補數字化崗位的缺口。高校培養的人才數量、質量遠遠達不到預期。
本文研究發現:企業對人才招聘的注重點更偏向于招收具有相關經驗的人才,用以減少企業的培養成本;相較于傳統互聯網行業來說,企業對于專業技能掌握程度的要求并不是很高,更注重人才的綜合素質以及工作中的分析、處理問題能力。但目前高校培養人才過于注重理論學習,導致畢業生沒有相應的項目經驗,而且許多高校的大數據專業往往都是在原有信息管理或計算機相關專業的基礎上設立,相關課程的設置不夠合理、科學。
高校應當是數字化人才的培養基地,培養的畢業生除了具有基礎知識,還要具有一定的實踐能力。如果剛畢業就能滿足企業中低崗位的從業要求,即有一定的實際應用能力,那么就會具有相當的競爭力。這種實際應用能力可以通過參與具體的大數據開發項目獲得。因此本文提出以下建議。
(1)高校需要時刻關注新技術的發展與應用,及時關注企業的需求,適時調整人才培養計劃,并同步進行新學科、新專業建設。
(2)在不放松理論基礎知識教育的同時,增加應用能力培養。理論基礎知識對于人才的綜合素養與發展潛力有著重要意義,不能削弱,但如果不具備實際應用能力,進入企業還需要再培訓,則畢業生的競爭力有限。應用能力培養可以通過具體的項目實施完成,這樣不僅能提高學生對于課程的興趣,更能提升對專業技能的認識。
(3)大數據的應用十分廣泛,在專業建設時可設置多個發展方向,教學方面則對應不同的側重點,例如,數據的采集與可視化方向、數據的分析與挖掘方向、機器學習與深度算法方向。
(4)高校可加強與企業之間的深度合作,使得地方企業成為高校人才的實踐基地,培養學生的實踐能力與項目經驗。
(5)高校應重視學生職業規劃教育,引導學生在實踐的過程中積累工作、生活經驗,提升自身綜合能力,完善職業生涯規劃。