編譯 方陵生

將信息數據稱為全球經濟的“新油”是一種普遍說法,數據科學家是能夠在全球經濟中提取、精煉和配置這種具有戰略價值能源的人才。
人類歷史上三次工業革命催生了大量新技術,導致了經濟、社會和產業各個領域的重大變革。蒸汽機的發明開始了人類從農業社會邁向工業化大生產的重要轉變;化石燃料用于發動機及裝配線等創新工業生產的模式迅速擴大了生產的規模;數字化革命更是顯示了計算和信息技術的強大力量。每一次工業革命都給人們的生活和工作方式、經濟價值的創造方式以及對高價值技能的需求帶來重大變化。
隨著第四次工業革命的展開,在數據科學和人工智能等技術的帶動下,勞動力市場再次發生了根本性的變化。業界領袖普遍認為,到2022年,人力和自動化流程將平均分擔目前的工作量,而隨著數字化創新在各行業和地區的普及,有可能同時出現一系列新職位,特別是在許多大型先進市場和新興市場,信息技術、可再生能源、教育和醫療保健等行業將占據大部分新的職位,數據科學、醫療保健和人力資源等行業預計也都將出現增長。
新的勞動力市場正在迅速發生變化,新興數據源也正以前所未有的深度和活力產生影響。在線平臺和具有專業洞察力的公司正在探索與傳統行業互補的新方法,以了解特定的技能、任務和職位在不同行業和地區之間的變化。這些探索有助于提高企業、決策者和員工對勞動力市場的現狀和未來的分析能力,并采取更明智、更協調的商業戰略和政策。
世界經濟論壇(WEF)發布了《新經濟下的數據科學——第四次工業革命中的數據科學人才競爭》(Data Science in the New Economy:A new race for talent in the Fourth Industrial Revolution)報告,旨在為政策制定者制定數據科學人才政策提供參考。報告認為,數據科學在未來將是人工智能、機器學習、信息通信、媒體娛樂、金融和服務等行業的基礎技能,對經濟增長尤其重要。因此,政策制定者應跟蹤把握數據科學及相關技術的發展態勢,注重區域平衡,加大行業投入和人才培養力度,為第四次工業革命提供足夠的數據科學人才。
報告結合Burning Glass Technologies公司、在線課程Coursera公司和領英公司的實踐,分析了新經濟下的數據科學技能市場以及數據科學人才在當今勞動力市場上的成長和分布:一是通過Burning Glass Technologies的招聘廣告分析數據科學技能需求;二是基于Coursera對學員技能的分析,了解數據科學人才跨行業和跨地區的分布和人員素質情況;三是通過領英的用戶簡歷,分析數據科學技能在特定職位核心組成中日益加強的重要性。
將信息數據稱為全球經濟的“新油”(new oil)是一種普遍說法,數據科學家是能夠在全球經濟中提取、精煉和配置這種具有戰略價值能源的人才。本報告重點關注數據科學人才,他們是第四次工業革命中最具競爭力的技能型人才。
在第一波數字化浪潮中,數據被視為純粹是數字應用、操作系統和數字平臺等的副產品。現如今數據越來越被認為是一項重要資產,是人工智能等領域內進一步創新的極大助力,如通過提高處理流程效率推動服務改進,為客戶提供最佳服務。新的數據源和處理方法帶來的好處不只限于私營部門,公共部門越來越多地利用數據改善政府服務,學術界應用新方法加強研究。
然而,對數據科學技能員工需求的迅速上升,導致數據科學技能人才供不應求,工業界、學術界和公共部門之間為爭奪此類人才的激烈競爭,降低了企業、行業和整個經濟體充分利用創新紅利的能力。各行業對這類人才的需求如何,數據科學技能如何成為核心職位構成的一部分,員工如何通過跨行業和地區的學習拓展其數據科學技能集,我們對未來數據科學需求增長的了解有多少,這些都是我們要探索的問題。
雖然數據科學崗位和技能在目前勞動力中所占比例相對較小,但最近的趨勢表明,數據科學人才在勞動力市場上的需求將日益增大。數據科學技能的需求不只限于信息技術部門,數據的重要性在許多行業中都在不斷提高,包括媒體和娛樂、金融業和服務業。
數據科學技能對于新產生的一些職位尤為重要,如美國的機器學習工程師和數據科學專家。而在一些傳統職業中,如公共關系顧問,對數據科學技能的要求只是象征性的,但這些職位所需的技能也正面臨重大變化。數據科學技能也并非固定不變,隨著數據分析的技術進步,數據科學技能職位的具體構成也將重新定義。
數據科學學習者的成就差異表明,各行業和各區域的數據科學人才的水平也各不相同:信息和通信技術、媒體和娛樂、金融和服務行業在招聘數據科學人才以及跨行業技能方面均處于領先地位;在大多數行業中,歐洲的在線學習者在數據科學技能方面的熟練程度高于北美,其次是一些新興地區;與此趨勢不同的是,在信息通信等領域內,亞太地區的學習者、中東和非洲的學習者成績均優于平均水平。
預測到2022年,人工智能與機器學習專家、數據分析師和科學家等將成為大多數行業中最需要的人才,對數據科學技能的需求也將急劇增加。
總體而言,數據科學職位和技能的快速發展和演變,提出了制定適當戰略和教育培訓政策的要求,以滿足對人才數量和質量的需求。不能了解和應對這些變化的行業和國家將可能面臨增長放緩甚至下跌的風險。上述提到的趨勢對決策者提出了新的要求:
在第四次工業革命中,所有部門都需要進行根本性變革,以充分利用數據經濟的潛在紅利,這種轉變需要伴隨著對數據科學技能人才的適當投資。
數據管理或統計行業已吸納了大量傳統數據科學技能人才,但這些行業不能沾沾自喜,自我滿足,要想發揮其創新潛力,這些行業需要對數據可視化或統計編程等新技能進行新的投資。
鑒于數據科學專業的快速變化,一次性技能升級投資是不夠的。要想跟上最新技能的發展,需要有一個動態的技能升級系統以及時響應快速變化的技術和相關技能的需求。
不同行業和不同區域在線學習者的成就差異顯示了掌握數據科學技能能力之間的潛在差距,這個問題如果不加以解決,可能會降低一些企業、行業和區域的創新能力和競爭力潛力,這些區域的公共和私營部門需要考慮加大對數據科學的投資。鑒于對這些技能需求的不斷增加,這方面的投資很可能為個人和公司帶來巨大回報,并有助于為社會經濟流動開拓新的途徑。
2013年至2018年期間,不同行業對在線技能和數據技能這兩種技能的需求表現出一些共同特點,如投資較多的行業是媒體和娛樂行業、服務業、信息和通信技術行業以及金融行業。同時,數據也顯示這兩種技能需求有明顯差異:與在線技能相比,對數據技能的需求仍然相對較小;不過,對數據技能的需求正在迅速增長。準確地說,2013年至2015年期間,信息和通信技術、媒體和娛樂、服務業、金融業對數據技能的需求分別增長59%、50%、69%和88%。相比之下,同一時期同一行業對在線相關技能的需求分別增長18%、14%、7%和44%。
對在線市場發展趨勢的進一步調研可以發現,一些行業在特定年份經歷了需求高峰。例如,2014年非營利性行業和2017年政府和公共部門都出現了這種需求高峰。這些高峰可以解釋為隨著新技術的應用對專業人力資本的迫切需求,但隨著這些技術開始成熟,對相關技能的需求也將相對放緩。
這些數據的價值在于,讓個人、企業和決策者了解各行業對新技能需求正在激增這一趨勢,可動態地解決技能短缺或不匹配的問題。同時,支持領導者對行業內和跨行業人力資本的未來投資目標進行定位。
不同行業和地區的學習者在數學、統計、統計編程、機器學習、數據管理和數據可視化這六個技能集里的數據科學技能各有其相對優勢和劣勢。這六個技能集可進一步細分為一些具體的技能,例如:數學中的微積分;統計學中的線性回歸;統計編程中的編程語言,如R語言;機器學習中的神經網絡;數據管理中的大數據分析;數據可視化中的圖表繪制。這六個技能集中的三個近年來有重大創新,分別是統計編程、機器學習和數據可視化。
在傳統的數據技能方面表現良好的行業,如統計和數據管理,如果希望發揮其創新潛力,就不能固步自封,需要對統計編程或數據可視化等更具創新性的數據技能進行新的投資。例如,金融業就屬于這一類。從歷史上看,金融業在人才和技能上一直保持著數量優勢,特別是在統計學方面擁有強大的人才基礎。盡管技術行業的人才競爭日益激烈,但金融業在這些傳統專業技能領域仍具有競爭優勢。然而,金融行業學習者在統計編程和機器學習等其他技能方面表現較差,技能熟練度排名較低。
學習者的技能熟練程度因地區而異。例如,在金融行業,歐洲的學習者被認為是“最前沿”的人才,而拉丁美洲的學習者是“新興”人才。總體而言,歐洲的在線學習學員在數據科學技能方面的熟練程度高于北美,其次是新興地區。通信領域的學員在亞太、中東和非洲地區表現出較強的技能熟練程度。同樣,在汽車行業,中東和非洲的學員在掌握數據科學技能方面表現良好。
隨著數據成為越來越重要的資產,勞動力市場需要更多掌握數據科學技能的人才,決策者和企業領導人必須考慮為新的勞動力市場更好地開發和部署有競爭力的人才。按行業和地區對在線學習學員的技能熟練程度進行分析,有助于確定未來人才需求的優先項,瞄準跨地區的技能再學習和技能提升機會,保證地區和產業的長期競爭力。要跟上第四次工業革命中已經開始的市場轉變步伐,需要個人、世界各地公司和政府在技能開發投資上的協同努力。
當今勞動力市場上出現的兩種類型的職位需要認真考察:一種是建立、操作和維護新技術的職位,如區塊鏈開發人員、機器學習工程師、機器學習專家和數據科學專家;另一種是吸引客戶并銷售產品和服務的職位,包括應用程序銷售主管、公共關系顧問、銷售開發代表和業務支持顧問。
不同的職位關注的重點不同。數據科學專家更重視數據可視化和SQL(結構化查詢語言)技能;機器學習專家更傾向于強調使用專門為機器學習設計的新編程工具(如TensorFlow和Keras)的技能,以及對計算機視覺的理解。與這些職位不同的銷售開發代表需要不同的技能集,如銷售技能、客戶關系管理和業務發展技能,即重點是“軟”技能和以人為中心的一些技能。
勞動力市場分析通常側重于就業機會的總體上升和下降趨勢,但職位技能組合的不斷變化提出了更高的要求,即跟蹤職位的技能要求比只跟蹤職位更能準確地洞察勞動力市場的需求。此外,領英的技能組合分析還可以跟蹤職位、行業、城市和地區的技能構成,以便對歷史趨勢進行比較。為跟蹤當今勞動力市場最重要的變化,技能必然成為勞動力市場調查的新的分析單位。

各行業對數據科學技能職位需求的優先級排名
將技能作為勞動力市場分析的關鍵單元,為確定技能再學習和技能升級提供了評估分析工具,為決策者提供了為未來勞動力市場可能出現斷層做好積極準備的評估分析工具。深入、細致和動態地了解勞動力市場正在發生的變化,要求我們的分析不只基于和局限于年輕一代的職業資歷和學歷。這些數據也可以給予教育和培訓提供者支持,使其與勞動力市場上新的技能要求更加靈活地結合起來。
在未來就業前景調查中,首席人力資源官和企業領導人預測了未來企業需要的技術以及可能出現的重要新職業。在接受調查的商界領袖中,85%的人表示,在2022年之前,他們計劃對“用戶”和“大數據分析”進行整合,使其成為最優先考慮的方面;他們還計劃將用戶和大數據分析方面的投資與新的數據科學相關職位進行匹配。此外,領導人還預測同一時期將變得更加突出的一系列新的重要職位。下表列出了各行業對人工智能和機器學習專家、數據分析師和科學家需求的優先級排名。
準確地說,在12個被調查的行業中,7個行業的數據分析師和科學家是排名第一的職位,是企業領導人計劃在2022年之前聘用新員工的工作職位。
為滿足這一需求,決策者和商界領袖需要共同努力,拓展當今數據科學人才隊伍。本報告中的數據揭示,除了數據科學技能基礎教育外,還需要制定動態、響應性的技能再學習和技能提升計劃。這方面的投資將以更高的工資水平,更多的創新、更強的競爭力和社會經濟變動形式,給個人、公司和經濟體帶來快速的回報。