祝英杰,李 晗,楊相群
(1.長春大學研究生院,吉林 長春 130022;2.長春大學理學院,吉林 長春 130022)
隨著信息時代和人工智能技術飛速發展,人類社會正式從IT(Internet)時代步入DT(Data Technology)。“大數據”概念最初由思科、威睿、甲骨文、IBM 等公司聯合倡議提出。大數據時代的到來,意味著亟須大量的數據科學人才,世界各國對數據科學人才的重視程度都已提高到國家戰略的高度。
大數據行業面臨全球性人才短缺的問題。據報道,美國2018 年數據科學人才缺口為151717 人,這個數據持續增長。中國至2025 年數據科學人才缺口將達到200 萬,然而我國每年高校輸出的數據科學方向的畢業生大約為20 萬人,這遠遠不能滿足我國對大數據專業人才的需求。世界各國相繼成立數據科學研究機構,各高校成立大數據科學學院或研究所。奧巴馬于2012 年3 月宣布啟動“大數據研究與開發計劃”,美國各高校開始大規模培養數據科學人才。我國2015 年啟動大數據戰略,發布了《促進大數據發展行動綱要》,正式拉開我國數據熱潮。2017 年2月,我國教育部著力推廣新工科建設,開設大數據、人工智能、數據科學與大數據技術等專業,獲批這些新增專業高校的數量由2016 年僅有3 所發展到2018 年250 所。由此可見,國內高校對大數據專業人才培養異常火爆,結合大數據時代對數據科學人才迫切需求的實際,高校對大數據專業人才培養模式的改革和數據科學學科建設工作任重而道遠。
2017 年11 月中國商業聯合會數據分析專業委員會聯合全國87 位專家共同起草《中國大數據人才培養體系標準》(以下簡稱“標準”)。《標準》給出“大數據人才”的界定,即大數據人才具備數學、計算機科學與技術等多種學科交叉且掌握金融、經濟、財會等商業技能的人,能夠將數據和技術轉化為企業的商業價值。大數據人才內涵包括三方面:(1)理論性,即掌握各種大數據技術算法和數據分析模型,進而更好地理解和運用大數據技術,具備計算機編程能力;(2)實踐性,即處理各領域中具有行業背景的數據,具備數據挖掘和統計建模分析能力;(3)應用性,即利用大數據技術解決各行業實際問題,具備行業業務管理能力。
對數據科學人才的培養進行系統分類,才能因勢利導,因材施教。目前國內大數據人才分類沒有統一標準。不論哪種分類方式,均依托于大數據的顯著特征,概括為“7V”:大量性(Volume)、黏性(Viscosity)、準確性(Veracity)、高頻性(Vevacity)、時效性(Volatility)、多樣性(Variaty)和易變性(Variabiltiy),其本質都是實現成本經濟型向新型并行架構轉變的驅動力。《大數據人才解讀》中將大數據人才分為核心人才和復合型人才。高全義等通過挖掘人才價值將大數據人才分為技術、應用、安全、管理和領軍五大類,每大類又進行二級細分。李佳培等將大數據人才分為工程型和科研型。大數據企業從“職業角色”角度給出大數據人才分類。大數據運維工程師、大數據前端應用開發工程師、大數據架構師、大數據分析師、大數據可視化工程師、大數據平臺研發工程師、數據挖掘師、大數據云端研發工程師、算法工程師,稱之為“數據操作型人才”。
2.1.1 加拿大滑鐵盧大學大數據人才培養模式
加拿大滑鐵盧大學為了更好地培養大數據專業人才提出Co-op 產學教育合作模式,即以高校、社會用人單位、學生、政府等為主體,特點是學生的Co-op 老師負責為學生尋找實習機會并提供面試指導。實習對于大數據專業人才的培養至關重要,滑鐵盧大學的Co-op 人才培養模式提升了大數據專業人才實操能力,因此,該校50%的學生申請注冊參加Co-op 學習。Co-op 人才培養模式是帶薪實習,這也是滑鐵盧大學制勝的關鍵。大部分Co-op 學生在長達5 年的學習生活中,一方面需要學習新知識,另一方面就是將在學校學習的知識付諸校外的實習中,在長經驗的同時實現生活經濟上的獨立。大數據專業的學生可根據自身情況選擇實習期,這更有利于他們的學習與生活。據統計滑鐵盧在校的Co-op 學生大約為5000 人,基本來源于工程院全院與數學院。以學習和實習并行的Co-op 人才培養模式使畢業生在數學、計算機科學、工程學領域取得的成績非常突出,這讓滑鐵盧大學成功成為北美地區的優秀大學之一。
2.1.2 美國德雷塞爾大學大數據人才培養模式
德雷塞爾大學大數據人才生源主要來源于計算與信息學院,有兩種培養模式,一是數據科學本科學位,二是數據科學輔修。在5 年學習中,大數據專業的學生需要在社會用人單位擁有3 次或3 次以上的實習經歷,否則不予畢業。德雷塞爾大學對于大數據專業人才的培養明確規定大數據專業學生的修習課程,對于大數據專業學生來說,必須選擇“數據科學導論”“數據分析導論”“數據挖掘應用”“云計算和大數據”等基礎性理論課程學習,而選修課一般為“計算機編程入門”和“數據監護”等。
2.2.1 清華大學大數據專業人才培養模式
面對大數據時代的沖擊,國內高校作為人才培養的搖籃也緊跟時代發展的潮流。作為國內首屈一指的高校,清華大學對大數據人才的培養,利用自身優勢學院進行教育與信息資源共享,建立數據科學研究院,特色培養大數據專業人才,并且建立自己的大數據共享的專業平臺,推出大量與大數據相關的開源軟件以及服務,在大數據專業人才的培養上起到了表率作用,并為國內大數據人才的培養提供寶貴經驗。清華大學數據科學研究院關于大數據專業人才培養分為三個模塊。第一模塊為基礎技能模塊,開設數據分析(A)、數據分析(B)、大數據系統基礎(A)、大數據系統基礎(B)等課程,其目的是讓學生了解大數據的專業知識。第二模塊為能力提升,這一模塊是深入學習大數據有關知識,了解大數據的發展方向,并學習數據理論、大數據算法、數據可視化處理、大數據分析與處理的相關課程。第三模塊為實踐,包括《大數據實踐課》及大數據相關講座,這一模塊目的是擴展學生眼界與實踐能力。
2.2.2 復旦大學大數據專業人才培養模式
2016 年復旦大學調集一切優勢力量,投入大量人力、物力培養大數據專業人才,開辦大數據統計與分析專業、大數據系統與計算專業、大數據與智能科學專業,制定大數據專業人才培養體系。復旦大學利用數學、計算機科學等優勢學科資源進行交叉融合,創建大數據學院,培養創新型大數據專業人才。大數據學院對于大數據專業人才的培養分為三個模塊:通識課程教育、基礎課程教育、專業課程教育。高級大數據解析、數據融合與同化、組學數據的統計分析和挖掘這幾門課程是復旦大學大數據學院的特色課程。
目前我國大數據人才市場需求現狀有以下幾個特點:
大數據人才供需地域不均衡。我國有八個國家級大數據綜合實驗區,主要集中在京津冀、長三角、珠三角、成渝等區域。與這些試驗區毗鄰的省份,如江蘇、陜西、湖北、浙江、四川、安徽和山東也在加緊大數據產業園/基地的建設。
大數據人才市場從事系統研發等技術崗位的大數據技術類人才稀缺。我國大數據產業發展成效顯著,應用創新不斷,在政府、金融、醫療、工業、交通、農業、能源、電信、教育、物流等眾多領域,大數據應用需求越發強烈,大數據人才缺口約150 萬。因此,新工科背景下國內大數據人才市場近期和遠期需求體量較大。
對于大數據人才培養,偏重統計學理論基礎知識的教學,力求知識體系的完整性,行業業務管理知識滲透不足。高校已有信息類相關專業,通過在培養方案中增加大數據相關課程,如數據科學導論、數據挖掘、云計算與大數據、Hadoop等,使畢業生適應大數據技術革命的迅速發展和行業應用需求的快速增長。然而,大數據人才培養和數據科學學科建設尚未形成完善體系。
具有企業實踐經歷的大數據專業教師師資力量薄弱。在經濟相對落后地區,開設優質的大數據課程實屬不易。大數據技術隨著信息技術發展不斷更新換代,這需要開設大數據專業的高校具備雄厚的師資力量和不斷完善課程體系,以便適應復雜多變的大數據產業市場。
大數據專業教學方式以面授為主。吳丹等研究發現,非iSchools 高校數據科學學科的授課方式仍以面授為主,不利于增加學習形式多樣性和提高學生學習效率。
我校以市場需求為導向,通過認真分析大數據專業教學存在的不足,研究制定我校數據科學與大數據技術學科專業培養目標,較全面掌握大數據處理和分析的基本理論、基本方法和基本技術,具有數據采集、存儲、處理、分析與展示的基本能力,能夠運用所學知識解決實際問題,具備較高的綜合業務素質、創新與實踐能力以及良好的外語運用能力,能從事大數據科學算法研究、大數據分析、大數據系統開發、大數據可視化以及大數據決策等工作的應用型創新人才。具有以下三方面素質的人才:理論性,即注重對數據科學中基本概念和理論的理解和應用;實踐性,即處理金融、生態、醫療衛生、電信等領域數據;應用性,即利用大數據技術解決具體行業應用問題的能力。
構建“產學研深度融合”的大數據課程群。依托教育部“產學研”項目,加強學校和企業間校企合作的深度和廣度,充分發揮高校和企業的主觀能動性,實現校企雙主體運作模式,最終實現雙贏。課程群包括三個模塊:學科基礎課(數據科學與大數據技術專業導論、大學計算機基礎、程序設計思維、概率論與數理統計)、專業核心課程(數據結構與算法、機器學習、最優化理論與算法)、專業方向課程(Python語言編程技術與實驗、應用回歸分析與實驗、大型數據庫、Hadoop編程與實驗、數據倉庫與實驗、深度學習與實驗、數據可視化與實驗)。
加強大數據實踐類課程教學。注重大數據企業實戰項目和案例分析,為此聘請大數據企業項目經理講授Hadoop 編程與實驗、數據倉庫與實驗、深度學習與實驗等課程。組織學生參加校內、校外企業實習實訓,采取“雙導師制”。選取綜合型實驗項目進行校外實習實訓,通過“頂崗實習”方式,讓學生融入企業環境,綜合運用大數據技術解決行業實際問題。
加強大數據專業師資隊伍建設。跨學科組織教師充分利用學校現有的科研平臺、校企合作基地進行“雙師型”教師培養;鼓勵教師積極參與大學生創新創業訓練計劃項目;有計劃地組織青年骨干教師到大數據培訓企業或培訓基地參加行業的專業技能培訓;鼓勵教師積極申報國家留學基金委國家公派出國項目和國內訪問學者項目,并且每年選派教師到國內外高校或企事業單位交流培訓。
充分利用互聯網,實現優質課程共享。鼓勵引進國家級、省級優質在線開放課程,任課教師采取MOOC 進行線上線下混合式教學方式,滿足學生個性化發展需求,提高學習形式多樣性和學生學習效率。
“數據生產力”一詞于2020 年7 月正式向社會發布試用,這意味著我們需要構建數據為生產要素的新業態、新模式。數據生產力成為人類改造自然的新型能力。特別在“十四五”期間,高校將不斷探索大數據人才培養模式改革,培養方式多元化;課程設置與時俱進;注重計算機編程課程以及行業背景實習。高校要進一步對標行業、企業需求,完善大數據人才培養方案一體化的理念,實現課程體系支撐人才培養目標與培養特色;完善實踐教學體系,加強校內外實踐環節,豐富項目與案例資源;加強課外實踐與創新環節及課外教育運行機制;培養具有創新能力的“雙師型”師資隊伍。