段小林,李鴻健,吳思遠,代 宇
(重慶郵電大學 計算機科學與技術學院,重慶 400065)
新工科建設是教育部為應對新經濟的挑戰,從服務國家戰略、滿足產業需求和面向未來發展的高度,在“卓越工程師教育培養計劃”基礎上提出的一項持續深化工程教育改革的重大行動計劃。新工科建設著重強調計算機技術、大數據、人工智能、智能制造等多學科的交叉與融合,其中大數據技術已成為計算機科學技術的前沿領域和研究熱點,與大數據密切相關的人工智能技術已上升至提升國家整體科研實力的戰略地位。新工科建設的本質是培養學生的工程實踐能力,在這種背景下大數據實踐課程建設迎來了新的機遇和挑戰。
華為公司提供公有云基礎設施,同時也提供以MRS(Map Reduce Service)為代表的大數據服務,為客戶提供Hadoop生態的高性能大數據組件,支持數據湖、數據倉庫、商業智能融合,為企業提供穩定可靠、持續創新的云服務,為企業可持續發展賦能。教育部和華為公司于2020年共同發起了“智能基座”產教融合協同育人項目。重慶郵電大學有幸首批入選該項目,與華為公司建立“智能基座”產教融合協同育人基地,通過課程資源建設、課程內容優化等教學改革手段,建立以華為云為基礎的高校人才培養體系,深化產教融合,持續為信息行業輸送高質量人才,打造國內產教融合協同育人示范基地。
一般認為,根據應用場景和業務類型,大數據實踐類課程的內容包括基于大數據平臺開發(數據采集、存儲及計算)和基于機器學習方法的數據挖掘。重慶郵電大學云計算與大數據綜合實踐課程于2018年底開設,課程內容以大數據平臺開發方向為重心,同時也力求在有限學時內將上述兩個方向進行有機結合。本文以該課程建設為例,力求將其教學內容與華為云大數據服務深度融合,從課程內容與知識體系、課程建設與教學改革、課程建設成果等多個方面闡述具體改革內容,以及取得的初步成效。
大數據技術領域對人才培養有較高要求,既要求學生掌握扎實的機器學習、統計分析理論基礎,又要求學生掌握大數據領域的實際工程技能。為滿足企業日益增長的大數據人才需求,培養和提升學生的行業技能,國內眾多高校開設了大數據課程,其中不少高校在課程建設與改革工作中取得了一定成效。例如,文獻[1]以培養具有行業特色和可持續競爭力的大數據卓越人才為目標,構建了貫通能力培養的大數據課程體系;文獻[2]以大數據分析與應用課程為例,探討了實踐任務與科研項目驅動的教學模式,構建了完善的課程體系;文獻[3]提出一種面向大數據通識課程的教學方案,采用混合式教學方法提升學生的大數據素養和大數據應用能力;文獻[4]闡述了課程思政的概念與內涵,對計算機視覺課程開展思政教育的具體方法進行了探索;文獻[5]提出計算機專業課教師應與思政課教師協同合作,系統挖掘課程思政資源、凝練課程思政主題。針對傳統課堂教學模式下部分學生學習興趣欠缺的情況,也有一些高校嘗試對教學模式進行了改革[6-8],通過對課程教學進行詳細設計,包括采用翻轉課堂和混合式教學等模式,顯著提高了學生學習的積極性和主動性。此外,部分高校探索在課程中融入競賽環節,例如文獻[9]將沉浸式實踐項目、校外學科競賽與傳統課程教學資源進行優化融合,構建混合式創新教育模式。
雖然大數據課程建設已取得較大成效,但針對課程體系的探索側重于宏觀視野,缺乏對某一門具體課程的精準分析。此外,實踐課程的教學研究工作略顯不足,沒有徹底解決新工科建設和工程教育的實質問題。總體而言,目前大數據實踐類課程教學仍然存在以下普遍性問題:①課程思政難題。立德和立學是高校人才培養的重要目標,前者是人才培養的根本宗旨,后者是人才培養的主要方向。如何在實際教學過程中捋順立德與立學的主次關系,實現思政內容與課程內容的有機融合仍然是課程思政建設的難點;②教學平臺和教學資源建設存在不足。很多高校經過前期各種學科平臺建設已具備大量計算和存儲資源,但缺乏簡單高效、使用便捷的大數據實踐教學平臺。因此,在后疫情時代如何有效利用平臺資源為學生提供更好的實驗環境值得進一步思考、研究和實踐;③傳統教學模式難以適應新工科建設對課程的要求。傳統實踐教學一般由教師布置實驗任務,學生進行上機練習,這種教學模式無法適應新的發展趨勢。如何根據實際情況建設和完善符合實際情況的教學模式是教學改革的重要環節;④競賽與課程成績評定問題。目前各種科技競賽活動如火如荼,如何將成績評定與科技競賽有機結合,進一步提高學生的學習積極性,提升其實踐能力和獨立思考能力需要進一步探索;⑤教學師資匱乏。大數據技術作為新興計算機技術,現階段高校相應師資力量的培養和提升工作有待加強。目前新引進的教師雖然具備較為扎實的理論基礎,但相當一部分青年博士缺乏工程實踐能力,大數據實踐課程教學經驗匱乏。
云計算與大數據綜合實踐課程主要面向計算機與智能科學類專業開設,同時也面向全校理工類專業選修。課程主要涉及到云計算及大數據處理基本方法的應用及工程實踐,側重于大數據平臺與開發方向,也涉及基礎的機器學習算法應用。云計算與大數據綜合實踐課程的知識點涵蓋范圍較廣,涉及數學(概率與統計、線性代數)、計算機(程序設計、數據結構、數據庫、操作系統)等多個學科。在本科培養方案中該課程的教學時間為2周40學時,教學過程中不僅要拓展學生培養的廣度,還要注重學生專業技能學習和掌握的深度,使其將知識點應用于實際工程項目中。
設置課程知識體系時,在考慮融合華為大數據相關內容的同時應注重重慶郵電大學的實際情況。首先要注重夯實基礎,如圖1所示,左邊版塊設置的是大數據基礎技術棧中常用組件的學習環節,包括Hadoop,Hive,Hbase及Spark等內容。每個知識點的學習過程中均依據任務驅動的指導思想,通過案例導向的方式引導學生完成學習和實踐。其中Hadoop模塊要求學生利用掌握HDFS和MapReduce進行數據分析;Hive模塊要求學生利用Hive進行數據存儲和分析;Spark模塊訓練學生利用RDD和Dataframe進行數據分析,并引導學生利用Spark streaming解決流式計算問題。圖1右邊設置的是綜合案例模塊,該模塊提供了百萬至千萬級規模的數據集。學生可以根據對基礎知識模塊的掌握情況自行設計解決方案進行數據預處理分析,并對分析結果進行可視化。同時該模塊提供了擴展內容,要求學生嘗試利用機器學習中的常用算法對給定數據集進行分類或預測。綜合案例1為離線計算任務,要求對Ebay拍賣數據進行處理、分析及預測,并對分析結果進行可視化。綜合案例2為流式計算任務,要求從農產品交易市場網站上爬取數據,采用Spark streaming對采集的數據進行清洗、轉換及存儲,并采用時序分析模型對蔬菜價格進行預測。綜合案例3為離線計算任務,要求對運營商用戶故障數據進行處理,采用聚類算法對用戶進行劃分,并對故障分布情況進行可視化。綜合案例4為數據倉庫建設任務,要求對電商平臺的訂單、支付數據以及用戶行為數據進行ETL操作并利用數據倉庫建模方法進行分層建模。通過實踐訓練環節,學生能夠掌握大數據分析處理的工作流程,能利用Hadoop平臺進行大數據存儲與處理,利用Hive實現數據的分析處理,能夠在Spark平臺上進行大規模數據處理的算法設計,初步具備了大數據分析處理的工程實踐能力。

Fig.1 Curriculum knowledge system圖1 課程知識體系
在確定課程知識體系和教學內容的基礎上融合華為云的技術與資源,以“案例導向,競賽驅動”為核心思想,從課程思政、平臺建設、教學模式、課賽結合以及師資培養等方面進行了探索。
課程思政工作不能流于表面。課程組在授課過程中注重列舉相應領域的國產軟硬件平臺,比較其功能差異,并指出部分國產軟硬件的某些關鍵指標已經處于國際領先水平,例如開源HDFS與華為OBS存儲、MySQL與華為OpenGauss、Centos與華為OpenEuler。通過比較國內外產品的性能優劣和應用場景,可以使學生正確認識到大數據領域的發展現狀,激發其學習熱情和投身大數據行業的使命感。
“工欲善其事,必先利其器”。經過不懈努力,目前課程組已可為學生提供兩個在線實驗平臺:2018年充分利用校內現有硬件資源,采用Docker和Kubernetes部署了本地大數據綜合實驗平臺;2020年引入華為云ECS主機為學生提供在線實驗平臺。基于兩個實驗平臺開展大數據類課程實踐和項目實踐,充分培養了學生的大數據專業技能和項目實踐創新能力,綜合素質全面提升。實驗平臺應具備良好的可擴展性,一方面是軟硬件資源的可擴展性,當需要滿足更多學生和課程同時在線使用時可增加服務器數量或提高現有服務器的內存和存儲資源;另一方面是可靈活對實驗項目和綜合實訓案例進行擴展和修改,也可根據需要加入新的實驗項目和實訓案例。
目前許多高校在校企共建課程方面進行了深度嘗試并取得了顯著效果[10-12],例如云計算與大數據綜合實踐課程已納入重慶郵電大學—華為“智能基座”項目的重點建設課程。課程組在充分調研華為云大數據服務的基礎上結合學校實際情況對課程教學大綱進行了梳理,并在教學過程中融入了華為云的部分教學資源和教學案例。在新冠疫情防控時期將課程遷移至華為云平臺上,保障了極端情況下教學活動的正常進行。此外,華為云學院也提供了大量在線學習課程,部分課程可作為該課程的課后補充學習資源。利用華為的云上大數據服務可以快速部署和驗證大數據解決方案,有利于學生采用大數據技術解決實際工程問題。
課程教學內容以企業真實場景和實際數據為基礎,主要圍繞“海量數據驅動、真實案例導向”的流程進行設計。通過實踐教學提升學生對大數據技術的理解及應用場景的認知,培養其分析能力和創新意識。如圖2所示,本文教學模式體現出循序漸進的思想,在教學過程中依托實驗指導書、在線視頻、源代碼等教學資源開展自學和課堂研討,分為基礎學習—課堂強化—實踐提高3個階段,其中第1階段在上課前公布給學生,使其通過自學完成;第2階段為正式上課階段,在課程上進行;第3階段為課后提高階段,通過設置開放性選題,利用華為大數據服務完成。

Fig.2 Three-stage blended teaching model圖2 三階段混合教學模式
本文教學模式秉承以學生為本、以能力培養為核心的教學理念,發揮學生的主觀能動性,在創新實驗部分由學生自主選擇實驗課題或自主擬定實驗課題,同時開展團隊協作模式共同擬定實驗方案、完成創新實驗內容并寫出總結報告。這種實踐教學模式激發了學生的學習熱情,調動了其積極性和主動性,提高了其動手能力以及分析和解決問題的能力,增強了其綜合素質和創新意識。
根據實踐教學的特點,以激發學生實驗興趣、提高實驗能力為目的,建立多元化實驗考核辦法,即根據不同層次、不同類型實驗采取不同的考核辦法。綜合設計類實驗成績評定主要參考項目的任務指標,通過答辯等形式進行考核,成績經過答辯小組審核后認定為相關實踐環節的學分。隨著大數據技術的發展和應用普及,相關科技競賽活動逐漸增多。各級政府及產業界舉辦了諸多算法程序和大數據方面的競賽,學校亦鼓勵學生參與相關科技競賽,指導其申報大學生創新創業訓練項目、大學生科研訓練計劃項目等,以此鍛煉其實踐創新能力。課程采取課賽結合的方式,鼓勵學生參加校內外大數據領域相關競賽,成績標準由課程組協商評定。例如,只要入圍省部級及以上競賽決賽即可認定成績為良以上,如果獲獎則認定成績為優。同時探索在校內建立開放的大數據基準測試平臺,為學生提供大數據在線測試環境,作為科技競賽校內選拔的基礎平臺。此外,重慶郵電大學計算機學院組建了“X-Data”大數據團隊,組織和引導學生參加大數據領域的各類高水平科技競賽,全面提升學生的大數據分析與處理能力。
由于大數據屬于新興專業,重慶郵電大學與許多地方院校一樣都面臨著大數據實踐類課程師資匱乏的問題。為了解決該類問題,一方面積極從國內外高校引進大數據相關專業高水平博士充實師資隊伍,另一方面重點挖掘內部潛力,每年都會派出2~3位教師參加高水平大數據師資培訓班,持續跟蹤大數據領域的技術發展,更新教師的知識體系并增強工程經驗的積累。借助“智能基座”項目,目前已經組織3批教師參加華為云的線上大數據培訓,課程組教師的專業能力和工程素養得到了全面提升。
重慶郵電大學通過一系列改革措施建立和完善了云計算與大數據綜合實踐課程教學體系和平臺,特別是疫情期間,學校利用自建實驗平臺和和華為云平臺克服一切困難完成了教學工作,教學質量得到了較好保障。
云計算與大數據綜合實踐課程自2019年開始采用自建實驗平臺開展教學活動,2020年開始嘗試在教學過程中融入華為云相關內容,在近3年的教學活動中不斷總結和改進,學生成績穩步增長,培養質量穩步提高。學生普遍反映經過該課程的學習初步掌握了大數據領域的專業知識,能夠靈活運用大數據工具對真實數據集進行分析和處理。近3年該課程成績如表1所示。

Table 1 Analysis of the grades of the last 3 years in this course表1 近3年課程成績
云計算與大數據綜合實踐課程共設置了5個考核目標,分別考察學生對基礎平臺、方案設計、數據分析、文獻檢索以及綜合工程實踐的掌握情況。每個課程目標基準值均為0.7,課程目標的達成度計算方式為:
式中,Ai表示第i個課程目標的達成度;和Si分別表示學生在課程目標i對應的現場檢查部分的實際平均分和滿分分值;為現場檢查部分所占權重,=0.7和Ri分別表示學生在課程目標i對應的報告部分的實際平均分和滿分分值;為報告部分所占權重=0.3。
如表2所示,近3年來各個指標點整體穩定增長,反映出學生的基礎技能和工程能力均得到了提高,特別是綜合工程能力這一指標的提升尤為顯著。

Table 2 Degree of achievement of the objectives of this course in the past 3 years表2 近3年本課程目標達成度
云計算與大數據綜合實踐課程積極組織學生參加各類國家級和省部級大數據類競賽,經過前期經驗摸索與積累,目前已經進入隊伍建設和競賽獲獎的良性循環。近3年共取得20余項大數據算法競賽全國冠軍,在中國高校計算機大賽(大數據挑戰賽)、阿里天池大數據競賽、全國高校大數據能力提升大賽等多個國家級比賽中取得優異成績,累計獲得150萬元獎金,在西南地區甚至全國范圍內具備一定影響力。對于未能進入知名企業實習的學生,參加大數據類科技競賽也是一個重要的實踐機會。
經過該課程的學習,學生的數據工程實踐能力得到明顯提升,大數據專業能力得到企業認可。不少優秀本科畢業生進入華為、阿里、字節跳動等頂級IT公司從事大數據開發、數據分析等專業性較強的技術工作,學生的專業素養得到用人單位好評;亦有多位在校本科生作為主力開發人員參與某知名電商大數據平臺的實際建設工作,并出色完成所承擔的任務。
培養學生的工程實踐能力是云計算與大數據綜合實踐課程始終堅持的重要目標。因此,本文在新工科建設背景下,以人才培養為導向,抓住與華為“智能基座”項目的合作機遇,充分培養與提升學生的大數據綜合實踐能力。下一步準備積極響應教育部倡導的“金課”計劃,充實課程資源,提升教學質量,探索將云計算與大數據綜合實踐課程建設為真正意義上的線上—線下混合式金課,同時繼續加強與行業內其他知名企業的校企合作和產學融合,建設課程經典案例,為社會培養優秀人才。同時繼續構建教學—實踐—競賽一體化教學體系,豐富教學形式和教學內容,激發學生學習興趣,引導其利用掌握的知識和技能解決實際項目問題。需要強調的是,大數據技術變革較快,如何保持課程內容的持續創新也是一個值得研究的問題,必須與時俱進、堅持不懈進行課程建設與改革工作。