羅國濤,余 紅
(成都東軟學院 計算機與軟件學院,四川 成都 611844)
“大數據處理”是數據科學與大數據技術,以及信息工程的專業必修課程。該課程主要讓學生掌握基于Hadoop技術的HDFS、MapReduce、Hive、Flume及Sqoop等組件,以解決海量數據的分布式存儲、分布式查詢統計分析及大數據應用等問題。該課程目前采用的是線下課堂教學,學生被動接受知識,不能很好地激發學生學習知識的主觀能動性,限制其對于重要知識點的理解和掌握、師生互動較弱、學生學習積極性及動手操作解決實際問題的能力有待提高,對于其創新能力的培養也產生了一定影響。因此,對該課程進行教學改革勢在必行。本校使用的教輔平臺是傳智教育研發的一體化教學平臺,該平臺主要功能包括教師線上備課、布置教學內容、簽到、發布作業、考試等教學任務,學生進行在線學習、課后輔導、課外知識學習等內容。因此,本課題按照“金課”高階性、創新性、挑戰度的標準,采用基于高校教輔平臺的線上線下混合式教學對該門課程進行教學改革與實踐。
“大數據處理”課程通過Hadoop 安裝配置、HDFS、MapReduce、Hive、Flume、Sqoop,以及大數據的處理與分析等理論學習與實驗,采用理論與項目訓練相結合的方式和線上線下混合式教學相結合的方法,使學生能夠搭建Hadoop集群,能夠采用HDFS 技術進行海量數據存儲,并能夠通過HDFS Shell 命令和JavaAPI 對分布式文件系統進行訪問操作;能夠采用MapReduce相關算法對不同大數據問題進行處理;能夠利用Hive技術對海量數據進行統計分析;能夠利用Flume、Sqoop 采集與遷移數據。同時,具有大數據工程師的角色責任與職業道德規范;具有較強的大數據算法設計與分析能力;運用大數據相關技術解決實際問題的能力。
2018年教育部發布《關于狠抓新時代全國高等學校本科教育工作會議精神落實的通知》,提出全面整頓本科教學秩序,淘汰“水課”、打造“金課”。“水課”是低階、陳舊的課程,教師不用心、學生不走心。“金課”要求課程有“兩性一度”,即高階性、創新性和挑戰度。其中“高階性”要培養學生解決復雜問題的綜合能力和高級思維;“創新性”是指課程內容要反映前沿性和時代性,教學形式呈現先進性和互動性,學習結果具有探究性和個性化;“挑戰度”是指課程有一定難度,需要跳一跳才能夠得著。本課題按照“金課”的標準對“大數據處理”課程教學內容和方法進行改革。“大數據處理”課程主要講解基于Hadoop的分布式計算平臺中,各個組件如何利用計算機集群處理海量數據問題,為了讓課程具有高階性、創新性和挑戰度,課程除了讓學生掌握單詞統計、TopN算法及單表關聯算法之外,還增加了多表關聯及倒排索引等算法的應用。為了提高學生解決綜合大數據問題的能力,課程引入了乘用車輛和商用車輛銷售數據分析項目,以及增加Mysql和Web服務器等內容完成推薦系統項目。
在教學方法方面,線上教學采用任務驅動法。學生在教師的幫助下,緊緊圍繞共同的任務活動中心,在強烈的問題動機的驅動下進行自主探索和互動協作學習。而線下課堂教學中主要采用講授教學法、小組教學法、翻轉課堂、項目教學法等多種教學方法。通過線上線下多種教學方法實施,改變學生的學習狀態,使學生主動建構探究、實踐、思考、運用、解決,形成高智慧學習體系。
“大數據處理”課程傳統的授課方式采用大班授課、“師講生聽”的教學模式,難以實現對學生個性化培養及高階能力培養的目標。因此,有必要采用一種新型教學模式和方法來提高本門課程的教學質量。本課程采用高校教輔平臺提供的慕課堂來實現線上線下混合式教學。混合式教學的形式分為在線學習和線下課堂講授,其中在線學習時教師主要根據學習平臺在線上布置作業,對學生的學習情況和作業完成情況進行監督,并根據完成情況通過在線學習平臺或者釘釘與學生交流溝通,對學生遇到的問題進行線上答疑和討論;同時,進行單元測試檢測學生階段性學習效果,并對檢測的結果進行統計分析,根據分析結果有針對性地進行輔導或者調整教學方案。而學生在在線學習階段,可以根據教師布置的學習任務在線觀看教學視頻,遇到問題及時在線進行交流溝通,可以將問題發到討論群,大家一起討論學習;除此之外,學生在線完成教師布置的作業、進行在線測試或者在線復習課程。在線下授課中,將課程教學分為課前、課中和課后三部分。學生在課前,根據教師布置的學習任務,依托教材和慕課,進行知識點自主學習,根據學習任務要求制作PPT,為翻轉課堂做好準備;同時,整理學習中遇到的問題便于課中進行討論。而教師在線下授課前,利用系統平臺的技術支持,通過了解學生在線學習進度、學生作業的完成情況及搜集整理的問題,及時調整面對面講授重點,并優化教學設計。在課中,首先,學生以組為單位提出在線預習時遇到的問題,教師根據學生提出的問題進行重點講解或者單獨輔導答疑。其次,教師以組為單位隨機抽取學生對線上所學內容進行講解和成果展示,教師點評并對重點和難點問題進行講解,對學生講課情況做好記錄,作為平時成績的一部分。另外,如果課中內容是實訓或者項目開發,學生需要完成實訓內容和實訓報告或者項目開發任務。最后,教師根據授課計劃講解新課內容。課后教師布置線下和線上學習任務,并監督學生完成。學生在課后,需要完成線上作業或者線上測試,以及完成實訓報告或者項目開發,并制作項目答辯PPT進行答辯等。通過線上線下混合式教學,為學生提供主動學習機會,促進學生深入思考,真正實現以學生為中心的分層次教學、個性化教學。
在“大數據處理”課程線上線下混合式教學設計中,特別要注意學生線上學習內容和教師線下課堂講授的內容連貫性。同時,要避免線下課堂的講授只是簡單地將線上視頻內容重復講解,要對線上學習和線下課堂講授內容以及活動環節進行精心設計。如果線上學習內容和線下課堂教授的內容比較簡單,線上和線下可以分開設計,如CentOS安裝配置、Hadoop的偽分布式和完全分布式安裝配置操作比較多且復雜,可以安排線上學習,學生可以反復觀看視頻,從而解決大數據環境配置問題;而Hadoop體系結構屬于理論講解,可以對其安排線下講解,但在線下課堂授課之前,教師需要對線上學習情況進行點評總結,對上節課重點和難點進行回顧,解答學生提出的疑問,然后再開始講解新課。如果有些知識點比較重要且困難,如MapReduce中的倒排索引算法,該算法的設計思路及算法的代碼實現比較復雜難理解,可以將該知識點設計線上學習1學時,線下學習2學時。其中線上學習通過觀看視頻、完成線上作業和在線交流進行,主要目的是對該知識點有初步的了解,為線下作為“小老師”講解該知識點做好準備。而線下課堂講授中,授課教師將學生分組,每組4~6 名,隨機抽取某一組的1 名學生講解倒排索引算法的設計思路,該組其他學生可以補充。再隨機抽取另外一組的1名學生講解倒排索引的Mapper類中map函數、Combiner類中的reduce函數,以及Reduce類中的reduce函數的實現過程并展示成果,該組其他學生可以補充。最后再隨機抽取其他小組的1名學生對前面2組學生的講解進行點評,指出優缺點和自己需要改進的地方,學生講解完畢后教師對該算法重點和難點進行講解并總結。通過線上和線下相結合,線下采用小組教學法、翻轉課堂、項目教學法等,以學生為中心,促進學生個性化學習。學生從知識的被動接受者轉變為知識建構的主動參與者,學生可根據自身情況來安排和控制自己的學習。線下授課中,學生將線上自學過程中遇到的問題與教師和同學進行有針對性地交流討論,這也與建構主義學習觀提倡的在解決問題中學習的思想不謀而合。通過線上和線下學習,學生的自學能力和動手操作解決大數據問題的能力得到提高,同時,學生的語言表達能力、協作能力也得到提高,個性得到發展,創新精神得到培養。
教學評價需要由教得怎么樣向學生學得怎么樣轉變。基于混合式教學的過程性評價要以促進學生發展為宗旨,采用形成性評價。形成性評價是一個動態的評價過程,該過程包括學生線上學習的態度、學習的方法、學習的效果,以及線下課堂表現、學習策略、合作精神及學生學習過程中所產生的情感。本課程過程性評價包括形成性考核和終結性考核。形成性和終結性考核各占總成績的50%。在形成性考核中,特別是在線下授課中,既要考核學生的學習態度,也要考核學生參與課堂提問、回答問題、課堂作業、課堂討論、團隊協作交流等課堂表現;也要考查學生線下以組為單位參與綜合性大數據項目的需求分析、設計、編碼實現、答辯PPT制作及現場答辯等內容,從而考查學生運用大數據處理理論知識、解決大數據綜合性問題的能力。學生線上學習主要考查學生的自學能力,主要考核內容包括線上視頻學習、線上作業、期中測試及在線討論等內容。在終結性考核中,主要考核學生對該課程理論知識的掌握情況。對學生線上和線下綜合性評價的主要目的是激勵學生主動學習,產生自信心和成就感,調動學生的學習積極性和創新性,從而形成繼續學習的動力。
為了提高課堂教學效果及學生的學習效率,“大數據處理”課程采用了傳智教育的高校教輔平臺和釘釘在線答疑、釘釘在線直播工具。在線上線下混合式教學過程中,利用高校教輔平臺在線上發表學習視頻,學生根據發布視頻進行線上學習,在學習過程中,如果有疑問,可以通過釘釘在線討論和答疑,如果學生遇到的問題比較多或者對某個知識點提出問題的學生比較多,教師則通過釘釘在線直播工具對所有學生統一講解;對于比較復雜的大數據環境配置或者較為復雜的大數據算法解決大數據問題,學生可以通過釘釘直播回放反復學習,從而提高學習效率。由于學生學習的差異性,為了滿足不同學生的學習需求,按照“金課”標準,讓學生從“淺層學習”走向“深層學習”,可以采用高校教輔平臺提供的線上討論功能。教師針對某個知識點發布有一定難度的主題,如學生在分布式文件系統中采用JavaAPI完成文件的上傳與下載功能后,教師在線上發布主題要求學生通過HDFS JavaAPI獲取分布式文件系統某個文件的節點信息、塊信息及文件拷貝的份數等內容,這就要求學生自己或者團隊查資料學習,并上機調試成功,隨后將結果發布到討論區。這樣既鍛煉了學生的自學能力,又增強了學生學習大數據的勇氣和信心,同時對成績稍微差一點的學生通過在討論區查看發布的答案從中學習并取得進步,從而帶動整體學生學習效果的提升。
TOPCARES-CDIO是成都東軟學院借鑒CDIO工程教育模式,創造性地將CDIO中國化和實際化的一種工程教育模式。該模式重點培養學生的工程環境適應能力與項目實施能力。在課程教學實施中,將項目分為一級、二級、三級、四級和五級項目。其中一級項目是包含本專業主要核心課程和能力要求的綜合項目;二級項目是課程群項目;三級項目是為達到該門課程能力目標而設計的項目;四級項目是該門課程兩個以上單元組合而成的項目;五級項目是單元項目。在“大數據處理”課程實踐教學中將項目分為三級、四級、五級項目,并在形成性考核中將四級、五級項目以實驗形式進行考核,三級項目單獨進行考核。通過該門課程的三級、四級、五級項目將專業知識與項目背景相結合,從而培養學生的大數據綜合應用開發能力,大數據算法編程能力及團隊協作能力。
本課題基于“金課”背景對“大數據處理”課程線上線下混合式教學內容和方法、教學模式、教學設計,以及過程性評價進行研究與實踐。在線上線下混合式教學設計與實施中,線上學習資源準備尤為重要,如果在線平臺提供了課程的慕課資源,特別是視頻資源,教師需要在課前熟悉每一個視頻的內容,并將線上視頻內容與線下課堂教學內容進行有效銜接,從而保證學生學習的質量與效果。在線下課堂授課中,將課堂分為課前、課中和課后三個部分,教師根據“金課”標準精心設計課堂活動,既要滿足普通學生基本知識的學習與掌握,又需要設計有一定高度、難度和挑戰度的內容以滿足優秀學生的學習需要,從而使學生能夠利用所學專業知識解決大數據相關問題,提高課堂教學質量。如何進一步提高在線資源建設質量,優化線上線下課堂活動,豐富“大數據處理”課程項目案例,提升學習廣度和深度,將是以后課程建設研究的重點。