謝賢芬,古萬榮,王斌會
(1.暨南大學經濟學院,廣州 510632;2.華南農業大學數學與信息學院,廣州 510642;3.暨南大學管理學院,廣州 510642;4.暨南大學經濟管理實驗教學中心,廣州 510632)
近年來,隨著互聯網、大數據和云計算技術的興起,社會經濟生活各領域產生了海量的數據信息,例如國家經濟統計數據、社交網絡數據、新聞媒體數據、金融股票數據、多媒體數據(視頻、音頻、圖像)、工業企業數據等。海量數據蘊含著豐富而寶貴的信息,可以為國家經濟決策、社會輿情分析、新聞數據挖掘、商業智能決策、預警監控等提供重要的數據支撐與決策依據。在此環境下,數據挖掘作為最常用的數據分析手段在各個領域中得到了廣泛的應用。數據挖掘作為一門應用性很強的交叉學科,涉及的知識內容包括統計學、數據建模、分類、算法優化、模式識別及預測等。在數據挖掘相關課程的教學過程中,如何基于云平臺和大數據處理工具,科學地講授對多源海量數據進行有效的數據收集、數據處理及分析的過程,對提高學生利用數據挖掘技術處理各領域問題的能力具有重要的作用。
數據挖掘是一門發展前景廣闊的應用型課程,可應用于眾多領域,解決很多實際應用問題,因此很多高校在本科相關專業的人才培養方案中均開設了此課程,該課程的教學模式研究也得到了不少學者的關注。孫瑞娜[1]詳細分析了數據挖掘課程的教學現狀,認為主要有三個缺點:教學內容難,學生學習興趣不高;教學模式及教學資源單一;實踐教學較為欠缺。針對這三個問題提出了解決方案,認為需利用網絡資源及相關新信息技術提高學生對該課程的興趣,引導學生將數據挖掘方法進行應用,同時通過考核方式的改革,合理分配實踐教學與理論教學的學時,使兩者有機結合起來,達到更好的教學效果。同樣認為數據挖掘課程實踐部分欠缺的還有文獻[2],該文提出應針對不同的專業和學生進行不同的應用實踐設計,對不同學科的特點對課程進行定位,才能滿足社會實踐的具體需求。黃劍[3]提出了符合數據挖掘課程教學特點的任務驅動探究式教學模式,該教學模式以學生為主體,教師的作用主要是負責組織教學和布置任務,引導學生基于任務要求學習相關知識,從而提高學習的主動性。商俊燕[4]和高銘悅[5]都認為應采用以提高學生分析解決實際問題能力為目標的案例驅動教學模式,同樣強調了實踐教學的重要性,并且要基于學科特點及人才培養方案來制定案例。郭傳好[6]認為數據挖掘課程的教與學應能滿足社會的需求、學生的需求和學科專業的發展需求,從這三個需求出發,對該課程的教學內容、教學方法及考核方式等方面進行了深入探討,得到了一些提高教學質量的結論,如采用多元化的考評方式、考察學生的創新能力等,以此提升課程教學質量。
除了教學模式及教學方法的研究[7-9]之外,也有不少學者引入各種新教育技術手段對數據挖掘課程進行教學改革。白妮[10]將“微課”和“雨課堂”智慧教學平臺結合起來,對其從課前應用、課中應用及課后應用等多方面進行了分析。陳二陽和袁姜紅[11]深入研究翻轉課堂在實訓課程中的應用,解決了傳統課程中的教學角色單一的問題。同樣在教學過程中利用各類智慧教學平臺的文獻有文獻[12-17]。還有一些文獻是對人才培養模式進行改進,對數據挖掘課程中的數據思維能力培養方法進行了探索,王建新[18]以提高人才培養質量為目標,探討了數據挖掘課程中數據思維能力培養的特征及方式,詳細介紹了相應的教學方案和教學措施,說明了實踐教學效果。黃浩等人[19]從數據挖掘課程中存在的問題出發,探討了融合案例穿透教學、能力拓展比賽等的教學方法,從而提高學生的創新能力,提升學生將所學知識合理應用于實際問題的能力。
與前面文獻相比,本文的改進及創新之處在于,將混合式教學模型與MOOC、雨課堂結合起來,結合課程跨學科的特點,提出將課程教學內容與項目結合起來,形成“項目式驅動的案例教學方法”,解決實踐教學不足的問題,并對課程的考核和評價方式進行改革。這種方式可使學生了解學科前沿與社會發展需求動態,在提高學生的學習興趣及動手能力的同時,培養了學生的創造思維能力。教學改革實踐方面,以暨南大學公共選修課《數據挖掘與可視化》課程為例,針對該課程的教學實際狀況,嘗試線上線下混合式教學模式。這種混合式教學模式的應用實踐,進一步完善并推動了數據挖掘課程的教學改革,從而提高教學質量。
(1)基本概述
混合式教學(Blending Learning)的概念最早在20世紀90年代提出,經過二十多年的發展,這種教學模式得到了極大的提升及應用。混合式教學的演變過程分為三個階段[20]:第一個階段是從20世紀90年代到2006年,這一階段的側重點是信息技術的使用,主要是探討如何利用信息技術實現線上教學,嘗試將多種信息技術應用于各類課程的教學過程中;第二個階段是從2007年到2013年,在信息技術較成熟的基礎上,著重研究這種混合教學模式下的師生互動形式,主要探索了如何對教學模式進行改進,以提高學生自主學習的能力,以及加強教師與學生之間、學生與學生之間的溝通與團體協作;第三階段是從2014年至今的互聯網階段,這一階段的重點是將學生的親身體驗作為關注重點,整個教學理念以學生為主體,教師為主導,由教師引導學生進入學習體驗之中,引導方式可以是以任務的形式,也可以是以案例、項目、實驗等形式。因此,這一階段也衍生出多種教學方式,如虛擬仿真實驗教學、混合式一流課程教學,等等。
目前的混合式教學是在不摒棄傳統線下教學優勢的基礎上,充分利用數字化線上學習的長處,充分發揮教師監控教學過程的引導作用。在整個教學過程中,要充分體現學生作為主體的主動性和創造性,其特點主要有四個:第一,學生應具有較強的主動性。根據課程的培養方案和要求,建立學習資源豐富的網絡課程教學平臺。學生通過該平臺即可進行課程內容的自主學習。第二,學生應具有較大的學習興趣。課程資源的設計應能激發學生學習的興趣同時也要具有很強的應用性。第三,增加教師-學生及學生-學生之間的多元互動,良好的交流及互動是提升學生能力的一個基本條件。第四,具備監控學習過程的功能。學生在學習平臺上的瀏覽、學習、測試、發言、提問等情況都應記錄并保存下來,為進一步的教學改革提供數據支撐。
(2)線上教學方式的偏好性調查
2020年上半年由于受到新冠疫情的影響,很多高校的課程都采用線上教學的模式,并且是100%的課程內容都是線上完成,這無論是對教師還是學生無疑都是新的體驗和挑戰。為了了解師生對這種純線上教學模式的真實感受,這里以問卷調查的形式對這種線上教學模式進行了調研。總共得到的有效問卷數量是151份(其中,學生完成的問卷數是104份,教師完成的問卷數是47份)。這里主要針對以下三個問題進行線上教學的偏好性分析。
問題一:您是否愿意接受線上教學方式?
A.完全接受
B.愿意接受但需改進
C.一般
D.不接受
問題二:您認為百分之幾的線上教學學時數是合理的?
A.0%-10% B.10%-30%
C.30%-50% D.50%-80%
E.80%-100%
圖1及圖2是上述兩個問題的數據統計圖。從圖1可以看出,教師及學生對“您是否愿意接受線上教學方式”問題的看法上,大部分都是持贊同的觀點,大部分選擇的是“愿意接受但需改進”,排名第二的是“一般接受”,只有部分師生選擇的是“完全接受”和“不接受”。從圖2可以看出,在問題二的選擇上,無論是教師還是學生,絕大部分師生選擇的比重是介于10%-50%之間,即:線上教學學時數所占比重不高于傳統教學學時數。另外,沒有教師認為應接受100%的線上教學或傳統課堂教學。綜上所見,無論是教師還是學生,都偏向于傳統教學與線上教學相結合的混合教學模式。

圖1 問卷調查問題Q1的統計柱形圖

圖2 問卷調查問題Q2的統計柱形圖
這里,我們還收集了師生對線上教學的文字性看法,基于這些看法我們繪制了詞云圖,如圖3所示。不難看出,“注意力”、“更難”、“課堂”、“提問”、“互動”、“集中”、“隨堂”、“測試”等表達占據了詞云圖的絕大部分。從中可以看出,線上教學的幾個常見特征:學生注意力更難集中,師生互動的要求更高,課堂的提問及測試是互動的一個重要手段。僅次于這些高頻詞之后的還有“聽課”、“狀態”、“網絡”、“睡覺”、“錄播”等。這也表明了線上教學也不可避免存在著一些缺點,例如相比傳統教學教師更難了解學生的聽課狀態,無法判斷學生是否在睡覺;另外,線上教學會受到網絡狀態的影響,如教學軟件穩定性、寬帶等,因此部分學生要求對線上教學過程能夠進行錄制,以便課后可以通過回看視頻進行知識點復習。下面在進行混合式教學模式探索及實踐中,也將從這些方面進行分析,提出相應的解決方案。

圖3 師生對線上課程所提意見的詞云圖
(1)教學目標及混合式教學總框架
這里,以暨南大學公共選修課《數據挖掘與可視化》來說明整個教學改革的思路。該課程遵循學校的辦學定位要求,整個教學過程以學生為中心地位,課程將根據內招生及外招生的特點,因材施教,實施分類的課程結構、教學方式及評價標準,以提高教育教學的質量為最終目的。《數據挖掘與可視化》課程是在大數據及云平臺環境下,應用Python語言進行數據挖掘及實現可視化,是一門應用性極強的課程。本課程主要面向于非計算機專業,如互聯網傳媒相關專業、經濟管理相關專業,強調應用性和實戰性,也可以作為計算機專業或數據科學專業的基礎應用課程。
本課程通過常見的互聯網大數據應用,如新聞爬取與檢索、新聞推薦等綜合應用為需求,進而詳細講授基礎編程語法、回歸分析、決策分析、預測分析和結果可視化等應用理論模塊。學生通過本課程的學習,學生能夠掌握Python開發的基礎知識,并基于收集到的計量或計數數據進行數據挖掘分析,并將結果進行可視化。通過本課程的學習,使得學生能夠利用Python語言(開發平臺、基礎語法、模塊化設計)可以熟練掌握基本的大數據處理和挖掘,并為進一步的大數據應用打下基礎。
課程將結合慕課和各種數字化教學資源(如雨課堂),進行線上線下混合式教學應用,特別是2020年因新冠疫情的影響,線上教學方式在很大范圍內得到了實施,取得了較好的教學效果。根據該課程的知識內容安排,將30%的教學時間(即12個學時)實施學生線上自主學習,與線下教學(28個學時)有機結合起來開展混合式教學,探索在線課程與本校課堂教學相融合的混合式教學模式,促進教學改革。課程改革內容包括課程教學方式的改革、課程內容的改革、互動形式的改革、考核方式的改革等,形成新型的混合式教與學模型。
該課程的混合教學模式總框架如圖4所示。框架圖主要包括三大模塊:課程內容模塊、教學模式及案例教學模塊。

圖4 《數據挖掘與可視化》課程混合式教學模式框架圖
①課程內容模塊主要包括整個課程的知識內容,一共有10個章節,圖4還羅列了每個章節的學時分配數。從圖中可以看到,課程的總學時數是40個學時,第十章數據挖掘綜合案例的學時數最多,共10個學時數,占比為25%。這是因為案例教學是本課程的重點知識內容,目的在于提高學生應用數據挖掘方法解決實際應用問題能力。
②課程采用線上線下的混合教學模式。線下方式采用傳統的面授+上機(占比70%),線上方式是利用慕課+雨課堂教學工具(占比30%)。多元統計分析理論知識部分,通過慕課MOOC來完成。而其他線上教學功能通過雨課堂來實現,具體包括:課前預習、在線語音教學、視頻教學、課堂測試、課后測試、作業布置、互動交流及答疑等環節。其中,視頻教學功能可以通過雨課堂在PPT中加入視頻鏈接來實現,從而解決了第二節中提到的學生對回看教學視頻有需求的問題。
③第三個模塊是項目式驅動的案例教學模塊。由于該課是公共選修課,選課學生可能來自不同的專業,所學領域可能相差太遠。這里提出采用“項目式驅動的案例教學”方法,即學生通過與老師的科研教學項目結合起來,帶領并引導學生將課程中所學的數據挖掘方法與實際應用領域的數據分析相結合,讓學生能夠更好地理解其適用性,提高學生動手能力,實現教學任務和項目相結合的教學方式改革。
(2)教學資源建設
混合式教學模式下的教學資源建設,不同于傳統的教學模式,它既包括傳統教學中涉及的電子版/紙質版教學PPT,數據資源庫,還包括音頻教學資源、視頻教學資源、課堂測試題、課后測試題以及應用案例庫等新型教學資源。其中,應用案例庫的資源建設方面:除了收集相關數據之外,還要選擇模型方法,對數據進行建模和評判,以及數據挖掘結果的可視化。總而言之,教學資源建設主要包括以下幾個部分:
①構建多領域數據資源庫。包括社會運行數據、經濟金融高頻數據、互聯網數據、工業企業數據資源、新聞媒體數據等。
②方法模型庫。包括分類分析方法、隨機模擬方法、數據壓縮方法、聚類分析方法、多元線性相關與回歸、綜合評價法、時間序列預測等方法。
③教學過程及結果分析庫。對學生進行線上課程的各項結果進行分析。
④課堂測試題庫。建設與課程相關的測試題,包括課堂即時測試題及課后試卷兩部分,用以評價學生的課程學習效果,以及促進線上教學的師生互動。
⑤音頻視頻教學資源庫。采用慕課+雨課堂教學技術平臺,建成在線的教學資源。學生通過該平臺進行線上自主學習,學生通過PPT或PDF講義進行預習或課后復習的過程中,可以邊看邊聽。視頻教學資源的建設,學生更加可以直觀了解整個數據挖掘的流程,包括數據采集、處理、方法的實現、模型的判斷、預測及分析過程,極大增強學習的趣味性和學習的主動性,增進學生的創新思維、實踐動手與科學研究能力。
⑥應用案例庫。該資源庫的建設與數據資源庫的建設相對應,在與項目需求相結合的基礎上,本資源庫的建設既包括在社會經濟領域中的應用案例(如國家經濟發展的多因素分析、金融股票數據的預測),也包括工業企業數據的案例,也涉及互聯網領域及新聞媒體領域中的應用案例(如新冠疫情與民眾輿情的相關關系研究)、P2P網貸等,隨著學生專業類別的不斷增加,應用案例的范圍也越來越廣。
(1)學生主導的案例式教學模式
由于課程《數據挖掘與可視化》屬于公共選修課,主要面向非計算機專業,如經濟管理類專業(經濟學、金融學、統計學、工商管理、會計學、管理學),新聞媒體類專業(新聞學、傳播學、廣告學)等。不同專業的學生面向的研究領域不同,而他們的最終目的都是為了能夠利用課程所學的數據挖掘技術解決實際應用中的問題。因此,本課程提出采用“項目式驅動的案例教學模式”,在整個教學過程中與項目相結合,主要是指與學生專業知識領域相關的項目相結合。學生可以自主選擇以個人或小組的形式進行實際案例研究,不同專業的學生將結合實際應用背景,將基于Python的數據挖掘方法應用到案例分析中。項目驅動的案例式教學模式見圖5。

圖5 項目式驅動的案例教學模式
具體流程如下:
①學生可根據自身專業、項目需求、項目難度或案例研究對象的不同,以1~3人的形式自由組合形成小組。
②根據案例所依賴項目的實際需求,老師跟每個小組的成員確定數據挖掘分析任務,盡量保證每個小組的案例是不同的。這些案例可具有相同的原始數據,但需采用不同的數據挖掘分析方法。
③重視解決方法的過程性。即學生在解決實際問題和案例分析的過程中,重視使用方法和實踐過程的考核。
(2)案例資源“質”的提升方案
提升學生實踐能力最重要的手段之一是課程的案例教學,而案例的教學過程中,最重要的是案例的選取。通過參考教學大綱和教學目標,對教學案例進行精心設計,可以提高學生的分析能力,提高學生發現問題和解決問題的能力。根據《數據挖掘與可視化》課程的特點和相關知識內容,我們將案例劃分為四大類:可視化基礎案例、統計方法基礎案例、大數據應用案例、提升性教學案例,每一類均設計了多個專業的應用案例,具體見表1。

表1 案例資源的分類及子案例
①可視化基礎案例。這部分共包含4個子案例,涉及的專業有營銷學、經濟學、統計學、金融學等,知識點主要是描述性統計分析及各種可視化圖表的使用。
②統計方法基礎案例。這部分共包含5個子案例,涉及的專業有:新聞媒體類、經濟管理類、醫學類等專業。知識點有:相關分析、多元線性回歸分析、聚類分析、主成分分析、綜合評價法、方差分析、時間序列分析等。學生通過這些子案例的學習,可以深刻理解知識點是如何應用的。例如,通過子案例3,學生可以了解如何進行多因素方差分析,通過子案例4可以知道如何對時間序列數據進行預測分析。
③大數據應用案例。由于目前無論是經濟社會領域、醫學統計領域、還是新聞媒體領域等,產生的各類數據往往是數量龐大的。因此我們也設計了三個專門針對大數據應用領域的案例,涉及的知識點包括如何利用Python進行數據爬取,如何基于文本類數據(輿情、評論、新聞內容等)進行文本分析,并利用詞云圖等進行文本挖掘結果的可視化。
④提升型教學案例。這是屬于綜合提高型的案例教學,包括的知識點更為豐富,是更為復雜的應用案例。往往是用到前面案例涉及的多種方法,側重點是與項目緊密相關。
(3)考核及評價方式
本課程實踐教學內容較豐富,因此傳統的采用閉卷的考核方式不適用于本課程。這里結合課程教學的目的,從課堂互動、課后交流、案例研究三個方面設置考核點。考核內容包括:熟悉Python基本語法及可視化;重點掌握數據挖掘方法、模型構建及使用要點。
考核形式:
①案例分析:根據確定的案例分析任務,考核學生所學數據挖掘方法,考察學生進行案例分析及解決實際問題的能力,最終須提交案例研究報告,權重為50%。
②課堂在線測試:根據考核內容建立試題庫,要求學生課堂上利用云教學平臺在規定時間內進行在線測試,這里側重于對理論方法方面的測試,同時也考察學生的課堂學習效果,權重為30%。
③課后在線討論:利用教學平臺的討論板,教師在討論版塊開設討論主題,學生在規定時間內自行跟帖回復,根據回復質量給予參與討論的同學高低不同的獎勵分,權重為20%。
這里,以課程第七章的第三節內容(ARIMA模型及其在Python中的構建)為例,來說明整個課程的教學設計思路及實施流程。這一節的教學目的、重點難點、內容梗概及學時分配等信息如下:
教學目的是講授ARIMA模型及其Python實現。重點是ARIMA模型及其原理及相關時序模型的Python實現兩部分。通過這章節內容的學習,應能了解時間序列數據的定義,掌握ARIMA模型的原理及其構建。總的學時分配數是4個學時(線下2學時+線上2學時)。下面將介紹其具體實施過程以及取得的教學成效。
(1)教學實施過程
該案例的目的是使學生掌握時間序列預測分析方法,使學生能夠針對實際應用數據,建立預測模型及進行可視化,對模型的合理性及預測結果能進行正確的判斷。

圖6 教學實施過程
具體實施過程主要包括以下六個步驟:
①采用線上+線下的方式,介紹ARIMA方法的基本原理及實現。教學手段:學生通過慕課或雨課堂進行課前預習(PPT+語音教學);線下利用面授+上機的混合模式,1學時。
②以數字化、可視化展現為主要模擬場,對數據進行基本的描述性統計分析,并利用Python進行基礎數據的可視化。教學手段:面授+上機、課堂測試,形成Python操作步驟的在線視頻教學,2學時。
③介紹項目的背景,指導學生進行數據的收集工作。教學手段:線上指導及交流。
④建立ARIMA模型分析實際數據。教學手段:面授+上機,形成Python操作步驟的視頻在線教學,1學時。
⑤對實際應用數據進行預測分析,為該案例對應的項目解決方案提供依據。
⑥最后,教師引導學生對案例進行總結,同時對案例涉及的知識點進行考核。
(2)教學成效
本章節的教與學過程中,豐富的應用案例吸引了學生的注意力,提高了學生課堂學習的興趣。將案例融合到ARIMA時間序列算法的講授中,增強了線上教學的效果。具體而言,利用雨課堂課前預習,課中互動,課后作業等層面的功能,極大幫助教師分析課程數據,量化分析學生的學習情況,實現了精準教學。針對線上教學的優勢及缺陷,由于疫情的影響,最近一期的課程教學全是在線教學,最大的缺陷是比傳統教學更難掌握學生的課堂情況,但可通過雨課堂的考勤記錄、隨機提問、課堂測試、彈屏等方式與學生進行互動,屏幕后的學生發言提問更為積極踴躍,通過課中及課后與同學們的交流,可以更加了解學生的學習情況,學生對應用案例教學的接受程度更高。總體而言,學生樂意接受這種新的教學模式,同時也實現了邊教學邊考核,教學效果較好。
本文對線上線下混合式教學的教學方法、教學手段、實踐教學及考核方式等內容進行了詳細介紹,從《數據挖掘與可視化》課程的實際教學改革中進行了分析。特別是以“項目式驅動的教學案例”的教學手段,提高學生的實踐教學能力,達到較好的教學成效。具體而言,主要包括以下幾個方面:
(1)傳統教學模式與線上教學密切結合的生動化課程。在理論學習方面,在采用原有的教學模式的基礎上,利用慕課+雨課堂進行知識點教學,提高學生自主學習的能力;在實際應用方面,采用“項目式驅動的案例教學”方式。通過使用多媒體設計生動的經濟運行案例教學課件,包括如何在云端實現數據的輸入輸出、可視化、探索性分析、預測分析和數據質量管理等。通過項目式案例驅動的教學方案,激發學生的學習主動性和興趣性,增強學生與學生之間、學生與教師之間的良性互動和溝通。
(2)將課程教學內容與項目結合起來,可使學生了解學科前沿與社會發展需求動態。課堂上通過內容豐富的多領域案例教學資源,引導學生從項目需求出發去發現問題、分析問題,從而解決問題。
(3)由于教學模式的多樣化,與之相對應的考核方式也應是多樣化的,案例教學的實施也促成了“邊教學邊考核”的目標。本文提出采用多元化考核評價,教學過程材料完整,教學數據齊全,過程可回溯,診斷改進積極有效。