張延宇, 李 偉
(河南大學 計算機與信息工程學院,河南 開封, 475004)
對教學過程和教學效果進行有效評價,及時向教師和學習者反饋教與學過程中的不足對于提升教學效果具有重要意義。學習效果的評價方式主要分為診斷性評價、形成性評價(過程性評價)和終結性評價;我國目前的評價方式以終結性評價為主[1]。終結性評價一般在學期結束時進行,以教師為評價主體,任課教師根據學生的卷面成績、實驗報告、平時作業、出勤率等因素,利用加權求和的方式對學習者的學習效果進行綜合評定。終結性評價存在以下弊端:①課程結束時評價一次,不能對教學的全過程進行動態評價,是一種靜態評價;②學期結束時教師和學生才確切知道教與學的效果,評價結果具有滯后性;③實驗報告和平時作業等驗收性成績主要依據提交的資料來評定,無法充分反映學習者的思維、能力等因素[2],評價結果具有片面性。
不同于終結性評價,形成性評價在教學全過程中,對教師的“教”和學習者的“學”進行跟蹤,從多維度及時對教學效果進行評價,向教師和學習者反饋評價結果,幫助教師提升教學效果,激發學習者的學習潛力[1]。近年來,越來越多的教育工作者對其進行了研究和實踐,在不同學科領域得到了廣泛應用[3~4]。特別是在工程教育專業認證的推動下,形成性評價得到了前所未有的重視。《工程教育認證通用標準解讀及使用指南》明確指出“對學生在整個學習過程中的表現進行跟蹤與評估,并通過形成性評價保證學生畢業時達到畢業要求”。
本文闡述了我們在河南大學自動化專業“計算機仿真”課程教學活動中開展形成性評價所做的研究和探索,重點從課程概況、評價目標、面臨的挑戰和解決辦法、評價效果等幾方面進行了論述。
“計算機仿真”課程是我校自動化專業本科生的專業選修課,開設于第3學期,48學時,2.5學分。該課程講授計算機建模、仿真的基本概念、方法、流程,重點講授計算機建模仿真常用工具Matlab的使用方法,同時以電路、模擬電子技術、信號與系統中的典型問題為例,進行仿真實踐練習。通過本課程的學習,學生具備以計算機為工具對復雜工程問題進行建模、仿真、分析的基本能力。2019-2020學年第1學期我校自動化專業共有2個班級開設此課程:18-4班自動化(一本,108人)、18級民生自動化(獨立學院,106人)。
我們在“計算機仿真”課程中引入形成性評價,希望達到以下4個目標:
(1)及時地對教和學全過程進行動態評估,發現教學過程的不足和學生學習的薄弱點,有針對性的改進;做到邊“教”“學”,邊評估,以評估結果來改進“教”“學”過程,構成閉環系統,做到評估的“全教學過程”、“全知識點”覆蓋。
(2)轉變學生課程綜合成績的評價方式,將成績評價貫穿于整個課程學習的全過程。采用形成性評價,通過期末考試、實驗報告、出勤率、隨堂測驗、章節測驗等多種方式進行評價,將評價活動貫穿于教學的全過程。
(3)以考促學。為避免學生平時懶散,考前突擊,考后“清零”的弊端,采用隨堂測驗的方式,每次上課前都對以前的知識點進行考核,考試完成后即刻反饋考試結果,并將考試結果計入最終綜合成績。從而督促學生積極主動地學習,將功夫用到平時。
(4)精準識別學生學習的難點和學習有困難的學生,做到精準教學、助學。利用形成性評價,多維度、全過程地對教學效果進行評價,及時了解學生對重難點的掌握情況,并識別出需要額外幫助的學生,從而做到因材施教、因人施教。
本節首先闡述在“計算機仿真”課程中實施形成性評價面臨的困難和挑戰;然后,給出了我們的解決辦法,重點闡述我們使用第三方平臺“智慧樹”實施形成性評價的經驗和心得。
根據物元概念[7],將普查績效評價指標體系的五個維度(準則層)定義為評價的主要因素Xi(i=1,2,…,5),將對應準則層下測評指標定義為第i項主要因素所屬的第j項次要因素Xij,相應的量值表示為xij(j=1,2,…,n),則待評價對象——普查績效的5維復合物元記為R5:
(1)教師工作量大。由于選課人數超過200人,大班授課,每次課前測驗后都需要教師花費大量的時間進行閱卷;另外,為了精準識別教學過程中的難點和學習有困難的學生需要對每個知識點的得分情況和學生的成績進行統計分析,這些工作大幅度地增加教師工作量。
(2)缺乏多維度的數據支撐,評價過程主觀性強,無法做到客觀、科學、全面的評價。從多維度采集能夠有效反映學生學習過程和學習效果的數據,基于數據并結合教師的經驗才能夠做到評價過程的客觀、科學、全面、有效。因此,需要采集學習過程的多維度數據。
(3)評價內容少,缺乏預測功能。傳統評價只能給出在過去的一段時間內,學生對已經學習過的知識和技能的掌握情況。但是,對于諸如“按照當前學習方式和效果,是否能夠順利通過期末考試,拿到學分”的問題無法給出預測。在我們所做的問卷調查中,92.9%的學生表示希望能有這種預測方法或模型。這也表明動態地對學生的期末考試結果進行預測也可以作為一種評價方法,并且更能激發學生學習的興趣和積極性。
為了解決上述挑戰,在學期剛開始時,面向選課的同學就學生接入互聯網的便捷性、途徑、目的、利用信息技術提升課堂效果的態度等問題進行了一次摸底調查。回收有效問卷177份,結果表明93.2%的學生可以隨時隨地接入互聯網;90.4%的學生主要通過手機接入互聯網。社交和視頻娛樂是他們接入互聯網的主要目的,兩者合占75.2%,查資料、輔助學習占19.2%,看網課占5.7%;85.9%的學生覺得應該對現有的教學手段進行升級,采用新型的信息技術提升課堂效果。
基于上述調查結果并結合實際情況,我們在授課過程中引入了第三方學分課程運營服務平臺——“智慧樹”。利用“智慧樹”輔助實施形成性評價,減輕教師的工作量,實現教學全過程、多維度的數據采集,為科學、及時、有效的形成性評價打下了堅實的基礎,解決了形成性評價實施面臨的難題。
1)基于“智慧樹”的形成性評價方法
智慧樹支持手機應用和瀏覽器兩種不同的接入方式。目前學生主要通過“智慧樹”手機應用“知到(學生版)”進行課程互動。選課學生通過身份認證后即可加入我們事先在“智慧樹”網站(www.zhihuishu.com)上建立的“計算機仿真”課程(課程編號:K787478),從而獲取教師發布的教學資源、進行課前測驗考試、在線提問、參與課堂互動等活動。教師在備課階段主要通過瀏覽器在計算機上實現學生管理、學習資源上傳、布置作業考試、監控學情數據、成績管理等操作;見面課階段,課堂互動則主要通過“知到(教師版)”來進行,通過“群聊”功能與學生互動,實現簽到、隨機點名、搶答、課堂答疑、投票等操作。教學過程中的各種學情數據和成績都由“智慧樹”自動搜集、統計,作為形成性評價的依據。
2)形成性考核

圖1 課前隨堂測驗成績分布圖
本次測驗主要考查學生對Matlab基本編程語法的掌握熟練程度,從圖1來看大部分學生掌握了相關知識;但分析具體題目的得分情況時發現不少學生對循環語句中continue語句的使用方法尚未掌握,本道題的得分率只有31%,點擊本題對應的“試題分析”按鈕,給出了本道題的詳細分析。在試題講解階段我們主要針對這個知識點進行回顧和講解。通過此種方式,我們可以精準識別學生學習的難點,有針對性地講解;同時也可以利用“作業批閱”里面的成績排序功能,精準識別學習有困難的同學,然后因人施教。一次測試完畢,成績自動歸檔,自動計算截止到當前的平時成績。
章節測驗主要在每個知識單元講解完畢后進行,隨堂測驗是“細粒度”的考核,章節測驗則是“階段性”的形成性考核。根據需要,試題類型除了選擇題、判斷題,還可以是填空題、簡答題、編程題和Simulink仿真題等。課堂內進行,每次30~45分鐘,一個學期3~5次,根據教學進度合理安排,但不易過頻,否則占用過多課內時間,不利于按時完成學期教學任務。受制于當前“智慧樹”的功能,編程題等無法自動閱卷的題型,由老師課下評閱,但成績匯總、統計、發布依舊由平臺自動完成。
3)學生學習結果預測
如前所述,在教學過程中對學生期末是否能夠通過課程測試進行預測也是一種有效的評價方式,不但能夠有效識別需要額外幫助的學生,而且還能激發學生學習的積極性。由于缺少歷史數據支撐,本輪授課過程中并沒有機會實踐這種形成性評價方式,但我們利用本輪“計算機仿真”授課過程中采集的數據建立了這種預測模型,并對這種預測模型的可行性和有效性進行了充分驗證。
在Matlab 2019a的環境下,利用DeepLearnToolbox -master工具箱建立了一個三層BP神經網絡預測模型,輸入層5個神經元,隱含層20個,輸出層1個。該模型根據學生學習過程中的實驗成績、測驗成績、出勤率、學習資源查看次數、下載次數來預測其期末總評成績及是否能夠通過期末課程測試(1:通過;0:不及格)。
為了訓練和測試模型,將每個班級的樣本數據以3:1的比例分成兩部分,其中75%的數據用于訓練預測模型,25%的數據用于測試模型的有效性。共進行了4種不同類型的實驗,其結果如表1所示。
實驗1和實驗2訓練所得模型相同,實驗3和實驗4訓練所得模型相同。每個模型的訓練數據和測試數據來源如表1所示。從預測精度來看,模型對同一來源的測試數據的預測精度略高于不同來源的測試數據,這是因為不同數據集蘊含的數據特征略有差異,同一數據來源的預測模型能更好地表征這種差異。

表1 實驗類別及預測精度
同時,利用18民生訓練數據訓練所得的模型,對兩種測試數據的預測精度均高于實驗1和實驗2中的模型,這可由18民生訓練數據中不及格的人數比18-4訓練數據中的人數多,訓練得到的模型更充分地表征了不及格類別的數據特征來解釋。
本文模型預測精度超過92%足以滿足形成性評價的需求。當然,利用深度學習等方法建立更加復雜的預測模型可以進一步提高預測精度,但這并非本文關注焦點。本文主要通過這種拋磚引玉的方式,驗證了利用成績預測作為形成性考核的一種輔助手段的可行性和有效性。
形成性評價在“計算機仿真”授課過程中受到了廣大師生的歡迎。學期末的專項調查問卷表明,97.2%的學生認為形成性評價能更好地反映其真實學業水平,91.8%的學生表示由于采用形成性評價他們在“計算機仿真”課程上花了更多的學習精力,達到了以考促學的目的。對比往年期末測試成績,實施形成性評價后,18民生自動化的“計算機仿真”課程平均成績提高2.43分,及格率提高了10.13%;盡管18-4的效果沒有這么顯著,但也具有明顯的積極作用。
對教師而言,借助“智慧樹”實施形成性評價,提高了評價的科學性、及時性,有助于精準識別教學難點和學習困難學生,提高教學效率。同時,也減輕了形成性評價中數據搜集的難度,助力工程教育專業認證的順利開展。
開展形成性評價,除了借助“智慧樹”平臺外,也可以借助雨課堂等其他模式。雨課堂直接將隨堂問題插入到課件中,不需要專門發布,更為靈活;但“智慧樹”的數據統計功能更為強大。目前,尚不存在盡善盡美的平臺,根據評價目的和形式,選擇最適合自己的即可。
本文以“計算機仿真”課程為例,闡述了我們在教學過程中實施形成性評價的目的、面臨的挑戰和解決辦法,總結了第三方平臺智慧樹在形成性評價中的作用,分析、驗證了利用預測模型對學生學業水平進行評價的可行性。本課程的形成性評價得到了教師和學生的一致認可,但尚需進一步完善,我們會在日后的教學活動中持續改進。