于興隆,張小志,張宏偉,王泊遠
(1.河北科技工程職業技術大學,河北 邢臺 054035;2.De Anza College,California,USA)
2018 年,教育部出臺的《教育信息化2.0 行動計劃》首次明確提出了智慧教育的發展目標,運用大數據技術與人工智能促進教育的改革與發展成為了新的趨勢。2020 年席卷全球的新冠疫情,更是打破了傳統的教育模式,在線學習已經成為一種常態模式,因此產生了大量在線學習行為數據,從海量數據中挖掘出有價值的信息成為研究熱點。
目前的一些在線課程學情分析方法[1-5],更多的是基于學生的在線學習行為進行的分析與挖掘,對于高職計算機教育來說,不同于其他類在線課程學習,計算機類編程課程具有一定的編程實踐特性,強調學生在掌握基礎理論基礎上的編程實踐。目前,在高職院校中,計算機編程課堂仍然在沿用傳統的課堂模式進行教學,教學模式相對固定,教師較難掌握學生的編程進度和問題所在,學生具有一定的畏難情緒,缺乏輔助的階梯。如何將學生的編程行為和過程數據收集并進行分析挖掘,判斷當前課程的實踐難點,幫助教師掌握課堂學情,將是一項有意義的研究。針對計算機類編程課程在線學習,Sándor Király[6]等人針對Java 編程課程,提出了一種基于Java 單元測試框架的代碼提交自動分級的技術,來評估學生提交代碼的質量;Efrat Vinker1[7]等人,通過對學生在線編程行為分析挖掘進行建模來預測學生在線學習編程中的難點;Hagit Gabba[8]等人分析了Python 在線編程課程中學習者的數據,論證了在線編程自動反饋系統對課程參與度與學習效果的提升作用。上述研究對在線學習中編程行為分析進行了深入探討,具有很強的參考價值。
但是,當前研究仍需進一步深化,要重點解決以下問題:通過挖掘在線學習環境的數據,掌握學習者的特點,構建信息化系統進行學情的診斷和預警。為此,我們針對高等職業教育人工智能專業核心課程進行了課程優化實踐,根據企業的實際工作技能需求,構建了五維能力模型,來刻畫學生技能提升情況,并根據在線平臺學習數據進行了量化;開發了在線學習平臺ANNsHub,整合了課程學習、在線編程等功能;并設計了在線學情可視化功能,幫助教師和學生即時獲取當前的學習情況,將在線學習行為和結果進行量化評估,為教師教學實施提供便利,從而可以利用在線學習平臺對大學生學習習慣進行數據化呈現行為診斷,達到學習習慣分析、學業干預的目的。
依據崗位需求,明確五維技能。通過調研計算機軟件行業崗位及工作環節,確定勝任崗位所需理論認知、實踐編程、信息素養、專業溝通及協作組織五項技能。在教學中對應學習新知能力、實踐新知能力、使用專業術語溝通能力以及團隊合作中的統籌計劃能力。
借助信息手段,自動收集評價。構建的ANNsHub 在線學習平臺的測試題、代碼匹配、模型打榜等自動打分結果,經API 接口錄入評價系統,對應理論認知和實踐編程能力評價。教師、企業和學生的人工評價通過騰訊文檔掃碼錄入評價系統,對應信息素養、專業溝通和團結協作能力評價。
其中,代碼匹配功能可以對提交的作業代碼內容進行自動匹配評分評級,不同版本間對比效果如圖1所示。在模型打榜功能模塊,教師在平臺設置F1-值、RMSE、AUC 等評測腳本,可自動評估模型準確率,平臺根據答案文件、評測腳本,自動評估作業得分;學生根據教師提供的訓練集進行模型訓練,提交模型文件作業。進行作業評估時,平臺將運行模型,預測測試集結果(答案文件),并據此預測結果作為作業評分。

圖1 代碼匹配功能演示圖
針對神經網絡模型開發課程,我們設計并開發了ANNsHub 在線學習平臺,旨在幫助學生建立深度學習模型開發思維,減少了課堂上在編碼和環境配置過程中出現的工程問題和時間花費,并將課程相關的多媒體學習材料納入平臺,以促進按需自我學習。ANNSHub 主要由五個模塊組成(圖2),如下:

圖2 系統框架
課程管理模塊。該模塊用于創建課程、添加課程內容(如多媒體文件、數據集、項目和課程作業)、創建和編輯基于jupyter notebook[9]的課件以及管理課程作業,在線平臺界面如圖3 所示。

圖3 在線學習平臺
組織管理模塊。此模塊用于幫助系統管理員管理學生、教師和學習組,明確訪問權限,將不同的計算資源分配給不同的組,并管理鏡像環境。
計算資源分配模塊?;贙ubernetes[10]技術框架搭建的計算資源分配模塊,可用于容器化應用程序的自動化部署、擴展和管理,可以為授權用戶提供一個在線的Python 編程工作區,學生在線編程代碼提交任務,在定制的工作區就可以分配計算資源并產生結果。
模型組件模塊。該模塊包含了神經網絡模型開發所需的核心功能,包括分析工具、數據管理、模型管理和算法庫等,允許授權用戶上傳數據集、導入Python 包和執行模型訓練評估等任務。
學情分析評價模塊。該模塊數據來自學生在在線學習平臺產生的行為數據,具體包括表1 中來自ANNsHub 和騰訊文檔2 個平臺7 個維度的數據情況、智能評價系統,依據學習目標設定和任務側重點,靈活設置權重,形成五維技能個性化評價數據。在此基礎上,進行智能分析,使用數據可視化技術Echarts[11]生成技能提升趨勢和增量評價圖表,數據可視化分析工具的另外一個核心能力指標,在于其可以支持的數據量級以及在大數據場景下的性能表現,為了實現大數據下的秒級響應,組件選型上,選擇了Apache Doris[12]作為本地模式下的OLAP 數據引擎,Doris 屬于MPP 分析型數據庫產品,僅需秒級甚至毫秒級響應時間即可獲得海量數據下的查詢結果,有效地支持實時數據分析、交互式數據分析等多種需求場景。Doris 的分布式架構非常簡潔,易于運維,并且可以支持10PB 以上的超大數據集。在線展示并發布,形成“評價-學情-反思-措施”快速迭代,促進“教”“學”雙方即時診改;系統實現了學生個人、學習小組和班級三個層面的學情分析與評價,呈現效果如圖4 所示。

圖4 學生在線學習學情分析評價頁面

圖5 三級編程輔助體系

表1 五維能力評估數據來源對應關系
基于heywhale[13]平臺通過二次開發,構建在線編程學習三級編程輔助體系,克服學生編程畏難情緒,提升獨立實踐能力。課程前期使用第一級“代碼積木”,基于Canvas 技術的算法組件、工作流模板,拖拽搭建可視化的分析流程實現組裝式編程,梳理整體結構;基于模塊化編程思想,在學習的中期使用第二級“代碼片段”實現修正式編程,側重關鍵代碼學習熟練;學習的后期使用第三級“知識庫”實現自主編程,編碼過程實現圖文混編,結果可展示可分享。幫助學生克服對編程從零開始的畏難情緒,迅速提升獨立編程實踐技能。
教學設計環節,教師可依據教學目標以及當前系統學情評價情況設定課程任務評價側重點,靈活設置權重,形成五維技能個性化評價數據,體現出不同課程環節對學生能力的培養側重;基于上一次課在線編程任務完成情況,教師可快速獲取學生們編程上的問題短板,從而可以針對性開展編程任務設置以及個性化的編程輔導。
通過課程教學實踐,學生借助三級編程輔助體系,編程學習從易到難,從整體程序流程搭建到具體代碼編寫,可有效幫助漸次提升模型開發能力,培養計算機程序設計思維。評價數據反映,自主編程能力和編程效率顯著提升,95%學生成績合格,35%學生成績優秀,85%學生均有超過5%以上的增值成長,學習目標高效達成。通過一個學期的課程實施表明該系統在計算機類編程課教學實施上具有一定的模式推廣價值。
本項目使用HP LoadRunner 測試工具對系統進行測試,軟硬件測試環境如表2 所示。
在測試過程中,確保系統測試的有效性及正確性,測試組將采用加工合成過的真實數據。見表3。
本文針對高等職業教育人工智能專業核心課程進行了課程優化實踐,構建了五維能力模型,設計并開發了在線學習平臺ANNsHub,設計了學情可視化分析功能,幫助教師和學生即時獲取當前的學習情況,為教師教學實施提供便利,從而可以利用在線學習平臺對大學生學習習慣進行數據化呈現行為診斷,達到學習習慣分析、學業干預的目的。
在線教育平臺的教學和平臺管理可以不斷優化,為學習者提供個性化的教學服務,從而促進學習者的個人發展。下一步研究重點包括,如何確保系統獲得數據的安全,保護學習者學習數據的隱私;如何設計更合理的系統功能模塊,獲取更多的學習數據,融入多源數據進行學習分析研究。