唐小燕,李建新
(常州信息職業技術學院,江蘇 常州 213164)
在“智慧教育”的背景下,教育要尋求以信息技術為支撐的教育新理念與新模式[1]。教育信息化包含了一系列的目標、價值觀念、技術規范以及應用手段等內容,需要各種各樣的信息化教學應用系統作為支撐,促進教學文檔數據化、評價反饋及時化。數字化的教學資源數據是所有這些應用系統的基礎。[2]
教學文檔數據化是在智慧教育環境下必需的一種新型文檔數據呈現方式,借助強大的信息技術將靜態孤立的文檔數據動態關聯起來進行分析,不僅能有效提高教學文檔管理安全性、有效性,還可以極大提高數據的利用率,通過進一步挖掘教學文檔的價值,幫助洞察學生的學習行為特征,優化教學管理手段,調整教學管理策略,充分發揮教學文檔數據化的優勢,為學校教育教學及相關管理工作提供更加有力的支持。
不少高職院校每個學期結束時,教師要整理一系列紙質教學文檔提交,一般包括記分冊、成績分析表和課程小結等文檔。面對海量教學文檔數據,如何選擇合適的數據采集和分析方法,已成為教學數據挖掘和價值分析工作面對的巨大挑戰。教學文檔數據化,其核心內容是通過文檔信息資源的數字化和文檔管理過程的網絡化,對教學過程中產生的各類信息進行存儲、加工、檢索、傳輸、共享,提高教學文檔管理的效率,為教學管理工作提供即時高效服務。教學文檔價值分析是指利用文本挖掘等相關技術對教學文檔相關內容進行提取和分析,并借助可視化工具直觀呈現分析結果,提高教學文檔的數據利用效率,為教學大數據分析指導教學等工作奠定基礎。
隨著信息技術的不斷發展與大數據時代的來臨,信息資源的數字化轉型已成為高校目前的重要任務之一,教學文檔資源的數字化建設無疑是其中重要的一環。目前教學文檔信息資源總體上存在碎片化、用戶對數據價值認識較低、文檔數據間的相關性難以發現、文檔資源整合不足等問題,[3]具體問題包含以下三個方面。
從教學管理工作角度來說,學期末教師工作比較繁瑣,紙質教學資料的準備和打印通常需要耗費很多時間,有時甚至出現排隊打印的情況。此外,人工收集整理紙質文檔,領導逐級審核文檔時,都受時空的限制,造成工作效率低下。面對增長迅速、來源多樣的海量教學數據,人工收集與處理數據愈發變得不現實。
從教學決策者角度來說,統計在孤立文檔中的成績數據和教師填寫的考試結果分析、教學效果評價和教學改進措施等文字,缺少高視角的整合關聯分析,信息未得到充分利用,不支持多維度的數據價值分析展示,很難起到小結改進教學的效果,為教學分析決策支撐功能有限。
目前,一些教學文檔的數據分析大都停留在靜態的數值統計層面,對文本的動態主題發現、不同數據隨時間的價值變化、局部數據變化對全部數據的影響和貢獻未發現。面對海量的教學文檔數據,往往需要進行一定的探索才能發現其中蘊含的價值。[4]從系統開發應用角度來說,這些文檔完全可以通過在線系統進行提交管理,充分發揮信息化給教學管理帶來的便利,為后期數據自動統計分析和挖掘做好數據準備。
信息技術的發展為教學文檔數據化和價值分析提供了技術可能,教學文檔數據化管理從根本上變更了傳統的組織驅動模式,在解除文檔管理時空限制的同時,充分利用數據資源,極大提升教學文檔的利用效率,為教學與管理工作改進提供數字依據,有助于提升整個院校教學管理的信息化水平。
本文構建一個教學文檔數據化及價值分析體系,集教學文檔數據收集、處理、可視化展示和價值分析與應用為一體。通過在線網頁系統收集多樣化教學數據,并對數據進行預處理,基于可視化方法對提交數據進行分析展示,提高教學和管理人員感知數據的能力,并在多場景下對數據價值指導實際工作進行實踐。
一般來說,數據分析分為6個既相互獨立又互有聯系的階段,分別是明確目的、數據收集、數據處理、數據分析、數據展現、報告撰寫。[5]為了能夠實現教學資料的在線提交及獲取其中的價值,筆者基于多年從事軟件技術教學、擔任教學督導等工作的經驗,在了解數據分析方法、應用場景、使用過程及其優缺點的背景下,將教學文檔數據化及價值分析體系設計為三個模塊:文檔數據化、數據價值分析以及價值體現。如圖1所示。

圖1 教學文檔數據化及價值分析體系
文檔數據化:即通過Web應用開發相關技術實現一個在線文檔系統,提供各個頁面填寫對應的文檔資料,數據提交后通過數據庫、文件等方式進行保存,明確數據收集的目的用于指導教學管理工作,確定數據分析的方向。
數據價值分析:即基于Python語言的自然語言處理、可視化工具等功能包,實現文檔數據提取、處理,并進行關聯分析,進行直觀圖表展現,得出數據背后隱藏的有效信息。
價值體現:即通過撰寫報告等形式,將數據分析的過程、結論、建議等內容完整地展示出來,為決策者提供科學、嚴謹的依據,根據分析結果來指導實際工作,如支持教學評價、輔助教學決策,充分發揮數據價值和作用。
從技術層面來分析,三個模塊需要一個核心軟件系統來支撐,主要包含教學資料數據化和數據價值分析兩大功能模塊,教學資料數據化工作以確保數據分析工作能夠有效開展。
1.基于B/S的教學資料數據化模塊
基于PHP+MySQL設計并開發教學文檔管理系統,前端頁面按照教學文檔的欄目和排版,使用HTML+CSS+JAVASCRIPT進行布局,方便教師在線提交教學文檔內容,通過PHP動態編碼,將提交的數據保存至MySQL數據庫,通過不同文檔對應的數據表進行存儲,從而完成教學文檔的提交和保存。系統中圍繞文檔管理的核心模塊有教學文檔提交模塊、文檔管理模塊、文檔審核模塊。
文檔提交模塊為常規教學文檔定制表單頁面,教師登錄后,關聯學期、課程、授課班級,提交對應的成績數據、教學小結等文字信息。在文檔管理模塊,教師提交的教學文檔在未審核前,可以進行編輯和刪除操作。文檔審核模塊可以定制逐級審批功能,文檔審批結果分為通過、未通過、返回修改三種。通過以上幾個核心模塊的交互運行,形成教學文檔采集、分析與審核的規范流程,便于構建科學合理的診斷式評價閉環機制。
2.數據價值分析模塊
文檔提交保存后為后續數據分析提供了可靠、真實的數據基礎,充分利用數據進行橫向、縱向對比分析,提高教學數據利用率。文檔數據一般包含數值和文本兩種形式。對于數值數據,如成績等數據,進行自動統計分析,并以可視化圖表進行顯示;對于文本數據,使用文本挖掘等技術進行處理,抽取事先未知的、可理解的、最終可用的知識,為相關教學決策提供數據依據。對于文本數據,需要進行預處理,主要包括分詞、去停用詞、去除低頻詞等步驟,以減少文本噪音,提高信息質量。[6]具體步驟包括:讀取數據庫文本文件內容;文本分詞,其中涉及自定義字典、自定義停止詞,然后分詞;構建文檔-詞條矩陣,對文本進行數字表達;對數據進行統計、聚類分析、主題挖掘等處理;分析結果可視化呈現并進行教學反饋。
“互聯網+”時代,教學文檔數據化后能深挖教學信息,依靠先進的信息化技術和手段為教師減負增效,協力培養面向未來的創新型人才,對教育改革發展的支撐引領作用日益凸顯。[7]隨著人工智能的發展,大數據挖掘對于教學文檔信息的抽取與潛在規律的探索具有重要意義,而可視化技術可對教學文檔中的潛在規律進行直觀展現,為教學理論與實踐改革提供指導。[4]
1.根據文檔數據,挖掘隱藏的信息
教學文檔中的數值和文本內容蘊含教學理念、教學手段、教學效果等信息,對指導教師改進教學、管理人員進行決策有著重要的參考價值。從海量的教學文檔數據中提取真正有價值的信息,將內隱信息生動化顯示,有助于迅速找出問題所在并及時反饋給相關者,有效達到指導教學實踐的目的。
2.基于信息化手段,提供文檔管理分析平臺
運用Web開發技術和主流的大數據分析技術,將傳統的靜態教學文檔信息數據化,提取其中的信息并進行關聯分析,高效呈現分析結果,提高人們對數據解讀的可能性和便捷性,節約工作時間、提高工作效率。
3.依據數據說話,提高數據治理能力
智能技術的發展驅動教育從“用經驗說話”向“用數據驅動決策、治理和創新”轉向,[8]教育手段的智慧化催生了教學管理各個領域數據價值分析的可能性。數據價值對數據治理高度依賴,通過治理實現數據的互聯、互通、互享,使數據發揮更大的作用和價值。[9]
教學文檔數據化及其價值分析的有益探索具有可擴展性,可以推廣至不同院校、多個部門、多個工作場景中使用,如師生心聲提交問題、教職工請假原因、學生信息員反饋信息、教師聽課評語等文檔數據,從多個維度進行數據分析,通過數據挖掘實現對教育數據的統計分析、綜合推理,為教育教學提供積極的建議,整體上提高教學管理過程的智慧化程度。
以常州信息職業技術學院“課程教學小結”文檔為例,通過頁面表單收集教師原本填寫在孤立電子文檔中的內容。文檔提交后,數據進行在線保存,支持在線瀏覽、打印等功能,為下一步數據分析做好準備。
頁面填寫內容依據各個高職院校的教學要求進行設計,主要包含本課程教學效果評價(側重于對學生知識傳授和能力培養)、本課程教學中存在的問題及改進措施、本課程的考核情況(采用的考核方法以及對考核結果的分析)和本課程教學中采用了哪些教學方法和教學手段,排版和內容與紙質稿一樣。教師填寫相關信息后,點擊“提交”按鈕,所填信息將被存入數據庫中,為接下來的數據分析和可視化提供數據源。
詞云是一種近年來頗為流行的文本可視化方式,它提取出文本中的關鍵詞并在二維空間上美觀地排布,通常用于展示文本內容、輔助文本分析以及吸引讀者閱讀等。[10]系統主要基于Python語言中的jieba和Wordcloud庫,[11]對“教學小結”中欄目“本課程教學中采用了哪些教學方法和教學手段”,采集2018年教學部門提交的一個學期的410份文字,進行分詞、統計分析,并使用詞云進行了可視化展示。詞云使用字體大小表示文本中詞語的重要性,可以直觀地表達詞語的重要程度,對應的分析結果如圖2所示。

圖2 “教學方法和手段”文本分析詞云
因為詞云中文字大小與其在文本中的出現頻率是對應的,從圖中可以看出,講授、PPT教學、多媒體教學等傳統教學方法和手段占據主流,混合式教學、翻轉課堂、慕課教學等方法手段普及率不高。這一分析結果為學校進一步推進信息化教學提供了直觀的數據參考。在數據分析報告中提出建議:在二級學院的教學和督導工作中增加了教師信息化培訓和推廣的力度。具體舉措有:邀請國家級在線開放課程建設團隊進行課程資源開發與應用的主題培訓,組織教學團隊骨干教師進行信息化教學培訓,積極培養教學團隊參加省級、國家級信息化教學大賽。
采集2020年教師提交的“教學小結”中同一個欄目的內容,隨機選取410份文本,分析結果對應的詞云如圖3所示。

圖3 最新“教學方法和手段”文本分析詞云
分析結果顯示傳統教學方法比重減少,信息化相關的教學方法和手段,如“在線”“混合式”“視頻”“MOOC”等詞語在詞云中的顯示比例明顯變大,說明混合式教學、視頻、學習平臺等信息化教學方式所占比例有明顯提升。學校多門在線開放課程的開發和應用,帶來了教學方式和教學環境的變革,教學管理環境和資源發生了實質性的改變,教師的信息化教學能力得到了大幅提升。
教學文檔數據化及價值分析研究,對于構建富有智慧的教育教學環境,實現智慧教學、智慧管理、智慧服務,[12]探索符合時代背景的教育管理新體制和教育教學運行新機制,促進學生、教師和學校的智慧發展起到了積極的作用。
調研目前高職院校教學文檔管理中存在的不足,構建高職院校教學文檔數據化和價值分析體系,對高職院校教學文檔進行統一線上管理,并對教學文檔數據進行挖掘和展示,實現對教學等數據的關聯分析、綜合推理,以達到實時提取分析的目的,從而推進信息化教學改革。該應用可推廣至高職院校其他類似問題領域,為教學決策、教師教學評價、學生學習效果監測、人才選拔、學習差異性分析等工作提供數字依據,對教育創新起到重要支撐作用。