



摘要:本文旨在構建適用于人機協同教學的教學評價與評估方法體系,以應對傳統教學評價方法在新型教育模式中的局限性。作者在研究過程中確立了構建評價體系的原則與框架,通過層次分析法構建判斷矩陣,并進行權重計算與一致性檢驗,同時運用模糊綜合評價法,將定性評價定量化,生成各指標的綜合得分,最終形成完整的評估體系,為教育管理者提供了科學的決策支持,能夠助力優化教學資源配置、提升教學質量。
關鍵詞:人機協同教學;模糊綜合評價法;層次分析法;教學評價體系
中圖分類號:G434" 文獻標識碼:A" 論文編號:1674-2117(2025)07-0107-06
引言
近年來,隨著教育信息化的迅猛發展,人機協同教學作為一種新興的教育模式逐漸引起了廣泛關注,在“人工智能+教育”的國家戰略背景下,人機協同教學在各類院校中的應用愈發廣泛。傳統的教學評價與評估方法,雖然在一定程度上能夠反映教學質量,但往往忽視了人機協同教學中技術與教學的深度結合所帶來的復雜性與多維度影響。因此,構建適應人機協同教學特點的評價與評估方法體系顯得尤為必要。
人機協同教學評價是一個融合了人類智慧與機器智能的復雜過程,旨在通過科學的評估方法,全面、準確地反映教學活動的質量和效果。在國內,人機協同教學評價關注教學設計的科學性、教學實施的合理性以及教學支持的有效性,具體評價內容包括教學目標的明確性、教學內容的適切性、教學方法的多樣性、教學資源的利用效率、教師教學水平、學生學習參與度、教學互動質量等多個維度,它還強調對技術支持的到位性、平臺使用的便捷性、數據處理與反饋能力的評價,以確保教學活動的順利進行。在國外,人機協同教學評價的內容也涵蓋了類似的方面,但更加注重對學生個性化學習和創新能力的培養,評價過程不僅關注學生的學習成果,還重視學生在學習過程中的思維發展、創新能力以及團隊協作能力的培養。國外的人機協同教學評價還強調對智能教學系統的性能、易用性和可靠性的評估,以確保系統能夠為學生提供高效、準確的學習支持。綜合來看,國內外的人機協同教學評價都致力于構建一個全面、客觀、準確的評價體系,以推動教學活動的持續改進和優化。
人機協同教學評價與評估的具體方法
1.模糊綜合評價法的引入
傳統的評價方法難以適應人機協同教學的復雜性和多樣性,尤其是在面對多維度、多層次的教學過程時,單一的定量或定性評價往往無法準確反映實際教學效果。模糊綜合評價法的引入為解決這一問題提供了有效的途徑。該方法通過模糊數學的原理,將定性評價與定量分析相結合,能夠處理不確定性和模糊性問題,特別適合用于對人機協同教學的復雜評價。借助模糊綜合評價法,可以更為客觀和全面地評估教學過程中的各類因素,包括學生的學習表現、智能系統的輔助效果以及師生互動情況等。
2.人機協同教學評價的數據收集與處理
在人機協同教學評價中,數據的收集與處理是至關重要的環節,評價的準確性和科學性在很大程度上取決于數據的完整性和可靠性。在進行教學評價之前,必須首先建立完善的數據收集機制,確保能夠獲取全面、真實的教學數據。在人機協同教學模式下,數據的來源不僅僅包括學生的學習表現和教師的教學行為,還包括智能系統的運行數據、學習資源的使用情況以及學生與系統的互動記錄等。
在數據收集過程中,必須充分考慮數據的全面性和代表性,在收集學生學習表現數據時,不僅要關注學生的學習成績,還要收集其學習過程中的行為數據,如學習時長、學習路徑、知識點掌握情況等。在收集教師教學行為數據時,除了關注教師的教學內容和教學方式,還需要記錄教師與智能系統的互動情況,以及教師對學生個性化指導的情況。智能系統的運行數據同樣不可忽視,通過對系統運行數據的分析,可以評估智能系統在教學過程中的實際效果,如個性化推薦的準確性、學習路徑的優化效果等。
構建人機協同教學評價與評估指標體系
1.構建指標體系原則
第一,全面性原則。在人機協同教學模式下,既要考慮到傳統教學中的核心指標,如學生的學習成果、教師的教學質量等,還要納入智能系統的協作效果和人機交互質量等新興因素。
第二,科學性原則。每一項指標的設置都應有其明確的評價目標和評價標準,并且要能夠通過數據或事實進行驗證。
第三,層次性原則。在人機協同教學評價中,可以將評價指標分為宏觀、中觀和微觀三個層次。宏觀層次的指標主要用于評估整個教學過程的整體效果,如教學目標達成度、教學資源利用率等;中觀層次的指標則側重于對具體教學環節的評價,如課堂教學效果、學生學習表現等;微觀層次的指標則更加關注教學過程中的細節,如師生互動情況、智能系統的實時反饋效果等。
第四,靈活性原則。人機協同教學模式的多樣化和不斷變化的特性,要求評價指標體系具備一定的靈活性,能夠根據不同教學場景和教學目標對其進行調整。
2.指標體系結構
由于傳統的教學評價方法存在一定的局限性,難以全面反映多維度影響因素,因此,在構建人機協同教學評價與評估方法時,筆者基于真實應用的典型案例,提出了更符合現代智能教學環境的評價指標(如上頁表1),以確保對教學效果進行準確評估。本指標體系通過量化各項指標和綜合分析,可以準確識別教學過程中的關鍵問題,為改進教學設計、提升教學效率提供科學依據,進而支持更加精準的教學決策和策略優化。
構建評估流程
1.構建層次分析法兩兩比較矩陣
依據表1,可以建立層次分析法結構模型,以明確各因素在不同層級之間的隸屬關系。利用Cij表示在同一一級指標下,兩個二級指標ai和aj相對于所屬指標Ux的重要性比例,要求Cij>0,且滿足Cij=1,Cij=1/Cji。在評估過程中,采用了1~9標度法對數據進行處理。該標度法規定了Cij的值域為[1/9,9],其中數值1、3、5、7、9分別表示ai與aj相比的相對重要程度,分別為相同重要、輕微重要、明顯重要、特別重要、極端重要;而數值2、4、6、8則表示兩者之間的中間程度。基于這種量化的比較方法,可以構建一個科學合理的人機協同教學評估模型,為系統地評估教學設計、實施、支持、過程及效果奠定基礎。
2.計算權重向量
在人機協同教學的評價與評估過程中,構建合理的指標體系和判斷矩陣是至關重要的。在上述分析中,使用1~9標度法建立了不同層級的判斷矩陣(C、C1、C2、C3、C4、C5)。為使評估結果更具實操性,可采用特征根法對各判斷矩陣進行計算。在這一過程中,通過計算判斷矩陣的最大特征根λk,并獲得相應的權重向量Wj。
在本文中,判斷矩陣為正矩陣,因此其最大特征根λk唯一且存在。利用Matlab軟件對矩陣進行運算,得出各層級的最大特征根和對應的權重向量。最后,將權重向量進行歸一化處理,以確定各因素相對所屬層級的權重分布。
通過Matlab軟件運算,矩陣C、C1、C2、C3、C4、C5對應的最大特征根分別為λ0=5.32,λ1=5.11,λ2=4.85,λ3=4.67,λ4=3.24,λ5=3.00,對應的權重向量分別為W=(0.42,0.25,0.18,0.10,0.05),W1=(0.35,0.30,0.20,0.10,0.05),W2=(0.40,0.30,0.15,0.10,0.05),W3=(0.45,0.25,0.15,0.10,0.05),W4=(0.50,0.30,0.20)、W5=(0.55,0.25,0.15,0.05)。
3.一致性檢驗
為確保評估結果的可靠性,必須對矩陣的分析結果進行一致性檢驗,以驗證穩定性和一致性。在人機協同教學評價中,采用一致性指標CI和一致性比例CR來進行檢驗。CI的計算公式為CI=(λmax-n)/(n-1),其中,λmax為矩陣的最大特征根,n為矩陣的階數。CR則通過公式CR=CI/RI進行計算,其中RI為對應階數矩陣的平均隨機一致性指標,如上頁表2所示。若計算出的CR值小于0.1,則表明矩陣的一致性在可接受范圍內;若CR值大于或等于0.1,則意味著一致性指標存在較大差異,可能需要重新收集數據進行評估。
根據計算結果,所有判斷矩陣的CR值均小于0.1,說明矩陣的一致性可接受,如上頁表3所示。
從表3中的一致性檢驗結果來看,各個矩陣的一致性均得到了有效驗證,說明在評價指標權重設置過程中,各矩陣的判斷矩陣具有較好的邏輯一致性。表中所有的特征根值都接近于其對應矩陣的維度值,這表明矩陣的構建具有合理性。對一致性指數CI和一致性比例CR的分析顯示,各矩陣的CR值均低于0.1的臨界值,尤其是C2和C3的CR值甚至為負值,這進一步驗證了判斷矩陣的一致性極好,在權重確定過程中,判斷矩陣的內部邏輯自洽且無明顯的判斷偏差。雖然C4的CR值相對較高,但其仍然在可接受范圍內,這意味著在3×3矩陣的情況下,該評價的判斷邏輯仍然可靠,C5矩陣的CR值為零,表明這是一個完全一致的矩陣,權重分配沒有任何不一致性問題。
模糊綜合評價法評估
1.建立因素集與評價集
在進行人機協同教學的評價與評估時,需要明確準則層和指標層的影響因素集,以便系統化地進行評價。設定準則層的影響因素集為U,其中U={u1,u2,…,um},m表示準則層的因素數量。同時,對于每個準則層影響因素Ui,可以進一步將其細分為指標層的子因素,如u1={u11,u12,…,u1k},其中k為隸屬于u1的指標數。為了有效地對這些因素進行評分,需要建立一個評價集V,該集定義了評判等級的范圍,記作V={v1,v2,…,vn},其中n是評判等級的數量。
為便于評價操作,筆者將評價等級設置為優秀、良好、合格、差四個等級,分別賦予的得分為{90,75,60,30}。在實際評估過程中,依據這些等級對各影響因素進行打分,以反映其實際情況。
2.建立單因素模糊評判矩陣
在進行模糊綜合評判時,構建單因素模糊評判矩陣是一個重要的步驟。單因素模糊評判矩陣的建立基于對各個評判因素的隸屬度的計算。隸屬度反映了每個評判因素在不同評價等級上的表現程度。通常,評判等級集(結論集)V包含若干個評價等級,從低到高依次排列,如“很差”“差”“一般”“好”“很好”等。對于每一個因素ui,需要依據這一評價等級集對其進行評分。
收集專家與評審人員對每個因素ui的評分數據,假設有m個專家參與評分,每個專家對因素ui的評分會落在結論集V的某個等級vj上,計算因素ui被評為vj的次數與專家總數之比,即為隸屬度rij,這個隸屬度rij表示的是因素ui在結論集V中被評為vj的概率或程度,數值范圍在0到1之間。通過計算每個因素ui在不同評價等級vj上的隸屬度rij,可以構建出一個單因素模糊關系矩陣Ri。這個矩陣的每一行對應一個因素ui,每一列對應一個評價等級vj,而矩陣中的元素rij則代表了因素ui在vj評價等級上的隸屬度(如上頁表4)。
通過以上步驟,得出了人機協同教學中的教學評價與評估的模糊綜合評價結果。結果顯示,該方法能夠有效綜合多種因素進行評價,為教學效果的改善和策略調整提供了科學依據。
結論
本研究通過構建人機協同教學的評價與評估體系,結合模糊綜合評價法與層次分析法,對教學過程的各個環節進行了科學且定量的評估,研究結果揭示了該體系在評估人機協同教學中的各要素相對重要性及其實際表現方面的有效性,能幫助明確教學中的優勢與不足。研究表明,信息化手段與傳統教學方法的合理結合能夠顯著提升教學效率,通過該評估體系的應用,教育管理者可以更加清晰地了解教學中的關鍵因素,并據此進行針對性的改進,以優化教學策略和資源配置。
參考文獻:
[1]秦丹,張立新.人機協同教學中的教師角色重構[J].電化教育研究,2020(11):13-19.
[2]王辭曉,徐珺巖,郭利明,等.多場景人機協同在線教學評價框架研究——基于層次分析法和熵權法的分析[J].現代教育技術,2023(01):74-82.
[3]余明華,王龔,卜洪曉,等.未來教師如何培養?——人機協同師范教育創新的理論模型與實踐進路[J].現代教育技術,2024(01):117-126.
[4]毛剛,周躍良,何文濤.教育大數據背景下教學評價理論發展的路向[J].電化教育研究,2020(10):22-28.
[5]肖冬杰,劉瑞,申海峰,等.人機協同下職業教育課堂評價改革與實踐[J].牡丹江教育學院學報,2023(06):16-19.
[6]呂寒雪.人機協同教學中教師身份認同的情感理路與提升路徑:一個情感社會學的解讀[J].電化教育研究,2023(12):108-115.
[7]袁偉,王婭,曠小芳,等.人機協同的“雙師課堂”人工智能教學模式構建實踐[J].華夏教師,2024(11):6-8.
[8]何文濤,張夢麗,逯行,等.人工智能視域下人機協同教學模式構建[J].現代遠距離教育,2023(02):78-87.
[9]張家華,鄧倩,周躍良,等.基于人機協同的師范教育實踐改革與平臺設計[J].教育發展研究,2021(01):6.
[10]方海光,李海蕓.人機協同課堂教學理論與實踐研究[J].中國現代教育裝備,2022(04):4.
[11]寇軍,張震堂,陳虹莉,等.“人工智能+智學”模式推動人機協同教學場域分析與框架建構[J].陜西教育:高教版,2022(12):38-40.
作者簡介:張笑墉(2000—) ,男,漢族,江蘇鎮江人,遼寧師范大學教育學部在讀碩士,研究方向為數字化學習;李玉斌(1975—),男,滿族,河北承德人,通訊作者,博士,教授,博士生導師,研究方向為數字化學習。
基金項目:遼寧省教育廳重點攻關項目“面向國家教育數字化戰略的中小學校長數字化領導力發展研究”(項目編號LJ112410165026)。