999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能賦能高等教育評價改革的國際借鑒

2025-02-20 00:00:00李運福
電化教育研究 2025年2期
關鍵詞:自我評價人工智能

[摘" "要] 深化教育評價改革是推動教育綜合改革,加快建設高質量教育體系,實現教育強國戰略目標的重要牽引力。充分發揮新一代人工智能技術優勢,推動高等教育評價改革是人工智能賦能行動的重要任務。文章以活動理論為基礎,從評價主體的協同性改革、評價客體的適應性改革、評價工具的創新性改革、評價原則的突破性改革等四個方面構建了人工智能賦能高等教育評價改革的分析框架。以此為基礎,將現有國際研究對人工智能賦能高等教育評價的關鍵要素概括為三個方面:科學研制評估指標是充分發揮人工智能評估主體作用,實現人機協同評估的重要前提;多模態數據深度分析是充分發揮人工智能優勢,推動評估方法創新的重要舉措;完善相關標準、制度或規則是推動人工智能賦能高等教育評價改革持續發展的重要保障。以此為鑒,為更好地發揮人工智能技術優勢,我國應在以下五個方面深化教育評價改革:完善制度規范,保障評價活動公平有序;優化指標體系,科學牽引高等教育改革;升級數字底座,全面普及數字教育形態;強化自評能力,保障技術賦能改革效度;注重文化培育,推動技術與制度協同創新。

[關鍵詞] 人工智能; 高等教育評價; 人機協同; 自我評價; 制度創新

[中圖分類號] G434" " " " " " [文獻標志碼] A

一、引" "言

對于教育而言,人工智能不是一般的策略性問題,而是影響甚至決定教育高質量發展的戰略性、全局性問題,這是當前的一個初步共識[1]。2024年3月,教育部啟動人工智能賦能教育行動,旨在利用人工智能推動教與學融合應用,提高全民數字教育素養與技能,同時規范人工智能使用科學倫理。深化教育評價改革是教育綜合改革的關鍵任務和重要內容,對加快推進教育現代化、建設教育強國、辦好人民滿意的教育具有重要戰略意義[2]。可以說,人工智能賦能高等教育評價是深化落實人工智能賦能行動重要任務的應有之意,也是深化高等教育評價改革正面臨的緊迫課題,且已引發國際學者的普遍關注和討論。全面系統地梳理和分析國際層面代表性研究成果,對推動我國人工智能賦能高等教育評價有著重要的借鑒意義。

二、分析框架構建

評價是一種價值判斷的活動。活動理論是一種把活動系統作為分析單位的社會文化分析模式[3],為高等教育評價活動的分析提供了一個很好的框架。活動理論誕生于蘇聯心理學研究中,維果斯基的社會文化歷史理論對活動理論的成熟和發展起到了重要作用。其中,中介理論是維果茨基社會文化歷史理論的一個重要內容。該理論強調工具與符號在人類活動中的價值,明確了活動中“主體—工具—客體”之間的關系。但是,它沒有指出個體如何與群體交互[4]。在后續發展過程中,芬蘭學者恩格斯托姆在維果茨基中介理論的基礎上,提出了活動理論模型,擴展了三角模型,增加了活動系統的互動要素,包括主體、客體、共同體,以及和其他人類活動的中介者,包括工具、規則和分工[5]。

人工智能賦能高等教育評價實際上是對評價活動關鍵要素及其作用關系進行解構、重組與再造的過程。以活動理論為指導,本研究將高等教育評價涵蓋的關鍵要素概括為評價主體、評價客體、評價工具、評價原則等四個方面。本研究根據評價活動的基本要素,構建了評價主體—協同性改革、評價客體—適應性改革、評價工具—創新性改革、評價原則—突破性改革等四個維度的分析框架,如圖1所示。

首先,評價主體是指參與評價的個體或組織,可能是教師、學生、家長、專家或其他利益相關者。人工智能的發展使教育教學開展自動評估與反饋成為可能,極大地減輕了個體或組織作為評價主體的工作負擔,提高了教育評價的及時性和精準度。因此,本研究將評價主體維度的人工智能賦能高等教育評價改革稱為協同性改革。其次,評價客體,即評價對象,從具體實踐角度來說,主要指的是評價內容,可以是學生的學習成果、教師的教學質量、高校人才培養成效等。人工智能對經濟社會發展產生顛覆性影響的同時,也對高等教育使命、教育教學目標、人才培養規格等產生了深刻影響,以培養適應未來發展的人才。因此,本研究將評價客體維度的人工智能賦能高等教育評價改革稱為適應性改革。再次,評價工具或方法是評價過程中所采用的具體技術和手段。評價方法的選擇應該根據評價內容的特點和要求來確定,一般包括定量方法和定性方法,且不同的評價方法具有不同的優勢和局限性。人工智能的應用為教育評價方法帶來了巨大創新,極大地改變了原有方法評價精準度不高或對某些內容尚且不能評價的困境。本研究將評價方法維度的人工智能賦能高等教育評價改革稱為創新性改革。最后,評價原則是評價過程中應遵循的基本準則和價值觀。評價原則的制定旨在確保評價的公正性、客觀性和有效性。人工智能是數據、算力、算法協同作用的集中體現。數據采集的全面性、算法的透明性等因素,增加了人工智能賦能高等教育評價的復雜性,必然會突破現有評價原則或標準的束縛,創建新的原則或標準,以更好地保障評價的公平性、客觀性和有效性。本研究將評價原則維度的人工智能賦能高等教育評價改革稱為突破性改革。

三、文獻檢索與分析

(一)文獻檢索

為增強檢索文獻的代表性,本研究首先以Web of Science核心數據庫為檢索源,以“Artificial Intelligence” or “Machine Learning” or “Large Language Model ” or “ChatGPT” or “Generative AI” or “Generative Artificial Intelligence”為主題詞獲得檢索結果#1,以“Higher Education” or “Undergraduate”為主題詞進行檢索獲得結果#2,以“Evaluation”or “Assessment”為主題詞進行檢索獲得結果#3。其次,通過#1amp;#2amp;#3獲得最終結果。初步形成檢索結果后,對2020—2024年間,語言為英文的研究文獻進行了二次篩選,共檢索出相關文獻418篇。通過閱讀摘要信息對檢索結果進行再次篩選,保留與主題相關的文獻221篇,并導入NoteExpress輔助文獻管理。最后,通過對文獻進行深度閱讀,將與研究主題密切相關的122篇文獻作為研究樣本,覆蓋工程、醫學、教育管理等多個領域的87種期刊。從年度分布來看,2020—2024年度的文獻分別為7篇、9篇、27篇、46篇、33篇。從刊載期刊來看,刊載研究樣本頻次≥2篇的期刊共有20種,累計刊載樣本文獻55篇,占總樣本的45.08%。

(二)文獻分析

以構建的分析框架為指導,對122篇文獻進行分析和歸類,國際研究中對人工智能賦能高等教育評價改革的實踐范疇主要集中在院校發展評價、課程教學評價、學生發展評價三個層面。

1. 人工智能賦能院校發展評價

院校發展評價層面,人工智能的應用主要集中在評價方法的創新性改革。即將已構建的評價指標體系及數據輸入相關模型進行精準分析,提升高校治理效能,推動高等教育的可持續發展。比如,利用梯度提升回歸樹機器學習算法開展高校創新人才培養能力評價[6],利用多層受限玻爾茲曼機特征提取方法與SoftMax分類器相結合來提高大學成績預測的準確性[7],利用na■ve貝葉斯網絡和樹增強貝葉斯網絡構建以提高高等教育率為目標的可持續招生計劃配置的評價模型[8],利用信息極端分層機器學習方法評估高等教育機構畢業部門教育內容與勞動力市場需求的匹配度[9],利用人工智能和邊緣計算開展高校體育資源評價[10],利用基于改進機器學習的人才培養質量評價模型實現對高等教育人才培養質量的動態評價[11]等。此外,充分發揮人工智能優勢,對大規模學生開展的高等教育評價的文本數據進行深度挖掘,以提升高等教育服務質量。例如,構建自動化分析框架對英國全國學生調查(NSS)的開放式回答文本數據進行深度挖掘,進而影響學校對教學干預措施的識別、設計、實施和評估[12],利用屬性級別情感分析(ABSA)深度挖掘學生對教師評價中的情緒類文本數據,提高高等教育機構服務質量[13]等。

2. 人工智能賦能課程教學評價

課程教學評價層面,人工智能的應用主要集中在評價主體的協同性改革和評價工具的創新性改革兩個方面。

一方面是評價主體的協同性改革。國際學者普遍以“通過考試”的方式對ChatGPT作為評估助手的潛力開展廣泛研究,研究成果主要集中在醫學和化學領域,且測試題型聚焦在選擇題、判斷題等知識導向的測試題目[14-16]。同時,ChatGPT除具有超強的考試能力外,其為學生考試提供的多項選擇題在質量、總評估分數以及其他領域與人類提供的題目不存在顯著差異[17],在人機協同評估中具有巨大潛力。此外,還可依托人工智能開展自動評價,進一步優化課程教學。如ChatGPT能夠自主建立課程的學習成果,描述評價權重,將學習成果映射到每種評價方法,并制定學習活動計劃和課程時間表,實現課程預期的學習成果、教學策略、學習活動和評價方法的相互協調,以確保學生參與到有意義的學習體驗中[18]。此外,人工智能不僅能在編程教學[19]、語言評估[20]等方面引導學生開展自我調節學習,還能通過基于人工智能驅動的自動職業面試將課堂教學與學生就業相結合,更好地促進學生技能發展[21]。

另一方面是評價工具的創新性改革。首先,在課程教學質量評價中,注重將非參數和參數統計技術與現代機器學習算法協同結合[22],通過自然語言處理技術實現課程學習成果到專業學習成果的自動化映射和驗證,實現課程與專業質量聯動[23],以及利用計算機視覺和智能語音識別等人工智能技術構建基于統計建模和集成學習的綜合模型以開展課程教學質量評價[24]等。其次,在改進課程教學的形成性評價中,利用機器學習模型整合大學生協作數據、面部行為數據和情緒數據等多模態數據開展形成性評價,能夠很好地理解學生的學習過程并預測學習結果[25],采用教育數據挖掘技術從可靠性程度、熱情程度和拖延程度三個維度分析學生作業數據,建立基于作業習慣的預測模型可以對學生的可持續性過程進行個性化評價[26],以及利用知識圖譜和人工智能的新型自動評價和反饋方法提升協作學習的小組績效[27]等。此外,還可以實現對學生知識理解程度的精準評價。如采用基于人工智能的探究性評價學生學習系統生成概率圖曲線來評價學生對課題的理解程度[28],采用自然語言處理技術從學生簡短回答中自動評估學生概念理解的有用性[29]等。最后,在改進學生評教方面,通過對非結構化文本數據的情感分析提升學生評價質量[30],還可采用基于描述性決策理論的文本挖掘和機器學習技術設計和實現的教育過程和數據挖掘+機器學習模型,對學生評教的文本數據進行量化和統計分析,進而確定學生作出評價的合理性[31]。

3. 人工智能賦能學生發展評價

對照人工智能賦能高等教育評價改革分析框架,該領域是人工智能賦能高等教育評價改革的研究重點,涵蓋了評價主體、評價工具、評價客體、評價原則等四個維度。

第一,評價主體的協同性改革。該維度主要集中在學生能力發展水平和學術論文的自動評價。如在電子模擬任務中,通過描述學生在任務中各種協作解決問題技能表現的計算語言方法,實現學生協作解決問題的自動評價[32]。此外,ChatGPT在學生論文質量反饋方面具有潛在的可靠性和可信度,與教師反饋相比,ChatGPT在提供情感反饋時僅限于語言層面,而教師的反饋更關注學生的整體學習進度,基于個人教學經驗來正確識別學生面臨的關鍵問題,并考慮到人文共情互動[33]。

第二,評價工具的創新性改革。該維度主要集中在大學生心理健康評價。傳統的心理健康評價方法主要采用問卷調查,其精準度和穩定性受到資源條件、調查路徑等諸多因素的限制。近年來,人工智能的發展為大學生心理健康評價提出了新的方向。有學者提出,采用基于最優稀疏自編碼器的七星瓢蟲 (Seven-spot Ladybirds)式特征選擇模型,用于評價大學生在抑郁、焦慮和壓力等方面的健康狀況[34];也有學者提出,利用堆疊支持向量機集成方法,提高持續性抑郁癥早期診斷的準確性[35],但是,研究表明,使用卷積神經網絡和隨機森林算法建立AI相關模型對學生心理健康的判斷水平要比支持向量機和反向傳播神經網絡算法具有更高的識別精度[36]。此外,人工智能也可賦能現有評價工具的升級,提升評估效果。如使用Risk SLIM對認知扭曲量表進行升級改造,建立可以手工評分的簡短形式量表[37]。

第三,評價客體的適應性改革。該維度主要集中在對學生評價性判定能力和人工智能倫理態度、數字能力等三個方面的評價。生成式人工智能迅速提高了生成文本、視覺和聽覺輸出的能力,但其輸出質量仍然存在諸多問題。面對這種挑戰,迫切需要培養學生的評價性判斷能力,即判斷自己和他人工作質量的能力,以適應人機協同時代發展的需要,這就迫切需要對人工智能時代的評估實踐進行改革[38]。為更加科學、規范、可持續地推進人工智能的應用,許多政府機構、非政府組織等陸續發布了人工智能倫理準則,為人工智能的應用提供了基本的制度保障,但是在未來發展中應進一步強化本科生人工智能倫理態度評價工具的設計開發,充分發揮評估牽引作用,為更好地推動人工智能教育應用及效果評估提供重要支撐 [39]。此外,數字能力評價也引起了人們的廣泛關注,但是以往數字能力的評價方式主要是自我報告和問卷等人工審查方式,評價價值有限。在人工智能時代,可以對標數字能力關鍵領域或維度,使用自然語言處理技術對大學生數字能力培養的教學大綱開展精準評估[40],確保生成高質量學習內容。

第四,評價原則的突破性改革。該維度主要集中在對大學生發展質量評價標準設定的變革以及人工智能公平評價原則兩個方面。生成式人工智能的發展和應用對大學生學術論文評價帶來了重大挑戰,引發了學術誠信危機,經驗豐富的學者也無法區分生成式人工智能和人類編寫的文本[41],并對這種成果形式能否有效反映學生能力發展水平提出質疑。面對這種挑戰,有學者提出,要重新設計評價,重塑傳統論文格式及完善傳統評分標準,引導學生高階思維能力的培育[42],開展終身學習導向的學生發展評估,評估指標要從知識(知道什么)測試擴展到能力(知道如何)評估和績效(展示如何)評估[43]。此外,透明度問題加劇了師生權力失衡,并形成了自上而下的監督機制,導致學生陷入生成式人工智能使用的低信任環境[44]。為增強人工智能評價的公平性,要避免算法霸權等潛在風險,提升信息透明度以及對評價結果的解釋,優化學生對人工智能評價的公平感知[45]。

四、研究結論與啟示

(一)研究結論

本研究將國際研究中人工智能賦能高等教育評價改革的關鍵要點歸納為以下三個方面:

其一,科學研制評價指標是充分發揮人工智能技術優勢,實現人機協同評價的重要前提。人工智能的優勢主要集中在對大規模、多類別數據的快速、精準分析。但是,人工智能賦能高等教育評價的邏輯主線是育人導向,而不是數據導向,也就是說,“分析哪些數據”要比“如何分析數據”重要得多,避免陷入“技術至上僭越教育主體底線”[46]的困境。因此,院校發展、課程教學、學生發展等不同層面質量評價指標及算法模型是發揮人工智能技術優勢,深化高等教育評價改革的重要基礎和前提。

其二,多模態數據分析是充分發揮人工智能技術優勢,推動評價方法創新改革的重要舉措。現階段,學習管理系統或在線學習平臺的廣泛應用使多模態數據的采集成為可能。人工智能的不斷發展,改變了以往通過問卷調查、面試反饋、在線行為等單一數據分析教育教學質量的方式,利用機器學習等高級算法處理復雜、異構的數據集,強化多模態數據的聯合分析和理解,揭示教育教學數據的內在關系,進而更好地解釋教育教學規律和學生學習發展規律,提升數據分析的全面性和準確性。這也是大數據賦能教育評價改革多維訴求的顯著優勢[47]。

其三,完善相關標準、制度或規則是強化人工智能賦能高等教育評價改革持續發展的重要保障。技術創新與制度創新是驅動經濟社會發展的重要動力,是一種協同演化、雙向動態適應的關系。人工智能在高等教育評價改革中的應用是一種顛覆性技術創新,也是一種顛覆性制度創新。這種技術創新必然會引發高等教育評價標準、制度或規則的調整,以適應技術創新的需要。制度或規則的創新主要集中在兩個方面:對學生發展質量評價方式及標準進行改革和創新,更加強調大學生高階思維能力的培育[48];規范人工智能的合理應用,強化高等教育評價的公平性。

(二)對我國推動人工智能賦能高等教育評價改革的啟示

1. 完善制度規范,保障評價活動公平有序

人工智能是引發整個社會產生深刻變革的顛覆性技術。加緊研制、發布人工智能治理政策、制度或規范,已成為各國推動經濟社會創新發展的重要議程。教育評價改革被視為統籌推進育人方式、辦學模式、管理體制、保障機制改革,建設高質量教育體系的關鍵牽引力,但是,對于在高等教育評價領域人工智能的應用缺乏制度規范的有效引導。為充分激發人工智能賦能高等教育評價改革潛力,在國家、省域或學校層面應加快完善制度規范,引導建立明確的評價標準與規則,保證數據的質量和代表性,強化算法透明性。在體制機制上,要設立監管與審核機制,建立獨立的監管機構或第三方審核團隊,對人工智能在教育評價中的應用進行監督,以確保其符合倫理和法律標準;同時要建立風險評估機制,對人工智能賦能教育評價的潛在風險進行評估,包括可能的誤判、歧視、偏見擴散等,并制定相應的預防和應對措施。此外,隨著人工智能的快速迭代升級和教育改革的不斷深化,要定期評價和更新相關制度,在滿足公平、透明的原則下,確保其適應時代發展。

2. 優化指標體系,科學牽引高等教育改革

在高等教育評價改革中,評價指標科學性的突破要比評價方法技術性的突破更迫切、更重要。經過40余年的探索和實踐,我國基本形成了具有中國特色的“五位一體”質量保障體系。其中,高等教育質量監測國家數據平臺承擔著為高校自我評估、院校評估、專業認證和評估等活動提供數據支撐以及開展本科教育教學質量常態監測的“雙層”作用,是數字技術賦能高等教育評價改革的重要抓手。但是,高等教育質量監測國家數據平臺,在數據采集、存儲、分析和應用方面存在諸多問題,嚴重制約了平臺作用的發揮[49]。當下,以人工智能為核心的第四次工業革命,對經濟產業結構調整產生了重大影響,引發了高校人才培養改革的連鎖反應[50]。在持續深化高等教育質量評價改革中,應強化系統理論指導,根據高校不同定位,分類別優化高等教育質量監測指標,推動形成“常態監測+周期評估+重點督察”三個層次的高等教育質量保障體系。在常態監測階段,充分發揮人工智能多模態數據分析的優勢,改變現階段高等教育質量監測國家數據平臺只聚焦校內教學狀態數據的采集和分析的現狀,弱化對畢業生去向落實率等外延式質量符號數據的采集,強化對社會網絡上多樣化數據的深度關聯分析,建立高等教育質量監測模型,實現高等教育對經濟社會發展支撐度、貢獻度的常態監測。在常態化深度監測的基礎上,以問題為導向,通過周期性評估深層次診斷高校教育教學關鍵問題,持續推進高校特色發展與創新發展。以常態監測數據為參考,對高校教育教學關鍵問題持續改進情況進行重點督查,實現高等教育質量“常態監測—問題聚焦—改進督查”的良性循環。

3. 升級數字底座,全面普及數字教育形態

深度推動人工智能賦能高等教育評價改革的前提是要實現數字教育新形態,這對高校基礎設施升級提出了更高要求。高校現有基礎設施很難支撐物理空間、社會空間、信息空間的多元融合,以及教育教學場景的創新,在形成以數據驅動“AI+HI”的高等教育新形態,進而為師—生—機三元互動提供良好的基礎環境支撐方面仍存在很大差距。在現有基礎網絡、智能終端普及的基礎上,高校應圍繞以下五個方面推動數字底座升級,進一步使數字教育形態落地:一是購買或開發易于使用、功能豐富的在線教學平臺和學習管理系統,支持課程發布、作業提交、互動討論和評估,實現教育教學關鍵環節數字化;二是持續開展以一體化智能教育教學平臺為依托,以智慧教室、智慧圖書館、多媒體教室和標準化考場等為陣地,構建“資源—數據—服務”無縫銜接的智能學習空間,支持“線上—線下—混合”多模式教學,實現多空間深度融合;三是深化學分制改革,規范在線課程應用,注重平臺數據的挖掘,實現大規模學習與個性化發展相統一;四是建立監測系統,定期評估數字教育的實施效果,以便及時調整策略;五是在推廣數字教育的同時,強化網絡和數據安全,保護學生和教師的個人信息和隱私。

4. 強化自評能力,保障技術賦能改革效度

根據古巴和林肯的研究,教育評價經歷了測量、描述、判斷和心理建構等四個階段[51]。隨著教育評價理論研究和實踐的深入開展,有學者提出了以自我評價為中心的第五代評價,并認為自我評價必須與協同評價同頻共振,二者是培育質量文化的基礎[52]。面向未來發展,高校自我評估在“五位一體”評估制度中的定位由“基礎”走向“中心”是必然趨勢,這與我國在院校評估中強調質量文化建設是相呼應的。但是,從新一輪審核評估來看,地方高校自我評估能力仍普遍較弱,在質量管理、持續改進等方面仍存在較為突出的問題,也制約著高校質量文化的形成。面對這種現狀與趨勢,高校應從以下兩個方面加強自我評估能力建設,以保障人工智能賦能評價改革效度:一是在高校內部要注重全員評價素養的提升。以需求為導向,針對教育質量管理者、教師、學生等不同群體制定評價素養框架,通過專題培訓、研討交流、引進在線課程等方式為全員評價素養提升提供常態化支持服務,要特別注重全員評價性判斷能力的培養[53],以更好地適應人機協同工作、學習和生活場景。二是在校外,教育行政部門要加緊研制高校自我評估效度指標,發揮評估牽引作用,提升高校自我評估能力,推動高校質量文化的形成,這也是健全我國高等教育元評估制度的重要舉措。

5. 注重文化培育,推動技術與制度協同創新

技術、制度、文化分別是推動社會進步的基本要素、基本維度和基本工具。文化是社會發展的靈魂,塑造了人們的價值觀和行為模式;技術是推動社會發展的重要力量,不斷改變人們的生活方式和工作方式;制度為社會的有序運行提供了框架和保障,確保技術和文化能在良好的環境下發展。人工智能賦能高等教育評價改革,是教育評價領域的顛覆性技術創新,與此同時,相關制度創新已引起美國羅素集團[54]、澳大利亞高等教育質量管理與標準署(TEQSA)[55]等組織的高度關注。但是,對于文化因素在推動人工智能賦能高等教育評價改革中的技術創新與制度創新的關注卻較為少見。為此,在未來發展中,高校應著重推動以下工作:明確人工智能賦能高等教育評價改革目標,并將其融入學校發展規劃,在戰略上達成共識;搭建共享平臺,及時分享人工智能賦能高等教育評價改革的基本知識、基礎理論、典型案例、顯著成效等,營造良好改革氛圍,同時,全員形成共同的知識基礎;設立人工智能賦能高等教育評價改革專項基金,打造典型賦能場景,發揮示范引領作用。

五、結 束 語

高等教育是教育強國建設的龍頭。教育評價事關教育發展方向,是樹立正確辦學導向的指揮棒,也是提高現代教育治理能力的關鍵點。面對人工智能對經濟社會各領域帶來的顛覆性影響,在國際研究借鑒的基礎上,探尋有效推動人工智能賦能高等教育評價改革的對策,對充分發揮評價牽引作用,持續深化高等教育綜合改革,加快建設高質量高等教育體系有著重要的現實價值。2024年3月,人工智能大模型應用示范行動(LEAD)的啟動,標志著我國人工智能賦能高等教育改革進入一個新的實踐探索階段,在加強人工智能學科專業建設、人工智能人才培養的同時,要充分發揮有組織科研的優勢,引導多學科、多領域的深度合作,在指標體系構建、多模態數據分析、標準制度完善等方面不斷尋求新的突破,有效推進人工智能賦能高等教育評價改革。

[參考文獻]

[1] 吳巖.教育專有大模型優先在10個學科推出垂直應用[EB/OL]. (2024-07-04)[2024-07-13]. https://baijiahao.baidu.com/s?id=1803639057302796603amp;wfr=spideramp;for=pc.

[2] 辛濤. 深化教育評價改革的四個關鍵環節[J]. 中國考試,2023(10):1-8.

[3] 戴維·H. 喬納森. 學習環境的理論基礎[M]. 鄭太年,任友群,譯. 上海:華東師范大學出版社,2002:92-98.

[4] 孫海民,劉鵬飛. 以活動理論審視學習活動[J]. 中國電化教育,2015(8):29-35.

[5] 于璐. 恩格斯托姆的活動理論[J]. 北方文學(下半月),2012(1):224.

[6] HUANG R J, SUN Y S, ZHANG Z F, et al. Capability assessment of cultivating innovative talents for higher schools based on machine learning[J]. International journal of information and communication technology education,2024,20(1):1-16.

[7] XU S Y, SZE S. Enhancing university performance evaluation through digital technology: a deep learning approach for sustainable development[J]. Journal of the knowledge economy,2024(4):1-17.

[8] WANG K Q, WANG T, WANG T Y, et al. Research on evaluation methods for sustainable enrollment plan configurations in Chinese universities based on Bayesian networks[J]. Sustainability,2024,16(7):1-18.

[9] SHELEHOV I V, PRYLEPA D V, KHIBOVSKA Y O, et al. Machine learning decision support systems for adaptation of educational content to the labor market requirements[J]. Radio electronics, computer science, control, 2023(1):62-72.

[10] HAO L, ZHOU L M. Evaluation index of school sports resources based on artificial intelligence and edge computing[J]. Mobile information systems,2022(1):1-9.

[11] ZHU R, LI Y. Improve the assessment model of personnel develop level in higher education based on machine learning[J]. Wireless communications and mobile computing,2022(10):1-9.

[12] NAWAZ R, SUN Q B, SHARDLOW M, et al. Leveraging AI and machine learning for national student survey: actionable insights from textual feedback to enhance quality of teaching and learning in uk's higher education[J]. Applied sciences,2022,12(1):1-21.

[13] NIKOLI■ N, GRLJEVI■ O, KOVA■EVI■ A. Aspect-based sentiment analysis of reviews in the domain of higher education[J]. The electronic library,2020,38(1):44-64.

[14] SURAPANENI K M, RAJAJAGADEESAN A, GOUDHAMAN L, et al. Evaluating ChatGPT as a self-learning tool in medical biochemistry: a performance assessment in undergraduate medical university examination[J]. Biochemistry and molecular biology education,2024,52(2):237-248.

[15] GANDHI A P, JOESPH F K, RAJAGOPAL V, et al. Performance of ChatGPT on the india undergraduate community medicine examination: cross-sectional study[J]. JMIR formative research, 2024(8):1-8.

[16] CLARK T M. Investigating the use of an artificial intelligence chatbot with general chemistry exam questions[J]. Journal of chemical education,2023,100(5):1905-1916.

[17] CHEUNG B H H, LAU G K K, WONG G T C, et al. ChatGPT versus human in generating medical graduate exam multiple choice questions—a multinational prospective study (Hong Kong S.A.R.,Singapore,Ireland,and the United Kingdom)[J]. PLoS one,2023,18(8):1-12.

[18] PEREIRA E, NSAIR S, PEREIRA L R, et al. Constructive alignment in a graduate? Level project management course: an innovative framework using large language models[J]. International journal of educational technology in higher education,2024(21):1-21.

[19] JORGE EPC, ARIEL RH.Enhancing programming education with an active learning plan and artificial intelligence integration[J]. Revista facultad de ingeniería, 2024 (33):1-16.

[20] LI L, KIM M. It is like a friend to me: critical usage of automated feedback systems by self-regulating english learners in higher education[J]. Australasian journal of educational technology, 2024,40(1):1-18.

[21] JARVIS A, HO A, LIM G. Impressing artificial intelligence: automated job interview training in professional english subjects[J].RELC journal,2024(4):1-9.

[22] STRANG K D, VAJJHALA N R. Integrating industry-crowdsourced projects in university capstone courses: a comparative study using parametric statistics and sentiment analysis[J]. Industry and higher education,2024,38(6):574-582.

[23] ZAKI N, TURAEV S, SHUAIB K, et al. Automating the mapping of course learning outcomes to program learning outcomes using natural language processing for accurate educational program evaluation[J]. Education and information technologies,2023(28):16723-16742.

[24] GUO J Q, BAI L D, YU Z H, et al. An AI-application-oriented in-class teaching evaluation model by using statistical modeling and ensemble learning[J]. Sensors,2021,21(1):1-28.

[25] MOON J, YEO S, BANIHASHEM S K, et al. Using multimodal learning analytics as a formative assessment tool: exploring collaborative dynamics in mathematics teacher education[J]. Journal of computer assisted learning,2024,40(6):2753-2771.

[26] WEN W K, LIU Y W, ZHU Z R, et al. A study on the learning early warning prediction based on homework habits: towards intelligent sustainable evaluation for higher education[J]. Sustainability,2023,15(5):1-15.

[27] ZHENG L Q, LONG M L, CHEN B D, et al. Promoting knowledge elaboration, socially shared regulation, and group performance in collaborative learning: an automated assessment and feedback approach based on knowledge graphs[J]. International journal of educational technology in higher education,2023,20(1):1-20.

[28] LIU L, SUBBAREDDY R, RAGHAVENDRA C G. AI intelligence chatbot to improve students learning in the higher education platform[J]. Journal of interconnection networks,2022(22):1-17.

[29] SOMERS R, CUNNINGHAM-NELSON S, BOLES W. Applying natural language processing to automatically assess student conceptual understanding from textual responses[J]. Australasian journal of educational technology, 2021,37(5):98-115.

[30] HOAR B B, RAMACHANDRAN R, LEVIS-FITZGERALD M, et al. Enhancing the value of large-enrollment course evaluation data using sentiment analysis[J]. Journal of chemical education,2023,100(10):4085-4091.

[31] OKOYE K, ARRONA-PALACIOS A, CAMACHO-ZU?譙IGA C, et al. Towards teaching analytics: a contextual model for analysis of students' evaluation of teaching through text mining and machine learning classification[J]. Education and information technologies,2022,27(3):3891-3933.

[32] ANDREWS-TODD J, STEINBERG J, FLOR M, et al. Exploring automated classification approaches to advance the assessment of collaborative problem solving skills[J]. Journal of intelligence,2022,10(3):1-24.

[33] WANG L, CHEN X Y, WANG C, et al. ChatGPT's" capabilities in providing feedback on undergraduate students' argumentation: a case study[J]. Thinking skills and creativity,2024(51):1-14.

[34] ALI ALJARALLAH N, KUMAR DUTTA A, ALSANEA M, et al. Intelligent student mental health assessment model on learning management system[J]. Computer systems science and" engineering,2023,44(2):1853-1868.

[35] UPADHYAY D K, MOHAPATRA S, SINGH N K. An early assessment of persistent depression disorder using machine learning algorithm[J]. Multimedia tools and applications,2024,83(16):49149-49171.

[36] CAI Y Y, TANG L. Correlation analysis between higher education level and college students' public mental health driven by AI[J]. Computational intelligence and neuroscience, 2022(1):1-11.

[37] MORRISON A S, USTUN B, HORENSTEIN A, et al. Optimized short-forms of the cognitive distortions questionnaire[J]. Journal of anxiety disorders,2022(92):1-7.

[38] BEARMAN M, TAI J, DAWSON P, et al. Developing evaluative judgement for a time of generative artificial intelligence[J]. Assessment amp; evaluation in higher education,2024,49(6):893-905.

[39] JANG Y, CHOI S, KIM H. Development and validation of an instrument to measure undergraduate students' attitudes toward the ethics of artificial intelligence (AT-EAI) and analysis of its difference by gender and experience of AI education[J]. Education and information technologies,2022,27(8):11635-11667.

[40] YANG T C. Application of artificial intelligence techniques in analysis and assessment of digital competence in university courses[J]. Educational technology amp; society,2023(26):232-243.

[41] MATTHEWS J A, VOLPE C R.Academics' perceptions of ChatGPT-generated written outputs: a practical application of turing's imitation game[J]. Australasian journal of educational technology,2023,39(5):82-100.

[42] SULEYMENOVA K, DAWOOD M, PSYLLOU M. Essays in economics in ICU: resuscitate or pull the plug?[J]. International review of economics education,2024(45):1-11.

[43] KOLADE O,OWOSENI A,EGBETOKUN A. Is AI changing learning and assessment as we know it? Evidence from a chatgpt experiment and a conceptual framework[J]. Heliyon,2024(10):1-21.

[44] LUO J H. How does GenAI affect trust in teacher-student relationships? Insights from students' assessment experiences[J]. Teaching in higher education,2024(4):1-16.

[45] CHAI F Y, MA J J, WANG Y, et al. Grading by AI makes me feel fairer? How different evaluators affect college students' perception of fairness[J]. Frontiers in psychology,2024(15):1-18.

[46] 吳龍凱,程浩,張珊,等. 智能技術賦能教育評價的時代內涵、倫理困境及對策研究[J]. 電化教育研究,2023,44(9):19-25.

[47] 張志華,王麗,季凱. 大數據賦能新時代教育評價轉型:技術邏輯、現實困境與實現路徑[J]. 電化教育研究,2022,43(5):33-39.

[48] 盧國慶,楊沁,賀相春. 生成式人工智能賦能高等教育形成性評價的價值、挑戰及路徑[J]. 電化教育研究,2024,45(11):84-91.

[49] 李運福,徐菲,李貝. 高等教育質量監測國家數據平臺現狀分析與改進建議[J]. 中國遠程教育(綜合版),2022,43(4):65-75.

[50] 李運福,楊方琦,王斐,等. 對“人工智能+高等教育” 三位一體的系統性思考[J]. 中國電化教育,2021(9):88-96.

[51] GUBA EG, LINCOLN YS. Fourth Generation Evaluation [M]. London: Sage Publications,1989: 21-31.

[52] GUSTAVO A, RAMON A. The Fifth Generation of Evaluation: Evaluating for Quality[EB/OL]. (2017-06-08)[2024-07-13]. https://artshumanitieshawaii.org/wp-content/uploads/2017/08/Mata-Toledo-Ramon-A.-2017-STEAM-HUIC.pdf.

[53] BOUD D, AJJAWI R, DAWSON P, et al. Developing evaluative judgement in higher education: assessment for knowing and producing quality work[M]. London: Routledge,2018:7-17.

[54] Russell Group. Russell Group principles on the use of generative AI tools in education [EB/OL]. (2023-07-04) [2024-07-12]. https://russellgroup.ac.uk/media/6137/rg_ai_principles-final.pdf.

[55] TEQSA. Assessment reform for the age of artificial intelligence[EB/OL]. (2023-01-01) [2024-07-12]. https://www.teqsa.gov.au/sites/default/files/2023-09/assessment-reform-age-artificial-intelligence-discussion-paper.pdf.

International Reference from Artificial Intelligence-enabled Evaluation Reform in Higher Education

LI Yunfu

(West China Higher Education Evaluation Center, Xi'an Jiaotong University, Xi'an Shaanxi 710049)

[Abstract] Deepening the reform of educational evaluation is an important driving force for promoting comprehensive education reform, accelerating the construction of a high-quality education system, and achieving the strategic goal of building a strong education country. Fully leveraging the advantages of the new generation of artificial intelligence technology and promoting the reform of" higher education evaluation is an important task of AI- enabled action. Based on activity theory, this paper constructs an analytical framework for empowering higher education evaluation reform with artificial intelligence from four aspects: collaborative reform of evaluation subjects, adaptive reform of evaluation objects, innovative reform of evaluation tools, and breakthrough reform of evaluation principles. Taking this framework as a reference, the key elements of existing international research on AI-enabled higher education evaluation can be summarized into three aspects: the scientific development of evaluation indicators is an important prerequisite for fully leveraging the role of artificial intelligence as an evaluation subject and achieving human-machine collaborative evaluation; the deep analysis of multimodal data is an important initiative to fully leverage the advantages of artificial intelligence and promote innovation of evaluation methods; improving relevant standards, systems or rules is an important guarantee to promoting the sustainable development of AI-enabled higher education evaluation reform. Taking this as a lesson, in order to better leverage the advantages of artificial intelligence technology, the reform of education evaluation in the following aspects needs to be deepeded in China: improve institutional norms to ensure the fairness and order of evaluation activities; optimize the indicator system and scientifically drive higher education reform; upgrade the digital base and comprehensively popularize digital education forms; strengthen the self-evaluation ability and ensure the effectiveness of technology-enabled reform; emphasize cultural cultivation and promote collaborative innovation of technology and institutions.

[Keywords] Artificial Intelligence; Higher Education Evaluation; Human-Machine Collaboration; Self-evaluation; Institutional Innovation

基金項目:2023年教育部人文社會科學研究青年基金“高校教學質量持續改進機制與模式研究”(項目編號:23YJC880058);2023年度陜西本科和高等繼續教育教學改革研究項目“高質量專業與課程聯動評估理論與實踐研究”(項目編號:23ZZ001)

[作者簡介] 李運福(1987—),男,山東聊城人。副研究員,博士,主要從事高等教育評估、教育數字化改革研究。E-mail:liyunfu@xjtu.edu.cn。

猜你喜歡
自我評價人工智能
我校新增“人工智能”本科專業
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
軍人習得性無助的表現及成因分析
青春歲月(2016年22期)2016-12-23 16:40:44
幼兒游戲中評價的三層階梯
考試周刊(2016年92期)2016-12-08 02:06:55
給你一個支點,玩轉“自我評價”
人力資源(2016年11期)2016-11-24 12:33:27
如何讓自我評價真實有效
在校大學生自我評價詞匯的探索研究
科技視界(2016年23期)2016-11-04 23:18:32
在體育課堂教學中培養學生自我評價能力
考試周刊(2016年81期)2016-10-24 11:11:49
主站蜘蛛池模板: 国产福利2021最新在线观看| 五月天天天色| 97狠狠操| 国产一区三区二区中文在线| 人妻少妇乱子伦精品无码专区毛片| 婷婷综合缴情亚洲五月伊| 一本色道久久88| 国产制服丝袜无码视频| 亚洲午夜综合网| 欧美日本不卡| 亚洲AV无码久久天堂| 亚洲免费毛片| 九色在线视频导航91| 1769国产精品免费视频| 一级香蕉人体视频| 67194亚洲无码| 国产一区在线观看无码| 永久天堂网Av| 国产sm重味一区二区三区| 日本欧美视频在线观看| 日韩国产欧美精品在线| 美女裸体18禁网站| 亚洲综合色区在线播放2019| 欧美国产中文| 亚洲久悠悠色悠在线播放| 五月婷婷丁香综合| 欧美a网站| 毛片免费网址| 亚洲欧美不卡中文字幕| 黄色一级视频欧美| 26uuu国产精品视频| 欧美成人免费午夜全| 无码人妻热线精品视频| 伊人91视频| 天天综合网色中文字幕| 22sihu国产精品视频影视资讯| 欧美日韩另类国产| 手机在线国产精品| 亚洲色图欧美视频| 无码免费视频| 国产黑丝一区| 91在线无码精品秘九色APP | 日韩小视频在线播放| 全裸无码专区| 久久成人国产精品免费软件| 久久99蜜桃精品久久久久小说| 国产aⅴ无码专区亚洲av综合网| 激情综合图区| 高清无码一本到东京热| 国产爽爽视频| 欧美亚洲欧美| 狠狠综合久久| 狠狠亚洲五月天| 日韩欧美国产成人| 日本午夜三级| 亚洲高清日韩heyzo| 亚洲区欧美区| 亚洲天堂精品视频| 欧美亚洲国产一区| 欧美a在线看| 国产肉感大码AV无码| 中文字幕永久在线观看| 国产成人禁片在线观看| 日韩高清成人| 久久精品日日躁夜夜躁欧美| 国产精品尤物在线| 无码高潮喷水在线观看| 日韩欧美91| 久久久精品国产亚洲AV日韩| 亚国产欧美在线人成| 色综合久久综合网| 99精品影院| 91色爱欧美精品www| 日本不卡在线| 色窝窝免费一区二区三区| 香蕉久久国产精品免| 啪啪国产视频| 国产成人精品亚洲日本对白优播| 国产va欧美va在线观看| 午夜视频免费试看| 婷婷色婷婷| 色综合天天视频在线观看|