基礎教育是國民教育體系的根基,評價改革是加快基礎教育現代化進程的關鍵環節。當前人工智能技術為基礎教育評價改革帶來新的契機,但在具體實踐中,仍面臨理念偏差、主體制約與技術依賴等諸多困境。推進教育數字化轉型,基礎教育評價改革應率先明晰發展方向,從厘清評價理念、增強主體關照、夯實技術基礎三方面入手,促進人工智能賦能基礎教育評價改革。
一、人工智能賦能基礎教育評價改革面臨的現實困境
隨著教育數字化轉型的深入推進,人工智能賦能基礎教育評價改革呈現出蓬勃發展態勢,但其面臨的諸多困境同樣不容忽視。
(一)理念偏差:科學教育評價觀的遲滯
教育評價理念是人對教育評價認識的直觀反映。《深化新時代教育評價改革總體方案》明確指出,要破除“五唯”痼疾,樹立科學的基礎教育評價理念。當前,一些地方仍存在的功利主義、工具主義與管理主義傾向遲滯了人工智能賦能基礎教育評價改革。其一,基于考評制度的功利主義評價傾向于片面追求分數與升學率,忽視了學生全面發展。其二,工具主義造成技術理性膨脹,導致評價功能迷失。人工智能技術具備參數大、算力強、速率高等優勢,教育評價者出于使用方便的考量,過于依賴監測、評價、分析系統,學生的多元個性被抽象為一組標準數據,導致評價育人功能的弱化。其三,管理主義取向的評價導致對價值關注不夠。教育評價的本質不僅是對學生過往成績的評判,還應當是對教育活動的改進。管理主義導向的評價易導致評價成為一個自上而下的控制過程,難以真正提升教育評價效能。
(二)主體制約:教育評價主體素養不夠
教育評價主體素養缺乏是教育評價改革面臨的現實難題。教育評價主體對人工智能技術的思想認識與實際應用能力,是落實人工智能賦能教育評價改革的關鍵。數智新時代對教育評價主體提出了新要求,亟待提升其數字素養。一方面,部分教育評價主體缺乏人工智能教育知識,在教育評價中設計、應用人工智能技術的能力不足,直接影響了教育評價活動的順利開展。另一方面,個別教育評價主體數字素養不夠,缺乏數據意識、計算思維與數字化創新能力,不能及時解決問題。
(三)技術依賴:教育評價應然價值萎縮
教育評價應然價值的實現要求技術必須服務于人特有的主體性。然而,在工具理性主導的教育評價實踐中,教育評價者的主體性可能因為技術依賴而被異化,導致被評價對象的需求被忽視,評價者的評價能力被削弱。同時,人工智能賦能的教育評價必然依賴于數據分析。海量數據分析支持的智能評價涉及評價主體的私人信息,數據的收集標準及其使用的安全性,可能會影響個體的信息安全。此外,囿于算法“黑箱”的復雜性,算法設計者的主觀偏見以及算法的固有缺陷,都可能在評價主體不知情的情況下,導致偏見與歧視等倫理問題。
二、人工智能賦能基礎教育評價改革的建設方向
人工智能賦能基礎教育評價改革困境的產生是多重因素共同作用的結果。基礎教育評價改革亟須主動回應技術變革,著力厘清理念、關照主體與技術保障,塑造人工智能賦能基礎教育評價改革新生態。
(一)厘清評價理念,樹立科學育人觀念
教育若想擺脫理念偏差的困境,亟待厘清評價理念,構建科學育人觀念。一是深入了解教育主體的實際需求。新時代基礎教育評價要實現本質功能,需增強對現實問題的把握。在進行規模化、批量化教育評價前,應借助人工智能技術開展評價測試,基于診斷情況總結經驗、提出改進措施,以提升評價的針對性與可操作性。二是堅決摒棄“五唯”現象,堅持將立德樹人作為教育評價的本質,確立“知識為基,能力為重,素養導向,價值引領”的評價觀,關注學生的全方位、全過程的發展,從根本上扭轉分數與效率至上的評價理念。三是工具理性應與價值理性相互補充、協調與融合。在教育評價過程中,應堅守教育的價值使命,真正回歸師生主體性本身,實現人、技術和教育的有機統一。
(二)增強主體關照,培育專業評價人才
全面關照基礎教育評價活動中的多元利益相關主體,是消解主體制約困境的有效策略。一方面,構建評價主體的智能素養培訓體系。人工智能賦能基礎教育評價改革涉及科研機構、政府、學校與企業等多元主體,不同主體需承擔不同的角色與職責。提升人工智能賦能教育評價效能,需加強對各級各類主體智能素養培訓的扶持。針對人工智能賦能基礎教育評價改革的核心訴求培育專業評價人才,實現對評價標準制定、評價過程開展、評價結果反饋以及評價實踐優化的有效推進。另一方面,探索多元主體協同參與的教育評價格局。借助人工智能技術建立多方參與的評價機制,為多元主體提供雙向或多向的協商對話,保障多元主體的良性互動,有助于形成多級主體相得益彰的評價格局。
(三)夯實技術基礎,驅動評價效能提升
技術基礎是驅動人工智能賦能基礎教育評價改革的重要保障。其一,多維度、全過程的真實數據是訓練智能評價模型的核心資源。只有真實性與精細程度高的數據,才能有效杜絕偏見,開展接近真實狀態的循證評價。其二,智能驅動是人工智能賦能基礎教育評價改革的重要模式。科學應用自然語言處理與數據挖掘技術,追蹤、處理與分析教育測評數據,能夠挖掘海量數據內隱的價值信息,實時反饋教育問題、精準預測教育趨勢并持續優化教育決策。其三,明確的人機協同機制是人工智能與基礎教育評價改革雙向賦能的有效路徑。在教育評價實踐中,不僅要破解技術層面的難題,注重技術倫理,助推人工智能技術向善賦能,更要明確評估所涉及人員的角色定位、責任權利與職業道德,使人工智能賦能教育評價改革走智能化、人性化、高效化發展道路。
三、人工智能賦能基礎教育評價改革的河南探索
作為教育大省,河南省對基礎教育評價改革的需求更為迫切,尋求智能技術賦能的動力也更加強勁。近年來,河南省基礎教育發展監測與評價中心(以下簡稱“監測中心”)開展了一系列監測與評價創新和探索,從指標體系研發,到人才隊伍建設,再到循證教育決策,全力推動人工智能的應用。
(一)體現“五育”并舉理念,賦能指標體系建構
指標體系是監測與評價的靈魂,決定了評價改革的效用與效益。河南省在教育評價體系改革中,注重“五育”并舉,以師生數字素養評價豐富評價內容,構建了助力學生成長的“生態指標體系”評價模型。在學生成長指標設計中,不僅融合了學生發展核心素養、綜合素質評價等相關體系的關鍵要素,還納入了社會情感能力、高階思維等最新研究成果,尤其突出了數字素養評價,以呼應數智時代對學生發展的新要求。在學生發展相關因素架構設計中,根據生態系統觀點,納入了國家義務教育優質均衡發展督導評估的所有縣級和校級指標,還通過調查學生、家長、教師、校長、教研人員和區域教育管理人員,納入了學生個體、學生家庭、教師、班級、學校、區域等多方面的影響因素,由此構成了一體化、立體式、全方位的生態指標體系,以期通過監測與評價改革,帶動教研、教學、學校發展協同提升,全力支持學生健康與全面發展。
(二)強化教研教學,賦能命題機制改革
在“生態指標體系”指導下,命題是監測評價的首要任務。人工智能賦能命題機制改革,不僅體現于命題內容,也貫穿于命題過程,更有助于命題意圖落實到教學一線。在此過程中,命題的理念與思路,能否獲得教研人員的理解、認同和實踐,是帶動一線教師教學和評價改革的關鍵。監測中心通過開展監測命題趨勢研討和系列培訓,匯聚相關教研人員,打造省域監測命題專家庫。在人工智能技術賦能下,以往命題各環節的技術壁壘、資源屏障、經驗局限逐一被打破,不僅教研人員的命題能力得以快速提升,優質監測題庫也得以快速構建。
為更好實現這一目標,監測中心根據教研協同進展,逐步提供人工智能輔助評價與應用系列培訓,以適當形式開放監測平臺,包括測試系統、閱卷系統、相關因素調查系統、數據分析系統和數字地圖可視化系統,甚至在一定程度上開放監測題庫,免費供一線教師使用。由此,最大限度降低了技術和資源門檻,力促一線教師參與評價改革,以期突破從監測評價到質量提升的下行瓶頸。
(三)提升分析技術,賦能循證教育決策
從監測評價到質量提升,還存在一個上行瓶頸,即循證教育決策。服務教育決策,是監測評價的重要職能。監測中心面對紛繁復雜的多源異構數據,創新了一系列數據清洗、集成和處理方案,例如大規模非隨機缺失數據處理方案、中招成績數據潛在地市級評分偏差處理方案、校際差異率算法國家督導和優均監測的對標校正方案、學業水平對標分級方案等,探索建立適合省情的監測體系和監測工具,為開展基礎教育監測和評價提供支持,為河南省基礎教育信息化建設與智能評價提供決策建議,推動基礎教育質量監測與評價轉向信息化、高效化、科學化。
(本文系2023年度河南省高校哲學社會科學應用研究重大項目“技術賦能視域下河南促進教師專業發展的行動路徑與實施策略研究”的研究成果,項目編號:2023-YYZD12;2021年度河南師范大學高等教育教學改革研究與實踐項目“‘互聯網+’背景下教育碩士實踐教學能力培養體系構建與應用”的研究成果,項目編號:YJS2021JG02)
(朱珂,河南省基礎教育發展監測與評價中心主任,河南師范大學教育學部副部長,博士生導師;吳雅欣,河南師范大學教育學部在讀碩士研究生;李明,河南師范大學教育學部教師;孔德宇,河南師范大學教育學部在讀博士研究生)