陳雨萱,楊立軍
(1.南京郵電大學教育科學與技術學院;2.南京郵電大學教學質量監(jiān)控與評估中心,江蘇南京 210023)
21 世紀,我國大力發(fā)展人工智能等先進技術,通過資金投入、技術研發(fā)等,力求追趕世界先進水平。同時,精準把握教育發(fā)展新趨勢,加強與拓寬人工智能、大數(shù)據(jù)、區(qū)塊鏈等技術在教育領域的應用,適時、重點推進教育信息化戰(zhàn)略。近幾年,中共中央發(fā)布《加快推進教育現(xiàn)代化實施方案(2018-2022 年)》、《中國教育現(xiàn)代化2035》等重要文件,更將“大力推進教育信息化”作為一個單獨條目列出[1]。在此背景下,我國教育目的從培養(yǎng)“知識人”逐步轉變?yōu)榕囵B(yǎng)“現(xiàn)代化智慧人”,一種新的教育方式——智慧教育順勢而生。
教育與技術的融合發(fā)展經(jīng)歷了不同的階段,其中教育評價隨著技術的發(fā)展也不斷經(jīng)歷改革與創(chuàng)新。正確的評價是促進個人健康成長的重要基石,是推進教育健康發(fā)展的不竭動力。19 世紀末,我國教育信息化進入以多媒體教育為核心的1.0 時代[2],多媒體設備作為工具為教育評價提供便利,教師是否使用多媒體進行教學進而被納入了教育評價的范圍。網(wǎng)絡教育是教育信息化2.0 時代的核心,國家大力建設教育資源和教育管理的公共平臺,籌辦開放大學,形成共享的網(wǎng)絡學習空間[3],教育評價也在不斷地探索中引入了不同的主體、內容和指標[4],網(wǎng)絡信息和數(shù)據(jù)的傳輸為教育評價提供了便捷。教育信息化3.0 時代以“互聯(lián)網(wǎng)+教育”為標簽,基于大數(shù)據(jù)技術開啟了教育評價的嶄新篇章,人人都能成為教育評價中的參與者,各項因素都可以被囊括在教育評價體系之中[5],然而大部分想法尚處于理論階段,距離實踐有較大差距。目前,伴隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能技術與教育過程深度融合的教育信息化4.0 新時代的到來,智慧教育也進入了新的發(fā)展階段。這一時期的教育會有什么樣的變化?教育評價又會因此出現(xiàn)怎樣的突破?還會面臨著什么樣的問題?
教育智慧評價以智慧教育為基礎,與智慧教育相伴而生、協(xié)同共進。2020 年10 月,國家發(fā)布《深化新時代教育評價改革總體方案》,指明了新時代背景下教育評價改革的方向,教育評價現(xiàn)代化是教育現(xiàn)代化的重要內容,未來人工智能時代下的教育智慧評價更是教育評價建設的重要方向。劉金松等[6]認為,教育智慧評價作為結合多種評價的新型方式,其目的在于使教育評價更加智慧。理論上,教育智慧評價能夠更多地關注學習者的個性需要,促進學習者的多元發(fā)展,有利于推動教育的全新變革,從而滿足新時代教育高效率培養(yǎng)高質量人才的需求,是未來教育評價發(fā)展的新趨勢。因此,本文聚焦教育領域的智慧評價進展,梳理其發(fā)展歷程、研究其發(fā)展現(xiàn)狀,并對它的未來趨勢進行探討,這對于定位我國教育現(xiàn)代化發(fā)展階段,推進我國教育現(xiàn)代化發(fā)展進程具有重要的實踐價值,尤其是對教育評價的現(xiàn)代化建設具有重要價值。
祝智庭等[7]認為,教育是由內而外覺悟智慧的過程,智慧教育可以最早追溯到錢學森所提出的“大成智慧學”和IBM 所倡導的“智慧地球”戰(zhàn)略。二者都包含智慧的字眼,智慧涵蓋了理性的智慧、實踐的智慧和價值的智慧,因此智慧教育除了為智慧而教,也包含應該教的智慧。
本文所提及的智慧教育,是指在教育信息化背景下,將人工智能、區(qū)塊鏈等新型技術與教育全過程相結合,以大數(shù)據(jù)賦能教育,從而進行深度挖掘和精細分析,為教育各環(huán)節(jié)提供準確、全面的反饋與調節(jié)的活動。這種活動不僅僅是利用先進技術優(yōu)化教育,而且是教育和技術的雙向促進、相輔相成。
本文將智慧教育評價和教育智慧評價進行區(qū)分,認為智慧教育評價是對智慧教育這一教育新形式的評價,而本文主要探討的教育智慧評價則是基于智慧教育背景下的評價方式,其有別于工具性的機器評價,并非單純地依靠機器對人的評價以省去冗余步驟,而是希望在借助先進技術展開理性評價的同時結合“以人為本”的個性評價。技術支撐的智慧評價實現(xiàn)了單憑人無法完成或者很難完成的數(shù)據(jù)采集和分析挖掘工作,從而構建出教育全程、全息、立體準確的評價。因此,教育智慧評價是在教育信息化背景下,在人工智能、區(qū)塊鏈等新型技術與教育全過程相結合的智慧教育基礎上而進行的全方位深層次的數(shù)據(jù)搜集、深度挖掘和精細分析,可以為教育各環(huán)節(jié)提供準確、全面、系統(tǒng)評價并給出針對性建議的評析和診斷活動。目前,我國想要實現(xiàn)的教育智慧評價主要是通過結合智慧學習、智慧教學方式,使用科學技術進行的以數(shù)據(jù)為導向、全面綜合、以人為本以及為終身學習服務的教育評價新模式。
任何事物的發(fā)展都需要一個過程,教育智慧評價也不例外。教育智慧評價的發(fā)展需要經(jīng)歷萌芽、探索階段才能趨于成熟。
2.1.1 萌芽階段
教育智慧評價是智慧教育背景下的評價方式,早在中國還處于建設階段的20 世紀,中國學界已經(jīng)受到過智慧教育思想的前身,即錢學森所提出的“大成智慧學”的影響。而一些發(fā)達國家科學技術發(fā)展迅猛,加上受到第四代教育評價多元化價值理念的影響,美國、新加坡、日本等國家在20 世紀末便帶頭推行智慧教育計劃,開始使用大數(shù)據(jù)等先進科技進行教育評價[8]。1996 年,美國推行國家教育信息化發(fā)展戰(zhàn)略,2001 年頒布《不讓任何一個孩子落后》法案后[9],基于大數(shù)據(jù)和人工智能的教育智慧評價也更加深入、有效。同樣地,類似于馬來西亞等勢頭強勁的發(fā)展中國家也從1996 年開始實施“智慧學校計劃”,積極促成教育評價方面的變革。以“智慧評價”為主題詞在中國知網(wǎng)(CNKI)使用順查法搜索其收錄的與教育有關的早期文獻,如圖1 所示。這些文章大多與學科教學有關,發(fā)布機構集中在華東等地區(qū),為適應新課改要求,將智慧評價聚焦于教師在課堂上使用充滿智慧的用語等教育機智對學生進行評價,以優(yōu)化教學效果,激發(fā)學生主動性。因此,本文探討的教育智慧評價概念在此時并未成型,但又因為我國在這一時期正處于多媒體技術走進教室的教育信息化1.0 時代,計算機技術作為教學工具能夠通過互動實現(xiàn)便捷、多元的評價以解放教師、解放學校,智慧評價的想法初步萌芽。2008 年,美國IBM 提出構建“智慧地球”戰(zhàn)略后,智慧城市、智慧學校、智慧教育的概念得以明晰和傳播。2012 年,中國學者祝智庭教授對智慧教育的概念加以闡述,引發(fā)學界關注,在此之后,我國基于智慧教育的教育智慧評價理論研究和應用研究占據(jù)了一席之地,發(fā)文數(shù)量與日俱增。

Fig.1 Annual frequency of literatures on smart educational evaluation圖1 教育智慧評價相關文獻各年份出現(xiàn)頻次
2.1.2 探索階段
由于受各種因素影響,各國教育智慧評價發(fā)展速度不一,新加坡、美國等發(fā)達國家或教育強國對教育智慧評價的起步早、關注高、投入多,已經(jīng)嘗試搜集教育時的眼動、腦電等生理數(shù)據(jù),進行學習過程的數(shù)據(jù)建模,使用游戲式評價等。新加坡使用自動批卷系統(tǒng)、建立知識圖譜,鼓勵將新的教學方法、更好的評價方式、先進的科技運用到教育中來;美國關注數(shù)據(jù)在教育評價與決策中的應用,建立數(shù)據(jù)系統(tǒng)、保障數(shù)據(jù)質量,實行更全面客觀的教育評價;李詠翰等[10]提到韓國也通過構建在線學習評價系統(tǒng)改進自身教育評價的不足。我國在2017 年大數(shù)據(jù)應用風靡一時期間將目光聚焦于教育領域,重點研究大數(shù)據(jù)在教育中的應用,技術和教育激烈碰撞,擦出許多驚喜的火花,擴展了教育評價空間[11],從現(xiàn)實世界衍生到網(wǎng)絡平臺,超星、爾雅、知到等學習平臺讓評測更加客觀、高效、多元,共享數(shù)據(jù)平臺能夠完成對一個人一生的學習追蹤評價;增強評價依據(jù)的可靠性,客觀數(shù)據(jù)的呈現(xiàn)和分析,加上計算機科學的精準處理,讓教育評價更加公平、透明[12];實現(xiàn)教育評價多主體,從他評轉變?yōu)樽栽u、互評等多種模式,使評價多角度,且更具說服力。2020 年新冠疫情期間,無數(shù)學子、教師被迫進行在線教學,使得智慧教育和教育智慧評價關注度飆升。后疫情時代,越來越多的國家加入教育智慧評價的陣營。在我國,許多地區(qū)的中小學廣泛開展了智慧評價項目,試圖利用智能平臺,聯(lián)結家、校、學生,形成追蹤、診斷、反饋、調節(jié)的評價體系[13]。智慧教育評價的不斷發(fā)展,讓教學、教育更加精彩,但是在實際操作過程中也存在很多局限,如在評價時過分側重于工具的精美,偏離實際任務的核心。整體而言,目前全球教育智慧評價處于探索階段,雖在評價觀念、工具、內容等方面有所創(chuàng)新,但在落實的過程中仍面臨著重重困難,在這一階段,教育智慧評價的發(fā)展重點在于不斷完善理論研究,并創(chuàng)造條件將理論付諸于實踐。
雖然各國教育智慧評價發(fā)展進度并不統(tǒng)一,但在目前發(fā)展階段中,我國基于教育智慧評價的理念關注、基本條件和技術支持等方面已呈現(xiàn)出較為清晰的脈絡。
2.2.1 理念關注有局限
近幾年,我國出臺了一系列相應政策,如《新一代人工智能發(fā)展規(guī)劃》《教育信息化2.0 行動計劃》和《中國教育現(xiàn)代化2035》等;也與聯(lián)合國教科文組織聯(lián)合舉辦了許多與智慧教育有關的國際論壇,如“國際人工智能與教育大會”“全球智慧教育大會”等。國家實施這些舉措無不希望將教育和新科技結合起來,時刻把握國際智慧教育新動向,使教育能夠適應技術、利用技術、融合技術從而促進個性化學習、智慧化教學、追蹤型評價,真正讓教育為現(xiàn)代化服務,滿足人的需要。
以往以結果為導向的教育評價常常將篩選人作為目的,經(jīng)過層層選拔將同學、教師和學校等歸類,間接通過教育實現(xiàn)了社會分層。劉金松等[6]提到,教育智慧評價的一大進步就是區(qū)別于之前以選拔為主的評價目的,將選拔和發(fā)展相結合,并更加側重于發(fā)展。2020 年10 月發(fā)布的《深化新時代教育評價改革總體方案》強調教育評價的現(xiàn)代化,同樣鞭策著教育評價更加“智慧”。無論是國家政策引導還是教育從業(yè)者的實踐經(jīng)驗總結,教育智慧評價的種子已經(jīng)埋在了很多人心中。
但是,截至2021 年底,以“教育智慧評價”、“教育評價”并含“智慧”、“智慧評價”并含“教育”為主題詞,使用Bicomb 2.0 軟件對CNKI 知網(wǎng)中337 篇相關論文進行關鍵詞詞頻統(tǒng)計,獲得關鍵詞759 個,其中頻次小于3 的關鍵詞占比61.274 5%,選取頻次≥3 的關鍵詞為高頻關鍵詞,最后得到66 個高頻關鍵詞(見圖2),占比38.725 5%。在這些高頻關鍵詞中“智慧教育”出現(xiàn)106 次。由此可見,我國對于教育智慧評價的理念關注還不夠,僅局限于教育工作者及部分思想先進的學者身上,且他們對于教育智慧評價的研究多包含在智慧教育或技術賦能教育評價的探討中,教育智慧評價還未完全成為一個獨立熱議的話題。這與我國教育智慧評價相關政策不足有關,缺乏深入的宣傳和剖析,針對該問題,教育系統(tǒng)已經(jīng)開始加強智慧評價的宣傳,推進智慧評價項目開展,在不斷的探索與完善中逐步促進公眾觀念的轉變。
2.2.2 基本條件有差異
全球各國教育資源并不均衡,在我國,教育因資源分布不均衡而屢遭詬病,并且嚴重導致了教育不公平,具體體現(xiàn)在發(fā)達地區(qū)和落后地區(qū)間,體現(xiàn)在師資力量、學習內容和學習方式上。實行教育智慧評價的基礎是教育主體擁有基本的信息化素養(yǎng),教育設備數(shù)量充足、功能先進,以及管理機制完備合理。只有這樣才能確保教育智慧評價在搜集和分析數(shù)據(jù)、整合和反饋信息時能夠得到教育主體的高效配合和迅速理解。

Table 1 High-frequency keyword statistics表1 高頻關鍵詞統(tǒng)計
2019 年,我國部署創(chuàng)建“智慧教育示范區(qū)”,截至2020年,名單聚焦于擁有較高信息化水平和智慧教育管理經(jīng)驗的地區(qū),囊括3 個直轄市、4 個省會、1 個經(jīng)濟特區(qū)和4 個東部經(jīng)濟發(fā)達城市。這些地區(qū)面向大眾宣傳教育智慧評價理念,在擁有比較完備的評價設備和系統(tǒng)的同時,能夠發(fā)展教育大數(shù)據(jù)的收集與共享機制、保障并維持網(wǎng)絡安全,并在實踐中推動各部門協(xié)同創(chuàng)新,進而在推進建設智慧城市、實行智慧教育與教育智慧評價中獲得了許多有效的經(jīng)驗。然而,信息化水平和教育資源幾乎齊頭并進,在國家推行教育信息化后,我國各省市地區(qū)由于資源分配不均,智慧教育發(fā)展也并不均衡,教育智慧評價更只在部分經(jīng)濟發(fā)達或重點地區(qū)及學校小有成效。類似云南、西藏、青海等省份的偏遠地區(qū),缺乏充足的智能設備、專業(yè)的教師以及先進的教育評價理念,常年接受發(fā)達地區(qū)的定向扶助,勉強可以完成正常教學任務,進行教育智慧評價于他們而言很難實現(xiàn)。再者,在我國目前社會背景和應試教育現(xiàn)狀下,即使是基礎條件較好的地區(qū)也很難完全落實選拔和發(fā)展相結合的教育智慧評價目標,更多的評價仍側重于選拔人才,很難擺脫傳統(tǒng)評價重分數(shù)的桎梏[14]。從教育大國向教育強國邁進的過程中,需要一點一點的發(fā)展和突破,“示范區(qū)”先行,能夠帶動基礎條件落后地區(qū)逐步實現(xiàn)教育智慧評價的不斷發(fā)展。
2.2.3 技術支持有不足
既然智慧教育源于技術和教育的賽跑,那么教育智慧評價必然離不開技術的支持。朱成晨等[15]認為,要想讓教育真正擁有“智慧”,并且日益創(chuàng)新,首先需要讓教育評價適應新技術,主動跟上技術的步伐;其次教育評價需要融合技術,使技術和評價形成一體的系統(tǒng);最后教育評價要鞭策技術的優(yōu)化和創(chuàng)新,通過促進技術的發(fā)展進而驅動教育評價的進步。
目前,我國正在教育評價中逐步普及以人工智能、區(qū)塊鏈為代表的智能技術。使用數(shù)據(jù)進行知識追蹤,并以概率圖等方式將結果呈現(xiàn)在大家面前,且為學生的每次測評提供全面的學科診斷報告[16]。然而,即使在評價前積累了很多基于過程的數(shù)據(jù)并作分析,可真正將過程中的數(shù)據(jù)作為評價標準的情況還是太少[17],技術和教育的結合并不到位。目前,智能評卷系統(tǒng)是應用比較廣泛、技術比較完善的教育智慧評價工具,基于人工智能的智能評卷將機器評分與人工評分進行融合,在減少教師閱卷任務量和閱卷時間的同時還有利于縮小閱卷誤差,加上其能夠快速、自動地搜集數(shù)據(jù),形成各種形式的考試結果反饋,十分便于學校、教師、學生和家長了解情況,以進行針對性的調整和改進[18]。類似去中心化的區(qū)塊鏈等技術在教育評價中也蘊藏著巨大潛力,但這些技術的應用既缺乏廣泛的社會認可,又缺少規(guī)范性的政策指導,再加上人才缺失以及部分功能可以使用其他技術替代,實際應用存在阻礙。此外,經(jīng)過新冠疫情時期的在線學習可以發(fā)現(xiàn),目前很多可供使用的在線軟件存在功能崩潰的隱患,評價時會發(fā)生“機器”一刀切等問題。不過,隨著對這些工具的重視和使用頻率的增加,這些技術漏洞和不足正不斷得以修復和完善。
綜上所述,我國目前的教育智慧評價發(fā)展還集中在教育評價適應科技和融合技術的前兩個層面,依靠先進技術的理性評價和“以人為本”的人文評價比例區(qū)分還不夠明晰,多元評價耗時長、難度大,數(shù)據(jù)繁雜,評價標準仍需要調整,且大多數(shù)的教育智慧評價僅用來參考,并不直接影響評價結果。
目前常用的教育智慧評價方式是抓取大數(shù)據(jù),利用先進的科學技術最大程度上搜集并保留所有能夠搜集到的有用數(shù)據(jù),并進行深度分析、及時反饋、智能預測。張樂樂等[19]認為,這種數(shù)據(jù)驅動評價拓展了評價功能、提升了評價效率,為未來一體化評價模式建立奠定了基礎。未來的教育智慧評價將更加“智慧”,具體體現(xiàn)在如下方面。
在教育和技術深度融合的時代,無論是促進教育的便捷,還是推動技術的發(fā)展,智慧教育都勢在必行。智慧教育的理念宣傳能在一定程度上改變知識和信息的獲取途徑、呈現(xiàn)形態(tài)以及學習方式。伴隨著智慧教育的推進,2015 年1 月,教育部給每位學生發(fā)放了終身唯一的學籍號,并制作電子學檔,希望實現(xiàn)對一個人一生的學習追蹤。這種情形下的學習要求遵循個性化、注重過程化、提高效率、滿足全面發(fā)展需要,評價便也相應地需要進行多主體、多指標的個性化評價和過程化評價,且便捷、全面。這不僅是教育智慧評價的基本特征,也正符合當今我國對教育評價改革的希冀。
以往以教師、分數(shù)為主的單一、主觀評價因缺乏客觀性和全面性而飽受詬病,教育智慧評價能夠彌補部分缺陷,如對學生進行評價時,將學生的思想道德、學習態(tài)度、課堂表現(xiàn)、言行舉止等都列入評價內容之中,將同學自評、小組互評、家長評價和教師評價相結合[20],既針對性又多元化看待問題,關注每一位教育參與者的表現(xiàn),洞察其內心世界,使得評價準確、透徹。班額問題作為學生和家長們最為關心的教育問題之一,也會直接或間接影響教育質量,一個教師面對一個班級幾十個學生,幾個班級幾百個學生,很難做到準確評價,教育智慧評價利用先進的技術工具,自動獲取、處理和反饋數(shù)據(jù),可以代替教師完成部分繁瑣冗余工作,提高教育評價的效率、解釋力和預測力[21],為因材施教創(chuàng)設條件。在未來,智慧評價的理念將不斷俘獲人心并得到落地。
在教育信息化發(fā)展進程中,我國正加速建設數(shù)字校園,不斷改善基礎設施設備,優(yōu)化教育資源分配[3]。21 世紀以來,我國提倡實行素質教育,要求學生掌握一定的計算機技能以促進其全面發(fā)展,從而培養(yǎng)創(chuàng)新精神,提升實踐能力。因此,信息化素養(yǎng)成為Z 時代(指95 后)的必備素質,并且貫穿于其學校教育階段的綜合實踐活動及社會生活的各方各面。實現(xiàn)教育智慧評價,離不開科學技術,更離不開計算機。可對于一些年紀稍長、未有過多機會接觸先進科技的教師和學生而言,由于缺乏智能化素養(yǎng)、缺少計算機技能等,可能無法緊跟時代教學技術的腳步[22]。上傳信息不便、讀取信息困難,面對諸如此類的問題,教育智慧評價也敦促著教育過程的所有主體堅持終身學習,掌握基本信息技能、擁有一定的學習更新能力,以適應科技時代的教育需求。未來的教育智慧評價領域必須培養(yǎng)出一批既掌握教育相關知識,又精通人工智能等先進技術的人才,組織各級各類教育機構從業(yè)人員持續(xù)針對信息化素養(yǎng)進行繼續(xù)教育,促進教育智慧評價的推廣和落地。
教育的發(fā)展與政治、經(jīng)濟、文化、科技等都息息相關,終身學習是21 世紀的生存之道,脫離了學校的學習階段,教育智慧評價也顯得尤為重要。秦靜怡等[23]提出高等教育評價應該對接社會各界,實現(xiàn)多行業(yè)協(xié)同促進教育發(fā)展。多領域合作是實現(xiàn)教育智慧評價與可持續(xù)發(fā)展的重要機制,通過數(shù)據(jù)共享,資源互通,集社會、政府、學校等多方力量,能夠探尋教育和相關領域之間的聯(lián)系,發(fā)現(xiàn)更多問題,提出更加有針對性的意見。既能提高教育質量治理效能,在促進全領域、可持續(xù)的發(fā)展上有所成效,又可以在多領域的共同治理下防止技術的不正當使用,保護數(shù)據(jù)和個人隱私,避免信息孤島。
高性能數(shù)據(jù)采集、存儲與計算是實現(xiàn)教育智慧評價的基礎工程。我國的教育智慧評價是基于大數(shù)據(jù)的人文理性相統(tǒng)一的評價方式[14]。何永紅[24]、祝智庭[25]認為,教育智慧評價利用先進的科學技術廣泛搜集教與學過程中的各項數(shù)據(jù),將教育過程可視化,能夠突破教育評價瓶頸,通過糾正主觀記憶和感受,使得描述與解釋現(xiàn)象更加準確、預警和調整當前學習更加及時、預測和指導未來方向更加明晰,從而達到實時反饋、常態(tài)反思、合理評價、及時調整的目的,讓學習者了解自己的學習情況、讓教學者明晰自己的教學問題,以此優(yōu)化教、學生態(tài)系統(tǒng)。基于數(shù)據(jù)的實證分析較經(jīng)驗分析更加客觀且具有直觀性和生成性,數(shù)據(jù)采集、存儲和計算作為教育智慧評價的三座大山,是非常重要的基礎建設工程。夯實全面、全程、全息的教育智慧評價數(shù)據(jù)基礎,持續(xù)優(yōu)化數(shù)據(jù)搜集來源,明確數(shù)據(jù)搜集廣度和深度,在保證數(shù)據(jù)安全性和有限性的同時不斷拓寬數(shù)據(jù)采集面和利用率,進而利用大容量空間進行快速存儲、計算和調用,才能為教育智慧評價開好頭、起好步。
科學的評價模型是實現(xiàn)教育智慧評價的關鍵技術。教育評價一直以來面臨的難題是確定誰來評價、評價什么、使用何種指標、如何兼顧多種指標等。教育智慧評價運用好多主體評價、多方面評價、全程全息評價和發(fā)展性評價等評價方式,能夠高效、精準地解決這些難題。首先,評價學生方面,可以從以往的“雙基”即基礎知識、基本技能轉變?yōu)椤八幕保椿A知識、基本技能、基本思想和基本活動經(jīng)驗甚至更多,利用教育智慧評價對學生的身體健康、心理健康等進行實時監(jiān)測,可以促進其德智體美勞全身心發(fā)展;其次,評價教師不僅僅通過學生的學業(yè)成績反映教師的教學能力和教學水平,更要從教師發(fā)展的角度,采用基于教師課堂表現(xiàn)的音視頻材料進行評價,使其更加直觀地了解到自己的教學問題所在,從而鞭策教師端正教學態(tài)度、優(yōu)化課堂教學方法模式、精細組織課堂教學內容,準確預測其“高原期”;此外,評價學校可以遵循劉邦奇等[26]提倡的從學生起點評價出發(fā),而非僅僅由其培養(yǎng)的學生成績?yōu)橐罁?jù),在了解學生基礎的情況下,以學生的進步作為衡量指標來評價學校的教學水平。未來,隨著技術的日益更新和進步,教育智慧評價模式將更加精細和完善,在算法層面,堅持問題修復和更新優(yōu)化,不斷適應未來評價需求,構建出信度、效度更加科學合理且能夠切實保障教育公平、促進教育發(fā)展的教育評價新模式;在價值導向層面,樹立正確的教育智慧評價價值取向,持續(xù)研究如何能夠讓技術實現(xiàn)更加有“溫度”的評價,如何更加傾向于培養(yǎng)人的創(chuàng)新精神和實踐能力、更加信賴那些關注人的內心,以促進其潛力發(fā)展。
一體化評價系統(tǒng)是實現(xiàn)教育智慧評價的重要平臺。王竹立[4]發(fā)現(xiàn),美國基于教育智慧評價建立了國家級—州級—學區(qū)級—校級在內的各級各類教育數(shù)據(jù)系統(tǒng),以促使教育問責體系的落實和完善。我國的教育智慧評價也要從過程出發(fā),要以全面系統(tǒng)的視角,洞察真實的教育參與者,爭取將教育所涉及的多方面、多領域、多元素整合在一套系統(tǒng)中,將更多理論層面的研究付諸于實踐,實現(xiàn)學生端、教師端、家庭端、學校端的教育大數(shù)據(jù)自動采集,完成分類和集中存儲,進行不同角度的淺層及深度分析,做到定點、及時、多元的歸納和反饋,使得評價的整個過程操作更加簡單靈活、可視化的領域和呈現(xiàn)方式更加豐富多彩,實現(xiàn)真正的評學教研一體化,從而提升教育評價的效率和效益。
未來的智慧教育將更多關注人的智慧,重視人的個性化,并將評價面向全教育過程,針對全部教育參與者,將多元評價主體、多種評價方式等相結合,以破除成績導向、結果導向的不正確評價原則,給學校和教師教學、學生學習學習營造出氣氛適宜、操作便捷、反饋準確、信息及時的教育新環(huán)境。但教育智慧評價在借助大數(shù)據(jù)和人工智能等技術試圖突破教育評價的瓶頸、順應未來教育發(fā)展趨勢的過程中仍存在著諸多問題,如果不加以重點關注,教育智慧評價將會陷入誤區(qū),阻礙教育健康發(fā)展。
一旦涉及技術和教育融合,不免會圍繞倫理問題產(chǎn)生很多爭議,并且該問題將在很長一段時間內困擾著大家。在評價前期如何搜集數(shù)據(jù),這些數(shù)據(jù)來源的正當性、傳遞過程的安全性、公之于眾有無授權,都是關注的重點。當人臉識別、實時監(jiān)控初進校園時,其帶來的隱私曝光和泄露問題便爭議不斷。智能時代信息公開,對于能夠接觸到這些數(shù)據(jù)的人員權限問題應該有嚴格的操作要求和規(guī)定、合適的處理機制和措施,對于學生的隱私問題[27]也必須有實實在在的保護方法,只有確保學生處于健康的評價環(huán)境中,才能推動公眾相信和認可智慧教育評價,才能真正實現(xiàn)教育評價促進個人健康發(fā)展的目標。
在利用技術、融合技術的過程中,教育智慧評價隱約存在著過分技術主義的偏向。智慧評價是利用技術進行教育評價而非完全依靠技術進行評價,即“智慧”是工具、是手段,而評價是核心。技術為評價服務,評價促進技術發(fā)展。如果一味重視技術的研發(fā)和使用而忽視評價,可能會卷入“唯工具”的漩渦中。黃榮懷等[28]強調,人工智能、互聯(lián)網(wǎng)等技術對教育評價所起到的是長期作用,因此實施教育智慧評價時,一定要遵循規(guī)律,把握技術賦能教育評價的發(fā)展進程,理性評估技術研發(fā)進度,在技術和評價中找到平衡。此外,部分冷冰冰的程序如果不加以平衡人的溫度,對出現(xiàn)相同結果的情況將會給出一致的分析,從而忽視人的主體性和個性化差異。在評價的具體實行過程中,要防患于未然,避免數(shù)據(jù)行為表象、數(shù)據(jù)偏見、黑匣子等問題[29],從人的角度出發(fā),保障評價的公平性和導向性。
教育智慧評價作為新時代的教育評價理念,追求評價內容的多元和全面,但教育中是否所有的要素都需要進行智慧評價,是否所有的要素都適合進行教育智慧評價,值得思考。首先,并非所有事物都能用數(shù)據(jù)衡量,當遇到技術無法解決的情況時,是否還有進行教育智慧評價的必要?其次,教育智慧評價應該是個性化的、智慧的,當面對不同群體、不同目的時,給出的評價和判斷也應具有針對性。面向未來教育,教育智慧評價需要不斷試錯,探尋適合的評價要素和適宜的評價主體,努力劃分好適用界限,在正確的領域中發(fā)揮出教育智慧評價的最佳成效。