摘要:智能教研是人工智能熱潮下的政策導(dǎo)向與實踐熱點,然而,當(dāng)前普遍存在對智能教研本質(zhì)的認(rèn)識不清,由此導(dǎo)致對其的盲目追捧及實踐誤區(qū)頻現(xiàn)?;趯θ斯ぶ悄鼙举|(zhì)和教研本質(zhì)的雙重考察,智能教研在本質(zhì)上是一種以可信模型采集的教研數(shù)據(jù)為基礎(chǔ),通過“人—機—人”協(xié)同教研決策,實現(xiàn)“三性”(即科學(xué)性、技術(shù)性和經(jīng)驗性)優(yōu)化的循證實踐。據(jù)此審視智能教研的典型誤區(qū)主要體現(xiàn)在囿于可疑模型的教研數(shù)據(jù)、高估數(shù)據(jù)效用的教研決策、陷入單性異化的教研循證實踐三個方面。為走出現(xiàn)有誤區(qū),未來智能教研亟須通過三大途徑實現(xiàn)理性回歸:一是聯(lián)合研發(fā)保障智能教研數(shù)據(jù)質(zhì)量的可信基礎(chǔ)模型;二是借鑒相關(guān)領(lǐng)域的已有研究,合力探索智能教研“人—機—人”協(xié)同決策的實踐新課題;三是內(nèi)外聯(lián)動推進(jìn)科學(xué)性證據(jù)庫的建設(shè),正視經(jīng)驗性證據(jù)的合理價值,持續(xù)優(yōu)化智能教研的循證實踐。
關(guān)鍵詞:智能教研;可信模型;“人—機—人”協(xié)同決策;循證實踐
中圖分類號:G434 " 文獻(xiàn)標(biāo)識碼:A " "文章編號:1009-5195(2025)02-0033-09 "doi10.3969/j.issn.1009-5195.2025.02.004
基金項目: 國家社會科學(xué)基金“十三五”規(guī)劃教育學(xué)一般課題“近70年中小學(xué)教研活動的中國經(jīng)驗研究”(BHA190131)。
作者簡介: 王麗華,博士,教授,博士生導(dǎo)師,浙江師范大學(xué)教育學(xué)院,浙江全省智能教育技術(shù)與應(yīng)用重點實驗室(浙江金華 321004);時一帆,碩士研究生,浙江師范大學(xué)教育學(xué)院(浙江金華 321004);盧國成(通信作者),講師,廣西職業(yè)技術(shù)學(xué)院馬克思主義學(xué)院 (廣西南寧 530226)。
智能教研既是新生事物,又是人工智能熱潮下的政策關(guān)切與實踐熱點。在《新一代人工智能發(fā)展規(guī)劃》《教育部關(guān)于加強和改進(jìn)新時代基礎(chǔ)教育教研工作的意見》等政策指引下,教育部教育技術(shù)與資源發(fā)展中心(中央電化教育館)組織研發(fā)了中央電化教育館智能研修平臺,并于2020年在全國范圍內(nèi)組織遴選了81個試點工作區(qū)和165所試點工作學(xué)校(李陽等,2022),以探索智能教研。與此同時,醍摩豆智慧教育、科大訊飛、希沃、翼課網(wǎng)與鯤翼教師學(xué)苑等先后開發(fā)了智能教研平臺,這些平臺的教師用戶量超過20萬(穆肅等,2024)。與平臺研發(fā)熱遙相呼應(yīng)的是,全國各地紛紛舉辦各類智能教研展示活動和論壇。從智能教研熱的實踐來看,關(guān)于智能教研大致有如下兩種認(rèn)識:一是智能教研就是利用智能教研平臺采集課堂教學(xué)數(shù)據(jù),生成報告并為教師提供決策和建議的過程。持此類觀點的以各大公司居多,他們往往宣傳智能教研能節(jié)省教研時間、提高教研效率、切實為教師減負(fù)。二是智能教研就是利用智能教研平臺進(jìn)行備課、觀課、評課并生成教研數(shù)據(jù)的過程。持此類觀點的以一線教師居多。在智能教研火熱的背后,我們亟待理性剖析智能教研的本質(zhì)是什么,并據(jù)此澄清當(dāng)前實踐中的誤區(qū),以為智能教研的未來發(fā)展提供指引。誠如有學(xué)者所指出的:“考察人工智能教育應(yīng)用本質(zhì)既是人工智能教育應(yīng)用基本理論研究的重要內(nèi)容,也是推動其實踐必須廓清的認(rèn)識問題?!保ê蝹ス?,2023)
一、智能教研的本質(zhì)剖析
本質(zhì)是指“事物的根本屬性,它對事物的性質(zhì)、面貌和發(fā)展起決定作用”(字詞語辭書編研組,2016,p.54)。目前各大平臺宣稱其提供的智能教研涵蓋個人備課、集體備課、觀議評課、集體教研等,但這只是功能,而非本質(zhì)。智能教研的本質(zhì)可以從人工智能的本質(zhì)及教研的本質(zhì)考察得出。聯(lián)合國教科文組織國際人工智能研究中心主任韋恩·霍姆斯(Wayne Holmes)等學(xué)者提出:“人工智能本質(zhì)上應(yīng)同時考慮其技術(shù)維度和人的維度”(韋恩·霍姆斯等,2023)。對于智能教研而言,技術(shù)維度的核心在于基礎(chǔ)模型及其規(guī)則設(shè)定,即數(shù)據(jù)采集模型能通過智能教研平臺形成教研數(shù)據(jù)與相關(guān)實踐的關(guān)聯(lián),并提出教學(xué)決策建議;人的維度應(yīng)著重考慮智能教研應(yīng)用過程中人的價值的彰顯。近年來,伴隨教師教育研究逐步向循證轉(zhuǎn)向,教研亦開始向循證轉(zhuǎn)向。教師教育研究循證強調(diào)的核心要義是,教師教育應(yīng)超越經(jīng)驗范式,向基于證據(jù)解決教師教育問題的循證實踐及其科學(xué)范式轉(zhuǎn)向(裴淼等,2020;閆予沨等,2020)。還有學(xué)者認(rèn)為證據(jù)等同于循證,提出教研應(yīng)向基于證據(jù)轉(zhuǎn)向(董洪亮,2021)或者向循證教研轉(zhuǎn)型(吳雨宸等,2023),亦有學(xué)者提出循證課例研究是智能教研實施的重要方式之一(穆肅等,2024)。然而,怎樣的教研數(shù)據(jù)可以作為證據(jù)?如何作出教研決策?教研到底應(yīng)向怎樣的循證轉(zhuǎn)向?對于這些本質(zhì)性的問題至今尚缺少系統(tǒng)研究?;谏鲜龇治?,本研究認(rèn)為智能教研的本質(zhì)是一種以可信模型采集的教研數(shù)據(jù)為基礎(chǔ),通過“人—機—人”協(xié)同教研決策,以實現(xiàn)“三性”優(yōu)化的循證實踐。
1.以基于可信模型的教研數(shù)據(jù)為基礎(chǔ)
教研數(shù)據(jù)可信,才可能為作為循證實踐的智能教研提供有效證據(jù)。關(guān)于智能教研數(shù)據(jù),已有研究主要關(guān)注兩個方面:一是數(shù)據(jù)的類型,如有研究提出教師畫像由五大類教研數(shù)據(jù)構(gòu)成(胡小勇等,2019);二是數(shù)據(jù)的用途,如教研數(shù)據(jù)可為教師提供決策建議和量化評估教研效果的依據(jù)(穆肅等,2024)。當(dāng)前研究極少關(guān)注教研數(shù)據(jù)是否可信,尤其是生成智能教研數(shù)據(jù)的模型是否可信的問題。
近年來,因人工智能快速發(fā)展引發(fā)了諸多信任危機,因此“發(fā)展可信人工智能正在成為全球共識” (中國信息通信研究院等,2021)。與此同時,可信人工智能領(lǐng)域的論文發(fā)表量、專利申請量均在快速增長,各國政府、國際標(biāo)準(zhǔn)化組織和行業(yè)組織也在積極推動建設(shè)可信人工智能的相關(guān)原則和標(biāo)準(zhǔn)(胡曉萌等,2024)。此外,鑒于人工智能技術(shù)本身的“黑箱模型”問題 (中國信息通信研究院等,2021),亦有研究者提出“大模型如何更可信”的呼吁(宰飛等,2023)。值得一提的是,已有研究機構(gòu)梳理了全球范圍內(nèi)已發(fā)布的84份政策文件,總結(jié)出可信人工智能應(yīng)包括“可靠可控、透明可釋、數(shù)據(jù)保護(hù)、明確責(zé)任、多元包容”五項特征要素(中國信息通信研究院等,2021)。其中與模型相關(guān)的特征主要是“可靠可控”和“透明可釋”。教研數(shù)據(jù)是否可信的關(guān)鍵在于模型是否可信。關(guān)于可信基礎(chǔ)模型中的“可信”探討,已有研究更多強調(diào)技術(shù)視野下的信任,即個體對信息技術(shù)的功能性、可靠性和有用性的信任信念(McKnight et al.,2011)。
綜上分析,結(jié)合智能教研的實際需要,為確保智能教研數(shù)據(jù)可信,可信模型應(yīng)指向?qū)Σ杉悄芙萄袛?shù)據(jù)的智能教研平臺模型可信度的判斷,主要包括三個衡量指標(biāo):一是教研數(shù)據(jù)采集模型設(shè)定的依據(jù)及其詮釋;二是模型訓(xùn)練數(shù)據(jù)的質(zhì)量與數(shù)量;三是智能教研平臺實際采集并展示數(shù)據(jù)的準(zhǔn)確性與可靠性等。特別需要指出的是,如果訓(xùn)練數(shù)據(jù)的質(zhì)量差,即便模型及其功能再完美,也無法輸出可信的教研數(shù)據(jù)。
2.走向“人—機—人”協(xié)同的教研決策
在智能時代,因人機協(xié)同情境的普遍存在而催生出了新的決策范式(張志學(xué)等,2024),智能教研決策也不例外。有研究指出:“學(xué)校應(yīng)主動利用人工智能等新技術(shù)……實現(xiàn)教研的精準(zhǔn)管理和決策”(鄭欣欣等,2023)。這里所指的智能教研決策主要是利用人工智能技術(shù)進(jìn)行決策,或者說是一種人工智能算法決策。誠如英國科學(xué)院院士斯蒂芬·鮑爾(Stephen Ball)所言,“教師作為課堂決策的最基本單位,正在被基于大數(shù)據(jù)收集和分析、算法設(shè)計的適應(yīng)性學(xué)習(xí)系統(tǒng)所取代?!保ㄋ沟俜摇U爾等,2020)
智能教研不僅是一種人工智能算法決策,它還是一種人機協(xié)同決策。此處所指的“人”主要指智能教研平臺的研發(fā)者,據(jù)此智能教研決策實際上也是一種研發(fā)者和人工智能算法協(xié)同決策的過程。因此,從某種意義上說,教研過程中的教師決策極有可能被研發(fā)者協(xié)同人工智能算法決策所控制,教師職業(yè)也極有可能失去其賴以生存的自主自決。誠如有學(xué)者所指出的:“未來當(dāng)整個社會系統(tǒng)都被數(shù)字化以后,掌握數(shù)據(jù)的人更有可能利用數(shù)據(jù)對人進(jìn)行控制?!保ㄖ茺愱赖?,2021)總之,不論是人工智能算法決策,還是研發(fā)者協(xié)同人工智能算法決策,其基本邏輯是,依據(jù)智能教研數(shù)據(jù),機器助力教師或?qū)W校作出科學(xué)精準(zhǔn)的教研決策。其隱含的基本前提是算法必須可信。盡管已有證據(jù)表明,基于算法決策的智能教研決策的確有助于改進(jìn)教研實踐,但其背后的“算法模型”至今仍然不夠透明。
從教師作為“人”師的獨特性(如具有很強的個體性、情境性、語境性)出發(fā),智能教研亟待走向“人—機—人”協(xié)同決策。亦有學(xué)者指出,智能時代的人—機關(guān)系從來都是“人—機—人”三者之間的關(guān)系 (常晉芳,2019);人工智能的社會意義也不是機器與人的關(guān)系,而是人與人的關(guān)系,即掌控人工智能的一個或一群人與不掌控人工智能的大多數(shù)人之間的關(guān)系(安維復(fù),2017)。筆者認(rèn)為,“人—機—人”協(xié)同決策中的兩“人”應(yīng)分別指涉智能教研平臺(或終端)的研發(fā)者和使用者(主要是教師),如此“人—機—人”協(xié)同決策就是研發(fā)者、算法、教師多方力量交互合作并共同作出教研決策的過程,其本質(zhì)是一種“科學(xué)決策—算法決策—經(jīng)驗決策”的協(xié)同過程。在智能教研過程中,教師決策具有不可替代的獨特作用,它“在很大程度上依賴于理性思維和創(chuàng)造性思維的結(jié)合,強調(diào)經(jīng)驗的作用,……能夠快速地對不同情況進(jìn)行分類并做出有效的決定”(Terziyan et al.,2018)。此外,教師決策很多情況下還依賴具體的情境或語境,甚至有時是基于情境或語境通過直覺作出決策。這些都是遠(yuǎn)離學(xué)校情境和教研語境的技術(shù)研發(fā)者尚不具有的認(rèn)知能力(谷口忠大,2023,pp.164-165)。因此,智能教研平臺在研發(fā)之前,就要充分考慮教師協(xié)同決策的技術(shù)實現(xiàn)路徑,包括科學(xué)決策、算法及模型優(yōu)化等的反饋路徑,教師觀察數(shù)據(jù)的輸入路徑,教師決策的貢獻(xiàn)路徑等。
3.指向探索“三性”優(yōu)化的教研循證實踐
循證實踐(Evidence-Based Practice)的字面意義為“以證據(jù)為基礎(chǔ)的實踐”,引申為“遵循證據(jù)進(jìn)行實踐”,肇始于循證醫(yī)學(xué)。醫(yī)學(xué)循證實踐遵循“最佳證據(jù)”。最佳證據(jù)是指研究者提供的與解決所需問題最為契合的、級別最高的研究證據(jù),其往往是基于同類問題大量研究的元分析,遵循嚴(yán)格的科學(xué)規(guī)范,其目的是盡可能地接近事實的真相,揭示出問題的癥結(jié)并提出相應(yīng)的解決方案(楊文登,2010)。由此可知,科學(xué)性是醫(yī)學(xué)循證實踐證據(jù)的主要特性。在醫(yī)學(xué)循證實踐中,唯有基于最佳證據(jù)形成最佳的解決方案,才能讓不同的實踐者在面對相同的問題時做出大致相同的實踐決策。
與循證醫(yī)學(xué)類似,智能教研的證據(jù)也應(yīng)具有科學(xué)性(特指教育學(xué)意義上的科學(xué)性,而非醫(yī)學(xué)意義上的科學(xué)性)。但與循證醫(yī)學(xué)不同,智能教研是教師在具體學(xué)校情境中開展的,教研過程具有高度語境性,而現(xiàn)代的人工智能“通常不擅長理解語境依賴性高的句子”(谷口忠大,2023,pp.163-164)。比如,當(dāng)老師提出問題后引導(dǎo)學(xué)生思考或討論,幾分鐘后再問學(xué)生:“誰能回答剛才那個問題嗎?”在此例中,人工智能若無法找到與之前提問的對應(yīng)關(guān)系,它就無法理解“那個問題”是什么,因而也無法提供具有關(guān)聯(lián)意義的有效證據(jù),只能記錄下師生話語。而現(xiàn)場參與教研活動的教師則可以毫不費力地將“那個問題”與前面的提問建立關(guān)聯(lián),表現(xiàn)出人所特有的經(jīng)驗性理解能力,這意味著智能教研的證據(jù)應(yīng)具有經(jīng)驗性。此外,智能教研本身所依托的包括人臉識別、語音識別、肢體識別、OCR識別、自然語言處理、機器學(xué)習(xí)等技術(shù)優(yōu)勢,生成的教研數(shù)據(jù)也是基于可信模型的,因而其證據(jù)也應(yīng)具有技術(shù)性。
綜上分析,就其本質(zhì)而言,作為循證實踐的智能教研的證據(jù)應(yīng)具有科學(xué)性、技術(shù)性和經(jīng)驗性,這就是智能教研循證實踐應(yīng)具有的“三性”。與此相應(yīng),這三種性質(zhì)的證據(jù)可以分別稱作科學(xué)性證據(jù)、技術(shù)性證據(jù)和經(jīng)驗性證據(jù)。在循證醫(yī)學(xué)中,科學(xué)性證據(jù)主要指“從事應(yīng)用研究(或?qū)嵺`相關(guān)的基礎(chǔ)研究)的研究者為實踐所提供的研究證據(jù)”(楊文登,2010),但該界定并未明確何謂證據(jù)。借鑒“證據(jù)”一詞是指“用以證明事物真?zhèn)蔚膽{據(jù)”(字詞語辭書編研組,2016,p.1636)的字面含義,筆者將智能教研中三類證據(jù)界定為:科學(xué)性證據(jù)是指從事教育教學(xué)應(yīng)用研究(或?qū)嵺`相關(guān)的基礎(chǔ)研究)的研究者為教研實踐提供的憑據(jù);技術(shù)性證據(jù)是指基于可信模型為教研實踐提供的憑據(jù);經(jīng)驗性證據(jù)是指教師基于教研情境或語境為教研實踐提供的憑據(jù)。借鑒“優(yōu)化”一詞的字面含義是指“經(jīng)過改革或選擇使其變得優(yōu)良”(字詞語辭書編研組,2016,p.1540),筆者將三性優(yōu)化的教研循證實踐界定為智能教研應(yīng)基于學(xué)校教研需求、教師發(fā)展需要、學(xué)生成長需要,以集體審議的方式評估科學(xué)性、技術(shù)性和經(jīng)驗性證據(jù),選擇優(yōu)良證據(jù)組合作為憑據(jù),作出符合學(xué)生成長需要和教師發(fā)展需求的教學(xué)改進(jìn)決策的行動總稱。早在2008年,學(xué)者孟華在追溯王國維提出的著名的“二重證據(jù)法”基礎(chǔ)上,系統(tǒng)梳理并提出了包括語言(口語)、文字(書寫)和圖像三類符號證據(jù)綜合運用的“三重證據(jù)法”,并認(rèn)為三重證據(jù)法起作用的關(guān)鍵在于證據(jù)間性。所謂證據(jù)間性是指一種證據(jù)符號的意義和價值不僅與原點事實有關(guān),同時也與其他證據(jù)符號發(fā)生關(guān)聯(lián)和交互作用(孟華,2008)。受此啟發(fā),筆者提出“三性”優(yōu)化的教研循證實踐,并認(rèn)為智能教研的證據(jù)是否有效,關(guān)鍵在于上述三類證據(jù)間的互動及其優(yōu)化。
二、智能教研的現(xiàn)實誤區(qū)
1.囿于可疑模型的教研數(shù)據(jù)
不可否認(rèn),依托模型和技術(shù)的智能教研平臺的確在一定程度上實現(xiàn)了對量化類智能教研數(shù)據(jù)的精準(zhǔn)描述,如教師行為軌跡、師生特定教學(xué)或?qū)W習(xí)行為等,但精確描述的前提是教研數(shù)據(jù)可信。由于教研數(shù)據(jù)采集模型的不可信,導(dǎo)致當(dāng)前智能教研數(shù)據(jù)總體而言是可疑的。
一是教研數(shù)據(jù)采集模型設(shè)定的依據(jù)及其詮釋問題突出。主要歸納為三類:(1)基本無依據(jù)但有詮釋。多數(shù)智能教研平臺都會基于采集的數(shù)據(jù)提供S-T曲線圖、Rt-Ch圖,前者統(tǒng)計師生互動情況,后者統(tǒng)計某節(jié)課中采用的教學(xué)模式,但并未給出數(shù)據(jù)采集模型的依據(jù)且其詮釋難以令人信服。比如,有平臺對S-T曲線圖的詮釋是“橫軸方向代表老師在講話,縱軸方向代表學(xué)生在講話;當(dāng)曲線偏向橫軸時,表示老師活動占多數(shù);偏向縱軸時,表示學(xué)生活動占多數(shù);當(dāng)某段曲線整體平行于45度線時,表示在此段時間內(nèi)師生互動充分”。難道師生互動就是師生說話嗎?顯然,任何一位研究師生互動的學(xué)者都會極力反對。(2)依據(jù)和詮釋都未經(jīng)考證。比如,不少智能教研平臺都用統(tǒng)計圖和時序圖來呈現(xiàn)學(xué)生主動學(xué)習(xí)和被動學(xué)習(xí)的情況,其依據(jù)是“學(xué)習(xí)金字塔理論”,其詮釋采用了百分比圖。然而,學(xué)習(xí)金字塔理論通常被認(rèn)為來源于美國緬因州的國家訓(xùn)練實驗室,該理論是否可以作為區(qū)分學(xué)生主動學(xué)習(xí)與被動學(xué)習(xí)的依據(jù),目前還未有與之相關(guān)的研究報告或論文。這種未經(jīng)考證的依據(jù)和詮釋顯然容易給人以誤導(dǎo)。(3)依據(jù)和詮釋高度雷同。比如,多數(shù)智能教研平臺都有對教師提問類型的統(tǒng)計,其依據(jù)一般都是布盧姆教學(xué)目標(biāo)分類理論關(guān)于認(rèn)知領(lǐng)域的分類,其詮釋也大致參考布盧姆的理論。然而,每所學(xué)校都有自己的特色,雷同的數(shù)據(jù)采集模型顯然無法滿足學(xué)校教研特色化發(fā)展的需求。
二是教研數(shù)據(jù)采集模型的訓(xùn)練數(shù)據(jù)不透明。主要表現(xiàn)為:(1)來源不明確,無法判斷訓(xùn)練數(shù)據(jù)的質(zhì)量;(2)數(shù)量不透明,無法判斷訓(xùn)練結(jié)果能否平衡例外和反常情況;(3)處理過程不透明,包括數(shù)據(jù)的預(yù)處理、清洗和標(biāo)注等都缺乏必要的透明度。這既會嚴(yán)重影響模型的性能,又難以評估數(shù)據(jù)質(zhì)量和處理的合理性。而且多數(shù)智能教研平臺也未公開是否運用差錯訓(xùn)練模型來提高其輸出數(shù)據(jù)的準(zhǔn)確性?!叭绻麤]有錯誤反饋,大數(shù)據(jù)模型就會持續(xù)輸出錯誤的結(jié)果”(凱西·奧尼爾,2018)。當(dāng)然,訓(xùn)練數(shù)據(jù)的不透明一定程度上與數(shù)據(jù)采集的復(fù)雜性、隱私保護(hù)需求、技術(shù)局限性等有關(guān),但也受商業(yè)機密的影響。
2.高估數(shù)據(jù)效用的教研決策
如前所述,智能教研平臺提供的量化數(shù)據(jù)的確能為可量化的教學(xué)研究提供教研決策。由于教研是高度依賴情境或語境的實踐性活動,除非智能教研平臺在與師生長期互動中諳熟師生話語特點,并能提供高度語境依賴的精準(zhǔn)教研數(shù)據(jù),否則很難單獨基于智能教研數(shù)據(jù)作出科學(xué)或精準(zhǔn)的教研決策。然而,要創(chuàng)造出兼具可以共享文本內(nèi)部語境和外部語境的人工智能,并與人類保持長期的相互作用,依然是一項很大的挑戰(zhàn)(谷口忠大,2023,p.165)。目前人工智能在教育中的應(yīng)用存在“炒作”現(xiàn)象,諸多關(guān)鍵性限制問題也未得到充分考量(韋恩·霍姆斯等,2023)。整體而言,智能教研中的數(shù)據(jù)效用及其教研決策依然受制于技術(shù)本身,盡管已有學(xué)者對此進(jìn)行了相對理性的探討,但仍然高估了基于數(shù)據(jù)的智能教研決策效用,具體表現(xiàn)在如下方面。
一是認(rèn)為基于數(shù)據(jù)的教研決策就是科學(xué)的教研決策。持該觀點的人們認(rèn)為,智能教研平臺提供的數(shù)據(jù)是真實、客觀的,據(jù)此作出的教研決策自然也是科學(xué)的。這類觀點集中體現(xiàn)在教師、校本教研、學(xué)校教研管理等層面。在教師層面,一些教師認(rèn)為智能教研數(shù)據(jù)有助于他們作出科學(xué)的教研決策,一般在智能教研展示及分享活動中涉及較多,如智能教研展示課的執(zhí)教教師通過分析和解讀AI課堂數(shù)據(jù)報告(包括教學(xué)行為分布、S-T分析圖、Rt-Ch 圖等數(shù)據(jù)),指出根據(jù)教學(xué)經(jīng)驗實施的教學(xué)與智能教研數(shù)據(jù)報告之間存在一定落差,并據(jù)此提出教學(xué)改進(jìn)的方向。在校本教研層面,一些學(xué)校認(rèn)為,相較于傳統(tǒng)校本教研以個人經(jīng)驗與主觀判斷為導(dǎo)向,數(shù)據(jù)驅(qū)動的校本教研更強調(diào)獲取與挖掘真實、客觀的過程性數(shù)據(jù),并在此基礎(chǔ)上進(jìn)行教學(xué)評估與決策,這有助于增強校本教研的科學(xué)性(陳禹辰等,2023)。在學(xué)校管理層面,體現(xiàn)為管理者可在眾多教研數(shù)據(jù)中,借助多維度可視化圖表全面了解學(xué)校教研情況,緊抓優(yōu)勢板塊與薄弱板塊,從而科學(xué)高效地做出教研決策(劉立杰,2024)。
二是認(rèn)為基于數(shù)據(jù)的教研決策就是精準(zhǔn)決策。持該種觀點的人們認(rèn)為,智能教研平臺基于自身的技術(shù)優(yōu)勢,能夠采集精準(zhǔn)的教研數(shù)據(jù),據(jù)此作出的教研決策自然也是精準(zhǔn)的。在公司的大力宣傳和裹挾下,諸多區(qū)域和學(xué)校采納并進(jìn)行了試點,特別是在學(xué)生作業(yè)的教研改革方面。如有些試點區(qū)域認(rèn)為,精準(zhǔn)決策有助于開展個性化輔導(dǎo)并布置分層作業(yè),理由包括:平臺能夠伴隨式實時采集數(shù)據(jù),診斷學(xué)生的學(xué)習(xí)情況,輔助教師做出精準(zhǔn)的教學(xué)決策;課后教師可以分析學(xué)生的作業(yè)數(shù)據(jù),發(fā)現(xiàn)學(xué)生的薄弱知識點,及時開展個性化輔導(dǎo);可以根據(jù)學(xué)生的階段性學(xué)習(xí)情況,針對不同個體、分組或群體發(fā)布分層作業(yè)(朱靖等,2024)。事實上,上述所論的精準(zhǔn)決策是針對以客觀題為主的學(xué)科(如數(shù)學(xué)、英語等),而諸如語文等以主觀題為主的學(xué)科則很難實現(xiàn)精準(zhǔn)決策;而且由于操作方面的不便捷,致使教研平臺給出的精準(zhǔn)決策有時還不如教師自身目測更快。況且上述基于錯題的個性化作業(yè)推送,總體而言并不精準(zhǔn),其原因是公司對作業(yè)庫中每道題標(biāo)注的知識點很不準(zhǔn)確,他們往往會把與某道題關(guān)聯(lián)的所有知識點都做標(biāo)注,這樣學(xué)生做錯一道題,推送的練習(xí)題就可能是10道。如果真要實現(xiàn)精準(zhǔn)推送,必須由教師逐條審核,然而教師也無暇做此類審核工作。
上述兩類觀點所推崇的決策,實際上就是前文所述的算法決策或研發(fā)者協(xié)同人工智能算法決策的結(jié)果??傮w而言,這類決策的實際績效并未經(jīng)過科學(xué)評估,因此,公司所宣稱的決策和教師真實感知的決策之間存在落差就在所難免了。
3.陷入單性異化的教研循證實踐
如前所述,技術(shù)性證據(jù)的確能為教研提供量化證據(jù),據(jù)此推動智能教研循證實踐。比如,教師可以在課前依托平臺完成前測,確定課堂教學(xué)的起點;也可以在課堂教學(xué)過程中用量化的實時數(shù)據(jù)精準(zhǔn)調(diào)控課堂等。然而,由于師生的個性化需求差異、教學(xué)實踐具有的情境或語境依賴性和復(fù)雜性,使得僅依靠技術(shù)性證據(jù)無法實現(xiàn)三性優(yōu)化的教研循證實踐。過于強調(diào)技術(shù)性證據(jù),極易使教研循證實踐陷入單性異化的困境。這里的單性主要指證據(jù)的單一性,異化主要指基于技術(shù)性證據(jù)的循證實踐已成為教師的“異己”力量,它會反過來制約教師的發(fā)展。卡爾·馬克思(Karl Marx)將這樣的異化稱為“需要的異化”(馬克思,2018)。阿格妮絲·赫勒(Agnes Heller)在解讀馬克思的需要理論時指出,需要的異化在資本主義社會中主要有四種表現(xiàn),分別是“需要的手段與目的之關(guān)系的顛倒”“需要的質(zhì)量與數(shù)量倒置”“需要的貧困化”“需要受到特定利益群體的影響”(Heller,1976)。從智能教研探索的實踐看,單性異化的教研循證實踐突出表現(xiàn)為如下兩類。
一是需要的手段與目的之關(guān)系的顛倒。主要表現(xiàn)為:智能教研的本意是為了扭轉(zhuǎn)過于依賴經(jīng)驗的局面,實現(xiàn)證據(jù)優(yōu)化的循證實踐,而通過智能教研平臺獲取技術(shù)性證據(jù)是實現(xiàn)循證實踐的手段。然而,在智能教研實踐中,一些區(qū)校卻把上述關(guān)系顛倒了,嚴(yán)重制約了教師教學(xué)的自主性和創(chuàng)造性,甚至為教師平添了諸多技術(shù)使用焦慮。如某區(qū)要求青年教師課堂教學(xué)中學(xué)生主動學(xué)習(xí)的時間確保在30%以上,且以智能教研平臺生成的報告為評判依據(jù)。該舉措的本意是用平臺提供的證據(jù)引導(dǎo)青年教師多關(guān)注學(xué)生主動學(xué)習(xí),而非“滿堂灌”;然而,實踐過程中由于前述的模型及其設(shè)定的問題,導(dǎo)致很多青年教師將關(guān)注焦點完全轉(zhuǎn)移到如何達(dá)標(biāo)上。而且在徒增技術(shù)焦慮的過程中,青年教師通過摸索和相互交流發(fā)現(xiàn),只要在課堂教學(xué)中持續(xù)準(zhǔn)確表述“小組合作”“隨堂練習(xí)”等關(guān)鍵詞,即可生成達(dá)標(biāo)的報告。
二是需要的貧困化。需要的貧困化并非指沒有需要,而是指智能教研過程中教師的需要高度同質(zhì)化和窄化。這種同質(zhì)化表現(xiàn)在:(1)教師所熟練運用的智能教研技術(shù)是同質(zhì)化的,以確保教師能使用區(qū)域或?qū)W校購買的智能教研平臺;(2)教師數(shù)據(jù)素養(yǎng)的同質(zhì)化,包括對智能教研數(shù)據(jù)的理解、分析和解讀等;(3)教師對教學(xué)模式理解的同質(zhì)化,即當(dāng)面對智能教研平臺提供的練習(xí)型、講授型、對話型、混合型教學(xué)模式時,教師為了“彰顯”自身的教學(xué)理念往往傾向于選擇對話型教學(xué)模式;(4)教師所使用教學(xué)方法的同質(zhì)化,如為了在智能教研過程中獲得良好的數(shù)據(jù),教師往往會采用以學(xué)生為中心的教學(xué)方法;等等。長此以往,學(xué)校的特色、教師的教學(xué)風(fēng)格、學(xué)生的個性化成長需要都有可能被智能教研循證實踐所異化。同時,課堂教學(xué)的高度同質(zhì)化也可能導(dǎo)致師生發(fā)展的需求被窄化。此外,智能教研平臺具有精準(zhǔn)滿足師生特定教學(xué)與學(xué)習(xí)偏好的優(yōu)勢,那些對師生發(fā)展重要但不被師生喜歡的需要也可能被遮蔽,進(jìn)而帶來窄化師生成長的風(fēng)險。需要指出的是,陷入單性異化的教研循證實踐,還與科學(xué)性證據(jù)匱乏、經(jīng)驗性證據(jù)被輕視密不可分。
三、智能教研的理性回歸
早有學(xué)者指出:任何一項改革如要得到持續(xù)推進(jìn),則有賴于三級改革方案,即需要在學(xué)校和社區(qū)層面、學(xué)區(qū)/地區(qū)層面、州/聯(lián)邦層面進(jìn)行系統(tǒng)改革(Barber et al.,2005)。智能教研改革也不例外,其不僅涉及上述三個對應(yīng)層面,還涉及公司、高校、工業(yè)界等。唯有各個層面聯(lián)合研發(fā)、合力探索、內(nèi)外聯(lián)動,方有可能實現(xiàn)智能教研的理性回歸。
1.聯(lián)合研發(fā)保障智能教研數(shù)據(jù)質(zhì)量的可信基礎(chǔ)模型
從現(xiàn)狀來看,前述智能教研平臺的數(shù)據(jù)采集模型大多是預(yù)訓(xùn)練模型,其特點是針對智能教研應(yīng)用場景進(jìn)行訓(xùn)練,模型訓(xùn)練需要大規(guī)模地標(biāo)注數(shù)據(jù),而且只有通過訓(xùn)練后的模型才能完成智能教研數(shù)據(jù)的采集任務(wù)。但實際上智能教研平臺只能根據(jù)公司自身設(shè)定的模型來采集數(shù)據(jù),很難滿足學(xué)校個性化智能教研數(shù)據(jù)采集的需要。盡管這些模型基本上都是多模態(tài)的,但上述局限依然存在。為此,亟待跨界聯(lián)合研發(fā)保障智能教研數(shù)據(jù)質(zhì)量的可信基礎(chǔ)模型。
基礎(chǔ)模型是一種基于通用類模型構(gòu)建AI系統(tǒng)的新興范式,既與凸顯技術(shù)維度的預(yù)訓(xùn)練模型、自監(jiān)督模型等不同,也與過于偏向語言的“大語言模型”不同?;A(chǔ)模型中的“基礎(chǔ)”是指作為通用基礎(chǔ),許多限定任務(wù)的模型是通過對其適配而構(gòu)建的。用“基礎(chǔ)”一詞同時也是為了凸顯架構(gòu)的穩(wěn)定性和安全性(Bommasani et al.,2021)。關(guān)于教育領(lǐng)域基礎(chǔ)模型的研發(fā),有學(xué)者認(rèn)為應(yīng)該整合直接調(diào)用和專門訓(xùn)練兩條技術(shù)路線。前者指“直接調(diào)用通用大模型,通過微調(diào)或提示學(xué)習(xí)的方式使之具備一定的專業(yè)能力”,后者指“利用教育領(lǐng)域?qū)I(yè)數(shù)據(jù),專門訓(xùn)練用于解決教育任務(wù)的大模型”(曹培杰等,2024)。盡管該研究提出了整合路線的思路和由基礎(chǔ)能力層、專業(yè)能力層、應(yīng)用服務(wù)層組成的整體架構(gòu),但其主要限于技術(shù)層面對模型開發(fā)的探討,并沒有考慮到模型研發(fā)所需的基礎(chǔ)研究。如前文所論,當(dāng)前智能教研模型大多借用或套用國外的相關(guān)理論,顯然無法滿足我國課堂教學(xué)快速發(fā)展的現(xiàn)實需求,因此亟待開展本土化的基礎(chǔ)研究。
聯(lián)合研究的關(guān)鍵是在政府支持下,組建跨界、跨學(xué)科的教育領(lǐng)域可信基礎(chǔ)模型研究團(tuán)隊。跨界主要指學(xué)術(shù)界和工業(yè)界的聯(lián)合。學(xué)術(shù)界的基礎(chǔ)研究能為工業(yè)界的模型研發(fā)提供指導(dǎo),反過來工業(yè)界也能為學(xué)術(shù)界的研究提供更明確的方向。跨學(xué)科研究團(tuán)隊主要由教育學(xué)、理學(xué)、工學(xué)、文學(xué)、交叉學(xué)科等學(xué)科領(lǐng)域的研究人員構(gòu)成,鼓勵他們基于我國已有的本土教研實踐,開展適合智能教研需要的可信基礎(chǔ)模型研究。其研究重點包括:(1)可信基礎(chǔ)模型建構(gòu)的理論,且應(yīng)將可能造成的教育影響和倫理風(fēng)險考慮其中,而非等投入學(xué)校使用后再作補救。(2)持續(xù)開展跨學(xué)科研究的對話。由于可信基礎(chǔ)模型研究是一個全新課題,研究人員之間的頭腦風(fēng)暴、深度研討和文獻(xiàn)研究同等重要。(3)系統(tǒng)調(diào)研已有的智能教研數(shù)據(jù)采集模型,深入調(diào)研一線教師的使用感受及真實需求,以便為基礎(chǔ)研究貢獻(xiàn)鮮活的實踐資料。
為確保基礎(chǔ)模型的可信,研發(fā)過程中的模型訓(xùn)練要向智能教研的個性化方向傾斜。為此應(yīng)當(dāng)積極探索基礎(chǔ)模型訓(xùn)練的新思路,如斯坦福大學(xué)的學(xué)者們所指出的:“盡管教育中的很多數(shù)據(jù)流因為過于有限而無法單獨用于基礎(chǔ)模型的訓(xùn)練,但可以利用領(lǐng)域外(如互聯(lián)網(wǎng))的相關(guān)數(shù)據(jù)以及利用跨多個模態(tài)(如教科書、數(shù)學(xué)公式、圖表、基于視頻的教程等)的數(shù)據(jù),共同為基礎(chǔ)模型廣泛應(yīng)用于教育任務(wù)提供幫助”(Bommasani et al.,2021)。但該思路面臨的瓶頸是,需要充分考慮模型訓(xùn)練所使用作品的版權(quán)問題(謝惠加等,2024)。
2.合力探索智能教研協(xié)同決策的實踐課題
已有研究基本認(rèn)為人機協(xié)同決策就是人類決策和機器決策(或稱為“算法決策”)的協(xié)同,極少考慮控制機器決策之人與不控制機器之人的不同,因此,實現(xiàn)“人—機—人”協(xié)同決策是改進(jìn)當(dāng)前智能教研決策的關(guān)鍵。由于人機協(xié)同決策研究起步相對較早,故可為“人—機—人”協(xié)同決策研究提供借鑒;同時,其他領(lǐng)域(如人力資源管理、經(jīng)濟管理等)對人機協(xié)同研究的推進(jìn)實踐亦為智能教研協(xié)同決策實踐研究提供了借鑒。
關(guān)于人機協(xié)同決策實踐,相關(guān)領(lǐng)域已開展了積極探索,主要包括如下三個方面:(1)用戶對算法決策和人類決策的感知及可接受性。例如,在人力資源管理領(lǐng)域,有學(xué)者通過實證研究發(fā)現(xiàn),員工覺得AI算法決策比上級主管決策的信息透明度更低,認(rèn)為AI算法并不能提供具有可獲得、可理解、可辨認(rèn)以及準(zhǔn)確清晰等特征的決策信息。該研究挑戰(zhàn)了現(xiàn)有文獻(xiàn)中認(rèn)為AI算法決策比人類決策更客觀公正的主流觀點(裴嘉良等,2021)。又如,在經(jīng)濟管理領(lǐng)域,有學(xué)者通過研究揭示了對算法的接受程度受員工對算法欣賞或厭惡態(tài)度的影響,他們指出:“算法欣賞或厭惡都不是普遍規(guī)律,而是隨著情境而發(fā)生變化的。在一些情況下(如決策結(jié)果不利時),人們欣賞算法;在另一些情況下(如決策結(jié)果有利時),算法或人工決策不會帶來差異化的感知?!保ㄎ宏康?,2021)(2)人機協(xié)同決策方式。例如,雅什·拉杰·什雷斯塔(Yash Raj Shrestha)等人將組織成員與人工智能決策相結(jié)合的方式劃分為三類,分別是全人類向人工智能的委托式?jīng)Q策(Full Human to AI Delegation)、混合式(人類到人工智能與人工智能到人類)序貫決策(Hybrid—Human-to-AI and AI-to-Human—Sequential Decision Making),以及聚合式人類—人工智能聯(lián)合決策(Aggregated Human-AI Decision Making),并將后兩種統(tǒng)稱為人機協(xié)同決策方式(Shrestha et al.,2019)。(3)人機協(xié)同決策的影響因素。例如,有研究發(fā)現(xiàn),決策者在主觀決策情境中會傾向于采納人的建議,而在客觀決策情境中則傾向于采納機器的建議;在客觀決策情境中,高認(rèn)知閉合需要的個體對人和機器建議的采納無顯著差異,而低認(rèn)知閉合需要的個體則更傾向于采納機器的建議;決策者在面對困難任務(wù)時更傾向于采納機器的建議,而在面對簡單任務(wù)時對人和機器建議的采納無顯著差異(惠青山等,2024)。上述其他領(lǐng)域的人機協(xié)同決策實踐為智能教研協(xié)同決策研究開闊了視野。
為走出高估數(shù)據(jù)效用的教研決策誤區(qū),亟待引導(dǎo)地方、學(xué)校、公司、高校等多主體合力探索智能教研協(xié)同決策中的實踐課題。結(jié)合當(dāng)前智能教研決策實踐中存在的典型問題,筆者將智能教研決策實踐課題歸納如下:智能教研實踐中教師對“人—機—人”協(xié)同決策的可接受程度如何?“人—機—人”是如何協(xié)同決策的?“人—機—人”協(xié)同決策的影響因素有哪些?哪些教研問題適合“人—機—人”協(xié)同決策?“人—機—人”協(xié)同能否產(chǎn)生更加科學(xué)、精準(zhǔn)的決策?
3.內(nèi)外聯(lián)動優(yōu)化推進(jìn)智能教研的循證實踐
優(yōu)化證據(jù)是智能教研循證實踐最大的挑戰(zhàn)。如前所述,單性異化是循證教研實踐最大的誤區(qū),為此亟須重視科學(xué)性證據(jù)的建設(shè)和經(jīng)驗性證據(jù)的價值,從而推動三性優(yōu)化的智能教研循證實踐真正落地。對此筆者提出以不同的內(nèi)外聯(lián)動方式來突破證據(jù)建設(shè)困境,實現(xiàn)智能教研循證實踐的優(yōu)化推進(jìn)。
一是外主內(nèi)輔聯(lián)動建立智能教研科學(xué)性證據(jù)庫。這既是突破科學(xué)性證據(jù)匱乏的關(guān)鍵,又能為智能教研平臺研發(fā)突破目前低層次重復(fù)建設(shè)困境提供科學(xué)依據(jù)。證據(jù)庫本質(zhì)上是“對經(jīng)過驗證的單個證據(jù)在進(jìn)行分類的基礎(chǔ)上進(jìn)一步系統(tǒng)化,是對科學(xué)經(jīng)驗的總結(jié)性提升”(安文霞,2016)。從智能教研實踐來看,目前智能教研平臺依據(jù)的科學(xué)性證據(jù)總體上呈個體性、零散性、非系統(tǒng)性等特點,不利于智能教研循證實踐的系統(tǒng)推進(jìn)??茖W(xué)性證據(jù)的構(gòu)建是一項系統(tǒng)、復(fù)雜的工作,亟須外主內(nèi)輔聯(lián)動推進(jìn)。外主是指以外部為主導(dǎo),外部主導(dǎo)者包括政府部門、教研管理者、教學(xué)研究者、專業(yè)技術(shù)人員、證據(jù)庫錄入人員等。其中,政府部門和教研管理者負(fù)責(zé)教研實踐的統(tǒng)籌和協(xié)調(diào),研究者負(fù)責(zé)科學(xué)性證據(jù)文獻(xiàn)的系統(tǒng)歸類和深化,專業(yè)技術(shù)人員負(fù)責(zé)科學(xué)性證據(jù)工具的研發(fā)及智能平臺的搭建。內(nèi)輔是指以學(xué)校利益相關(guān)者作為輔助,并基于學(xué)校需求視角提出證據(jù)庫建設(shè)的建議。
二是內(nèi)主外輔正視經(jīng)驗性證據(jù)的合理價值。經(jīng)驗性證據(jù)是指教師基于教研情境或語境為教研實踐提供的憑據(jù),教師經(jīng)驗是其主要來源。然而,在智能教研熱潮中,教研經(jīng)驗成了理論界和實踐界批判的“靶子”,如“傳統(tǒng)教研較為依賴教師或?qū)<医?jīng)驗,缺乏針對教學(xué)過程數(shù)據(jù)和材料的科學(xué)分析” (穆肅等,2024);又如“學(xué)校迫切需要學(xué)科教研活動從‘基于經(jīng)驗’走向‘基于實證’,從基于‘主觀臆斷’走向‘精準(zhǔn)診斷’”(胡曉紅等,2019)。在法學(xué)界同樣存在輕視經(jīng)驗的問題,由于經(jīng)驗證明在司法實踐中具有不可或缺的作用,為此法學(xué)界提出了和教研中經(jīng)驗性證據(jù)類似的“經(jīng)驗法則”,認(rèn)為經(jīng)驗法則“指代對事實認(rèn)定中經(jīng)驗知識的運用”,“具有可信性、蓋然性、公共性、具體性及隱蔽性五大內(nèi)部特征”(李汀,2023)。參照法學(xué)界的已有探索,教育界也亟待以學(xué)校為主體,連同教研員、高校研究者、公司相關(guān)人員等,探索怎樣的教研經(jīng)驗可以作為經(jīng)驗性證據(jù),以及這類證據(jù)應(yīng)具有何種獨特性,據(jù)此真正推進(jìn)三性優(yōu)化智能教研循證實踐的落地。
參考文獻(xiàn):
[1][德]馬克思(2018).1844年經(jīng)濟學(xué)哲學(xué)手稿[M].中共中央馬克思恩格斯列寧斯大林著作編譯局.北京:人民出版社:118-119.
[2][美]凱西·奧尼爾(2018).算法霸權(quán):數(shù)學(xué)殺傷性武器的威脅與不公[M].馬青玲.北京:中信出版社:前言Ⅸ.
[3][日]谷口忠大(2023).愛麗絲計劃:人工智能的現(xiàn)在與未來[M].丁丁蟲.北京:人民文學(xué)出版社.
[4][英]斯蒂芬·鮑爾,埃米利亞諾·格里馬爾迪(2020).新自由主義教育與新自由主義課堂[J].金津,劉紅霞.教育學(xué)報,16(3):4-14.
[5][英]韋恩·霍姆斯,孫夢,袁莉(2023).人工智能與教育:本質(zhì)探析和未來挑戰(zhàn)[J].中國教育信息化,29(2):16-26.
[6]安維復(fù)(2017).人工智能的社會后果及其思想治理——沿著馬克思的思路[J].思想理論教育,(11):23-27.
[7]安文霞(2016).簡析循證矯正證據(jù)庫的構(gòu)建[J].中國司法,(6):76-79.
[8]曹培杰,謝陽斌,武卉紫等(2024).教育大模型的發(fā)展現(xiàn)狀、創(chuàng)新架構(gòu)及應(yīng)用展望[J].現(xiàn)代教育技術(shù),34(2):5-12.
[9]常晉芳(2019).智能時代的人-機-人關(guān)系——基于馬克思主義哲學(xué)的思考[J].東南學(xué)術(shù),(2):75-82.
[10]陳禹辰,唐曉航,聶姿等(2023).數(shù)據(jù)驅(qū)動的校本教研路徑探索與實踐[J].中小學(xué)數(shù)字化教學(xué),(9):27-31.
[11]董洪亮(2021).基于證據(jù)的教研轉(zhuǎn)向——基本概念問題的初步討論[J].華東師范大學(xué)學(xué)報(教育科學(xué)版),39(5):108-115.
[12]何偉光(2023).走向解放:人工智能教育應(yīng)用本質(zhì)的哲學(xué)沉思[J].中國遠(yuǎn)程教育,43(7):11-20.
[13]胡小勇,林梓柔(2019).精準(zhǔn)教研視域下的教師畫像研究[J].電化教育研究,40(7):84-91.
[14]胡曉紅,凌偉(2019).發(fā)現(xiàn)與改進(jìn):基于數(shù)據(jù)的精準(zhǔn)教研的路徑與實踐[J].中國信息技術(shù)教育,(Z4):7-10.
[15]胡曉萌,陳力源,劉正源(2024).大語言模型的信任建構(gòu)[J].中州學(xué)刊,(5):171-176.
[16]惠青山,趙俊峰,姜紅梅等(2024).人與機器,誰的建議更容易被采納?不同決策情境下建議者類型對建議采納的影響研究[J].管理工程學(xué)報,38(1):74-87.
[17]李?。?023).經(jīng)驗法則與印證的功能歸屬:一個敘事理論的視角[J].證據(jù)科學(xué),31(6):752-767.
[18]李陽,曾祥翊(2022).人工智能賦能教研高質(zhì)量發(fā)展:智能精準(zhǔn)教研的理論框架、實踐藍(lán)圖與發(fā)展脈絡(luò)[J].中國電化教育,(11):99-107,122.
[19]劉立杰(2024).依托希沃?jǐn)?shù)字校園基座,構(gòu)建教育生態(tài)新模式[J].安徽教育科研,(2):15-18.
[20]孟華(2008).符號學(xué)的三重證據(jù)法及其在證據(jù)法學(xué)中的應(yīng)用[J].證據(jù)科學(xué),(1):16-26.
[21]穆肅,陳孝然,胡小勇(2024).教師專業(yè)發(fā)展視域下智能教研平臺功能分析[J].現(xiàn)代遠(yuǎn)距離教育,(2):23-32.
[22]裴嘉良,劉善仕,鐘楚燕等(2021).AI算法決策能提高員工的程序公平感知嗎?[J].外國經(jīng)濟與管理,43(11):41-55.
[23]裴淼,靳偉,李肖艷等(2020).循證教師教育實踐:內(nèi)涵、價值和運行機制[J].教師教育研究,32(4):1-8.
[24]魏昕,黃鳴鵬,李欣悅(2021).算法決策、員工公平感與偏差行為:決策有利性的調(diào)節(jié)作用[J].外國經(jīng)濟與管理,43(11):56-69.
[25]吳雨宸,宋萑,徐興子(2023).循證教研:指向教師實踐性知識生成的教研轉(zhuǎn)型[J].教師教育研究,35(1):13-19.
[26]謝惠加,譚鈞豪(2024).基礎(chǔ)模型訓(xùn)練使用作品的版權(quán)保護(hù)困境及出路[J].中國出版,(15):5-12.
[27]閆予沨,付鈺,劉麗莎等(2020).我國循證教師教育決策:內(nèi)涵、價值與路徑[J].教師教育研究,32(6):21-26.
[28]楊文登(2010).循證實踐:一種新的實踐形態(tài)?[J].自然辯證法研究,26(4):106-110.
[29]宰飛,吳丹璐(2023).大模型如何更可信可靠可及[N].解放日報,2023-07-08(004).
[30]張志學(xué),華中生,謝小云(2024).數(shù)智時代人機協(xié)同的研究現(xiàn)狀與未來方向[J].管理工程學(xué)報,38(1):1-13.
[31]鄭欣欣,曾媛,曾祥翊等(2023).智能精準(zhǔn)教研中學(xué)校支持服務(wù)對教研效果影響的組態(tài)研究——基于定性比較分析方法[J].中國電化教育,(10):111-119.
[32]中國信息通信研究院,京東探索研究院(2021).可信人工智能白皮書[EB/OL].[2024-05-05].http://www.caict.ac.cn/kxyj/qwfb/bps/202107/P020210709319866413974.pdf.
[33]周麗昀,王天恩,王國豫等(2021).人工智能與人類未來的跨學(xué)科對話——從“交叉”到“融合”[J].哲學(xué)分析,12(5):181-195.
[34]朱靖,劉太如(2024).建設(shè)區(qū)域精準(zhǔn)教學(xué)支持體系 助力教育數(shù)字化轉(zhuǎn)型整體推進(jìn)——以上海市閔行區(qū)為例[J].中小學(xué)數(shù)字化教學(xué),(5):9-13.
[35]字詞語辭書編研組(2016).新編現(xiàn)代漢語詞典[M].長沙:湖南教育出版社.
[36]Barber, M., amp; Fullan, M. (2005). Tri-Level Development[EB/OL]. [2024-05-05]. https://www.edweek.org/leadership/opinion-tri-level-development/2005/03.
[37]Bommasani, R., Hudson, D. A., amp; Adeli, E. et al. (2021). On the Opportunities and Risks of Foundation Models[EB/OL]. [2024-05-05]. https://crfm.stanford.edu/assets/report.pdf.
[38]Heller, A. (1976). The Theory of Need in Marx[M]. New York: ST. Martin’s Press:48-66.
[39]McKnight, D. H., Carter, M., amp; Thatcher, J. B. et al. (2011). Trust in a Specific Technology: An Investigation of Its Components and Measures[J]. ACM Transactions on Management Information Systems, 2(2):1-25.
[40]Shrestha, Y. R., Ben-Menahem, S. M., amp; von Krogh, G. (2019). Organizational Decision-Making Structures in the Age of Artificial Intelligence[J]. California Management Review, 61(4):66-83.
[41]Terziyan, V., Gryshko, S., amp; Golovianko, M. (2018). Patented Intelligence: Cloning Human Decision Models for Industry 4.0[J]. Journal of Manufacturing Systems, 48:204-217.
收稿日期 2024-11-09 責(zé)任編輯 劉選
Intelligent Teaching Research: Essence, Misunderstanding and Return
WANG Lihua, SHI Yifan, LU Guocheng
Abstract: Intelligent teaching research (ITR) is a policy direction and practical hotspot under the trend of artificial intelligence. However, there is currently a widespread lack of understanding of the essence of ITR, which leads to blind pursuit and frequent practical misunderstandings. Based on a dual examination of the essence of artificial intelligence and teaching research, it is proposed that ITR is an evidence-based practice of “three-essence” (scientific, technical and empirical) optimization, which is realized by human-machine-human collaborative decision making from the teaching research data by trusted models. Based on this, the typical misconceptions of ITR are mainly reflected in three aspects: teaching research data constrained by suspicious models, teaching research decisions that overestimate the utility of data, and evidence-based teaching research practice that fall into singularity. In order to avoid misunderstandings, ITR urgently need to achieve rational regression through three ways in the future: first, it is essential to jointly develop trustworthy basic models to ensure the quality of ITR data; the second is to draw on existing research in related fields and work together to explore new practical topics for ITR “human-machine-human” collaborative decision making; the third is to promote the construction of a scientific evidence base through internal and external linkage, recognize the reasonable value of empirical evidence, and continuously optimize the evidence-based practice of ITR.
Keywords: Intelligent Teaching Research; Trusted Models; Human-Machine-Human Collaborative Decision Making; Evidence-Based Practice