999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

從“負(fù)能”到“賦能”:基于LLMs的思維鏈提示設(shè)計(jì)與教研AI智能體構(gòu)建

2025-03-31 00:00:00王冬青陳自力邵文豪張粵芳李贊堅(jiān)任光杰
中國電化教育 2025年3期

摘要:課堂教學(xué)智能分析是人工智能技術(shù)賦能循證教研的新趨勢,通常以報(bào)告的形式呈現(xiàn)給一線教師,但其往往包含巨大認(rèn)知負(fù)荷且數(shù)據(jù)呈現(xiàn)復(fù)雜,使得一線教師難以把握問題關(guān)鍵點(diǎn)并用于教學(xué)改進(jìn),以數(shù)據(jù)“賦能”為出發(fā)點(diǎn),卻反而給教師帶去了數(shù)據(jù)“負(fù)能”。該文基于思維鏈提示邏輯,提出了教研AI智能體賦能課堂教學(xué)分析報(bào)告解讀的構(gòu)建框架,實(shí)現(xiàn)從數(shù)據(jù)解析到反饋生成的循環(huán),并以此為導(dǎo)向模塊化構(gòu)建了基于開源大語言模型(LLMs)的智能體框架,個(gè)性化開發(fā)教研AI智能體。通過63份真實(shí)報(bào)告數(shù)據(jù),驗(yàn)證了“基于思維鏈提示的回復(fù)”相較于“基于LLM的普通回復(fù)”的有效性,結(jié)果表明前者在多項(xiàng)評價(jià)維度上均表現(xiàn)出更高的評分,尤其是在準(zhǔn)確性、邏輯性和專業(yè)性方面具有顯著提升。該文通過聚焦智能體在教研中的垂直應(yīng)用,探索從數(shù)據(jù)負(fù)能到賦能轉(zhuǎn)變的新路徑。

關(guān)鍵詞:大語言模型;智能體;思維鏈提示;課堂教學(xué)智能分析;循證教研

中圖分類號:G434 文獻(xiàn)標(biāo)識(shí)碼:A

* 本文系廣東省哲學(xué)社會(huì)科學(xué)規(guī)劃項(xiàng)目“教育數(shù)字化轉(zhuǎn)型下促進(jìn)知識(shí)建構(gòu)的人機(jī)智能協(xié)同方法與適應(yīng)性干預(yù)研究”(項(xiàng)目編號:GD24XJY35)、廣東省哲學(xué)社會(huì)科學(xué)創(chuàng)新工程特別委托項(xiàng)目“廣東省高校人工智能學(xué)科發(fā)展現(xiàn)狀與對策研究”(項(xiàng)目編號:GD24WTCXGC10)研究成果。

① 任光杰為本文通訊作者。

依托大語言模型的強(qiáng)大創(chuàng)生和推理能力,生成式人工智能(Generative Artificial Intelligence,GAI)為教育場景中的個(gè)性化教學(xué)、學(xué)習(xí)反饋和課堂評估提供新技術(shù)支持,在教育應(yīng)用中展示出極大的潛力[1]。但隨著其應(yīng)用的普及,教師們逐漸發(fā)現(xiàn)了一些局限性,例如,基于少量數(shù)據(jù)訓(xùn)練的教學(xué)智能體由于規(guī)則簡單,依賴于預(yù)設(shè)的規(guī)則或算法[2],其反饋往往缺乏動(dòng)態(tài)調(diào)整及涌現(xiàn)能力,生成的內(nèi)容也較為固定[3]。研究者開始嘗試基于開源大語言模型構(gòu)建專用的教育智能體[4],它能感知學(xué)習(xí)環(huán)境、提供動(dòng)態(tài)反饋和為師生生成個(gè)性化教學(xué)內(nèi)容[5],也有研究者深入討論了ChatGPT的四項(xiàng)核心能力在教育任務(wù)設(shè)定、內(nèi)容記憶、交互協(xié)作等多個(gè)教學(xué)場景方面的潛在應(yīng)用能力[6],并在此基礎(chǔ)上提出了基于大模型的教學(xué)智能體框架,這一框架能夠支持多模態(tài)數(shù)據(jù)的分析,輔助教學(xué)活動(dòng)[7],上述研究為解決GAI教學(xué)應(yīng)用的局限性做出了有益探索。針對教育領(lǐng)域通用大模型和多模態(tài)教育模型的創(chuàng)新應(yīng)用,已有研究還提出了潛在風(fēng)險(xiǎn)與教育變革的展望,并為其未來發(fā)展提出了針對性的建議[8]。當(dāng)前在教學(xué)智能體理論方法與技術(shù)框架方面的研究,為我們探索不同教育場景下的專用智能體構(gòu)建提供了新思路和新方法。本研究將從一線教研場景中人工智能技術(shù)應(yīng)用產(chǎn)生的實(shí)際“負(fù)能”問題出發(fā),研究專用的教研AI智能體構(gòu)建框架與實(shí)踐效果,探索高質(zhì)量的GAI賦能教育發(fā)展新路徑。

一、問題提出:“負(fù)能”何來

課堂教學(xué)智能分析報(bào)告(以下簡稱報(bào)告)是依托課堂智能分析技術(shù)可視化分析課堂教學(xué)中的問題,最近受到教研員和一線教師的廣泛喜愛,被應(yīng)用于教研活動(dòng)的循證支持。課堂智能分析技術(shù)是指基于人工智能技術(shù)對課堂教學(xué)過程的行為、語音、視頻、表情等多模態(tài)數(shù)據(jù)進(jìn)行自動(dòng)化識(shí)別、采集與分析,客觀解讀與評價(jià)教師教學(xué)行為和學(xué)生學(xué)習(xí)狀態(tài)[9],報(bào)告是其可視化表征的形式。

本研究依托G市“AI助推教師隊(duì)伍建設(shè)示范區(qū)”項(xiàng)目以及國家智能教育融合創(chuàng)新中心項(xiàng)目開展“人工智能教育應(yīng)用的負(fù)能研究”,實(shí)地調(diào)研G市56所中小學(xué)的課堂智能分析技術(shù)應(yīng)用實(shí)踐效果,關(guān)注課堂教學(xué)智能分析報(bào)告,例如CSMS[10]等,聚焦報(bào)告在賦能教研應(yīng)用過程中所帶來的問題和困難,分析障礙因素和負(fù)能,嘗試提出GAI賦能教研高質(zhì)量發(fā)展的解決方案。

從調(diào)研結(jié)果看,一方面,課堂智能分析技術(shù)相對成熟,能夠通過多模態(tài)課堂數(shù)據(jù)生成詳細(xì)報(bào)告,提供諸如師生互動(dòng)、提問回答、學(xué)生情感等多維度的數(shù)據(jù)[11];另一方面,報(bào)告內(nèi)容過于繁冗復(fù)雜,包含大量的學(xué)生行為數(shù)據(jù)、交互分析和學(xué)習(xí)成效評估圖表等,信息量巨大且數(shù)據(jù)呈現(xiàn)復(fù)雜,一線教師的認(rèn)知負(fù)荷大,難以迅速把握關(guān)鍵點(diǎn)并據(jù)此凝練教學(xué)問題,提出解決方案,進(jìn)而難以應(yīng)用于教學(xué)改進(jìn)。因此,每節(jié)課生成的報(bào)告反而給一線教師帶來了明顯的信息過載,一部分教師想到借助通用大語言模型進(jìn)行報(bào)告解讀,但結(jié)論過于泛化,難以聚焦問題[12],導(dǎo)致包含豐富數(shù)據(jù)和價(jià)值的報(bào)告難以有效應(yīng)用,并給教師帶來了日常工作壓力,以數(shù)據(jù)“賦能”為出發(fā)點(diǎn)的智能分析報(bào)告,卻反而給教師帶去了數(shù)據(jù)“負(fù)能”。以下為具有代表性的一線優(yōu)秀教師A的訪談?dòng)涗洠?/p>

“我們備課組已常態(tài)化使用智能分析報(bào)告進(jìn)行教研,對于報(bào)告中的數(shù)據(jù)大家很認(rèn)可,但感覺報(bào)告并沒有真正應(yīng)用于一線。我們對于報(bào)告最核心的需求在于快速知道自己教學(xué)問題所在,而報(bào)告中包含大量數(shù)據(jù),專業(yè)術(shù)語繁復(fù),脫離了‘解決問題’的目標(biāo),更像是一種學(xué)習(xí),帶來了不少負(fù)擔(dān)。

教師真正的成長是‘自我對話’,教研會(huì)中的碰撞通常只能得出較為表面的結(jié)果,難以對自己的課堂有更清晰的認(rèn)識(shí)。智能分析報(bào)告在一定程度上促進(jìn)了我去自我反思,是有助于我的教學(xué)成長和素養(yǎng)提升,但報(bào)告中的‘問題’泛泛而談,沒有對課堂總體情況有一個(gè)清晰的概覽,更難以聚焦學(xué)科和教學(xué)問題改進(jìn)。”

從A老師的訪談?dòng)涗浛矗悄芊治鰣?bào)告中的數(shù)據(jù)很有價(jià)值,但通常一線教師難以具備獨(dú)立分析數(shù)據(jù)的能力,進(jìn)而無法充分發(fā)揮數(shù)據(jù)的意義和價(jià)值[13]。從教師專業(yè)發(fā)展的角度講,報(bào)告解讀要靠教師理解和吃透,才能讓教研從經(jīng)驗(yàn)走向數(shù)據(jù),從數(shù)據(jù)走向證據(jù),循證教研才能真實(shí)有效發(fā)生。因此如何幫助教師真正讀懂報(bào)告,改進(jìn)教學(xué)成為工作的重難點(diǎn)。在研究初期,團(tuán)隊(duì)致力于向教師普及基于開源大語言模型的生成式人工智能,如“文心一言”“智譜清言”等,通過上傳報(bào)告再提出問題的形式,幫助教師完成報(bào)告解讀,但這種方式效果并不理想,很大程度上受生成式人工智能的“通用性”限制,雖然為報(bào)告的初步解讀提供便利,但缺乏針對具體教學(xué)場景的深度定制,生成的回答空泛且不聚焦。這種“大一統(tǒng)”的解讀方法往往無法提供具體的、可操作性的教學(xué)建議,使得教師難以從報(bào)告中獲得實(shí)質(zhì)性的指導(dǎo)。

基于上述研究實(shí)踐提出本文聚焦的“負(fù)能”問題:第一,課堂教學(xué)智能分析報(bào)告內(nèi)容復(fù)雜,在支撐教師發(fā)現(xiàn)教學(xué)問題方面存在不足。第二,基于開源大語言模型輔助報(bào)告解讀,結(jié)論空泛不聚焦。針對上述問題,本研究提出基于開源大語言模型設(shè)計(jì)思維鏈提示,構(gòu)建教研AI智能體框架,旨在幫助教師識(shí)別教學(xué)中的關(guān)鍵問題,提供個(gè)性化改進(jìn)方案,逐步優(yōu)化教學(xué)活動(dòng)。為減少“通用性”的限制,進(jìn)一步提升智能體回答的專業(yè)性,本研究聚焦在專用智能體設(shè)計(jì)中融合思維鏈提示方法的研究,如何將思維鏈提示賦能報(bào)告分析,并以此構(gòu)建基于開源大語言模型的教研AI智能體框架,是本研究的研究重點(diǎn)。

二、解決方法:面向智能分析報(bào)告解讀的思維鏈提示設(shè)計(jì)

課堂教學(xué)智能分析報(bào)告往往包含多維度的數(shù)據(jù),例如師生互動(dòng)、學(xué)生情感、提問模式等。教師需要以一種邏輯清晰、易于理解的方式來逐步解讀這些數(shù)據(jù),并分析出具體問題所在。思維鏈提示因其逐層遞進(jìn)的思考特性,為解決當(dāng)前復(fù)雜報(bào)告解讀困難的問題提供了有效路徑。提示詞是指基于自然語言的句子或片段(包含描述、命令、查詢和請求)[14],適當(dāng)準(zhǔn)確的提示詞使得使用者能夠獲得較為理想的預(yù)期結(jié)果[15]。思維鏈作為一種邏輯化的思維工具,能夠幫助個(gè)體從表面問題逐步深入,探討原因并提出可操作的解決方案[16]。本研究從宏觀的數(shù)據(jù)分析到具體問題聚焦,實(shí)現(xiàn)數(shù)據(jù)解讀到教學(xué)優(yōu)化的循環(huán),思維鏈提示方法包括兩個(gè)層次:一是,構(gòu)建分階段引導(dǎo)機(jī)制,提升教師對報(bào)告的理解;二是,實(shí)現(xiàn)邏輯遞進(jìn)式對話,提高教師的反思和調(diào)整能力,如圖1所示。

(一)分階段引導(dǎo)機(jī)制:擴(kuò)展報(bào)告分析步驟與細(xì)化邏輯

分階段引導(dǎo)機(jī)制旨在實(shí)現(xiàn)對課堂互動(dòng)、提問模式、學(xué)生情感表現(xiàn)等數(shù)據(jù)的多層次分析,以形成對課堂整體表現(xiàn)的全貌理解,進(jìn)而識(shí)別并深入探討課堂中存在的核心問題,最終生成個(gè)性化的教學(xué)建議。整個(gè)引導(dǎo)過程被細(xì)化為五個(gè)有效階段:初步認(rèn)知、問題識(shí)別、原因分析、決策支持和反饋優(yōu)化,通過逐步提示的形式幫助教師從復(fù)雜的課堂數(shù)據(jù)中提取有用信息,將復(fù)雜的教學(xué)問題分解為多個(gè)可操作的小步驟,逐步轉(zhuǎn)化為具體的教學(xué)改進(jìn)措施。

初步認(rèn)知階段將基礎(chǔ)數(shù)據(jù)進(jìn)行歸納,幫助教師快速掌握課堂概況。問題識(shí)別和原因分析階段則聚焦于深層次問題,如識(shí)別學(xué)生的特定行為模式和情緒反應(yīng)的原因。在決策支持階段,智能體基于數(shù)據(jù)生成可行的教學(xué)改進(jìn)建議,并在反饋優(yōu)化階段接受教師的反饋進(jìn)行調(diào)整和改進(jìn)。以上五個(gè)階段共同構(gòu)成從數(shù)據(jù)解析到反饋生成的循環(huán),具體提示示例如表1所示。整個(gè)過程通過遞進(jìn)式對話和靈活的分層提問,使得教師能夠在不同的層次上獲取適合的支持,增強(qiáng)教學(xué)決策的科學(xué)性和精準(zhǔn)性。

(二)邏輯遞進(jìn)式對話:基于多層互動(dòng)的反饋調(diào)整

邏輯遞進(jìn)式對話指通過逐步提問的方式增強(qiáng)大語言模型與教師之間的互動(dòng),是教師與大語言模型之間的一種信息交換模式,更是一種動(dòng)態(tài)的反饋調(diào)整機(jī)制,通過五個(gè)具體的互動(dòng)層次:遞進(jìn)引導(dǎo)、個(gè)性化反饋、靈活對話、反饋循環(huán)和自學(xué)習(xí),逐步引導(dǎo)教師深入理解課堂數(shù)據(jù),最終形成對教學(xué)問題的全面理解。五個(gè)互動(dòng)層次的協(xié)作流程如圖2所示。

遞進(jìn)引導(dǎo)是互動(dòng)的第一層,通過由簡入繁的方式逐步引導(dǎo)教師對課堂數(shù)據(jù)進(jìn)行分析,形成鏈?zhǔn)綄υ捖窂健J紫日故菊n堂的總體數(shù)據(jù)表現(xiàn),在后續(xù)對話中逐漸引導(dǎo)教師關(guān)注更細(xì)化的信息,如“互動(dòng)頻率是否達(dá)到預(yù)期?”或“學(xué)生在互動(dòng)中的情感狀態(tài)如何?”這種逐層深入的問題設(shè)計(jì),幫助教師逐步從數(shù)據(jù)的表面現(xiàn)象過渡到更復(fù)雜的原因分析,并在此過程中發(fā)現(xiàn)潛在的教學(xué)改進(jìn)空間。通過多輪對話和層次性提問,實(shí)現(xiàn)一個(gè)層層遞進(jìn)的對話鏈,從而為教師提供逐步深化的教學(xué)支持。

在個(gè)性化反饋層次,根據(jù)教師的反饋和關(guān)注點(diǎn)進(jìn)行動(dòng)態(tài)調(diào)整。每位教師的關(guān)注點(diǎn)可能有所不同,如某些教師可能更關(guān)注學(xué)生的情感表現(xiàn)。當(dāng)教師對某一方面表現(xiàn)出特定關(guān)注時(shí),調(diào)整后續(xù)的反饋和建議,以滿足教師的個(gè)性化需求。這種反饋調(diào)整增強(qiáng)了對話的互動(dòng)性,也幫助教師在決策過程中能夠更加精準(zhǔn)地聚焦于關(guān)鍵教學(xué)問題,從而有效提升教學(xué)效果。

靈活對話層次是指針對不同情境和學(xué)科需求的實(shí)時(shí)適應(yīng)能力。通過動(dòng)態(tài)調(diào)整對話路徑,實(shí)現(xiàn)從鏈?zhǔn)剿季S到圖式思維的發(fā)展。例如,適應(yīng)教師在不同教學(xué)情境中的具體需求,確保提供的建議與情境密切相關(guān),以語文學(xué)科為例,應(yīng)更加關(guān)注學(xué)生的閱讀理解和情感反應(yīng),在理科學(xué)科中則應(yīng)更側(cè)重于問題解決和互動(dòng)頻次。靈活對話使大語言模型能夠有效適應(yīng)教師的課堂需求,為教師提供情境化的教學(xué)建議,以支持不同學(xué)科的教學(xué)改進(jìn)。

反饋循環(huán)層次是一個(gè)持續(xù)優(yōu)化的過程。教師在實(shí)施建議后可以繼續(xù)基于反饋跟蹤問題,以獲得進(jìn)一步調(diào)整建議。反饋循環(huán)根據(jù)教師的教學(xué)反饋不斷優(yōu)化其建議內(nèi)容,這種循環(huán)往復(fù)的過程確保了所提供的建議能夠隨著教師的實(shí)際情況不斷調(diào)整,使教師能夠在教學(xué)實(shí)踐中逐步提高質(zhì)量,從而形成一個(gè)長期的改進(jìn)過程,不斷提升反饋的有效性和針對性。

自學(xué)習(xí)層次則是通過累積教師的交互數(shù)據(jù),不斷優(yōu)化對話路徑和反饋策略。使大語言模型在與教師的多次交互中逐漸學(xué)習(xí)教師的特定需求和偏好,從而提升互動(dòng)的精準(zhǔn)度。如教師在多次對話中表現(xiàn)出對學(xué)生情感數(shù)據(jù)的強(qiáng)烈關(guān)注,則自動(dòng)調(diào)整其對話結(jié)構(gòu),優(yōu)先展示相關(guān)數(shù)據(jù)。這種自學(xué)習(xí)能力使得模型在長期使用中能夠更加精確地滿足教師的需求,并提供更加個(gè)性化和高效的建議。自學(xué)習(xí)的實(shí)現(xiàn)依賴于智能體對歷史交互數(shù)據(jù)的分析,使得系統(tǒng)能夠在多變的教學(xué)場景中保持對教師需求的快速響應(yīng)。

三、基于思維鏈提示的教研AI智能體構(gòu)建:轉(zhuǎn)負(fù)能為賦能

依托上述思維鏈提示設(shè)計(jì)構(gòu)建教研AI智能體,包括用戶交互、思維鏈、長期記憶和語言模型四個(gè)模塊。模塊與模塊之間高效協(xié)同,共同構(gòu)成從數(shù)據(jù)解析到反饋生成的閉環(huán),實(shí)現(xiàn)將課堂教學(xué)智能分析報(bào)告中的復(fù)雜信息轉(zhuǎn)化為可操作的教學(xué)建議,具體設(shè)計(jì)架構(gòu)如圖3所示。

用戶交互模塊是教師與智能體互動(dòng)的核心,該模塊包含兩個(gè)組件:對話組件和上傳組件。上傳組件支持教師上傳智能分析報(bào)告,智能體將自動(dòng)生成思維鏈的反饋,涵蓋學(xué)生參與度、互動(dòng)頻率、情緒分析等關(guān)鍵信息,提出關(guān)鍵問題并給出對應(yīng)的改進(jìn)建議。在對話組件中,教師可以直接輸入問題,通過自然語言與智能體進(jìn)行多輪互動(dòng),以獲得針對性的教學(xué)反饋。此外,通過內(nèi)嵌的自學(xué)習(xí)機(jī)制,智能體能夠不斷積累與教師的交互歷史,優(yōu)化對教師的回應(yīng),使得反饋內(nèi)容更加符合個(gè)性化需求。該模塊不僅支持即時(shí)互動(dòng),還能在多輪對話中提供逐層深入的分析和引導(dǎo),幫助教師更好地理解和應(yīng)用課堂分析報(bào)告中的數(shù)據(jù),為教學(xué)改進(jìn)提供實(shí)用建議。

思維鏈提示模塊是智能體的個(gè)性化核心,結(jié)合分階段引導(dǎo)機(jī)制和邏輯遞進(jìn)式對話,通過多層次的推理和生成能力,幫助教師有效解構(gòu)課堂數(shù)據(jù),識(shí)別關(guān)鍵問題并提供個(gè)性化的教學(xué)支持。智能體首先簡化數(shù)據(jù),幫助教師形成課堂整體認(rèn)知,接著識(shí)別課堂問題并深入分析其原因,最終提供個(gè)性化改進(jìn)建議并根據(jù)教師反饋不斷優(yōu)化。邏輯遞進(jìn)式對話通過逐步提問增強(qiáng)互動(dòng),幫助教師從表面數(shù)據(jù)深入分析潛在問題。初期提問關(guān)注基本信息,后續(xù)提問引導(dǎo)教師探討更深層次的原因和改進(jìn)措施。智能體根據(jù)教師需求調(diào)整對話,確保建議精準(zhǔn)有效。通過反饋循環(huán)和自學(xué)習(xí)機(jī)制,智能體在長期交互中優(yōu)化建議,推動(dòng)教學(xué)質(zhì)量持續(xù)改進(jìn)。

長期記憶模塊是多輪對話質(zhì)量提升的保障,通過分析交互歷史和回復(fù)策略,支持智能體的自學(xué)習(xí)和內(nèi)容優(yōu)化。歷史數(shù)據(jù)主要包括交互歷史、提問偏好、常模數(shù)據(jù)等,回復(fù)策略是指引入情境適應(yīng)和知識(shí)拓展等。在實(shí)際應(yīng)用中,教研AI智能體會(huì)對教師的提問歷史和偏好進(jìn)行分析,結(jié)合常模數(shù)據(jù)和最佳案例生成個(gè)性化建議內(nèi)容。在情境適應(yīng)上,智能體能夠識(shí)別不同教學(xué)情境中的細(xì)微差異,提供符合實(shí)際需求的建議。在知識(shí)拓展方面,智能體會(huì)結(jié)合最新的教育研究和學(xué)科發(fā)展,提供具有前瞻性的教學(xué)建議。通過這些策略,智能體在與教師的長期交互中不斷積累經(jīng)驗(yàn),使得回復(fù)內(nèi)容更加精準(zhǔn)和高效,有助于提升教師的教學(xué)效果。

語言模型模塊是智能體在深度融合大語言模型和計(jì)算平臺(tái)時(shí)的關(guān)鍵支持環(huán)節(jié)。首先,提示詞工程利用思維鏈模塊的分階段引導(dǎo)策略,通過遷移學(xué)習(xí),多任務(wù)學(xué)習(xí)等微調(diào)方法,幫助大語言模型在分析課堂數(shù)據(jù)時(shí)層層解構(gòu)關(guān)鍵信息(如學(xué)生提問次數(shù)、情緒反應(yīng)等),實(shí)現(xiàn)對復(fù)雜數(shù)據(jù)的有序呈現(xiàn)。在微調(diào)過程中,針對教育場景的特定需求,模型通過引入領(lǐng)域數(shù)據(jù)和場景化任務(wù)進(jìn)一步優(yōu)化,以確保對教育數(shù)據(jù)的深度理解和精準(zhǔn)反饋。遞進(jìn)式對話不僅增強(qiáng)了與教師的互動(dòng)效果,也使得智能體在教師反饋的基礎(chǔ)上進(jìn)行實(shí)時(shí)調(diào)整和內(nèi)容生成,確保反饋的深度和針對性不斷提升。此外,計(jì)算平臺(tái)在提供計(jì)算資源和數(shù)據(jù)管理功能的同時(shí),也為模型微調(diào)提供了支持。通過數(shù)據(jù)增強(qiáng)機(jī)制和數(shù)據(jù)管理系統(tǒng),計(jì)算平臺(tái)能夠擴(kuò)展大語言模型的知識(shí)覆蓋面,同時(shí)確保數(shù)據(jù)質(zhì)量的持續(xù)優(yōu)化[17]。數(shù)據(jù)增強(qiáng)機(jī)制通過不同情境、樣本和變量的引入,使模型在多種課堂情境中具備較強(qiáng)的泛化能力。數(shù)據(jù)管理系統(tǒng)則嚴(yán)格篩選和更新模型的訓(xùn)練數(shù)據(jù),確保在復(fù)雜問題處理時(shí)保持高水平的準(zhǔn)確性和一致性。這些微調(diào)與優(yōu)化措施相結(jié)合,使智能體在動(dòng)態(tài)教學(xué)環(huán)境中表現(xiàn)出高度適應(yīng)性和穩(wěn)定的反饋質(zhì)量。

四、研究過程與結(jié)論:賦能循證教研的數(shù)字化轉(zhuǎn)型

本研究基于上述智能體設(shè)計(jì)架構(gòu),開發(fā)了基于思維鏈提示的教研AI智能體,通過真實(shí)的一線課堂教學(xué)智能分析報(bào)告數(shù)據(jù)驗(yàn)證有效性。

(一)實(shí)驗(yàn)設(shè)計(jì)

依托56所G市中小學(xué)校,共收集70份報(bào)告,經(jīng)篩選后確定合格報(bào)告樣本數(shù)量為63份,隨后對這63份報(bào)告進(jìn)行“普通回復(fù)”和“基于思維鏈的回復(fù)”生成處理,分別獲得63份“普通回復(fù)”和“基于思維鏈的回復(fù)”文本數(shù)據(jù)作為評價(jià)樣本,其中“普通回復(fù)”為基于開源大語言模型(智譜清言)對報(bào)告的初步分析結(jié)果,而“基于思維鏈的回復(fù)”指的是教研AI智能體的分析結(jié)果。為建立客觀科學(xué)的回復(fù)內(nèi)容檢驗(yàn)標(biāo)準(zhǔn),研究者參考了相關(guān)研究者對智能體回復(fù)的評價(jià)標(biāo)準(zhǔn)[18]及對教學(xué)反饋的評價(jià)標(biāo)準(zhǔn)[19],結(jié)合本研究中兩種回復(fù)的特點(diǎn),整理出了適用的評價(jià)標(biāo)準(zhǔn),如表2所示。

評價(jià)標(biāo)準(zhǔn)綜合了“教學(xué)分析能力”和“綜合語言能力”兩個(gè)方面的評價(jià)要點(diǎn),劃分出9個(gè)方面的評價(jià)維度,包含對回復(fù)文本的準(zhǔn)確性、邏輯性等具體層面的分析,結(jié)合兩點(diǎn)和三點(diǎn)李克特量表,通過計(jì)分制的方式獲取最后的評分。隨后,研究者與A專家合作,對63對“普通回復(fù)”和“基于思維鏈的回復(fù)”文本數(shù)據(jù)內(nèi)容進(jìn)行標(biāo)注。操作程序如下:首先,研究者隨機(jī)抽取5對回復(fù)數(shù)據(jù),與A專家分別對每一對回復(fù)中兩個(gè)評價(jià)內(nèi)容“教學(xué)分析能力”和“綜合語言能力”所包含的10個(gè)評價(jià)要點(diǎn)進(jìn)行標(biāo)注,計(jì)算得分。隨后與A專家比對標(biāo)注和得分結(jié)果,對不一致的方面進(jìn)行協(xié)商并達(dá)成共識(shí)。最后,研究者與A專家獨(dú)立對剩下的數(shù)據(jù)進(jìn)行標(biāo)注和評分。經(jīng)一致性計(jì)算發(fā)現(xiàn),回復(fù)數(shù)據(jù)得分的一致性達(dá)到0.84,表明人工標(biāo)注結(jié)果較為準(zhǔn)確。在數(shù)據(jù)標(biāo)注完成后,通過描述性統(tǒng)計(jì)、配對樣本t檢驗(yàn)和效應(yīng)量分析,對回復(fù)數(shù)據(jù)的多維度表現(xiàn)進(jìn)行量化,以驗(yàn)證思維鏈提示優(yōu)化的智能體在報(bào)告解讀上的相對優(yōu)勢。

(二)數(shù)據(jù)分析與結(jié)論

經(jīng)計(jì)算得出,“普通回復(fù)”平均得分為7.8,“基于思維鏈的回復(fù)”平均得分為12.4,對兩種回復(fù)在9個(gè)細(xì)分維度上的具體量化分析結(jié)果如表3所示。可見,“基于思維鏈的回復(fù)”在其中7個(gè)維度上都有明顯更好的表現(xiàn),為進(jìn)一步驗(yàn)證上述維度差異的顯著性,對兩種不同回復(fù)的7個(gè)維度的得分?jǐn)?shù)據(jù)采用了配對樣本t檢驗(yàn),結(jié)果顯示,兩種回復(fù)在準(zhǔn)確性、多樣性、充分性、專業(yè)性、廣泛性、邏輯性6個(gè)維度上具有顯著差異,p值均小于0.05。為進(jìn)一步量化這些差異的實(shí)際影響,本研究計(jì)算了效應(yīng)量(Cohen’s d),得出在準(zhǔn)確性、充分性、專業(yè)性、廣泛性和邏輯性維度上,效應(yīng)量d值大于0.8,屬于大效應(yīng),而在多樣性和理解性維度上屬于小效應(yīng)。

由此可見,思維鏈提示賦能的智能體在多項(xiàng)評價(jià)維度上均表現(xiàn)出更高的評分,尤其是在準(zhǔn)確性、邏輯性、廣泛性和專業(yè)性方面,顯示出其在處理復(fù)雜課堂數(shù)據(jù)和提供教學(xué)反饋方面的優(yōu)勢。第一,準(zhǔn)確性提升:智能體在反饋準(zhǔn)確性上的評分從普通回復(fù)的0.54提升至1.14,反映了其在準(zhǔn)確解讀課堂數(shù)據(jù)、提供可靠反饋方面取得了較大進(jìn)步。第二,充分性和廣泛性提升:在充分性上,智能體的評分從“普通回復(fù)”的1.12 提高到1.59,顯示出其在提供全面證據(jù)和支撐論點(diǎn)方面的改進(jìn)。廣泛性維度表現(xiàn)尤為顯著,從“普通回復(fù)”的0.39提升至1.67,表明智能體基于思維鏈賦能,能夠大幅度地提供更多拓展性信息,從多角度支持教師的課堂分析需求。第三,邏輯性和專業(yè)性提升:智能體的邏輯性評分從“普通回復(fù)”的0.47提高至1.65,表明思維鏈提示顯著增強(qiáng)了回復(fù)內(nèi)容的邏輯連貫性和專業(yè)深度,使教師更好地理解報(bào)告內(nèi)容的內(nèi)在邏輯。專業(yè)性評分從“普通回復(fù)”的0.46顯著提高到1.43,顯示智能體在專業(yè)性反饋上的增強(qiáng),使得教師能夠根據(jù)分析結(jié)果進(jìn)行更具實(shí)踐指導(dǎo)意義的教學(xué)改進(jìn),在教學(xué)改進(jìn)中形成更系統(tǒng)化的認(rèn)知。

然而,在多樣性方面,“基于思維鏈提示的回復(fù)”雖然有所提升,但與“普通回復(fù)”的均值差距僅為0.15,且配對樣本結(jié)果不顯著,同時(shí)在親和性、簡要性、理解性維度上,基于思維鏈的回復(fù)未表現(xiàn)出顯著提升。分析其原因?yàn)椋阂皇牵季S鏈提示設(shè)計(jì)的側(cè)重性,思維鏈主要關(guān)注遞進(jìn)邏輯和深度分析,而對于多樣性等維度并未進(jìn)行針對性的優(yōu)化。二是,語言生成模型的限制,未對智能體的語言風(fēng)格做調(diào)整,對于多樣化和易讀性強(qiáng)的反饋,還需要專門的語言風(fēng)格調(diào)控與優(yōu)化機(jī)制。三是,數(shù)據(jù)集特征的影響,實(shí)驗(yàn)所采用的數(shù)據(jù)樣本集中于具體的教學(xué)反饋情境,導(dǎo)致數(shù)據(jù)中的智能體表現(xiàn)缺乏多樣化、親和性和簡潔度的反饋訓(xùn)練。

五、下一步研究方向

基于思維鏈提示的教研AI智能體在解讀報(bào)告和決策支持中具有較好的應(yīng)用潛力,結(jié)合上述討論,還可以從以下幾個(gè)方向?qū)I 智能體的改進(jìn)進(jìn)行深入研究:

(一)數(shù)據(jù)集的多樣化和情境化

為推動(dòng)教育專用大模型的發(fā)展,構(gòu)建教育領(lǐng)域的專業(yè)數(shù)據(jù)集顯得尤為重要。未來研究可將教師行為與學(xué)生表現(xiàn)細(xì)化為不同的課堂情境數(shù)據(jù)[20],除當(dāng)前應(yīng)用較多的學(xué)科領(lǐng)域知識(shí)外,應(yīng)涵蓋教學(xué)教研、教育評價(jià)以及教師專業(yè)發(fā)展等數(shù)據(jù),以支持多樣化的課堂分析需求,構(gòu)建更具通用性和適應(yīng)性的教研AI智能體,更有效地響應(yīng)教師在多樣課堂場景中的不同需求。

(二)智能體的微調(diào)與優(yōu)化

結(jié)合遷移學(xué)習(xí)、多任務(wù)學(xué)習(xí)等微調(diào)方法,進(jìn)一步優(yōu)化智能體的性能[21],使其更好地適應(yīng)教育場景中教師專業(yè)發(fā)展的需求。例如,通過遷移學(xué)習(xí),智能體可以高效利用已有的通用知識(shí),將其轉(zhuǎn)化為適應(yīng)教育領(lǐng)域特征的專業(yè)能力;通過多任務(wù)學(xué)習(xí),智能體能夠在處理多個(gè)相關(guān)任務(wù)時(shí)實(shí)現(xiàn)知識(shí)共享和互相促進(jìn),從而提高學(xué)習(xí)效率和任務(wù)表現(xiàn)。此外,還可以結(jié)合自監(jiān)督學(xué)習(xí)等方法,增強(qiáng)模型的泛化能力和對特定場景的適應(yīng)性。通過一系列優(yōu)化策略,智能體可以更好地解讀和分析教學(xué)報(bào)告、設(shè)計(jì)個(gè)性化教學(xué)方案,并提供專業(yè)化的決策支持,更有效助力教師教學(xué)能力提升和課堂效果優(yōu)化。

(三)多智能體協(xié)同應(yīng)用

多智能體作為一種新型智能技術(shù),具有動(dòng)態(tài)交互和角色扮演能力,在教育領(lǐng)域中具有非常廣闊的應(yīng)用前景[22]。例如,為多智能體設(shè)計(jì)特定具體的角色,如多專家型智能體,通過訓(xùn)練精通專業(yè)領(lǐng)域的學(xué)科知識(shí)和技能,從而能夠提供高度專業(yè)化的問題回答和教學(xué)建議。此外,多智能體能夠模擬真實(shí)的教學(xué)場景,創(chuàng)設(shè)虛擬型學(xué)生,模擬不同學(xué)習(xí)風(fēng)格、能力和需求的學(xué)生,與教師進(jìn)行互動(dòng)。讓教師在虛擬環(huán)境中練習(xí)應(yīng)對策略,提高教師群體處理復(fù)雜課堂情境的能力,為教師提供豐富的互動(dòng)體驗(yàn)和個(gè)性化反饋,促進(jìn)教師的教學(xué)技能和教研能力的提升。

綜上,通過持續(xù)的數(shù)據(jù)優(yōu)化和智能體設(shè)計(jì)改進(jìn),未來的教研AI智能體有望進(jìn)一步推動(dòng)教師專業(yè)能力的發(fā)展,探索從數(shù)據(jù)“負(fù)能”到“賦能”的轉(zhuǎn)變的新路徑。

參考文獻(xiàn):

[1] 楊欣.基于生成式人工智能的教育轉(zhuǎn)型圖景——ChatGPT究竟對教育意味著什么[J].中國電化教育,2023,(5):1-8+14.

[2] Xi Z,Chen W,et al.The rise and potential of large language model based agents:A survey [EB/OL].https://arxiv.org/abs/2309.07864,2023-09-19.

[3] 鄭永紅,王辰飛,張務(wù)偉.生成式人工智能教育應(yīng)用及其規(guī)制[J].中國電化教育,2024,(5):114-119.

[4] 劉邦奇,喻彥琨等.人工智能教育大模型:體系架構(gòu)與關(guān)鍵技術(shù)策略[J].開放教育研究,2024,30(5):76-86.

[5] 劉邦奇,聶小林等.生成式人工智能與未來教育形態(tài)重塑:技術(shù)框架、能力特征及應(yīng)用趨勢[J].電化教育研究,2024,45(1):13-20.

[6] 盧宇,余京蕾等.生成式人工智能的教育應(yīng)用與展望——以ChatGPT系統(tǒng)為例[J].中國遠(yuǎn)程教育,2023,43(4):24-31+51.

[7] 盧宇,余京蕾,陳鵬鶴.基于大模型的教學(xué)智能體構(gòu)建與應(yīng)用研究[J].中國電化教育,2024,(7):99-108.

[8] 盧宇,余京蕾等.多模態(tài)大模型的教育應(yīng)用研究與展望[J].電化教育研究,2023,44(6):38-44.

[9] 張治,程抒一,王天蓉.基于計(jì)算教育學(xué)的人工智能課堂分析框架和技術(shù)實(shí)現(xiàn)[J].開放教育研究,2024,30(5):87-100.

[10] 李海東,許世紅,劉軍民.數(shù)字化賦能課堂教學(xué)評價(jià)與改進(jìn):打造教育教學(xué)研究新生態(tài)——廣東省中小學(xué)課堂大數(shù)據(jù)報(bào)告暨數(shù)據(jù)開源發(fā)布會(huì)綜述[J].課程教學(xué)研究,2023,(10):72-79.

[11] 蔡慧英,盧琳萌,顧小清.人機(jī)協(xié)同教研會(huì)促進(jìn)教師教學(xué)反思能力的發(fā)展嗎 ——基于課堂視頻智能分析技術(shù)的實(shí)證研究[J].現(xiàn)代遠(yuǎn)距離教育,2023,(1):40-49.

[12] 楊鑫.數(shù)字化教學(xué)思維:教師邁入數(shù)字化“深水區(qū)”的思維范式[J].中國電化教育,2024,(5):53-60.

[13] 張剛要,楊俊善.教師數(shù)字素養(yǎng)驅(qū)動(dòng)數(shù)字教育發(fā)展的機(jī)理研究[J].中國電化教育,2024,(11):37-44.

[14] 方海光,王顯闖等.面向AIGC的教育提示工程學(xué)習(xí)提示單設(shè)計(jì)及應(yīng)用[J].現(xiàn)代遠(yuǎn)距離教育,2024,(2):62-70..

[15] 王一巖,劉淇,鄭永和.對話式人機(jī)協(xié)同學(xué)習(xí):本質(zhì)內(nèi)涵與未來圖景[J].中國電化教育,2024,(11):21-27.

[16] Wei J,Wang X,et al.Chain-of-thought prompting elicits reasoning in large language models [J].Advances in neural information processing systems,2022,35:24824-24837.

[17] Yancheng Liang,Daphne Chen,et al.Learning to Cooperate with Humans using Generative Agents [EB/OL].https://arxiv.org/abs/2411.13934,2024-11-21.

[18] Zeidler,D.L.,Osborne,J.,S.et al.The Role of Argument During Discourse About Socioscientific Issues [A].Zeidler,D.L.(Ed.).The Role of Moral Reasoning on Socioscientific Issues and Discourse in Science Education [C].Dordrecht:Springer,2003.97-116.

[19] Xu J,Lu L,et al.Medgpteval:A dataset and benchmark to evaluate responses of large language models in medicine [EB/OL].https://arxiv.org/ abs/2305.07340.https://arxiv.org/abs/2409.03512,2023-05-12.

[20] 羅恒,廖小芳等.生成式人工智能支持的教師評語研究:基于初中數(shù)學(xué)課堂的實(shí)踐探索[J].電化教育研究,2024,45(5):58-66.

[21] From MOOC to MAIC:Reshaping Online Teaching and Learning through LLM-driven Agents [EB/OL].https://arxiv.org/abs/2409.03512,2024-09-05.

[22] 吳永和,姜元昊等.大語言模型支持的多智能體:技術(shù)路徑、教育應(yīng)用與未來展望[J].開放教育研究,2024,30(5):63-75.

作者簡介:

王冬青:教授,博士,博士生導(dǎo)師,研究方向?yàn)槿斯ぶ悄芙逃龖?yīng)用、教育大數(shù)據(jù)與學(xué)習(xí)分析、計(jì)算機(jī)輔助教育測量與評價(jià)。

陳自力:在讀博士,研究方向?yàn)榻逃斯ぶ悄堋⒅腔壅n堂、計(jì)算機(jī)視覺。

邵文豪:在讀碩士,研究方向?yàn)榻逃斯ぶ悄堋W(xué)習(xí)分析、虛擬現(xiàn)實(shí)教育應(yīng)用。

張粵芳:在讀碩士,研究方向?yàn)榻逃斯ぶ悄堋⒔逃髷?shù)據(jù)、智慧學(xué)習(xí)環(huán)境。

李贊堅(jiān):高級教師,研究方向?yàn)橹腔劢逃腿斯ぶ悄芙逃?/p>

任光杰:博士,碩士生導(dǎo)師,研究方向?yàn)榻逃斯ぶ悄堋⒂?jì)算機(jī)輔助教育測量與評價(jià)、虛擬現(xiàn)實(shí)教育應(yīng)用。

From “Negative Energy” to “Empowerment”: Designing Chain of Thought Prompts Based on LLMs and Building AI Agents for Teaching and Research

— A Case Study in Intelligent Classroom Teaching Analysis

Wang Dongqing1, Chen Zili1, Shao Wenhao1, Zhang Yuefang1, Li Zanjian2, Ren Guangjie1

1.School of Information Technology in Education, South China Normal University, Guangzhou 510631, Guangdong 2.Guangzhou Educational Technology Center, Guangzhou 510091, Guangdong

Abstract: Intelligent analysis of classroom teaching represents a new trend in leveraging artificial intelligence (AI) to empower evidencebased educational research. Typically presented to frontline teachers in the form of reports, these analyses often impose a high cognitive load and involve complex data presentations, making it challenging for teachers to identify key issues and apply findings to improve teaching practices. What begins as an effort to “empower” teachers with data often results in a “data burden.” This study introduces a framework for enhancing the interpretation of classroom teaching analysis reports using Chain of Thought Prompting (CoT) logic, facilitated by AI agents. The proposed framework modularly constructs AI agents based on open-source large language models (LLMs), enabling the development of AI agents for Teaching and Resarch. Using 63 real-world reports, the study evaluates the effectiveness of “CoT-based responses” compared to “standard LLM-based responses”. Results indicate that CoT-based responses achieve higher scores across multiple evaluation dimensions, particularly in accuracy, logical coherence, and professionalism. By focusing on the vertical application of AI agents in educational research, this study explores a novel pathway to transition from data burden to data empowerment.

Keywords: large language models; AI agents; Chain of Thought prompting; intelligent classroom teaching analysis; evidence-based educational research

收稿日期:2024年12月12日

責(zé)任編輯:宋靈青

主站蜘蛛池模板: 久久亚洲高清国产| 五月婷婷综合网| 中文字幕在线观| 日韩免费中文字幕| 99久视频| 日韩黄色在线| 国产成人综合久久| 国产不卡国语在线| 高清精品美女在线播放| 久久综合亚洲色一区二区三区| 伊人久久综在合线亚洲2019| 中文字幕自拍偷拍| 亚洲国产精品无码AV| 亚洲福利网址| 好紧太爽了视频免费无码| 国产超碰一区二区三区| 国产av一码二码三码无码| 国产成人a在线观看视频| 香蕉国产精品视频| 97国产在线视频| 久久久成年黄色视频| 老司机久久99久久精品播放| 日本久久久久久免费网络| 国产成人精品18| 成人亚洲国产| 日本精品视频| 青青操国产视频| 日本一区二区三区精品国产| 国产精品成| 午夜影院a级片| 波多野结衣一区二区三区四区| 91亚洲影院| 久久99国产精品成人欧美| 日a本亚洲中文在线观看| 99久久国产精品无码| 亚洲综合片| 国产白丝av| 午夜视频免费试看| 99热国产在线精品99| 四虎国产精品永久一区| 四虎亚洲精品| 色婷婷啪啪| 久久香蕉国产线看精品| 五月婷婷激情四射| 亚洲欧美一区在线| 婷婷五月在线视频| Jizz国产色系免费| 久久精品视频亚洲| 国产av剧情无码精品色午夜| 噜噜噜综合亚洲| 99热这里只有精品免费国产| P尤物久久99国产综合精品| 99伊人精品| 无码视频国产精品一区二区| 国产视频 第一页| 亚洲va在线∨a天堂va欧美va| 日韩不卡高清视频| 色综合成人| 第九色区aⅴ天堂久久香| 日韩欧美视频第一区在线观看| 亚洲女同一区二区| 手机精品福利在线观看| 亚洲视频免费播放| 中文字幕亚洲乱码熟女1区2区| 五月天久久婷婷| 国产毛片高清一级国语 | 全部毛片免费看| 狠狠色丁香婷婷综合| 性色一区| 婷婷中文在线| 国产亚洲视频免费播放| 国产成人精品日本亚洲77美色| 久久精品人人做人人爽| 亚洲成人免费看| 国产麻豆精品在线观看| 亚洲成aⅴ人片在线影院八| аv天堂最新中文在线| 国产va在线观看| 亚洲伊人电影| 人人91人人澡人人妻人人爽| 国产精品99久久久久久董美香| 亚洲日韩精品综合在线一区二区|