


摘要:生成式大語(yǔ)言模型從形式上實(shí)現(xiàn)了人與機(jī)器的自然對(duì)話,使古老的對(duì)話式教學(xué)成為現(xiàn)實(shí)可能,因此其自問(wèn)世以來(lái)便受到教育界廣為推崇。為了更好地了解生成式大語(yǔ)言模型在對(duì)話式教學(xué)應(yīng)用中的適用性,有必要從其工作原理出發(fā)探索其在教育應(yīng)用中的固有困難,以尋求其賦能對(duì)話式教學(xué)的適切路徑。作為一種基于大規(guī)模語(yǔ)料庫(kù)訓(xùn)練而具有自然語(yǔ)言對(duì)話能力的人工神經(jīng)網(wǎng)絡(luò)應(yīng)用,生成式大語(yǔ)言模型本質(zhì)上是一種基于數(shù)據(jù)處理的“聊天機(jī)器人”,本身存在缺乏理解能力、知識(shí)立場(chǎng)不堅(jiān)定、語(yǔ)言僅是生成而非創(chuàng)造、難以滿足個(gè)別化學(xué)習(xí)需求等固有困難。因此,無(wú)論從知識(shí)傳授還是情感培養(yǎng)方面看,生成式大語(yǔ)言模型自身均因受到特定價(jià)值取向影響、缺乏策略性引導(dǎo)、難以做到因材施教而無(wú)法達(dá)成對(duì)話式教學(xué)的理想效果。即便如此,生成式大語(yǔ)言模型仍能為對(duì)話式教學(xué)提供適宜的應(yīng)用場(chǎng)景,如為客觀性知識(shí)類教學(xué)問(wèn)題提供高效信息咨詢服務(wù),基于海量大數(shù)據(jù)為語(yǔ)言教學(xué)提供精準(zhǔn)模擬和糾錯(cuò)服務(wù),以及針對(duì)常規(guī)教學(xué)活動(dòng)提供一般性的參考框架、范式或提綱等。
關(guān)鍵詞:人工智能;生成式大語(yǔ)言模型;對(duì)話式教學(xué);個(gè)別化教學(xué)
中圖分類號(hào):G434 " 文獻(xiàn)標(biāo)識(shí)碼:A " "文章編號(hào):1009-5195(2025)02-0052-11 "doi10.3969/j.issn.1009-5195.2025.02.006
基金項(xiàng)目:2021年度深圳市教育科學(xué) “十四五”規(guī)劃課題“慕課教學(xué)中批判性思維能力培養(yǎng)的理論與實(shí)踐研究”(ybzz21002)。
作者簡(jiǎn)介:顏士剛,博士,教授,博士生導(dǎo)師,天津師范大學(xué)教育學(xué)部(天津 300387);胡修磊,碩士研究生,天津師范大學(xué)教育學(xué)部(天津 300387);李文光(通信作者),博士,副教授,深圳大學(xué)教育學(xué)部(廣東深圳 518060)。
以ChatGPT為代表的生成式大語(yǔ)言模型自問(wèn)世以來(lái),就引發(fā)了教育教學(xué)領(lǐng)域的廣泛關(guān)注。中國(guó)、美國(guó)及歐盟國(guó)家紛紛出臺(tái)一系列針對(duì)生成式人工智能教育應(yīng)用的相關(guān)政策性文件,以規(guī)范其良性發(fā)展,如美國(guó)高等教育信息化協(xié)會(huì)(EDUCAUSE)發(fā)布的《2024年人工智能圖景研究》指出“高等教育界仍在就人工智能應(yīng)如何以及不應(yīng)如何用于學(xué)習(xí)和工作尋找共識(shí)”(Robert,2024)。鑒于其強(qiáng)大的對(duì)話功能,有研究者堅(jiān)持認(rèn)為,雖然生成式大語(yǔ)言模型并非專為教學(xué)研發(fā),但其功能卻極具教學(xué)價(jià)值(張志禎等,2023),能夠通過(guò)海量的數(shù)據(jù)資源訓(xùn)練,對(duì)人的提問(wèn)給出合理回答。甚至有學(xué)者認(rèn)為,生成式大語(yǔ)言模型可以使具有悠久歷史的對(duì)話式教學(xué)逐漸回歸(焦建利,2023)。實(shí)際上,對(duì)話是一種教學(xué)關(guān)系,它以參與者持續(xù)的話語(yǔ)投入為特征,且將互動(dòng)與反思貫穿整個(gè)過(guò)程(Burbules,2001)。師生對(duì)話不僅能更好地促進(jìn)知識(shí)建構(gòu),還可以實(shí)現(xiàn)情感交流,增進(jìn)師生情誼,進(jìn)而促進(jìn)學(xué)生良好價(jià)值觀的形成。假如生成式大語(yǔ)言模型真能有效實(shí)現(xiàn)對(duì)話式教學(xué),確為教育之幸、師生之福。現(xiàn)在來(lái)看,“對(duì)話”的形式已能實(shí)現(xiàn),且已有研究結(jié)合大語(yǔ)言模型的功能進(jìn)行二次開發(fā),設(shè)計(jì)出相應(yīng)的會(huì)話機(jī)器人,但從實(shí)際運(yùn)用的角度審視,模型在本質(zhì)上是否契合對(duì)話式教學(xué)的內(nèi)在要求,仍是值得深入探討的問(wèn)題。有鑒于此,本文擬從生成式大語(yǔ)言模型的基本工作原理出發(fā),探討將其應(yīng)用于教育領(lǐng)域中的困難和優(yōu)勢(shì),再結(jié)合對(duì)話式教學(xué)的實(shí)際需求,討論其能否有效實(shí)現(xiàn)對(duì)話式教學(xué)。為表述方便,本文所提及的模型與大語(yǔ)言模型均指生成式大語(yǔ)言模型。
一、生成式大語(yǔ)言模型的工作原理、能力局 限性及教育應(yīng)用探討
聯(lián)合國(guó)教科文組織(UNESCO)在《教育和研究中的生成式人工智能指南》中將生成式人工智能界定為一種“根據(jù)人類思維符號(hào)表征系統(tǒng)自動(dòng)生成內(nèi)容的人工智能技術(shù)”(Holmes et al.,2023)。隨著OpenAI公司發(fā)布的ChatGPT引起廣泛關(guān)注和影響,國(guó)內(nèi)一些科技公司也積極致力于研發(fā)類似模型,如文心一言、星火認(rèn)知大模型、AI機(jī)器人豆包等,并在不斷進(jìn)行優(yōu)化與提升。這些應(yīng)用均以深度學(xué)習(xí)技術(shù)為核心,旨在實(shí)現(xiàn)多樣化的語(yǔ)言交互功能。為了實(shí)現(xiàn)該功能,它們都需要構(gòu)建相應(yīng)的語(yǔ)言模型,以使機(jī)器能夠判斷和生成符合語(yǔ)法規(guī)則的回答。
1.生成式大語(yǔ)言模型的工作原理
基于文本處理的大語(yǔ)言模型技術(shù)的實(shí)現(xiàn),需要在深度學(xué)習(xí)過(guò)程中構(gòu)建人工神經(jīng)網(wǎng)絡(luò),具體包括輸入層、隱藏層和輸出層。輸入層負(fù)責(zé)接收原始數(shù)據(jù);隱藏層中包含多個(gè)節(jié)點(diǎn)(也稱“神經(jīng)元”),每個(gè)節(jié)點(diǎn)對(duì)應(yīng)一個(gè)非線性變換,通過(guò)學(xué)習(xí)和調(diào)整相應(yīng)的參數(shù)來(lái)捕捉數(shù)據(jù)中的復(fù)雜特征;輸出層則輸出相應(yīng)的預(yù)測(cè)內(nèi)容。在模型的學(xué)習(xí)訓(xùn)練過(guò)程中,除了對(duì)已有的無(wú)標(biāo)注數(shù)據(jù)(如來(lái)源于書籍、期刊雜志、互聯(lián)網(wǎng)等大量?jī)?nèi)容)進(jìn)行學(xué)習(xí)之外,還需學(xué)習(xí)相應(yīng)的標(biāo)注數(shù)據(jù)。標(biāo)注數(shù)據(jù)是指在原始數(shù)據(jù)之上附加特定標(biāo)簽或注釋所形成的數(shù)據(jù)。通過(guò)學(xué)習(xí)標(biāo)注數(shù)據(jù),可以提高模型在情感、語(yǔ)義、實(shí)體識(shí)別等方面的判斷能力,進(jìn)而增強(qiáng)模型的準(zhǔn)確性與精度。在訓(xùn)練過(guò)程中,模型首先對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行前向傳播計(jì)算,得到預(yù)測(cè)結(jié)果,并計(jì)算該結(jié)果與真實(shí)數(shù)據(jù)之間的誤差;隨后將誤差反向傳播回深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中的每個(gè)神經(jīng)元,并計(jì)算每個(gè)神經(jīng)元對(duì)誤差的貢獻(xiàn),以更新神經(jīng)元之間的連接權(quán)重,進(jìn)而使模型的預(yù)測(cè)結(jié)果更加接近于標(biāo)注數(shù)據(jù)。上述過(guò)程不斷迭代,直到模型收斂并得到滿意的預(yù)測(cè)結(jié)果為止。ChatGPT作為基于Transformer的人工智能應(yīng)用,其主體架構(gòu)遵從“語(yǔ)料體系+預(yù)訓(xùn)練+微調(diào)”的基本模式(錢力等,2023)。實(shí)踐中,各種大語(yǔ)言模型的訓(xùn)練往往會(huì)更加復(fù)雜,并且需要用到大規(guī)模語(yǔ)料庫(kù)來(lái)訓(xùn)練和優(yōu)化模型的參數(shù)。
大語(yǔ)言模型與人的“對(duì)話”通常會(huì)經(jīng)歷如圖1所示的步驟。當(dāng)輸入端輸入一個(gè)文本形式的問(wèn)題時(shí),模型會(huì)接收這些文本,進(jìn)行編碼并將其轉(zhuǎn)化為計(jì)算機(jī)語(yǔ)言,經(jīng)過(guò)語(yǔ)義推斷,嘗試“理解”輸入文本的含義并作出回答。在整個(gè)“對(duì)話”過(guò)程中,模型能夠綜合之前的對(duì)話歷史,更好地理解人的需求,從而生成更連貫和符合上下文的回答。由此可見,大語(yǔ)言模型基于輸入文本的要求、上下文信息以及訓(xùn)練得到的知識(shí),能夠生成比較合適的回答并呈現(xiàn)出來(lái),該回答可能是一個(gè)句子、段落或者更長(zhǎng)的文本,一般均符合自然語(yǔ)言表達(dá)的規(guī)范和習(xí)慣。
對(duì)話和交流是人與人之間最為重要的基本行為方式(沈書生等,2023)。很多初次使用大語(yǔ)言模型的人均感到無(wú)比震撼,主要原因在于,與傳統(tǒng)聊天機(jī)器人相比,二者在技術(shù)實(shí)現(xiàn)和功能表現(xiàn)上有著本質(zhì)區(qū)別。前些年,由智能手機(jī)廠商開發(fā)的語(yǔ)音助手(如小愛、小藝等),均屬于傳統(tǒng)聊天機(jī)器人,其按照固定的程序運(yùn)行(見圖2),必須通過(guò)預(yù)設(shè)相應(yīng)的對(duì)話內(nèi)容才能實(shí)現(xiàn)與人交互。在接收到信息后,機(jī)器會(huì)對(duì)這些信息進(jìn)行簡(jiǎn)單的意圖識(shí)別,然后按照程序既定的規(guī)則匹配固定的回復(fù)內(nèi)容,進(jìn)而實(shí)現(xiàn)與人的交互。假如程序中沒(méi)有預(yù)設(shè)相應(yīng)的交互內(nèi)容,那么交互過(guò)程就會(huì)顯得不連貫,甚至無(wú)法作出回復(fù)。與傳統(tǒng)聊天機(jī)器人不同,生成式大語(yǔ)言模型能夠基于算法和模型數(shù)據(jù)生成回答,并具有類似人類推理的能力,可以聯(lián)系上下文進(jìn)行解答,讓人感覺置身于真實(shí)的問(wèn)題情境中。在功能拓展方面,如GPT-4o、Sora等大語(yǔ)言模型還具備文生圖、文生視頻的功能,這讓傳統(tǒng)聊天機(jī)器人在機(jī)制上難以企及,進(jìn)而加深了人們對(duì)大語(yǔ)言模型的好奇,也引發(fā)了對(duì)其推理能力的思考。
2.生成式大語(yǔ)言模型的能力局限性
近期,英國(guó)前沿人工智能工作組與紐約大學(xué)等機(jī)構(gòu)在一項(xiàng)針對(duì)大語(yǔ)言模型邏輯推理能力的研究中發(fā)現(xiàn),包括GPT-4在內(nèi)的大語(yǔ)言模型均存在一種“逆轉(zhuǎn)詛咒”,即經(jīng)過(guò)訓(xùn)練的大語(yǔ)言模型學(xué)會(huì)了“A是B”,但是并不能順利推廣到“B是A”(Berglund et al.,2023)。類似地,當(dāng)人類知道“劉邦是漢朝的開國(guó)皇帝”這一事實(shí)后,能正確回答“漢朝的開國(guó)皇帝是劉邦”,然而該研究則表明大語(yǔ)言模型無(wú)法以這種方式進(jìn)行泛化推理。
該研究主要包括兩個(gè)實(shí)驗(yàn)。實(shí)驗(yàn)一是通過(guò)一系列對(duì)合成數(shù)據(jù)的微調(diào)來(lái)測(cè)試大語(yǔ)言模型的泛化能力。大語(yǔ)言模型學(xué)習(xí)的數(shù)據(jù)集均為虛構(gòu)信息。實(shí)驗(yàn)結(jié)果表明,在進(jìn)行精確匹配時(shí),若提問(wèn)形式與訓(xùn)練數(shù)據(jù)的形式一致,則大語(yǔ)言模型回答的準(zhǔn)確率很高;但是當(dāng)提問(wèn)形式與訓(xùn)練數(shù)據(jù)的形式不一致時(shí),則模型完全無(wú)法泛化,準(zhǔn)確率趨于0。該實(shí)驗(yàn)表明,當(dāng)提問(wèn)形式的順序顛倒時(shí),模型無(wú)法提高其正確率。實(shí)驗(yàn)二是對(duì)真實(shí)世界的名人及其父母的客觀事實(shí)進(jìn)行測(cè)試,形式為“A的父母是B”和“B的孩子是A”。實(shí)驗(yàn)人員收集了1000位名人的名單,通過(guò)OpenAI的API訪問(wèn)并查詢GPT-4,以獲得其父母的名字。結(jié)果表明,GPT-4能夠識(shí)別出這些名人父母的概率為79%;在提供相應(yīng)的子女—父母配對(duì)情況下,當(dāng)實(shí)驗(yàn)人員反向詢問(wèn)GPT-4來(lái)識(shí)別父母的子女時(shí),GPT-4的正確率只有33%。但是,當(dāng)研究人員采用來(lái)自LLaMa-1系列未經(jīng)微調(diào)的基本模型(Touvron et al.,2023)進(jìn)行評(píng)估測(cè)試后發(fā)現(xiàn),所有模型在識(shí)別父母方面都比識(shí)別子女要好得多。此外,研究人員還嘗試用“影響函數(shù)”“事實(shí)回憶機(jī)制”“大語(yǔ)言模型中的知識(shí)編輯”“語(yǔ)言模型語(yǔ)句中的不一致性”“人類的前向記憶和后向記憶”等來(lái)解釋這一實(shí)驗(yàn)結(jié)果,但都難以證明大語(yǔ)言模型有從正向泛化到反向的能力。這意味著預(yù)訓(xùn)練模型若沒(méi)有在兩個(gè)方向上都接受過(guò)訓(xùn)練,那么它就不會(huì)泛化到這兩個(gè)方向。
以上研究從側(cè)面證明,模型的生成過(guò)程并未涉及推理和邏輯思維,在機(jī)器學(xué)習(xí)過(guò)程中,模型并不能真正理解語(yǔ)句的含義及其背后的語(yǔ)境,因此大語(yǔ)言模型并不具備等同于人類的推理能力,其與人類的“對(duì)話”能力建基于機(jī)器學(xué)習(xí)與訓(xùn)練數(shù)據(jù),即通過(guò)對(duì)海量文本序列的學(xué)習(xí),模型可以預(yù)測(cè)下一個(gè)單詞或語(yǔ)句的概率,進(jìn)而生成看似合理的回答。由此可見,生成式大語(yǔ)言模型實(shí)質(zhì)上是一種基于文本數(shù)據(jù)處理的“聊天機(jī)器人”,相較于傳統(tǒng)聊天機(jī)器人,它們能夠根據(jù)人類提出的聊天內(nèi)容和要求作出更適當(dāng)?shù)幕卮穑M(jìn)而實(shí)現(xiàn)與人類的交互。
針對(duì)生成式大語(yǔ)言模型在實(shí)際應(yīng)用中表現(xiàn)出來(lái)的一些問(wèn)題,如模型生成的回答內(nèi)容不精準(zhǔn)、邏輯推理能力較差等,各科技公司積極推出了各種升級(jí)和優(yōu)化策略。一方面,借助追問(wèn)補(bǔ)充機(jī)制,讓模型主動(dòng)補(bǔ)充更多關(guān)于問(wèn)題的細(xì)節(jié),再結(jié)合更為詳盡的對(duì)話歷史,以使回答內(nèi)容更為精準(zhǔn)。另一方面,從資源供給的視角,為模型配備更為詳盡且專業(yè)的數(shù)據(jù)資源,并針對(duì)模型的某種能力展開強(qiáng)化訓(xùn)練,促使該能力得以提升。以O(shè)penAI發(fā)布的推理能力更為突出的GPT-o1模型為例,目前官方雖暫未公布其內(nèi)部運(yùn)作的詳細(xì)信息,但根據(jù)其表現(xiàn)可以推測(cè),該模型增加了推理過(guò)程數(shù)據(jù)的訓(xùn)練集,尤為強(qiáng)調(diào)模型在邏輯推理過(guò)程中的強(qiáng)化學(xué)習(xí),使其在一定程度上能夠模擬人類的思維過(guò)程。然而,盡管模型經(jīng)過(guò)優(yōu)化提升后部分能力有所進(jìn)步,但其底層邏輯并未改變,仍是基于數(shù)據(jù)處理的深度學(xué)習(xí)技術(shù),這種通過(guò)數(shù)據(jù)驅(qū)動(dòng)來(lái)不斷優(yōu)化自身性能表現(xiàn)的做法,與真正意義上的人類思維和認(rèn)知方式仍存在本質(zhì)差異。
人類思維是在長(zhǎng)期的生物進(jìn)化過(guò)程中逐漸形成的,其形成過(guò)程涉及大腦復(fù)雜的神經(jīng)生理機(jī)制以及長(zhǎng)期的社會(huì)文化經(jīng)驗(yàn)積累。正是在不斷地接收和處理外界信息的過(guò)程中,人腦才逐漸構(gòu)建起了豐富多樣的認(rèn)知模式和思維路徑,而這些模式和路徑顯然受到情感、價(jià)值觀以及社會(huì)文化背景的影響,因而也使得人類思維具有高度的主觀性和內(nèi)化能力。而生成式大語(yǔ)言模型所具備的“思維”則是建基于大量數(shù)據(jù)的訓(xùn)練以及算法之上。它僅僅是對(duì)數(shù)據(jù)中的語(yǔ)言模式和統(tǒng)計(jì)規(guī)律進(jìn)行學(xué)習(xí)和模仿,并沒(méi)有自身的感知系統(tǒng)去直接體驗(yàn)世界,也缺乏自我意識(shí)去反思和調(diào)整自身的思維過(guò)程,因而導(dǎo)致模型缺失內(nèi)在情感與自我意識(shí)。另外,由于生成式大語(yǔ)言模型的思維模式依據(jù)所習(xí)得的模式和算法展開,呈現(xiàn)出相對(duì)固定的特性,因而也缺乏人類思維所具備的靈活性和創(chuàng)造性。總之,模型的知識(shí)獲取源于訓(xùn)練數(shù)據(jù),具有有限性且對(duì)數(shù)據(jù)信息存在依賴,其性能相對(duì)固化,對(duì)解決不同情境下問(wèn)題的適應(yīng)能力欠佳。正是這種人機(jī)思維本質(zhì)上存在的客觀差異性,將導(dǎo)致模型難以直接適用于當(dāng)下的教育情境中。
3.生成式大語(yǔ)言模型的教育應(yīng)用探討
在教育領(lǐng)域,很多學(xué)者認(rèn)為人機(jī)協(xié)同是發(fā)展趨勢(shì),并衍生出人機(jī)協(xié)同認(rèn)知(郝祥軍等,2022)、人機(jī)協(xié)同教育(方海光等,2022)等一系列相關(guān)的理論研究。協(xié)同認(rèn)知來(lái)源于系統(tǒng)科學(xué)中的“協(xié)同理論”,該理論強(qiáng)調(diào)結(jié)構(gòu)永遠(yuǎn)處于形成、消失、競(jìng)爭(zhēng)、協(xié)作或者組成更大結(jié)構(gòu)的過(guò)程中,協(xié)同會(huì)經(jīng)歷無(wú)序狀態(tài)、近平衡、遠(yuǎn)平衡、漲落和有序狀態(tài)的迭代(李海峰等,2023)。這意味著通過(guò)人機(jī)協(xié)同可以實(shí)現(xiàn)人機(jī)互惠(郝祥軍等,2023),達(dá)到真正意義上的“學(xué)生更具智慧、機(jī)器更加智能”(王一巖等,2024)。
然而,生成式大語(yǔ)言模型在實(shí)際教育應(yīng)用中的表現(xiàn)果真如此嗎?有學(xué)者認(rèn)為,心智未成熟的個(gè)體過(guò)度依賴生成式大語(yǔ)言模型可能會(huì)存在“智慧退化”的風(fēng)險(xiǎn)(李政濤,2023),讓學(xué)生的思維訓(xùn)練和創(chuàng)造力發(fā)展空間受限(鐘秉林等,2023)。也有學(xué)者通過(guò)人—機(jī)對(duì)話交互實(shí)驗(yàn)發(fā)現(xiàn),在面對(duì)寫作任務(wù)時(shí),大部分學(xué)生傾向于依賴人工智能生成的文本內(nèi)容直接替代自己的思考,這種“拿來(lái)主義”既不利于知識(shí)和思維的發(fā)展,而且助長(zhǎng)了人的惰性(汪婧等,2024)。此外,由于大語(yǔ)言模型本身缺乏推理能力,其互動(dòng)和反饋通常基于已有信息,而不具備自主動(dòng)態(tài)調(diào)整和深度理解的能力,這種局限性導(dǎo)致其難以真正實(shí)現(xiàn)協(xié)同。由此可見,以上所謂的人機(jī)協(xié)同認(rèn)知和協(xié)同教育,實(shí)質(zhì)上是一種對(duì)技術(shù)樂(lè)觀的暢想,當(dāng)下還不具有實(shí)現(xiàn)的可能性。
雖然僅通過(guò)人機(jī)對(duì)話難以實(shí)現(xiàn)協(xié)同認(rèn)知,但是通過(guò)設(shè)計(jì)提示語(yǔ)可以有效引導(dǎo)大語(yǔ)言模型產(chǎn)生預(yù)期響應(yīng)。有學(xué)者提出了一種結(jié)構(gòu)化提示語(yǔ)設(shè)計(jì)模板,該模板包括角色名稱、角色簡(jiǎn)歷、角色規(guī)則、工作流程以及初始化等部分(趙曉偉等,2024)。在設(shè)定好角色信息后,大語(yǔ)言模型能夠根據(jù)預(yù)設(shè)的問(wèn)題和個(gè)體提供的主題生成高質(zhì)量的回答。例如,當(dāng)利用提示語(yǔ)將模型設(shè)定為項(xiàng)目化學(xué)習(xí)課程設(shè)計(jì)專家時(shí),它能通過(guò)角色扮演向用戶詢問(wèn)相關(guān)學(xué)科主題和學(xué)情信息等,從而自動(dòng)生成相應(yīng)的項(xiàng)目化學(xué)習(xí)教案。相比之下,若不使用提示語(yǔ)而直接提問(wèn),即便提供的信息與使用提示語(yǔ)時(shí)完全一致,大語(yǔ)言模型生成的回答質(zhì)量以及內(nèi)容詳盡程度也會(huì)顯著低于前一種情況。因此,利用結(jié)構(gòu)化提示語(yǔ)模板為生成式大語(yǔ)言模型設(shè)定規(guī)則和屬性,并以特定的語(yǔ)法結(jié)構(gòu)表達(dá)指令的方式,則能夠更加清晰地引導(dǎo)其執(zhí)行特定任務(wù)。這種方法在教學(xué)實(shí)踐中具有一定的借鑒價(jià)值,可以為生成式大語(yǔ)言模型在賦能學(xué)習(xí)方面提供支持。除此之外,也有學(xué)者基于大語(yǔ)言模型的交互能力進(jìn)行二次開發(fā),通過(guò)調(diào)用大語(yǔ)言模型的API接口,并與其他會(huì)話軟件相結(jié)合,構(gòu)建了人機(jī)協(xié)作系統(tǒng)。在此過(guò)程中,模型能夠依據(jù)設(shè)定的參數(shù),模擬教師或?qū)<业纳矸菡归_會(huì)話及評(píng)價(jià)。例如,有學(xué)者通過(guò)對(duì)ChatGPT、文心一言進(jìn)行二次開發(fā),設(shè)計(jì)了“孔子大語(yǔ)言模型會(huì)話機(jī)器人”和“智能蘇格拉底教學(xué)機(jī)器人”(李海峰等,2024a;2024b),并將教學(xué)方法、教學(xué)模式與大語(yǔ)言模型加以融合運(yùn)用,其研究發(fā)現(xiàn),模型的二次開發(fā)的確能化解人機(jī)會(huì)話形式單一的問(wèn)題,而且比直接使用模型更具優(yōu)勢(shì),然而大語(yǔ)言模型在提升學(xué)生的學(xué)習(xí)績(jī)效、批判思維能力、內(nèi)在動(dòng)機(jī)等方面仍存在一定不足。
總之,盡管生成式大語(yǔ)言模型在與人類的交互層面呈現(xiàn)出一定的優(yōu)越性,但在教育應(yīng)用中,其與人類之間對(duì)話的差異在很大程度上限制了它在教育領(lǐng)域的有效適配與深度應(yīng)用。
二、生成式大語(yǔ)言模型在教育應(yīng)用中的固有 困難
1.不能夠真正理解問(wèn)題,只能給出“理想解”
深度學(xué)習(xí)的機(jī)制實(shí)際上是對(duì)人類從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律能力的膚淺模仿(徐英瑾,2021),其雖然參考了人類的神經(jīng)元網(wǎng)絡(luò)結(jié)構(gòu),但與人類大腦的復(fù)雜結(jié)構(gòu)相比,仍相去甚遠(yuǎn)。人類與機(jī)器在面對(duì)問(wèn)題時(shí)存在巨大的認(rèn)知差異:人類的認(rèn)知是人腦通過(guò)感覺、知覺、記憶、思維、想象等形式反映客觀對(duì)象的性質(zhì)及對(duì)象間關(guān)系的過(guò)程;而機(jī)器則是基于人類預(yù)先設(shè)定的邏輯或規(guī)則,嚴(yán)格按照既定規(guī)則進(jìn)行運(yùn)算、判斷、執(zhí)行相應(yīng)指令,缺乏像人類一樣依據(jù)主觀感受去調(diào)整認(rèn)知的能力,其行為和判斷結(jié)果基本是在預(yù)設(shè)框架內(nèi)輸出,相對(duì)較為機(jī)械和模式化。
如前文所述,人工智能神經(jīng)元網(wǎng)絡(luò)是在各種可能的映射情況之間進(jìn)行反復(fù)迭代,將輸出結(jié)果與人類預(yù)先給出的數(shù)據(jù)進(jìn)行比對(duì),若比對(duì)成功,系統(tǒng)則會(huì)保存各神經(jīng)元之間的連接權(quán)重并在此基礎(chǔ)之上繼續(xù)學(xué)習(xí),由此不斷強(qiáng)化其根據(jù)新的輸入數(shù)據(jù)作出合理推斷的能力。這種機(jī)器學(xué)習(xí)的方式實(shí)質(zhì)上是一個(gè)復(fù)雜的語(yǔ)言信息重組的過(guò)程,即通過(guò)大量的數(shù)據(jù)和算法模型訓(xùn)練,機(jī)器可以學(xué)習(xí)到輸入與輸出信息之間的關(guān)聯(lián)規(guī)律,但其并不具備人類對(duì)意義的主觀內(nèi)化能力,因此,以這種方式解決問(wèn)題的過(guò)程并不能稱之為“理解”問(wèn)題,而只能稱之為在各種可能的輸出結(jié)果之間選擇“理想解”。
例如,當(dāng)人們向ChatGPT提問(wèn)“快遞三天才到,為什么不提前三天發(fā)出”這種邏輯問(wèn)題時(shí),ChatGPT會(huì)從“商家和倉(cāng)庫(kù)提前發(fā)貨會(huì)導(dǎo)致庫(kù)存管理混亂”以及“影響快遞服務(wù)運(yùn)送的各種因素”等角度一本正經(jīng)地進(jìn)行分析與回答。對(duì)于一般人而言,他們能在主觀上理解并意識(shí)到“商家發(fā)出快遞”的必要前提是“顧客購(gòu)買商品”,顯然ChatGPT并沒(méi)有理解、意識(shí)到這一點(diǎn)。可以說(shuō)ChatGPT并不具備感知力,而只是一個(gè)具有強(qiáng)大的文本生成能力的模型(宋萑等,2023)。它一本正經(jīng)回答問(wèn)題的原因在于其并沒(méi)有真正意義上的推理能力,已學(xué)習(xí)的數(shù)據(jù)語(yǔ)料中也沒(méi)有針對(duì)這類問(wèn)題的相應(yīng)解答,因此只能按照自身規(guī)則對(duì)回復(fù)的文本進(jìn)行概率分析和預(yù)測(cè),這就解釋了為什么大語(yǔ)言模型會(huì)給出“看似合理卻非常荒謬的回答”(王佑鎂,2023)。
2.僅能依賴訓(xùn)練數(shù)據(jù),知識(shí)立場(chǎng)不堅(jiān)定
從其工作原理可知,生成式大語(yǔ)言模型非常依賴訓(xùn)練數(shù)據(jù),它回答問(wèn)題的準(zhǔn)確性和合理性受預(yù)訓(xùn)練時(shí)的數(shù)據(jù)集以及能搜索到的網(wǎng)絡(luò)學(xué)術(shù)資源的影響與限制(肖峰,2023)。大語(yǔ)言模型借助海量的高質(zhì)量語(yǔ)料體系進(jìn)行預(yù)訓(xùn)練,進(jìn)而使機(jī)器能夠?qū)W習(xí)人類的文字表達(dá)和語(yǔ)言邏輯,這個(gè)過(guò)程中所使用的訓(xùn)練數(shù)據(jù)在一定程度上決定了機(jī)器的認(rèn)知范圍。縱使現(xiàn)在大語(yǔ)言模型與搜索引擎相結(jié)合,能夠?qū)z索到的網(wǎng)絡(luò)資源進(jìn)行學(xué)習(xí),但也不可避免地會(huì)遭遇諸多問(wèn)題。一方面,網(wǎng)絡(luò)中存在大量無(wú)用或低質(zhì)量的數(shù)據(jù),這些數(shù)據(jù)混入學(xué)習(xí)資源中,難免會(huì)干擾模型對(duì)正確知識(shí)的掌握,從而降低其輸出內(nèi)容的質(zhì)量與準(zhǔn)確性。另一方面,在涉及專業(yè)性較強(qiáng)的知識(shí)及研究領(lǐng)域時(shí),大多數(shù)學(xué)者的學(xué)術(shù)觀點(diǎn)和思想并非能通過(guò)網(wǎng)絡(luò)免費(fèi)檢索到,因此生成式人工智能在回答專業(yè)性較強(qiáng)的問(wèn)題時(shí)就很難達(dá)到專業(yè)水準(zhǔn)。此外,縱使模型與訓(xùn)練所使用的數(shù)據(jù)再龐大,用于預(yù)訓(xùn)練的數(shù)據(jù)集中也不會(huì)存在未來(lái)還未發(fā)生的數(shù)據(jù)信息,因而更做不到對(duì)尚未發(fā)生的未來(lái)事件的數(shù)據(jù)進(jìn)行處理。
在明確了大語(yǔ)言模型的“知識(shí)”來(lái)源后,本研究嘗試通過(guò)質(zhì)疑其答案合理性的方式檢測(cè)其知識(shí)立場(chǎng)是否堅(jiān)定,案例見圖3。
由此可見,ChatGPT并不具備堅(jiān)定的知識(shí)立場(chǎng),缺乏對(duì)知識(shí)內(nèi)容的正確性檢測(cè),也不會(huì)對(duì)提問(wèn)者的內(nèi)容產(chǎn)生質(zhì)疑。人類思維是人類實(shí)踐活動(dòng)的意識(shí)映射(李芒等,2023),表現(xiàn)在個(gè)體思考、分析和判斷時(shí)的獨(dú)立性和主觀性。而機(jī)器思維并不具備“自我”概念,其是基于數(shù)據(jù)和程序算法進(jìn)行決策的,無(wú)法像人類一樣按照一定的邏輯進(jìn)行問(wèn)題分析。因此,大語(yǔ)言模型并不具備堅(jiān)定的知識(shí)立場(chǎng),其回復(fù)內(nèi)容僅僅是根據(jù)輸入信息進(jìn)行一系列復(fù)雜演算的結(jié)果,缺乏對(duì)問(wèn)題的深入理解,容易產(chǎn)生錯(cuò)誤或者誤導(dǎo)。若在大語(yǔ)言模型的訓(xùn)練數(shù)據(jù)中包含針對(duì)同一個(gè)問(wèn)題的不同觀點(diǎn)和立場(chǎng),則可能會(huì)出現(xiàn)回答相同問(wèn)題得到不同結(jié)果的情形,而究竟會(huì)生成哪一種結(jié)果則取決于模型所接觸到的數(shù)據(jù)和權(quán)重分配。總之,大語(yǔ)言模型解決問(wèn)題的內(nèi)在機(jī)制決定了其在連續(xù)回答相同問(wèn)題時(shí)可能會(huì)表現(xiàn)出不一致性,且在特定的話題或領(lǐng)域中,大語(yǔ)言模型確也無(wú)法提供準(zhǔn)確且一致的知識(shí)立場(chǎng)。
3.僅是語(yǔ)言的生成而非創(chuàng)造
何為創(chuàng)造?《漢語(yǔ)大辭典》中對(duì)創(chuàng)造的解釋為:想出新方法、建立新理論、做出新的成績(jī)或東西。大語(yǔ)言模型所謂的“生成性”是指基于大數(shù)據(jù)的語(yǔ)言生成性,而缺乏與人相比的創(chuàng)造能力及相應(yīng)意義上的生成性(張絨,2023)。大語(yǔ)言模型的生成能力雖然可以產(chǎn)生看似有創(chuàng)意的文本,但其本質(zhì)仍然是基于已有數(shù)據(jù)的模仿和組合。模型通過(guò)統(tǒng)計(jì)和分析大量的現(xiàn)有文本數(shù)據(jù),按照概率進(jìn)行組合和生成新的文本,這種方式并不等同于人類的創(chuàng)造過(guò)程。人類的創(chuàng)造是建立在對(duì)世界的感知、思考和情感之上的,而不具備“自我”概念的模型顯然缺乏這些主觀意識(shí)和情感因素,且也沒(méi)有內(nèi)在的動(dòng)機(jī)或目標(biāo)。因此,大語(yǔ)言模型所生成的內(nèi)容并不是出于自發(fā)的創(chuàng)作欲望,而是受到指令、預(yù)設(shè)規(guī)則和數(shù)據(jù)等影響而被動(dòng)作出的回答。
盡管大語(yǔ)言模型可以生成一些看似具有創(chuàng)造性的作品,但這種“創(chuàng)造力”更多是基于對(duì)已有模式的模仿和延伸,而非真正的創(chuàng)造性表達(dá),其創(chuàng)造能力仍受限于缺乏主觀意識(shí)和情感體驗(yàn)的特性,這種語(yǔ)言生成的能力在某種程度上更像是一種“生產(chǎn)力”的體現(xiàn)。由于對(duì)“創(chuàng)造”和“生產(chǎn)”概念的模糊認(rèn)識(shí),導(dǎo)致人們誤以為生成式大語(yǔ)言模型具備一定的創(chuàng)造能力。模型的語(yǔ)言生成局限在有限的訓(xùn)練數(shù)據(jù)范圍之內(nèi),其提供的回答往往是直接生成的,與人類解決問(wèn)題的過(guò)程相比,模型生成回答的過(guò)程缺少對(duì)問(wèn)題本身的批判性思考。而在解決實(shí)際問(wèn)題的過(guò)程中,人們往往需要考慮諸多主客觀因素的影響,才能達(dá)到解決問(wèn)題的目的。可以說(shuō),盡管生成式大語(yǔ)言模型建立在豐富的知識(shí)積累基礎(chǔ)之上,但其作為交互工具并不具備人類所擁有的創(chuàng)造力,學(xué)習(xí)者在使用大語(yǔ)言模型時(shí)很可能會(huì)忽視對(duì)其所生成信息的辨別,甚至?xí)捎谶^(guò)度依賴模型的回答而無(wú)法進(jìn)行獨(dú)立思考和判斷。
4.不能真正解決個(gè)別化教學(xué)的問(wèn)題
個(gè)別化教學(xué)的核心在于精準(zhǔn)滿足學(xué)生的需求和興趣,以助力其實(shí)現(xiàn)最優(yōu)化發(fā)展(牟智佳,2017)。學(xué)生的學(xué)習(xí)過(guò)程受到眾多因素的影響,既包括學(xué)習(xí)資源、學(xué)習(xí)環(huán)境等外在因素,也涵蓋學(xué)習(xí)動(dòng)機(jī)、學(xué)習(xí)策略、思維習(xí)慣與認(rèn)知風(fēng)格等內(nèi)在因素。從人工智能在教育領(lǐng)域的應(yīng)用現(xiàn)狀來(lái)看,人們期望借助人工智能技術(shù)對(duì)學(xué)生進(jìn)行多元分析,進(jìn)而結(jié)合學(xué)習(xí)者的學(xué)習(xí)薄弱點(diǎn)進(jìn)行路徑規(guī)劃和資源推薦,借此來(lái)實(shí)現(xiàn)學(xué)生的個(gè)別化學(xué)習(xí)。然而,這種將個(gè)別化學(xué)習(xí)簡(jiǎn)單等同于“學(xué)情分析”“資源推薦”和“學(xué)習(xí)路徑規(guī)劃”的認(rèn)識(shí)偏差,實(shí)際上是將學(xué)習(xí)的本質(zhì)簡(jiǎn)化為學(xué)生對(duì)學(xué)習(xí)資源的選擇、瀏覽和加工,很顯然這種盲目相信數(shù)據(jù)和忽視學(xué)生主體性的觀念是站不住腳的。
以“學(xué)習(xí)成績(jī)下降怎么辦”為例,ChatGPT的回答包含了對(duì)該問(wèn)題的分析和“確定原因”“制定規(guī)劃”“尋求幫助”等6個(gè)建議,并對(duì)每個(gè)建議進(jìn)行了解釋說(shuō)明,最后再回歸問(wèn)題對(duì)提問(wèn)者進(jìn)行勸導(dǎo):“記住,學(xué)習(xí)成績(jī)的提高是一個(gè)漸進(jìn)的過(guò)程,需要持續(xù)的努力和耐心,相信自己,相信你能夠克服困難并取得好成績(jī)。”同樣的問(wèn)題,在“文心一言”和“訊飛星火”中得到的答案與ChatGPT相似。“文心一言”從學(xué)習(xí)方法、學(xué)習(xí)態(tài)度、尋求幫助三個(gè)方面進(jìn)行闡述,并給出總結(jié)和激勵(lì)。“訊飛星火”則給出10條更為詳細(xì)的建議,比如分析原因、設(shè)定目標(biāo)等,最后同樣給出總結(jié)和勸導(dǎo)。但是向真實(shí)的教師去詢問(wèn)相同的問(wèn)題時(shí),教師會(huì)結(jié)合對(duì)該學(xué)生既往學(xué)習(xí)和心理情況的了解,有針對(duì)性地通過(guò)詢問(wèn)“最近遇到了什么特別的事情”或者“學(xué)習(xí)中遇到什么困難”等具體情況與學(xué)生進(jìn)行更深層次的對(duì)話,進(jìn)而嘗試幫助學(xué)生走出困境或者克服困難,而非單純地羅列解決該問(wèn)題的一般方法。目前雖然一些模型在技術(shù)上有了進(jìn)步,例如能夠主動(dòng)詢問(wèn)關(guān)于問(wèn)題的更多細(xì)節(jié),但其本質(zhì)上仍然是基于數(shù)據(jù)訓(xùn)練和算法運(yùn)行的簡(jiǎn)單結(jié)果,缺乏真實(shí)教師敏銳的洞察力和對(duì)學(xué)生個(gè)體差異的深度理解,難以像真實(shí)教師那樣通過(guò)長(zhǎng)期的互動(dòng)、觀察和情感交流深入了解學(xué)生的個(gè)性、心理狀態(tài)以及不斷變化的學(xué)習(xí)需求。
由此不難看出,大語(yǔ)言模型的回答看似合理且有邏輯,但實(shí)際上仍缺少針對(duì)性,難以滿足學(xué)習(xí)者深層次、復(fù)雜的現(xiàn)實(shí)需求。即便通過(guò)分析對(duì)話歷史數(shù)據(jù)以及詢問(wèn)補(bǔ)充更多相關(guān)細(xì)節(jié),大語(yǔ)言模型也難以真正實(shí)現(xiàn)對(duì)學(xué)習(xí)者的全面了解。筆者認(rèn)為,大語(yǔ)言模型能夠?yàn)閷W(xué)生推薦必要的學(xué)習(xí)資源,規(guī)劃學(xué)習(xí)路徑并提供一般性指導(dǎo),但是對(duì)于個(gè)別化的學(xué)習(xí)需求,模型給予的幫助并不理想。未來(lái)大語(yǔ)言模型或許可以通過(guò)不斷改進(jìn)技術(shù),如加強(qiáng)對(duì)學(xué)生情感和認(rèn)知狀態(tài)的識(shí)別、提高與學(xué)生互動(dòng)的深度等方式,來(lái)更好地滿足個(gè)別化學(xué)習(xí)的需求。但就目前而言,生成式大語(yǔ)言模型仍難以有針對(duì)性地解決學(xué)生的個(gè)別化學(xué)習(xí)問(wèn)題。
三、對(duì)話式教學(xué)與大語(yǔ)言模型人機(jī)交互的適 用性考證
教學(xué)活動(dòng)在本質(zhì)上是對(duì)話式的(張?zhí)鞂殻?005),但對(duì)話式教學(xué)中的“對(duì)話”并不等同于生活中人與人之間的溝通交流,而是指通過(guò)對(duì)話能夠使師生之間進(jìn)行雙向的知識(shí)、思想以及精神世界的能量轉(zhuǎn)換,進(jìn)而促進(jìn)個(gè)體的自我發(fā)展。可見,對(duì)話式教學(xué)必然強(qiáng)調(diào)學(xué)生主體意識(shí)的喚醒和批判性思維的生成(王海碩,2020),它對(duì)教師的專業(yè)化水平有更高的要求,也確能有效促進(jìn)學(xué)生的成長(zhǎng)(李森等,2004)。
在實(shí)踐層面,師生之間的對(duì)話并不僅僅為了知識(shí)的傳授,還有師生情誼的養(yǎng)成和精神的傳承,這就要求對(duì)話過(guò)程應(yīng)該是相互合作、彼此互動(dòng)、共同學(xué)習(xí)的過(guò)程。教師需要通過(guò)有效對(duì)話了解學(xué)生,并結(jié)合學(xué)生的不同特點(diǎn),采用一定的教學(xué)策略來(lái)提供針對(duì)性的指導(dǎo)。換言之,在進(jìn)行對(duì)話式教學(xué)時(shí),對(duì)話雙方要做到民主平等,對(duì)話過(guò)程要有一定的策略性,且要做到因材施教。結(jié)合大語(yǔ)言模型在教育應(yīng)用中的固有困難,筆者發(fā)現(xiàn)與對(duì)話式教學(xué)的要求相比,其在教學(xué)領(lǐng)域的適用性仍需考證。
1.人機(jī)交互過(guò)程并非民主平等,而是隱含著某種價(jià)值取向
師生之間的對(duì)話是建立在師生平等關(guān)系基礎(chǔ)之上的(徐潔,2000),對(duì)話不是形式,也不是目的,更不是手段,而是師生共同解決問(wèn)題的過(guò)程(張紫屏,2015)。民主平等意味著師生之間權(quán)利和義務(wù)的相近,只有在雙方身份地位平等的理想狀態(tài)下,師生才能共同圍繞某個(gè)主題進(jìn)行討論,進(jìn)而解決問(wèn)題甚至產(chǎn)生新的認(rèn)識(shí)和理解,不斷實(shí)現(xiàn)主體間的雙向建構(gòu)。這種雙向建構(gòu)不應(yīng)受某種特定價(jià)值取向的影響,但在基于大語(yǔ)言模型的人機(jī)交互中卻并非如此。
大語(yǔ)言模型對(duì)問(wèn)題的回答,一般蘊(yùn)含著某種潛在的價(jià)值取向,如經(jīng)濟(jì)上的商業(yè)利益訴求、倫理道德層面的某種取向,甚至是意識(shí)形態(tài)上的政治傾向。導(dǎo)致這種價(jià)值取向的來(lái)源主要有兩個(gè)方面:其一是數(shù)據(jù)偏差。如果數(shù)據(jù)本身存在偏差或錯(cuò)誤,而模型本身并不具備人類的道德判斷力和價(jià)值觀,其必然無(wú)法區(qū)分什么是正確的、公正的、合理的。其二是開發(fā)者和管理者有意為之。出于自身商業(yè)利益或其他價(jià)值取向的考量,開發(fā)者和管理者會(huì)對(duì)某些問(wèn)題的回答進(jìn)行干預(yù)和調(diào)整,如限制對(duì)某些敏感問(wèn)題的回答,或在某些話題中優(yōu)先設(shè)置更具傾向性的答案,以實(shí)現(xiàn)其利益最大化。當(dāng)然,師生對(duì)話也會(huì)蘊(yùn)含某種價(jià)值取向,但是這種價(jià)值取向是建立在“為國(guó)育才”“尊師愛生”等雙向建構(gòu)基礎(chǔ)之上的,既是合理的,也是必須堅(jiān)持的。而大語(yǔ)言模型所蘊(yùn)含的價(jià)值傾向,顯然并非如此。
另外,由于大語(yǔ)言模型沒(méi)有“自我”概念,沒(méi)有堅(jiān)定的知識(shí)立場(chǎng),缺乏人類所擁有的意志和選擇的權(quán)利,因此它只能被動(dòng)接收輸入的指令或問(wèn)題,依據(jù)自身的規(guī)則生成相應(yīng)的回答,而并不能選擇是否回答問(wèn)題和回答問(wèn)題的方式,也不能理解對(duì)話語(yǔ)境中的情感并作出合理回應(yīng)。例如,在一個(gè)涉及情感支持的對(duì)話情境中,大語(yǔ)言模型只能機(jī)械地給出一些通用的語(yǔ)句,而無(wú)法像人類教師那樣根據(jù)學(xué)生的情緒變化給予真正有針對(duì)性和情感共鳴的回應(yīng)。因此,模型與人之間的對(duì)話是單向的,它只是被動(dòng)地回答問(wèn)題,而且這種回答還可能帶有某種價(jià)值取向,根本無(wú)法實(shí)現(xiàn)對(duì)問(wèn)題的討論,更不可能提出有挑戰(zhàn)性的觀點(diǎn)并進(jìn)行辯論。顯然,建立在民主平等意義上的雙向互動(dòng),在模型和人之間是不可能的。
2.人機(jī)“對(duì)話”缺乏策略性,難以引導(dǎo)學(xué)生進(jìn)行深入思考
教師在與學(xué)生的對(duì)話過(guò)程中扮演著關(guān)鍵角色,他們需要采取一定的策略引導(dǎo)學(xué)生進(jìn)行深入思考并提出問(wèn)題,從而逐步培養(yǎng)學(xué)生的創(chuàng)新思維,提高其解決問(wèn)題和應(yīng)對(duì)挑戰(zhàn)的能力。已有研究表明,批判性思維對(duì)于培養(yǎng)學(xué)生的創(chuàng)造性具有積極的促進(jìn)作用(黃朝陽(yáng),2010)。但是大語(yǔ)言模型與人交互的過(guò)程卻難以具備策略性,無(wú)法有效促使學(xué)生打破固有的思維模式。大語(yǔ)言模型雖然可以為學(xué)生提供豐富的已有信息和觀點(diǎn),但它本身并不具備創(chuàng)造力,如果學(xué)生在與模型的互動(dòng)中缺乏自己獨(dú)特的思考和判斷,就可能導(dǎo)致過(guò)于依賴模型進(jìn)而喪失其主體性。換言之,大語(yǔ)言模型輸出的內(nèi)容類似自動(dòng)化的“內(nèi)容預(yù)制菜”,表面上實(shí)現(xiàn)了知識(shí)建構(gòu)和技能獲得,但實(shí)際上卻存在“反智”風(fēng)險(xiǎn)(苗逢春,2023)。
從教學(xué)實(shí)踐的角度看,大語(yǔ)言模型并不具備人類所擁有的推理能力,人機(jī)交互的過(guò)程缺乏策略性。具體表現(xiàn)在,模型的回答只局限于問(wèn)題表面,不能提供詳盡的解釋,也不能有效引導(dǎo)學(xué)生進(jìn)行深入思考。例如,當(dāng)我們提問(wèn):“氣候變化對(duì)環(huán)境會(huì)有哪些影響?”模型給出的回答較為簡(jiǎn)單——“氣候變化會(huì)導(dǎo)致海平面上升、極端天氣事件增加等。”但是在真實(shí)的課堂教學(xué)中,教師通常會(huì)利用大量信息對(duì)氣候變化的復(fù)雜性、對(duì)人類社會(huì)和生態(tài)系統(tǒng)的影響等方面進(jìn)行更深層次的解釋和說(shuō)明,以引導(dǎo)學(xué)生深入思考。這一過(guò)程有助于激發(fā)學(xué)生保護(hù)環(huán)境的潛意識(shí),從而為培養(yǎng)學(xué)生的批判性和創(chuàng)造性思維奠定基礎(chǔ)。顯然大語(yǔ)言模型的回答缺乏一定的深度和策略性,無(wú)法引導(dǎo)學(xué)生進(jìn)行深入思考和進(jìn)一步探究,也難以提高學(xué)生的問(wèn)題解決能力。此外,大語(yǔ)言模型很難做到理論聯(lián)系實(shí)踐,學(xué)生僅能接受模型提供的已有信息,難以從零開始構(gòu)建新觀點(diǎn)、新概念或新作品。
3.大語(yǔ)言模型難以真正做到因材施教
因材施教對(duì)于對(duì)話式教學(xué)而言至關(guān)重要。對(duì)話式教學(xué)要求針對(duì)學(xué)生的個(gè)性特點(diǎn)和需求,采取不同的途徑、措施和方法(梁秋英等,2009),來(lái)制定或調(diào)整教學(xué)計(jì)劃,以便為學(xué)生提供針對(duì)性的反饋和指導(dǎo)。
相較于大語(yǔ)言模型,教師通過(guò)師生對(duì)話能夠?yàn)閷W(xué)生提供個(gè)別化指導(dǎo)和反饋,以幫助他們克服困難、挖掘潛力。孔子倡導(dǎo)因材施教,面對(duì)弟子們的相同問(wèn)題,他能夠針對(duì)不同弟子的性格特點(diǎn)進(jìn)行教導(dǎo),甚至給出截然不同的回答。例如,子路問(wèn):“聽到什么就行動(dòng)起來(lái)嗎?”孔子說(shuō):“有父親和兄長(zhǎng)在世,怎么能聽到什么就行動(dòng)起來(lái)呢!”而面對(duì)冉有同樣的提問(wèn),孔子卻說(shuō):“聽到什么就行動(dòng)起來(lái)。”這是由于孔子對(duì)兩位弟子的性格特點(diǎn)非常了解,前者平時(shí)好勇過(guò)人,所以讓他謙退,后者日常做事縮手縮腳,所以鼓勵(lì)他勇進(jìn)。而大語(yǔ)言模型僅僅基于輸入的文本進(jìn)行內(nèi)容生成,只能提供一般性的回答,難以根據(jù)學(xué)生的具體情況進(jìn)行個(gè)別化指導(dǎo),以及解決個(gè)別化問(wèn)題。再例如,當(dāng)一個(gè)學(xué)生提出關(guān)于“如何解一元二次方程”的問(wèn)題時(shí),模型只會(huì)給出一個(gè)標(biāo)準(zhǔn)的解題方法,并不能根據(jù)學(xué)生的疑點(diǎn)和學(xué)習(xí)風(fēng)格提供個(gè)性化的解釋,實(shí)際上學(xué)生可能需要更多的步驟示范、提示或者練習(xí)來(lái)幫助其掌握解方程的方法。因此,大語(yǔ)言模型僅能通過(guò)回答問(wèn)題的形式為學(xué)生提供一些通用性的解釋和反饋,而并不能根據(jù)學(xué)生的現(xiàn)實(shí)情況進(jìn)行因材施教。
四、生成式大語(yǔ)言模型在對(duì)話式教學(xué)中能做 什么
同師生對(duì)話相比,大語(yǔ)言模型與學(xué)生的交互雖然達(dá)不到真正意義上的“對(duì)話”,但教學(xué)實(shí)踐卻無(wú)法回避技術(shù)對(duì)其產(chǎn)生的影響(鄭燕林等,2023)。結(jié)合大語(yǔ)言模型所具備的強(qiáng)大的語(yǔ)言生成能力,其仍然能夠從以下三個(gè)方面支持對(duì)話式教學(xué)的開展。
1.為客觀性知識(shí)類教學(xué)問(wèn)題提供高效信息咨詢服務(wù)
盡管模型并不能理解問(wèn)題,但是機(jī)器學(xué)習(xí)具有基于計(jì)算機(jī)的強(qiáng)大算力而表現(xiàn)出來(lái)的高效性,這是人類學(xué)習(xí)過(guò)程中很難具有的特點(diǎn)。模型通過(guò)預(yù)訓(xùn)練積累了豐富的客觀性知識(shí),這使其具備了大量的知識(shí)儲(chǔ)備。因此,在針對(duì)客觀性知識(shí)較強(qiáng)的教學(xué)問(wèn)題時(shí),大語(yǔ)言模型具備獨(dú)特的優(yōu)勢(shì)。利用大語(yǔ)言模型可以提高知識(shí)獲取的效率和便捷性,與傳統(tǒng)的知識(shí)信息搜索方式相比,大語(yǔ)言模型可以輕松回答學(xué)生提出的各類知識(shí)性問(wèn)題,并且準(zhǔn)確性有較大提高(周洪宇等,2023)。傳統(tǒng)的信息搜索方式通常需要用戶輸入關(guān)鍵詞或提出問(wèn)題,然后系統(tǒng)會(huì)返回相應(yīng)的搜索結(jié)果,這種方式雖然能夠提供很多信息,但是需要用戶自行整理有用信息,費(fèi)時(shí)且費(fèi)力。而大語(yǔ)言模型可以根據(jù)輸入的問(wèn)題生成相應(yīng)的回答,并以更加自然的方式進(jìn)行交流,知識(shí)獲取更加高效便捷。而且大語(yǔ)言模型還可以根據(jù)學(xué)生的需求拓展延伸相應(yīng)的知識(shí)。例如,學(xué)生在學(xué)習(xí)古詩(shī)《鋤禾》時(shí)想要了解作者李紳的生平,在閱讀文章時(shí)看到某個(gè)學(xué)術(shù)概念想要進(jìn)一步了解其含義,在觀察到丁達(dá)爾現(xiàn)象時(shí)希望了解其中的科學(xué)原理……面對(duì)諸如此類的情境,大語(yǔ)言模型所提供的回答在很大程度上能夠較好地滿足學(xué)生的需求,即便這些回答的準(zhǔn)確性和合理性稍差,也不會(huì)對(duì)最終的學(xué)習(xí)效果產(chǎn)生很壞的影響。
2.基于海量大數(shù)據(jù)為語(yǔ)言教學(xué)提供精準(zhǔn)模擬和糾錯(cuò)服務(wù)
語(yǔ)言作為人類交流的重要媒介,其學(xué)習(xí)與表達(dá)具有內(nèi)在的規(guī)律性。每種語(yǔ)言都擁有獨(dú)特的語(yǔ)法規(guī)則和句法結(jié)構(gòu),構(gòu)成了語(yǔ)言的基本框架,為信息傳遞提供了必要的準(zhǔn)則和約束。當(dāng)前的人工智能主要是通過(guò)模擬人類智能的外在表現(xiàn)來(lái)實(shí)現(xiàn)智能模擬的機(jī)器智能(顏士剛等,2022),大語(yǔ)言模型作為自然語(yǔ)言處理工具,其學(xué)習(xí)過(guò)程不僅僅是簡(jiǎn)單地對(duì)文本進(jìn)行編碼和解碼,還能通過(guò)捕捉和學(xué)習(xí)文本數(shù)據(jù)中的語(yǔ)法規(guī)則、詞匯使用和句子結(jié)構(gòu)等特征,實(shí)現(xiàn)對(duì)文本語(yǔ)言的有效建模。雖然大語(yǔ)言模型并未能真正理解語(yǔ)法規(guī)則的內(nèi)在機(jī)制,但可從海量的文本數(shù)據(jù)中學(xué)習(xí)語(yǔ)言的表達(dá)規(guī)范,并根據(jù)指令精準(zhǔn)模擬人類的表達(dá)習(xí)慣和寫作手法,如模仿詩(shī)人作詩(shī)、模仿某位作家的寫作風(fēng)格撰寫文章等。大語(yǔ)言模型對(duì)文本語(yǔ)言內(nèi)在結(jié)構(gòu)和表達(dá)方式的掌握,使其能夠提供精準(zhǔn)模擬和糾錯(cuò)等高質(zhì)量的語(yǔ)言服務(wù)。
例如,在二語(yǔ)習(xí)得過(guò)程中,學(xué)生可以為大語(yǔ)言模型設(shè)定特殊身份(如一位外國(guó)友人),然后通過(guò)人機(jī)交互模擬兩人的對(duì)話,以便在一個(gè)低壓力的環(huán)境中練習(xí)語(yǔ)言表達(dá),進(jìn)而提升語(yǔ)言交流能力。當(dāng)學(xué)生出現(xiàn)不同程度的語(yǔ)法錯(cuò)誤時(shí),模型可以為其提供多方面的幫助和支持。第一,進(jìn)行語(yǔ)法糾錯(cuò)。基于學(xué)習(xí)到的語(yǔ)法規(guī)則和句子結(jié)構(gòu),大語(yǔ)言模型能夠識(shí)別輸入文本中的語(yǔ)法錯(cuò)誤,例如主謂不一致、冠詞使用錯(cuò)誤等,并給出正確的語(yǔ)法建議或進(jìn)行糾錯(cuò)修改,如此學(xué)生便能從模型的反饋中快速掌握正確的語(yǔ)法規(guī)范,從而提高語(yǔ)句表達(dá)的準(zhǔn)確性和規(guī)范性。第二,優(yōu)化詞匯選擇。根據(jù)上下文的語(yǔ)境,模型能夠提供合適的詞匯選擇建議,不僅可以增強(qiáng)語(yǔ)句的表達(dá)力,而且能有效擴(kuò)展學(xué)生的詞匯知識(shí)庫(kù),還有助于提高學(xué)生正確使用詞匯的意識(shí)和語(yǔ)言技能。第三,優(yōu)化語(yǔ)句結(jié)構(gòu)。在接收到輸入文本后,大語(yǔ)言模型能夠結(jié)合語(yǔ)言學(xué)習(xí)的規(guī)范,對(duì)語(yǔ)句結(jié)構(gòu)進(jìn)行優(yōu)化,使其更加清晰流暢,從而幫助學(xué)生不斷提升語(yǔ)言學(xué)習(xí)的效果。
3.針對(duì)常規(guī)教學(xué)活動(dòng)提供一般性的參考框架、范式或提綱
雖然大語(yǔ)言模型對(duì)解決具體問(wèn)題的幫助并不明顯,但它具有為教育實(shí)踐領(lǐng)域提供多樣的模式化內(nèi)容框架的潛力卻有目共睹。這意味著教師可以依據(jù)特定的教學(xué)需求,利用大語(yǔ)言模型生成一般性的框架、范式或提綱,以支持教學(xué)活動(dòng)的設(shè)計(jì)和實(shí)施。這里的“一般性”是指模型生成的內(nèi)容具有適用于其他廣泛情境的普遍性和通用性。換言之,這些框架、范式或提綱并非針對(duì)特定的情境和問(wèn)題,而是適用于各種教學(xué)實(shí)踐領(lǐng)域的一般模式。
例如,在進(jìn)行對(duì)話式教學(xué)過(guò)程中,當(dāng)教師需要設(shè)計(jì)一個(gè)教學(xué)評(píng)價(jià)框架來(lái)評(píng)估教學(xué)效果時(shí),他們可以向ChatGPT發(fā)送指令:“請(qǐng)?zhí)峁┮粋€(gè)關(guān)于對(duì)話式教學(xué)的教學(xué)評(píng)價(jià)框架。”收到ChatGPT的回復(fù)內(nèi)容為“從教學(xué)設(shè)計(jì)評(píng)價(jià)要素、教學(xué)實(shí)施評(píng)價(jià)要素、學(xué)習(xí)效果評(píng)價(jià)要素三個(gè)方面展開”,并提示教學(xué)設(shè)計(jì)評(píng)價(jià)要素包括“對(duì)話目標(biāo)明確性、問(wèn)題設(shè)計(jì)質(zhì)量、資源準(zhǔn)備”,教學(xué)實(shí)施評(píng)價(jià)要素包括“教師引導(dǎo)能力、學(xué)生參與度、互動(dòng)質(zhì)量”,學(xué)習(xí)效果評(píng)價(jià)要素包括“知識(shí)掌握程度、思維能力提高、學(xué)習(xí)態(tài)度和價(jià)值觀”。雖然模型所生成的框架較為全面,且對(duì)每個(gè)要素都進(jìn)行了解釋說(shuō)明,但是這些內(nèi)容并不能直接拿來(lái)應(yīng)用于教學(xué)。教師需要根據(jù)現(xiàn)實(shí)情況進(jìn)行針對(duì)性的修改完善,才能對(duì)教學(xué)起到及時(shí)診斷和調(diào)整優(yōu)化的作用(白雪梅等,2024)。在此過(guò)程中,教師需要認(rèn)識(shí)到評(píng)價(jià)的目的并非是簡(jiǎn)單檢測(cè)學(xué)生的學(xué)習(xí)情況,而是為了促進(jìn)學(xué)生的發(fā)展與提升教學(xué)質(zhì)量。
同樣當(dāng)教師要求大語(yǔ)言模型提供一個(gè)關(guān)于歐姆定律的教學(xué)案例時(shí),它提供的教學(xué)案例雖然包含了教學(xué)目標(biāo)和教學(xué)活動(dòng)等較為全面的內(nèi)容,但也不難發(fā)現(xiàn)其教學(xué)目標(biāo)描述的行為動(dòng)詞、實(shí)驗(yàn)細(xì)節(jié)和評(píng)價(jià)方案等內(nèi)容并不能直接應(yīng)用于教學(xué)實(shí)際,仍需要進(jìn)行系統(tǒng)修改。因此,大語(yǔ)言模型可以提供一般性的范式、框架或提綱,便于教師在教學(xué)實(shí)踐中參考使用,但這一過(guò)程還需教師結(jié)合專業(yè)知識(shí)、學(xué)情以及教學(xué)經(jīng)驗(yàn)進(jìn)行必要調(diào)整。
五、結(jié)語(yǔ)
生成式大語(yǔ)言模型雖然擁有與人交互的能力,形式上能夠?qū)崿F(xiàn)人機(jī)“對(duì)話”,但其本質(zhì)仍然是一種基于大數(shù)據(jù)處理的“聊天機(jī)器人”,難以僅通過(guò)人機(jī)交互真正實(shí)現(xiàn)教學(xué)的目的,也達(dá)不到對(duì)話式教學(xué)中師生對(duì)話的理想效果。即便如此,當(dāng)下大語(yǔ)言模型依舊可以憑借其強(qiáng)大的語(yǔ)言生成能力為教學(xué)提供更多支持。前文列舉的三個(gè)方面,均源于對(duì)模型工作原理的分析,是其工作原理和“邏輯能力”能夠支持的服務(wù)范疇,雖然未必涵蓋它所能提供的全部服務(wù),但卻是最為真實(shí)和有效的。總之,大語(yǔ)言模型在教育中的推廣和應(yīng)用,應(yīng)充分考量其優(yōu)勢(shì)與局限性,恰當(dāng)且審慎地應(yīng)用,杜絕虛妄的夸大和脫離實(shí)際的暢想,這或許是一條打破一百多年來(lái)教育技術(shù)實(shí)踐“無(wú)奈循環(huán)”的有效途徑。
參考文獻(xiàn):
[1]白雪梅,郭日發(fā)(2024).生成式人工智能何以賦能學(xué)習(xí)、能力與評(píng)價(jià)?[J].現(xiàn)代教育技術(shù),34(1):55-63.
[2]方海光,孔新梅,李海蕓等(2022).人工智能時(shí)代的人機(jī)協(xié)同教育理論研究[J].現(xiàn)代教育技術(shù),32(7):5-13.
[3]郝祥軍,顧小清,張?zhí)扃龋?022).人機(jī)協(xié)同學(xué)習(xí):實(shí)踐模式與發(fā)展路向[J].開放教育研究,28(4):31-41.
[4]郝祥軍,張?zhí)扃櫺∏澹?023).智能時(shí)代的人機(jī)協(xié)同學(xué)習(xí):形態(tài)、本質(zhì)與發(fā)展[J].中國(guó)電化教育,(10):26-35.
[5]黃朝陽(yáng)(2010).加強(qiáng)批判性思維教育 培養(yǎng)創(chuàng)新型人才[J].教育研究,31(5):69-74.
[6]焦建利(2023).ChatGPT:學(xué)校教育的朋友還是敵人?[J].現(xiàn)代教育技術(shù),33(4):5-15.
[7]李海峰,王煒(2023).人機(jī)協(xié)同深度探究性教學(xué)模式——以基于ChatGPT和QQ開發(fā)的人機(jī)協(xié)同探究性學(xué)習(xí)系統(tǒng)為例[J].開放教育研究,29(6):69-81.
[8]李海峰,李廣鑫,湯允鳳(2024a).智能群體多維感知機(jī)器人支持的人機(jī)協(xié)同研學(xué)教學(xué)模式——以“孔子”大語(yǔ)言模型會(huì)話機(jī)器人的研發(fā)與教學(xué)為例[J].現(xiàn)代遠(yuǎn)距離教育,(4):48-59.
[9]李海峰,王煒,李廣鑫等(2024b).智能助產(chǎn)術(shù)教學(xué)法——以“智能蘇格拉底會(huì)話機(jī)器人”教學(xué)實(shí)踐為例[J].開放教育研究,30(2):89-99.
[10]李芒,楊宇軒(2023).人非機(jī)器:對(duì)計(jì)算思維本質(zhì)的認(rèn)識(shí)[J].開放教育研究,29(2):55-60.
[11]李森,吉標(biāo)(2004).師生對(duì)話的特點(diǎn)及意義[J].西南師范大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),(3):88-91.
[12]李政濤(2023).ChatGPT/生成式人工智能對(duì)基礎(chǔ)教育之“基礎(chǔ)”的顛覆與重置[J].華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版),41(7):47-55.
[13]梁秋英,孫剛成(2009).孔子因材施教的理論基礎(chǔ)及啟示[J].教育研究,30(11):87-91.
[14]苗逢春(2023).生成式人工智能技術(shù)原理及其教育適用性考證[J].現(xiàn)代教育技術(shù),33(11):5-18.
[15]牟智佳(2017).“人工智能+”時(shí)代的個(gè)性化學(xué)習(xí)理論重思與開解[J].遠(yuǎn)程教育雜志,35(3):22-30.
[16]錢力,劉熠,張智雄等(2023).ChatGPT的技術(shù)基礎(chǔ)分析[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),7(3):6-15.
[17]沈書生,祝智庭(2023).ChatGPT類產(chǎn)品:內(nèi)在機(jī)制及其對(duì)學(xué)習(xí)評(píng)價(jià)的影響[J].中國(guó)遠(yuǎn)程教育,43(4):8-15.
[18]宋萑,林敏(2023).ChatGPT/生成式人工智能時(shí)代下教師的工作變革:機(jī)遇、挑戰(zhàn)與應(yīng)對(duì)[J].華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版),41(7):78-90.
[19]汪靖,陳恬妮,楊玉芹(2024).思維與調(diào)節(jié)的融合共創(chuàng):生成式人工智能支持的人智交互過(guò)程與模式研究[J].中國(guó)電化教育,(8):45-55.
[20]王海碩(2020).對(duì)話教學(xué)及其內(nèi)涵式建構(gòu)[J].教學(xué)與管理,(24):1-3.
[21]王一巖,劉淇,鄭永和(2024).人機(jī)協(xié)同學(xué)習(xí):實(shí)踐邏輯與典型模式[J].開放教育研究,30(1):65-72.
[22]王佑鎂(2023).奇點(diǎn)確認(rèn):ChatGPT時(shí)代教育的沖擊與挑戰(zhàn)[J].中小學(xué)信息技術(shù)教育,(4):1.
[23]肖峰(2023).生成式人工智能介入知識(shí)生產(chǎn)的功用探析——借助ChatGPT和“文心一言”探究數(shù)字勞動(dòng)的體驗(yàn)[J].重慶郵電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),35(4):1-10.
[24]徐潔(2000).民主、平等、對(duì)話:21世紀(jì)師生關(guān)系的理性構(gòu)想[J].教育理論與實(shí)踐,(12):12-17.
[25]徐英瑾(2021).人工智能哲學(xué)十五講[M].北京:北京大學(xué)出版社:52-53.
[26]顏士剛,王麗蕊,周紫婷(2022).論情感教育視角下人工智能機(jī)器人的德育困難[J].現(xiàn)代教育技術(shù),32(4):5-12.
[27]張絨(2023).生成式人工智能技術(shù)對(duì)教育領(lǐng)域的影響——關(guān)于ChatGPT的專訪[J].電化教育研究,44(2):5-14.
[28]張?zhí)鞂殻?005).試論教育對(duì)話及其基本特征[J].北京大學(xué)教育評(píng)論,(3):102-106.
[29]張志禎,張玲玲,米天伊等(2023).大型語(yǔ)言模型會(huì)催生學(xué)校結(jié)構(gòu)性變革嗎?——基于ChatGPT的前瞻性分析[J].中國(guó)遠(yuǎn)程教育,43(4):32-41.
[30]張紫屏(2015).師生互動(dòng)教學(xué)的困境與出路[J].教育發(fā)展研究,35(6):44-52.
[31]趙曉偉,戴嶺,沈書生等(2024).促進(jìn)高意識(shí)學(xué)習(xí)的教育提示語(yǔ)設(shè)計(jì)[J].開放教育研究,30(1):44-54.
[32]鄭燕林,任維武(2023).實(shí)踐觀視域下ChatGPT教學(xué)應(yīng)用的路徑選擇[J].現(xiàn)代遠(yuǎn)距離教育,(2):3-10.
[33]鐘秉林,尚俊杰,王建華等(2023).ChatGPT對(duì)教育的挑戰(zhàn)(筆談)[J].重慶高教研究,11(3):3-25.
[34]周洪宇,李宇陽(yáng)(2023).ChatGPT對(duì)教育生態(tài)的沖擊及應(yīng)對(duì)策略[J].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),44(4):102-112.
[35]Berglund, L., Tong, M., amp; Kaufmann, M. et al. (2023). The Reversal Curse: LLMs Trained on “A Is B” Fail to Learn “B Is A”[EB/OL]. [2024-01-11]. https://doi.org/10.48550/arXiv.
2309.12288.
[36]Burbules, N. C. (2001). Theory and Research on Teaching as Dialogue[M]// Richardson, V. (Ed.). Handbook of Research on Teaching (4th Edition). Washington, DC: American Educational Research Association:1102-1121.
[37]Holmes, W., amp; Miao, F. (2023). Guidance for Generative AI in Education and Research[EB/OL]. [2024-01-15]. https://unesdoc.unesco.org/ark:/48223/pf0000386693.
[38]Robert, J. (2024). EDUCAUSE AI Landscape Study[EB/OL]. [2024-12-10]. https://www.educause.edu/ecar/research-publications/
2024/2024-educause-ai-landscape-study/introduction-and-
key-findings.
[39]Touvron, H., Lavril, T., amp; Izacard, G. et al. (2023). LLaMA: Open and Efficient Foundation Language Models[EB/OL]. [2024-01-18]. https://doi.org/10.48550/arXiv.2302.13971.
收稿日期 2024-10-20 責(zé)任編輯 劉選
Can Generative Large Language Models Effectively Implement Dialogic Teaching
YAN Shigang, HU Xiulei, LI Wenguang
Abstract: Generative large language models have, in form, enabled natural conversation between humans and machines, making it a realistic possibility for the ancient dialogic teaching method. Therefore, since their advent, they have been widely praised in the education field. In order to better understand the applicability of generative large language models in the dialogic teaching, it is necessary to explore the inherent difficulties in the application to education based on their working principles, so as to find appropriate paths to empower dialogic teaching. As an application of artificial neural networks with the ability of natural language conversation based on the training of large-scale corpora, generative large language models are essentially “chatbots” based on data processing. They have inherent difficulties such as a lack of comprehension ability, an unsteady knowledge stance, the fact that language is merely generated rather than created, and the difficulty in meeting individualized learning needs. Therefore, whether from the perspective of knowledge imparting or emotional cultivation, generative large language models themselves cannot achieve the ideal effects of dialogic teaching due to being influenced by specific value orientations, lacking strategic guidance, and being unable to teach students in accordance with their aptitudes. Even so, they can still provide suitable application scenarios for dialogic teaching. For example, they can provide efficient information consultation services for teaching problems related to objective knowledge, offer accurate simulation and error correction services for language teaching based on massive amounts of big data, and provide general reference frameworks, paradigms, or outlines for regular teaching activities.
Keywords:Artificial Intelligence; Generative Large Language Model; Dialogic Teaching; Individualized Teaching