【摘要】智能技術的快速發展,為教師解決作文評改難題提供了有力支撐。實踐表明,作文智能評改系統優勢明顯:規模化即時性反饋可賦能作文高效評改,有針對性的客觀反饋可賦能作文精細評改,大數據可視化反饋可賦能作文增值評價。然而,作文智能評改的專業性還有待提升,智能系統的支持性功能有待完善,智能評改環境下師生的主體性也有待加強。教師運用智能評改系統要以人為本,明確教師責任和價值;樹立評價即學習理念,重塑學生主體性;加強各方合作,推動作文智能評改系統的優化升級。
【關鍵詞】智能評改;作文教學;實驗
小學作文評價長期存在教師評改任務繁重、反饋不及時、評價標準模糊、增值評價困難等問題。智能技術的快速發展,為教師解決上述難題提供了有力支撐。2024年9月,筆者聯合高校教育研究者與小學骨干教師共同教研,運用作文智能評改系統,在山東省濟南市槐蔭區恒新小學五年級開展了為期一學期的作文智能評改實驗。相比傳統的評改方法,智能評改系統有何優勢?還存在哪些問題?我們又該如何解決問題,推動作文智能評改系統優化升級?本文結合實驗情況,嘗試對上述問題做出回答,以期為語文教師使用智能評改系統賦能作文教學提供參考。
一、作文智能評改系統的實踐優勢
從實驗情況來看,智能評改系統在作文評改的高效性、精細性以及作文增值評價等方面,可為教師提供有效幫助。
1.規模化即時性反饋,賦能作文高效評改
及時有效的作文評改反饋有助于強化學生對自己作文的持續思考,提升作文修改效果。然而,傳統作文教學中,教師常常因工作量大而難以做到及時反饋。智能評改系統支持班級創建,可在10分鐘內完成對全班作文的快速評改,同時自動生成各種統計數據,在賦能作文高效評改方面呈現出較大優勢。在使用智能評改系統前,實驗校教師大多數一學期僅能完成8次單元習作評改。實驗團隊在使用智能評改系統之后,某教師在54天內便指導學生完成了18次作文練習(含單元習作、習作二稿、片段練習和測試作文),學生的習作頻率顯著提高,習作量明顯加大。
值得注意的是,習作頻率的提高和習作量的加大并未令學生感到反感。筆者針對某實驗班42名學生的問卷調查顯示:對三天一次的習作頻率,43.9%的學生感覺“很有意思,沒有壓力”,51.22%的學生認為“有一點壓力,但是能承受”;在寫作效果方面,實驗班95.12%的學生認為使用智能系統后“進步很大”或“有一定進步”。通過對不同層次學生的訪談,筆者還了解到,使用智能評改系統之后,學生可在短時間內獲得作文反饋,并在記憶較新的情況下修改作文,這極大地激發了他們的興趣,修改效果也比過去好很多。關于作文智能評改的質量,參與實驗的教師總體感覺效果較好。有研究數據表明,智能作文評價的反饋精確度為94.44%[1]。教師還可以使用智能系統的審核功能彌補智能評改的不足。
2.有針對性的客觀反饋,賦能作文精細評改
作文精細評改是指依據評改標準,客觀細致地指出學生作文的優點和不足,并提供具體、有針對性的修改建議。以往人工作文評改,教師的評改量、主觀性和當下情緒狀態等因素都會影響作文評改的精細度與客觀性。智能系統則可以借助統一的評改標準、多樣的評改形式、豐富的評語內容,有效賦能作文精細評改。
首先,智能評改標準統一,評價針對性強。智能系統根據教師提供的習作要求自動分項評改,分優秀、良好、中等、合格、須完善五個級別檢測學生作文目標實現情況,有針對性地指出優點和不足。統一的評改標準與分項評語相配合,保證了評價的客觀性和針對性。
其次,智能評改形式多樣,評價全面細致。作文智能評改系統有分項評價、評分、旁批和總評等多種評改形式。分項評價是按照評改標準逐項簡評;評分包括作文總分和打分詳情;旁批是系統直接用紅筆在作文中作標注,含字詞糾錯和好詞好句圈點等;總評包括總體簡評、作文優點、修改建議等多個部分。多種評改形式相互配合,使作文智能評改全面而細致。
最后,智能評語內容豐富,指導具體明確。智能評語包括分項評語和總評評語。分項評語簡潔明了,直指優點和不足。總評評語結合作文具體內容提供詳盡且有針對性的修改建議。例如,在作文《推薦一本書》中,一位同學向媽媽推薦完《紅樓夢》后寫道:“祝媽媽見多識廣。”智能系統認為這樣表達不妥,建議修改為“希望媽媽也能喜歡這本書,我們一起分享閱讀的快樂!”最后鼓勵這位同學“繼續保持對閱讀的熱愛,成為更加優秀的自己!”這樣具體明確的指導,不僅為學生修改作文搭建了具體的支架,還為他們提供了情緒價值。
3.大數據可視化反饋,賦能作文增值評價
《義務教育語文課程標準(2022年版)》強調“應重視增值評價,關注學生個體的進步幅度”[2]。相比于結果評價,增值評價“注重起點、關注過程、強調發展”[3],其前提是有規模化的數據來源。傳統人工作文評改,教師往往憑借記憶和經驗對學生進行縱向評價,而智能評改系統能夠長期跟蹤學生寫作的情況,其大數據存儲和可視化反饋功能可為學生作文進行增值評價提供客觀、精確的數據。教師可以根據需要選擇相應的時間段,參照學生個人歷史成績走勢圖進行增值評價。下面是實驗班某學生在2024年10月21日到2025年1月17日期間的作文個人歷史成績走勢圖。

上圖顯示,這位學生在測評時間段內的第一次作文成績不足25分,最后一次接近滿分30分,成績整體呈上升趨勢,中間略有起伏。若想深入了解該生在上述時間段內的習作增值情況,教師還可以查看其個人寫作成長檔案或作文集。表1是根據該生作文集中的匯總信息,按時間順序提取的部分數據。
可以看出,該生第一次作文字數較少,第二次開始大幅度增加,之后字數相對穩定。該生作文成績一直處于班級平均成績之上,且增幅大于班級整體增幅,說明他比多數同學進步快。教師可通過指導學生對個人習作情況進行縱向數據分析,引導他們關注學習過程,了解自身寫作的優勢與不足并確定努力的方向。
二、作文智能評改系統運用中存在的問題
作文智能評改系統在賦能作文高效、精細評改和增值評價等方面優勢顯著,但是,實踐中我們也發現智能評改的專業性還有待提升,智能系統的支持性功能有待完善,智能評改環境下師生的主體性也有待加強。
1.作文智能評改的專業性有待提升
盡管智能作文評改的反饋精確度可達94.44%,教師甚至感受到智能評改多數時候比人工評改更全面、細致、準確,然而無法回避的是,智能評改錯誤、評改漏洞仍會出現,智能系統對文本結構的把握能力、對作品內容的深度理解能力也有待提高。
智能評改錯誤包括字詞識別錯誤、作文格式修正錯誤等。比如,智能系統在批改學生寫給媽媽的一封信時,要求該生在開頭稱謂“親愛的媽媽”后面加上“收”字,這顯然是錯誤的。雖然智能評改出錯概率不算太高,但是這樣的錯誤一旦出現,就會對盲目信任智能技術的學生造成不良影響。評改漏洞是指智能系統對作文中的錯誤識別不全,主要表現為對字、詞、句、標點符號等運用錯誤的忽略。研究顯示,智能系統的錯誤召回率只有11.89%[4],這意味著大量文本錯誤不能被系統識別。
作文智能評改系統對文本結構的把握能力有待提高。比如,系統建議學生在作文中加入某段文字,卻不關注加上之后是否會對作文的整體結構產生影響。另外,智能系統受訓練數據來源、研發者自身局限等因素影響,對文本質量高下的判斷有時會滯后于學科前沿認識,而智能算法強于提取結構性數據、弱于處理非結構性數據的特點,也容易導致系統難以深入理解作品內容。一些淺層次的模式化建議,對小學生當下的寫作可能會產生立竿見影的提升效果,但是從長遠看則可能影響寫作的多樣性,限制學生的創造力。
2.作文智能評改系統的支持性功能有待完善

作文智能評改系統的支持性功能,是指那些不直接參與作文評改,卻為作文評改提供必要支持或輔助的功能,是確保智能系統整體效能的重要因素。筆者當前使用的作文智能評改系統的相關支持性功能尚待完善。一是智能評分標準不透明。智能評分標準是智能系統進行作文評價的依據,也是學生習作的抓手和修改的側重點。當前智能評改系統只為教師調整檢測指標提供了技術權限,而各項指標所占比重、每項指標中不同層級所屬分數段等對教師來說還是“黑箱”,評分結果的可解釋性不足。二是智能系統多主體交互式參與作文評改的功能有待完善。研究表明,學生作為評價主體在評價活動中的“評他頻率和回復頻率”對學生認知與反思能力的提升影響較大。[5]學生作文自評、同伴互評會促使學生深入思考自己作文的優勢和不足,有利于提高寫作水平。筆者當前使用的作文智能評改系統還缺少線上學生自評、同伴互評功能。三是智能系統須加強寫作支持性資源建設。當前智能系統能夠在作文點評中通過“評語+修改建議”的方式,有針對性地為學生提供部分支持性信息,體現了智能系統個性化推送的優勢。但是,在根據學生所屬學段、年齡特征和具體作文要求,為學生習作全過程提供支持性資源方面,還有較大提升空間。
3.作文智能評改環境下師生的主體性有待加強
技術常常“以為人提供便利的方式控制著人”[6]。作文智能評改的快捷、細致、友好等性能在贏得師生信任的同時,也很容易使師生對智能技術過度依賴或盲目崇拜,進而弱化了教育主體的自主性、能動性和創造性。
首先,教師對智能評改系統的過度依賴容易導致教學責任的缺席。當智能評改系統能以規模化、即時性的反饋替代教師完成大部分作文評改任務,特別是智能評改結果能得到教師認可時,教師便容易產生技術依賴癥,從而弱化或讓渡應有的教學責任。這種技術依賴主要表現為不加審視地直接使用系統推薦的評改標準、傾向于使用系統的批量審核功能、不了解具體學情等。教師教學責任的缺席,不僅不利于學生的成長,更是對自身專業成長的失責。
其次,學生對智能評改系統的盲目崇拜容易導致高階思維能力的弱化。智能評改的即時性在一定程度上激發了學生的寫作興趣,作文修改的支持性信息為他們修改作文提供了便利,智能系統的友好性也為其提供了較高的情緒價值,這些都容易導致小學生對智能系統盲目崇拜。他們會極度信任系統的評價結果,即便系統指導有誤,他們為了二稿得到高分也愿意采納系統的建議。他們不愿意費力思考修改建議是否合理,于是在不知不覺中便放棄了作文的自我評價。思考惰性的產生也必然會導致學生分析、綜合、評價、創造等高階思維能力的弱化,不利于寫作能力的真正提高。
三、作文智能評改系統的運用建議
綜合考慮智能系統賦能作文評改的優勢和不足,我們一方面要抓住智能技術發展帶來的機遇,深入挖掘技術潛力,破解教學難題;另一方面也要立足實踐,明確教師在智能系統使用中的責任與價值,重塑學生的主體性,加強各方合作,共同推動作文智能評改系統的優化升級。
1.以人為本,明確作文智能評改環境下語文教師的責任和價值
聯合國教科文組織頒布的《教師人工智能能力框架》指出,“教師應該對教學中使用人工智能和促進學生使用人工智能的教學決策負責”[7]。當前的智能系統在作文評改環節呈現出較大優勢,但是無法替代人類制定評改標準,更不能替代人類決策,因此,確立以人為本的人工智能價值取向,明確教師的責任和價值至關重要。
教師主動參與智能評改標準的制定,是履行主體責任的重要方式。作文評改標準是作文評改的依據,也為學生的習作增值指引了方向。習作目標不同,評改標準也不一樣。通常依據課程標準對各學段寫作能力的要求,結合教材單元語文要素,并考慮學生實際水平和發展需求來制定小學單元作文評改標準,兼顧科學性、適用性,不建議教師照搬智能系統的作文檢測要求。
針對智能評改專業性不足的問題,教師要自覺承擔起對智能評改結果審核的責任。一要審核智能評改錯誤,檢查旁批、修改建議是否有誤并判斷其合理性;二要關注智能評改漏洞,識別是否為抄襲、判斷書寫是否認真、圈畫系統忽略的錯誤;三要識別智能系統的模式化修改建議可能給學生長遠發展帶來的風險。
利用智能評改結果監測學情、為學生提供個性化輔導,也是教師主體責任和價值的重要體現。教學“本質上是一種倫理實踐”[8],教師在擺脫人工作文批改重負之后,可充分發揮認知優勢,加強師生間的人際互動,為學生提供超越工具理性的深層次個性化輔導,也可以通過分享個人寫作經驗,加強師生間的情感溝通,以教師自身人格魅力和優良的專業素養影響學生,同時感受個人成長的喜悅和職業幸福。
2.樹立評價即學習的理念,重塑學生在作文評改中的主體性
評價即學習的理念強調評價本身就是一種學習,它可以激發批判性思維,喚醒學生的主體性。這一理念的提出者西方學者羅娜·厄爾認為“評價的終極目標應該是學生作為評價主體,也就是說如果希望評價能夠真正發揮作用,那么學生必須參與到評價的設計與實施之中,他們不應僅僅作為接受者而存在”[9]。在小學作文評改中,學生可通過參與作文自評、互評的方式重塑自身主體性。
作為作文評價活動的設計者和引導者,教師首先可以指導學生分析智能評閱報告,學習作文評改方法,為自評和同伴互評奠定基礎。其次,教師要合理設計學生作文評價活動,不能因為引入智能評改而忽視學生參與評價的重要性。“在行動和言說中,人們表明了他們是誰”[10],教師通過設計作文自評、互評,為學生的行動與言說提供舞臺,引導他們在提問與回答中持續合作,彰顯主體性。最后,教師要引導學生審視智能修改建議,幫助他們形成個人決策。例如,一位學生在介紹賈寶玉時引用了《紅樓夢》中“面若中秋之月,色如春曉之花”的原文,智能系統建議學生將引文調整為符合五年級學生認知水平的白話表述方式。教師可引導學生自己決定是否采納這一建議并提供理由。這一設計目的指向學生分析問題和形成決策的思維過程,而不在于最終選擇的結果。
3.加強各方合作,推動作文智能評改系統優化升級
作文智能評改系統的優化升級,對提高作文評改質量、贏得利益相關方信任,從而加快教育推廣應用步伐具有重要意義。小學語文教師、技術研發企業和高校、科研機構相關領域專家發揮各自優勢并加強合作,是推動作文智能評改系統優化升級的重要途徑。針對當前作文智能評改專業性不足的問題,教師可主動與企業合作,降低智能系統評改錯誤率,提高錯誤識別率,增強智能系統對文本的整體把握和深度理解力。企業應與相關領域專家合作,緊跟學術前沿,采用更高質量的數據集作為模型訓練依據,包括但不限于優秀作文和常見錯誤類數據、語文學科理論相關數據,如文學理論、寫作理論、文章學、修辭學等相關領域的前沿成果,以切實增強智能評改的專業性。同時,企業作為服務方,應建立長效用戶反饋機制,及時收集和處理師生意見,完善智能系統的相關支持性功能,優化師生體驗,推動作文智能評改系統的持續優化升級。
作文智能評改系統可有效賦能作文高效、精細評改和增值評價。雖然當前智能系統尚未達到理想的要求,但是相比教師人工評改仍呈現出較大優勢,可以承擔教師作文評改助手的角色。語文教師應秉持開放、客觀、審慎的態度,積極嘗試運用作文智能評改系統改進作文教學,明確自身責任和價值,確立學生主體地位,積極尋求各方合作,敏銳地發現新問題,探索新策略,共同推動作文教學高質量發展。
參考文獻
[1][4]劉淑君,李艷,楊普光,等.智能作文評價的效果研究[J].開放教育研究,2021(3).
[2]中華人民共和國教育部.義務教育語文課程標準(2022年版)[S].北京:北京師范大學出版社,2022:47.
[3]汶莎莎,孫剛成.增值性評價:促進每一個學生可持續發展[J].上海教育科研,2022(3).
[5]張生,王雪,齊媛.評他能力:人工智能時代學生必備的高階思維能力[J].中國電化教育,2021(11).
[6]孫婧,楊子婷.人工智能時代教學評價改革的主要動因、基本原則與實踐路徑[J].課程·教材·教法,2024(5).
[7]UNESCO.AI Competency Framework for Teachers[EB/OL].(2024-08-08)[2025-02-02]https://unesdoc. unesco.org/ark:/48223/pf0000391104.
[8]徐繼存.數智化時代的教學隱憂與教學自覺[J].中國教育學刊,2025(1).
[9]黃顯涵,李子健.西方評價理念的轉型之路——兼談對中國課程改革的啟示[J].教育發展研究,2013(20).
[10]漢娜·阿倫特.人的境況[M].王寅麗,譯.上海:上海人民出版社,2021:141.