劉曉羽
長期以來,因為缺乏母語環境,小學生英語表達能力相對較弱,啞巴英語的現象在一定范圍內仍然存在。為此,2018年9月至12月,南京市電化教育館、南京市教研室借助鳳凰智能英語語音訓練平臺,舉辦了南京市小學生“講故事—展風采”英語素養展示活動。本次活動全程使用線上微信小程序,搭載人工智能語音評分引擎,并遴選優秀教師研發語音訓練內容。在多方共同努力下,全市238213名學生參與其中,成功收集語音數據8177175條,不僅提升了南京市小學生的英語聽說能力,而且為南京市英語聽說學習的數據分析打下了基礎。
為了進一步鞏固此次活動的成效,擴大活動的影響力,促進南京市小學生英語表達能力的提升,南京市電化教育館與教研室從2019年起,逐年開發涵蓋英語聽說讀寫四個方面的數字化資源,與教育教學部門長期合作,開展常態化的英語語音訓練活動。
語音訓練平臺主要基于微信小程序,包含學生訓練、教師查詢和后臺管理、統計數據可視化服務三大功能模塊。為學生、教師、教育主管部門提供同步的數據分享服務以及學習過程性數據報告,使數據分析為英語學科教學服務真正落到實處。
平臺架構(如下頁圖1所示)采用公有云與私有云結合的方式部署,將微信小程序作為入口,將練習資源發布到公有云上,使用CDN加速,保障學生在大量用戶同時請求的情況下能夠正常訪問;將分析功能、數據存儲及備份放在私有云上,為將來的“人人通”空間數據共享做準備。

圖1 英語語音訓練平臺架構
語音引擎是整個平臺的關鍵。我們對多家公司的語音引擎進行測試,最后選擇了微軟亞洲研究院開發的語音引擎和語音合成技術。借助人工智能技術,語音訓練平臺能夠為教師節省更多的時間和精力,成為教師掌握學情的重要工具。
經過前期的招標、開發和測試,2020年10月,微信小程序“英語藍鯨靈”正式上線,該公益項目為南京市小學三至六年級近22萬學生提供在線英語語音訓練服務。在開通后的幾個月內,一共采集了3萬名學生的學習數據并進行數據分析,初步研究學生線上語音訓練的行為規律。
“英語藍鯨靈”微信小程序在南京市部分區試用,我們及時收集學生的訓練反饋意見。學生進入小程序后選擇訓練章節,系統會自動推送本單元的訓練內容,學生可以依次完成五種題型訓練,也可以隨時退出,以后再繼續練習。學生每完成一個訓練內容,系統會自動給出分數,也可以集中查看自己每個題型的練習成績。在整個訓練過程中,系統采集了大量的學生學習過程數據,比如:學生的登錄和退出時間、選擇了哪些學習內容、訓練后語音引擎給出的分數以及學生發音的錄音文件等。
隨著平臺使用人數的增加,我們對平臺使用情況做了統計。通過數據分析,市教研室對全市學生的學習規律和習慣有了初步了解。
以3萬名小學生作為樣本,并根據全市各年級學生使用“英語藍鯨靈”小程序人數的比例確定各年級樣本人數。同時確定樣本性別比例構成:其中男性7420人,女性22580人,男女比例約為1:3。樣本性別數據來源于微信小程序官方授權信息,雖然小程序的使用者是學生,但小學生大多是借用家長的手機及微信號,因此,該數據反映的主要是家長的性別構成。數據顯示,小學生的家庭中大多數是由母親負責督促和陪伴孩子進行英語語音學習。
我們選取2020年10月1日至12月6日這個時間段,統計單日內用戶在線學習平均時長分布,單用戶每日在線學習平均時長為387.98秒(約為6.5分鐘)。學生每日在線學習平均時長的高峰和低谷區反映學生的主要學習時段集中在16:30~20:30。以10月5日至10月25日這三周為研究周期,分析每周全體用戶在線學習時長的變化。第一周在線學習時長為參考值,第二周達到峰值,第三周回落。這些數據說明學生課后訓練英語口語和聽力的熱情會隨著時間的推移下降,需要我們及時引導或激勵。
為了研究學生在線學習的進度與學校教學進度之間的關系,我們抽取了200名學生首次學習各個單元的時間與教學進度的時間進行對比,發現大部分學生在最初使用“英語藍鯨靈”小程序的時候,訓練進度絕大部分滯后于教學進度,但也有部分學生嘗試訓練沒有學過的章節,這說明學生能夠根據自己的學習情況自行調節學習進度,進行預習、復習。基于此,教師要及時予以引導,同時鼓勵學生根據自己的需要進行個性化學習。
小學是學生英語學習的開始階段,也是英語發音形成特點的階段,如果學生在小學學習英語時就能進行系統訓練,對將來提高英語聽說能力很有幫助。正是基于這個原因,很多小學家長和教師都很重視語音發音訓練,對這個平臺的訓練效果也非常認可。英語語音訓練平臺的使用引發了教與學方式上的變革,讓人工智能語音引擎發揮了更大的作用。
教師通過后臺分析,了解學生的訓練進度和訓練情況,以及他們的口語和聽力水平。教師可以把分數較低的學生作為重點輔導和訓練對象,因材施教。從采樣數據的分析看,學生英語口語發音的準確性和得分率確實隨著訓練時長的增加在進步。由于采用了人工智能語音引擎去完成訓練評分,高質量的訓練資源由教研室統一制作,減輕了教師的工作量,提高了工作效率,也讓教師的教學方式發生了變化。
以前學生的口語訓練主要是通過課堂朗讀和課后背誦來實現,通過磁帶和光盤來鍛煉口語和聽力,訓練效果無法及時反饋。而使用訓練平臺后,語音引擎會根據評分標準進行評分,學生能夠立刻看到自己的訓練分數,系統還能分別用綠色和紅色標記凸顯發音好和不好的單詞,讓學生能夠更直觀地發現問題。學生也可以回放自己的發音,與標準的發音進行比對。同時,學生也能看到同班同學的訓練情況,內心的競爭意識會促使他們更好地訓練。
南京市教研室每學期組織南京市優秀名師,根據教學進度、學生年齡和學段特點制作訓練資源。目前支持題型包含:聽力選文本、聽力選聽力、跟讀、復述、情景問答。為了保證資源的質量和權威性,教研室還專門請專業教材配音人員錄制聽力內容,統一繪制插圖,使資源從題目質量到制作質量都達到了教材級別。根據學生訓練數據對資源內容和難度進行調整,隨著資源不斷積累和增加,逐漸形成一個完整的語音訓練資源庫。每年舉辦的“講故事—展風采”活動也不斷為平臺添加課外讀本和繪本等聽說訓練資源,讓學有余力的學生有更多選擇。
后臺數據統計內容包含:學生訓練的題量、完成度、總分數,聽力時長,口語時長,學習總時長,訓練單詞量,語音完成度,發音準確度,發音流利度,語速,課標知識點分布數據等。隨著學生訓練時間的累積,采集的數據量越來越多,通過數據分析,可以更科學地為學生提出訓練建議,也為教師提供了教學參考。
很多事情只有長期堅持,才會形成習慣,英語學習亦是如此。任課教師每天查看數據統計結果,對沒有堅持下來的學生及時督促和提醒,有利于學生良好學習習慣的養成。
接下來,我們將在平臺功能和學習資源上進行開發和升級。通過對學生學習過程數據的分析和挖掘,發現有價值的規律和結果,進一步提升英語教學的效率。英語作文的自動批改已經能夠幫助學生檢查出語法和單詞上的錯誤,并且可以根據句子的意思推薦更恰當的表達方式,有利于學生提高寫作水平。目前的語音識別很多還停留在“speech-to-text”的階段,需要繼續向“speech-to-meaning”的階段發展。語意識別仍是技術難點,很多研究機構正在進行研究,現在的技術解決的是計算機“聽得見”的問題,而在未來“聽得懂”才是需要解決的最為關鍵的問題。自然語言處理的進展還沒有找到理想的突破口,若想要達到人類的理解層次,還需要走很長的路。
運用新技術的進步,不斷完善英語語音訓練平臺,并且在平臺現有功能的基礎上開發學習工具、分析工具以及習慣培養模型,通過規律性和科學性的訓練,讓學生能夠對自己的學習情況有更直觀的了解和更好的規劃,這對學生形成良好的學習習慣起到促進作用。通過這些年的研究發現,好的學習習慣和科學的記憶方法是學生學習效率高和成績好的重要因素,通過合適的工具和方法引導學生養成良好的學習習慣是我們對這個平臺寄予的希望。