蘆展華 喻瑩 莊甲鵬 楊佳泰 鄭世玨



關(guān)鍵詞:高校思政課;高校虛擬教師;語音識(shí)別及合成;答疑數(shù)據(jù)庫;小雅智能助教平臺(tái)
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2023)12-0105-04
0 引言
高校思政課是我國落實(shí)立德樹人根本任務(wù)的關(guān)鍵課程,是為國育人、為黨育才的關(guān)鍵步驟[1]。2016年習(xí)近平總書記在全國高校思想政治工作會(huì)議上明確指出:“要運(yùn)用新媒體新技術(shù)使工作活起來,推動(dòng)思想政治工作將傳統(tǒng)優(yōu)勢(shì)同信息技術(shù)高度融合,增強(qiáng)時(shí)代感和吸引力?!盵2]
新媒體以數(shù)字化為主要特征,呈現(xiàn)出及時(shí)性、互動(dòng)性、共享性等特點(diǎn),高校思政課程具有內(nèi)容廣泛、理論深刻的特征,因此,借助人工智能的相關(guān)技術(shù)為高校學(xué)生的思想政治教育賦能是一項(xiàng)極佳的選擇。2021年北京理工大學(xué)在VR+思政課領(lǐng)域率先建成大規(guī)模沉浸式虛擬仿真思政課體驗(yàn)教學(xué)中心[3]。在美國加利福尼亞大學(xué),JOHNSON W L和SHAW E研發(fā)了虛擬教學(xué)代理Adele,并成功應(yīng)用于教授醫(yī)學(xué)專業(yè)外傷及腫瘤課程。針對(duì)教學(xué)問答輔助系統(tǒng)的發(fā)展現(xiàn)狀,中南財(cái)經(jīng)政法大學(xué)的陳宇對(duì)實(shí)際課堂中獲取的數(shù)據(jù)進(jìn)行分析處理,為學(xué)生提供了問答檢索的服務(wù),驗(yàn)證了問答形式對(duì)于教學(xué)的輔助效果[4]。
針對(duì)高校學(xué)生對(duì)思政課程的問題與建議,筆者進(jìn)行了走訪調(diào)查,了解到主要問題如下:高校思政課程內(nèi)容與中學(xué)所學(xué)部分重復(fù)度較高,思政課大班教學(xué)的模式限制師生交流互動(dòng),學(xué)生學(xué)習(xí)方法缺乏靈活性。為解決以上問題,高校思政課需要引入新技術(shù)、新模式、新方法,故如何設(shè)計(jì)出高藝術(shù)性與高吸引力的智慧課堂成為高校教師積極探索的熱點(diǎn)。
對(duì)于上述現(xiàn)狀,本文嘗試將高校思政課程引入智慧課堂新模式,借助語音識(shí)別及合成技術(shù),搭載科大訊飛API實(shí)現(xiàn)語音交互,通過構(gòu)建虛擬教師形象,在原有小雅智能助教平臺(tái)的基礎(chǔ)上,設(shè)計(jì)高校思政虛擬教師答疑數(shù)據(jù)庫,實(shí)現(xiàn)了高校思政虛擬教師答疑系統(tǒng),改變傳統(tǒng)的人機(jī)交互模式,增強(qiáng)高校思政課程的趣味性及靈活性,提高學(xué)生對(duì)思政教育的熱情和興趣,打破傳統(tǒng)模式下師生交流的時(shí)空壁壘,充分發(fā)揮高校學(xué)生在思政教育中的主體地位。
1 系統(tǒng)的相關(guān)技術(shù)
1.1 小雅智能助教平臺(tái)
小雅平臺(tái)是由教育大數(shù)據(jù)應(yīng)用技術(shù)國家工程研究中心和華中師范大學(xué)共同研發(fā)的云端一體化智能教育SPOC 平臺(tái),如圖1所示,該平臺(tái)構(gòu)建了智能問答、知識(shí)圖譜等多個(gè)智能模塊,支持伴隨式采集教學(xué)數(shù)據(jù)和數(shù)據(jù)驅(qū)動(dòng)分析。目前小雅平臺(tái)已完成在華中師范大學(xué)、武漢理工大學(xué)等多個(gè)高校的部署,用戶人數(shù)持續(xù)上升,開設(shè)課程4.5萬余門,涵蓋校內(nèi)各類教育資源220萬余個(gè)。小雅平臺(tái)作為連接師生的智能終端,支持多種教學(xué)模式,學(xué)生可以借助平臺(tái)隨時(shí)隨地對(duì)課程內(nèi)容進(jìn)行學(xué)習(xí),教師可以通過平臺(tái)布置課程任務(wù)、分派小組學(xué)習(xí)等。根據(jù)學(xué)生的學(xué)習(xí)情況,小雅平臺(tái)將學(xué)生的學(xué)情進(jìn)行數(shù)字化分析并加以可視化呈現(xiàn),助力學(xué)生查漏補(bǔ)缺,加強(qiáng)對(duì)知識(shí)體系的掌握,同時(shí)幫助教師實(shí)施精準(zhǔn)化差異教學(xué)。本文以小雅平臺(tái)作為研究載體,用新媒體技術(shù)提高虛擬課堂的輔助教學(xué)效果,讓高校思政教育更加智能、便捷。
1.2 語音識(shí)別及語音合成方法
本文研究主要涉及智能語音技術(shù)中的自動(dòng)語音識(shí)別技術(shù)(ASR,Automatic Speech? Recognition) 和語音合成技術(shù)(TTS,Text To Speech) :語音識(shí)別技術(shù)主要用于實(shí)現(xiàn)讓計(jì)算機(jī)“聽懂”人類發(fā)出的聲音,即將人的音頻轉(zhuǎn)換為文本信息的技術(shù);語音合成技術(shù)主要用于實(shí)現(xiàn)讓計(jì)算機(jī)像人類一樣“會(huì)說”,即通過機(jī)械的、電子的方法將文本信息轉(zhuǎn)換為人造語音的技術(shù)。借助語音識(shí)別及語音合成技術(shù),使得虛擬教師和高校學(xué)生之間的人機(jī)交互更加簡(jiǎn)明快捷,智能語音交互系統(tǒng)結(jié)構(gòu)圖如圖2所示。
科大訊飛提供了智能語音開發(fā)技術(shù)的應(yīng)用程序編程接口(API,Application Programming Interface)。本文將采用科大訊飛API作為語音識(shí)別及語音合成的技術(shù)支持,將其API直接嵌入整體系統(tǒng)中,當(dāng)用戶使用高校思政虛擬教師系統(tǒng)進(jìn)行語音提問時(shí),通過網(wǎng)絡(luò)直接訪問科大訊飛平臺(tái),調(diào)用其語音識(shí)別API,將轉(zhuǎn)換后的文本信息返回傳遞給系統(tǒng);在系統(tǒng)查詢得到正確的回答對(duì)話后,再次通過網(wǎng)絡(luò)訪問科大訊飛平臺(tái),調(diào)用其語音合成API,將回答對(duì)話的文本信息轉(zhuǎn)換為音頻信息。通過調(diào)用科大訊飛API,極大地簡(jiǎn)化了虛擬教師答疑系統(tǒng)的搭建過程,提高系統(tǒng)整體語音技術(shù)的響應(yīng)速度。
1.3 Okapi BM25算法
系統(tǒng)在數(shù)據(jù)庫中匹配學(xué)生問題的正確率是影響系統(tǒng)使用效果的關(guān)鍵因素,匹配正確率的高低將直接影響系統(tǒng)為學(xué)生解答的有效性及幫助程度。因此,本系統(tǒng)采用BM25(Best Matching 25) 算法進(jìn)行學(xué)生問題和數(shù)據(jù)庫問答表中問題的匹配。BM25算法多用于搜索相關(guān)性的評(píng)分,系統(tǒng)使用BM25算法將語音識(shí)別得到的問題文本與答疑數(shù)據(jù)庫中的問題文本進(jìn)行相關(guān)性評(píng)分,并將得分高于某一預(yù)設(shè)值的問題視為用戶提問的問題,調(diào)出其預(yù)先存儲(chǔ)的答案文本,從而實(shí)現(xiàn)系統(tǒng)在答疑數(shù)據(jù)庫中的一次查詢。
2 系統(tǒng)總體設(shè)計(jì)
2.1 系統(tǒng)總體框架設(shè)計(jì)
本系統(tǒng)總體架構(gòu)層次設(shè)計(jì)如圖3所示:客戶端層用于獲取用戶信息,互聯(lián)網(wǎng)層用于提供網(wǎng)絡(luò)信息。虛擬教師系統(tǒng)依托于華中師范大學(xué)小雅平臺(tái),其內(nèi)部共分為四個(gè)層次,分別為前臺(tái)界面層、核心計(jì)算處理層、數(shù)據(jù)管理層和系統(tǒng)信息安全層。其中的數(shù)據(jù)管理層用于存放各類資源和數(shù)據(jù),同時(shí)也是對(duì)前臺(tái)用戶提交的請(qǐng)求進(jìn)行響應(yīng)的區(qū)域,是本文的研究重點(diǎn)。
數(shù)據(jù)管理層可以細(xì)分為四個(gè)子層:系統(tǒng)數(shù)據(jù)管理子層用于存儲(chǔ)系統(tǒng)自身相關(guān)數(shù)據(jù),如系統(tǒng)軟件數(shù)據(jù)等;資源管理子層用于將各種資源(原始資源、處理后的資源)和數(shù)據(jù)等存放在既定的邏輯區(qū)域中,以便更好地對(duì)各種資源進(jìn)行管理;問答數(shù)據(jù)管理子層負(fù)責(zé)整合并存放所有的問題及其對(duì)應(yīng)的答案,以便后續(xù)更好地查詢題目;個(gè)人數(shù)據(jù)管理子層存放著學(xué)生的個(gè)人基本信息等與學(xué)生有關(guān)的數(shù)據(jù)[7]。
2.2 答疑數(shù)據(jù)庫設(shè)計(jì)
MySQL是一種關(guān)系型數(shù)據(jù)庫管理系統(tǒng),其管理的數(shù)據(jù)庫將數(shù)據(jù)保存在不同的表中,從而增加了速度并提高了靈活性[8]。本文將使用MySQL作為系統(tǒng)后臺(tái)數(shù)據(jù)庫的管理系統(tǒng),用于存儲(chǔ)大量有關(guān)虛擬教師思政課知識(shí)問答對(duì)話等信息,借助MySQL查詢速度快、支持多線程等特點(diǎn),提高系統(tǒng)的整體性能。
在本文設(shè)計(jì)的系統(tǒng)中,建立答疑數(shù)據(jù)庫是搭建整個(gè)系統(tǒng)的重要環(huán)節(jié)。系統(tǒng)對(duì)學(xué)生幫助的程度及有效性,取決于系統(tǒng)的答疑數(shù)據(jù)庫。數(shù)據(jù)庫中的信息越完善,越能真實(shí)復(fù)現(xiàn)教師的思維過程、解題方法等,進(jìn)而答疑系統(tǒng)的輔助教學(xué)效果越強(qiáng)[9]。
本文整體以高校思政課程知識(shí)答疑為背景,故系統(tǒng)答疑數(shù)據(jù)庫主要針對(duì)高校大學(xué)生思政課程學(xué)習(xí)內(nèi)容等方面的情況進(jìn)行數(shù)據(jù)庫的設(shè)計(jì)及構(gòu)造。在建立答疑數(shù)據(jù)庫之前進(jìn)行相關(guān)調(diào)研活動(dòng),并整合歸納出對(duì)應(yīng)數(shù)據(jù)模型,設(shè)計(jì)出如圖4所示系統(tǒng)E-R圖。
2.3 答疑數(shù)據(jù)庫的建立及系統(tǒng)設(shè)計(jì)
系統(tǒng)答疑功能主要借助答疑數(shù)據(jù)庫實(shí)現(xiàn),而在答疑數(shù)據(jù)庫構(gòu)造前,需要先構(gòu)建知識(shí)庫。知識(shí)庫是用于知識(shí)管理的一種特殊數(shù)據(jù)庫,能夠?qū)ο嚓P(guān)知識(shí)進(jìn)行有效整合與轉(zhuǎn)化,使知識(shí)在答疑數(shù)據(jù)庫內(nèi)部進(jìn)行傳遞和應(yīng)用。系統(tǒng)想要很好地實(shí)現(xiàn)答疑功能,就要兼具以下兩個(gè)功能:①作為知識(shí)的來源;②作為衡量學(xué)生知識(shí)掌握情況的一個(gè)標(biāo)準(zhǔn)。因此,采用有效而統(tǒng)一的結(jié)構(gòu)來組織存儲(chǔ)知識(shí)、較為完整地表示知識(shí)內(nèi)容,是答疑數(shù)據(jù)庫結(jié)構(gòu)合理、有效性強(qiáng)、覆蓋知識(shí)面廣的前提條件。根據(jù)分析,本文在建立答疑數(shù)據(jù)庫前先建立如圖5所示的知識(shí)庫,系統(tǒng)將使用專家模塊的知識(shí)響應(yīng)學(xué)生行為,并生成相關(guān)問題分析。
本文答疑數(shù)據(jù)庫主要針對(duì)高校大學(xué)生對(duì)于思政課程存在的問題進(jìn)行數(shù)據(jù)庫的設(shè)計(jì)與構(gòu)造。通過走訪等相關(guān)調(diào)研活動(dòng),設(shè)計(jì)出高校思政課虛擬教師答疑系統(tǒng)的E-R 圖。故系統(tǒng)整體建立一個(gè)數(shù)據(jù)庫VRTeacher,該數(shù)據(jù)庫中包含如下幾個(gè)表:學(xué)生信息表、學(xué)生行為表、學(xué)生成績(jī)表、學(xué)習(xí)記錄表、課程表、知識(shí)點(diǎn)表、常用對(duì)話表、問答題表、使用記錄表?;趯?duì)E-R關(guān)系圖的分析,轉(zhuǎn)化出如下幾個(gè)關(guān)系模式:
學(xué)生信息(學(xué)號(hào)、真實(shí)姓名、密碼、用戶、專業(yè)、年級(jí))
學(xué)生行為記錄(學(xué)號(hào)、登錄時(shí)間、登錄次數(shù)、累積登錄時(shí)長(zhǎng))
學(xué)生成績(jī)(學(xué)號(hào)、試卷編號(hào)、試卷得分)
課程學(xué)習(xí)記錄(學(xué)號(hào)、當(dāng)前學(xué)習(xí)知識(shí)點(diǎn)、已學(xué)習(xí)且通過測(cè)試的知識(shí)點(diǎn))
知識(shí)點(diǎn)信息(知識(shí)點(diǎn)序號(hào)、知識(shí)點(diǎn)主題、知識(shí)點(diǎn)關(guān)鍵詞、知識(shí)點(diǎn)內(nèi)容、知識(shí)點(diǎn)難度、所屬課程)
常用對(duì)話(對(duì)話編號(hào)、對(duì)話內(nèi)容、使用次數(shù)、對(duì)話關(guān)鍵詞)
課程(課程編號(hào)、課程名稱、課程難度)
課程問題(課程名稱、創(chuàng)建者、創(chuàng)建時(shí)間)
答疑問題(問題編號(hào)、問題內(nèi)容、問題答案、關(guān)鍵詞、所屬課程編號(hào)、難度、使用次數(shù)、知識(shí)點(diǎn)編號(hào)、問題分析)
如圖6所示是問答題表中的兩條記錄示例,其中:Qno指問題編號(hào),Que指問題內(nèi)容,Ans指問題答案,KeyWord指關(guān)鍵詞,ClassNo指所屬課程編號(hào),Deg指難度,F(xiàn)re指問題使用次數(shù),KnoNo指知識(shí)點(diǎn)編號(hào),Anyl 指問題分析。其他表單以此類推,不再一一列舉。
2.4 語音調(diào)用及實(shí)現(xiàn)
本文人機(jī)交互多基于語音交互實(shí)現(xiàn),系統(tǒng)的語音調(diào)用及實(shí)現(xiàn)過程歸納如圖7所示:
1) 語音識(shí)別
系統(tǒng)通過麥克風(fēng)采集用戶提問的音頻;計(jì)算機(jī)對(duì)音頻信息進(jìn)行A/D轉(zhuǎn)換等預(yù)處理;之后對(duì)采集的音頻進(jìn)行語音信號(hào)特征的抓取,提取出反映語音特征的矢量序列;對(duì)提取到的矢量序列進(jìn)行模式匹配,把輸入的語音特征同模板庫中的模型進(jìn)行匹配,將最佳匹配對(duì)象作為識(shí)別結(jié)果,得到最終的文本信息[10]。
對(duì)于語音識(shí)別功能模塊,我們選擇調(diào)用科大訊飛的接口,獲取所需應(yīng)用的Appid 及secretkey,通過在demo.js中的play函數(shù)傳遞所獲得的信息取得與科大訊飛平臺(tái)的對(duì)接[11]。調(diào)用函數(shù)onResults(ArrayList results, Boolean isLast)獲取識(shí)別后的結(jié)果,其中,ArrayList 是語音識(shí)別后的結(jié)果,isLast 是用于判斷識(shí)別的文本是否讀完的標(biāo)志變量。麥克風(fēng)采集音頻信息后,將得到的參數(shù)通過網(wǎng)絡(luò)傳到語音API分析器中,并將返回的結(jié)果放入result的臨時(shí)變量中,同時(shí)將結(jié)果做相應(yīng)的正則表達(dá)式處理得到最終的分析結(jié)果。
2) 問題匹配
當(dāng)系統(tǒng)API識(shí)別成功后,將轉(zhuǎn)換后的文本傳至虛擬教師系統(tǒng)。系統(tǒng)將獲取到的問題文本與答疑數(shù)據(jù)庫中的問答表中的問題一一借助BM25算法進(jìn)行相關(guān)性評(píng)分,將得分最高的問題作為用戶提出的問題,將其答案返回給系統(tǒng)。
3) 語音合成
系統(tǒng)對(duì)于獲得的答案文本,首先對(duì)其進(jìn)行文本分析,將文本分析得到的參數(shù)用于實(shí)現(xiàn)韻律控制;從基元庫挑選出一個(gè)最符合當(dāng)前韻律要求的候選基元,將其及分析得到的韻律與文本相結(jié)合,進(jìn)行語音合成。
3 系統(tǒng)使用流程
基于系統(tǒng)的整體設(shè)計(jì),將高校思政課虛擬教師答疑系統(tǒng)使用流程歸納如下:用戶通過瀏覽器進(jìn)入Web 端小雅智能助教平臺(tái)或通過手機(jī)、平板等個(gè)人終端設(shè)備進(jìn)入小雅App;用戶登錄自己的賬號(hào)進(jìn)入平臺(tái),若為首次使用,則需要先進(jìn)行賬號(hào)注冊(cè);在首頁,用戶可以搜索或點(diǎn)擊進(jìn)入需要提問的課程;點(diǎn)擊頁面上“虛擬教師答疑”按鈕進(jìn)入高校思政課虛擬教師答疑系統(tǒng);用戶點(diǎn)擊“開始提問”按鈕并對(duì)問題進(jìn)行表述;等待片刻,即可聽到虛擬教師對(duì)于問題的解答。系統(tǒng)使用流程圖如圖8所示。在系統(tǒng)的使用過程中,用戶需確保良好的網(wǎng)絡(luò)環(huán)境,并擁有麥克風(fēng)及揚(yáng)聲器等設(shè)備。
4 系統(tǒng)測(cè)試
在系統(tǒng)整體實(shí)現(xiàn)后,筆者對(duì)各個(gè)功能模塊都進(jìn)行了測(cè)試。測(cè)試結(jié)果如下:首先,分別在Web端及An?droid端對(duì)小雅平臺(tái)進(jìn)行了測(cè)試,經(jīng)十組測(cè)試,用戶均可成功進(jìn)入小雅平臺(tái)并轉(zhuǎn)入高校思政虛擬教師答疑系統(tǒng)。之后,在某一特定條件下(帶寬10Mbps,較標(biāo)準(zhǔn)普通話,音量高于45dB,輸入語音長(zhǎng)度為2.5~4.5s,噪音低于25dB) 測(cè)試了本系統(tǒng)的語音識(shí)別和回答響應(yīng)時(shí)間。測(cè)試結(jié)果如圖9所示:共進(jìn)行十組實(shí)驗(yàn),橫坐標(biāo)表示實(shí)驗(yàn)組數(shù)(單位:組),縱坐標(biāo)表示實(shí)驗(yàn)測(cè)試所得時(shí)間(單位:秒)。由十組測(cè)試數(shù)據(jù)計(jì)算可得,系統(tǒng)平均語音識(shí)別時(shí)間為0.84687s,平均響應(yīng)時(shí)間為1.55293s。
最后,對(duì)答疑數(shù)據(jù)庫的匹配效果進(jìn)行測(cè)試,從三個(gè)渠道(高校教師提供、高校學(xué)生提問、網(wǎng)絡(luò)隨機(jī)查詢)隨機(jī)選取了共計(jì)200道思政題目,經(jīng)測(cè)試,系統(tǒng)對(duì)這些題目的匹配正確度可達(dá)96%。綜合以上測(cè)試,系統(tǒng)及答疑數(shù)據(jù)庫設(shè)計(jì)基本符合預(yù)期效果。
5 結(jié)束語
隨著科技的進(jìn)步及教學(xué)需求多樣化的發(fā)展趨勢(shì),如何使用現(xiàn)代科學(xué)技術(shù)助力教育發(fā)展是一個(gè)值得研究的問題。本文采用科大訊飛的語音交互技術(shù),依托于小雅智能助教平臺(tái),在前期調(diào)研的基礎(chǔ)上設(shè)計(jì)并構(gòu)造高校思政課程虛擬教師答疑對(duì)話數(shù)據(jù)庫,最終實(shí)現(xiàn)了高校思政課虛擬教師答疑系統(tǒng),借助互聯(lián)網(wǎng)+教育調(diào)動(dòng)高校學(xué)生學(xué)習(xí)思政課程的熱情,助力高校學(xué)生思想政治教育“活”起來。