趙崇里 李利正

摘 要:文章介紹了基于語音識別和語音合成技術的商務英語移動學習平臺設計技術。闡述了平臺開發(fā)的背景,提出了平臺開發(fā)的技術路線、功能結構和關鍵技術,結合商務英語專業(yè)教師提供的教學資料,平臺在本校商務英語專業(yè)中測試通過,為學生利用課外零碎時間學習商務英語提供了方便和有效的工具,豐富了學生的學習資源。
關鍵詞:語音合成;語音識別;移動學習平臺
隨著全球化趨勢的發(fā)展,英語作為一種交流工具扮演著越來越重要的角色。商務英語是以適應職場生活的語言要求為目的一種專業(yè)性語言,需要掌握的核心技能包括口語交流和函件閱讀、撰寫。對于如何提高商務英語的學習效果和應用能力,已經(jīng)成為廣大英語教育工作者和從事外貿工作的職員所關注的重要問題。移動學習作為一種新型學習方式,能夠有效利用時空資源實現(xiàn)高效學習,正受到越來越多的關注。商務英語移動學習平臺不失為是一種幫助學習者提高商務英語學習效率的有效手段。目前市場上基于計算機的英語智能學習軟件很多,通過計算機輔助學習技術,系統(tǒng)的給出學習計劃,生成單詞發(fā)音、基于情境的對話,基于特征提取、模式匹配及時得到發(fā)音質量評分的智能化功能。然而受移動設備運算速度、存儲空間和總線帶寬等因素的限制,很難將此類軟件移植到手機平臺。因此,需要根據(jù)商務英語的特點,綜合利用Android設備的優(yōu)勢和Google TTS和百度語音識別技術的開源應用等各種先進技術,對商務英語移動學習平臺進行功能設計和軟件開發(fā)。文章對基于TTS、百度語音識別的商務英語移動學習軟件平臺的設計進行了研究,意在為廣大商務英語學習者、應用者提供一個不受時空限制的商務英語學習平臺。
1 語音技術
語音合成和語音識別技術是實現(xiàn)人機語音通信,建立具有聽和講功能的口語系統(tǒng)所必需的兩項關鍵技術[1]。
Text To Speech(簡稱TTS),從文本到語音所使用的關鍵技術就是語音合成技術,能將文字信息轉變?yōu)榭梢月牰摹⒘骼恼Z音輸出技術。早期的TTS一般采用專業(yè)的芯片實現(xiàn),在語音處理專家的努力下,目前已日益成熟,合成效果越來越接近于自然語境[2]。
語音識別(Speech Recognition),是通過計算機將人類語音信號轉換為文本序列的過程。語音識別技術主要包括特征提取技術、模式匹配準則及模型訓練技術三個方面[3],涉及信號處理、模式識別、概率論和信息論、發(fā)聲機理、聽覺機理、人工智能等領域,是一門非常復雜的交叉學科。
2 項目背景
利用隨身攜帶的移動設備安裝英語學習軟件就可以拋棄厚重資料、利用碎片時間學習英語。英語的移動學習軟件市場研究較早,應用也甚廣。這些移動學習軟件中,有些詞匯量龐大,像我愛背單詞、超級英語詞典等;有些教材比較系統(tǒng)和完整,無論處在哪個英語學習階段,都可以從新概念英語中找到相應的教材,并且功能豐富,幫助學習者很好地學習和記憶單詞或是英語語法;有些通過英文原聲電影寓教于樂形式輕松地記住一些日常單詞和口語的用法。這些軟件功能齊全,但是在商務英語教育、學習方面,缺少系統(tǒng)的編排。而現(xiàn)有的商務英文口語900句等軟件又缺少中英文互譯或者不支持發(fā)音功能。因此開發(fā)一個支持中英文互譯、又具備發(fā)音功能的免費簡易商務英語學習軟件是非常有意義的。
3 移動學習平臺功能分析及其設計
移動學習平臺的設計應考慮到移動學習所具有的四個特性,即:學習便捷性、知識導航性、情境相關性、交互便捷性[4]。針對以上特性,總結現(xiàn)有英語學習軟件的優(yōu)點,本平臺設計了商務情境,提供了商務情境下的學習內容。
3.1 技術路線
⑴平臺采用C/S架構,客戶端程序運行在Android移動設備上,服務器端程序運行在服務器上。
⑵客戶端與服務器端交互采用Http協(xié)議進行數(shù)據(jù)通信,服務器端在收到客戶端請求后,以XML文件格式發(fā)送數(shù)據(jù)到客戶端。
⑶數(shù)據(jù)存儲上采用本地數(shù)據(jù)和服務器數(shù)據(jù)兩者結合,既能提高數(shù)據(jù)存儲容量,又能加快軟件運行速度。
3.2 應用系統(tǒng)搭建
基于TTS和百度語音識別技術,構建應用系統(tǒng),如圖1所示。
⑴自學模塊:包括計劃學習和隨機學習兩種模式。計劃學習按系統(tǒng)編排進行商務單詞學習、商務短句學習、情境對話學習、商務函件學習等。隨機學習模式是根據(jù)學習者提交的知識范圍系統(tǒng)隨機抽取學習庫中文件進行學習。學習者開始學習后,平臺會在展示文本的同時根據(jù)學習者意愿播放語音,讓學習者跟讀。
⑵成績測試模塊:對自學模塊的單詞、短句、商務函件等模塊知識進行測試,并給出相應得分,幫學習者查漏補缺。
⑶中英文互譯:借助google translate和tts技術實現(xiàn)中英文互譯、朗讀。在學習者碰到生詞、僻詞可以進行中英文轉譯,并給出英文發(fā)音,讓學習者在記住單詞意思的同時,能正確發(fā)音。
4 關鍵技術
4.1 語音合成技術
TTS是Android從1.6版本開始支持的新功能,需要由TTS Engine的支持,系統(tǒng)默認的TTS引擎是Pico TTS,該引擎支持English、French、German、Italian和Spanish,但是不支持中文,因此本文引入第三方開源引擎eSpeak。
TTS提供了兩個接口和兩個類來實現(xiàn)語音合成功能,具體步驟如下:
⑴[5]通過新建Intent檢查移動設備是否安裝或缺少TTS語言數(shù)據(jù),并根據(jù)返回結果進行處理,若檢查成功創(chuàng)建一個TextToSpeech對象,若失敗則需要下載TTS數(shù)據(jù),關鍵代碼如下:
Public void onCreate(){
…
Intent intent = new Intent();
intent.setAction(TextToSpeech.Engine.ACTION_CHECK_TTS_DATA);
startActivityForResult(checkIntent,REQ_TTS_STATUS_CHECK);
…
}
protected void onActivityResult(int requestCode,int resultCode,Intent data){
…
Case TextToSpeech.Engine.CHECK_VOICE_DATA_PASS:
mTts = new TextToSpeech(this,this);
…
}
⑵當TTS引擎檢測到新生成TextToSpeech對象,就會調用OnInitListener接口中定義的回調函數(shù)onInit(),該函數(shù)里若檢測到TTS引擎初始化成功,用TTS的setLanguage()方法設置語言,speak()方法進行文語轉換。
4.2 語言識別技術
語音識別是以語音為研究對象,通過特征提取、模式識別技術讓設備聽懂人類發(fā)出的語言,并轉換為文本的一種高技術。目前語音識別的方法主要有隱馬爾科夫模型(HMM)、動態(tài)時間規(guī)整技術(DTW)、矢量量化(VQ)等[6],本文主要利用百度語音識別SDK提供的API接口實現(xiàn)人機口語交互。
百度語音識別API關鍵類是Voice Recognitiion Client,該類提供了speakFinish()、startVoiceRecognition()和stopVoiceRecognition()方法分別用來控制語音輸入結束、語音識別開始和語音識別結束。首先在主程序中實例化該類,在接收語音輸入前通過VoiceRecognitionConfig類設置識別類型,開啟語義解析,設置識別開始提示音、識別結束提示音和采樣率,并由VoiceRecognitionClient類的startVoiceRecognition方法發(fā)起語音識別,語音識別回調接口VoiceClientStatusChangeListener根據(jù)語音識別過程中不同的狀態(tài)做出不同的反饋,當檢測到VoiceRecognitionClient.CLIENT_STATUS_FINISH即語音識別完成,則通過UpdateRecognitionResult方法將識別內容顯示,本文是通過Android自帶的Google Translate進行中英文互譯。
5 結語
文章結合如何設計一個基于語音識別和語音合成技術的移動商務英語學習平臺,詳細闡明了平臺開發(fā)的解決方案及核心技術要點。該平臺已經(jīng)投入商務英語專業(yè)教師的教學活動當中,獲得了師生們的好評,他們一致認為該平臺為學生利用課外零碎時間學習提供了有力工具,豐富了學生的自主自我學習方式,也提高了教師教育教學的質量。
[參考文獻]
[1]胡延峰,程濤.寬帶增值服務——語音上網(wǎng)[J].有線電視技術,2004,165(21):58-60,33.
[2]邢敬宏,趙雙萍,劉軍.基于Web的TTS應用編程實現(xiàn)[J].甘肅科技,2007,23(3):78-80.
[3]張海峰,趙凱,陸倜.輕量級認證與授權研究綜述[J].計算機工程,2003,29(1):168-170,198.
[4]高毅,崔向平.淺析移動學習的特征及應用模式[J].絲綢之路,2009,169(24):104-106.
[5]Lauren Darcey,Shane Conder.Android移動開發(fā)一本就夠[M].北京:人民郵電出版社,2011.
[6]涂惠燕,陳一寧.基于語音識別和手機平臺的英語口語發(fā)音學習系統(tǒng)[J].計算機應用與軟件,2011,28(9):64-66,147.