溫玉華



摘? 要: 為了提高英語發音錯誤自動校正系統的校正準確度,提出基于DTW算法的英語發音錯誤自動校正系統設計。依托語音識別傳感器優化設計和發音識別處理器改進設計,完成系統的硬件設計;基于英語發音采集程序設計和提取英語發音錯誤信號參數,完成系統的軟件設計。在DTW算法基礎上,實現了英語發音錯誤自動校正系統設計。測試結果表明,基于DTW算法的英語發音錯誤自動校正系統相比于傳統校正系統,英語發音校正的準確率提升了36.53%。
關鍵詞: 自動校正; 英語發音; 系統設計; DTW算法; 程序設計; 系統測試
中圖分類號: TN912.34?34? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼: A? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)10?0124?03
Design of DTW algorithm based automatic correction system for
English pronunciation mistakes
WEN Yuhua
(Inner Mongolia Agricultural University, Hohhot 010019, China)
Abstract: A design of DTW algorithm based automatic correction system for English pronunciation mistakes is proposed to improve the calibration accuracy of the automatic correction system for English pronunciation mistakes. The hardware design of the system is completed based on the optimized design of speech recognition sensor and the improved design of pronunciation recognition processor. The software design of the system is completed based on the design of English pronunciation collection program and the extraction of English pronunciation mistake signal parameters. The design of automatic correction system for English pronunciation errors is realized based on DTW algorithm. The testing results show that the English pronunciation correction accuracy of the DTW algorithm based automatic correction system for English pronunciation mistake is 36.53% higher than that of the traditional correction system.
Keywords: automatic correction; English pronunciation; system design; DTW algorithm; program design; system testing
隨著對計算機語音識別系統需求的提高,發音錯誤自動校正系統的研究也越來越受到人們的重視[1?3]。針對傳統英語發音錯誤自動校正系統存在的其他數據信息干擾、多種語音混淆、雜音無法徹底消除、語音識別混亂等問題,本文將DTW算法應用到英語發音錯誤自動校正系統設計中對英語發音進行在線語音識別,將一些常用詞匯語音識別應用在特定的環境中,解決人們生活中的難題。
1? 英語發音錯誤自動校正系統硬件設計
1.1? 語音識別傳感器優化設計
語音識別傳感器是利用二極管完成語音識別,將英語發音轉換成數字信號。目前應用最廣泛的語音識別傳感器是CMOS傳感器和CCD傳感器。CMOS傳感器中每一個二級管都會連接一個識別器和轉換電路,采用類似內存電路的方式將識別到的英語發音輸出[4];而CCD傳感器優化了CMOS傳感器的內部結構,只有一個識別器[5],每一個二極管的英語發音數據都會一次傳到下一個單元中,經傳感器最底端的部分整合后輸出,最后經過傳感器末端的識別器,識別成功后輸出[6]。
1.2? 發音識別處理器改進設計
本文發音識別處理器在原優化基礎上進行改進設計,根據DTW算法完成英語發音的分析與識別,它強調的是英語語音處理的實時性。因此發音識別處理器除了具有普通處理器的控制功能和高速運算外,還針對實時英語發音處理的要求,改進了處理器機構、指令系統和流程,提高了校正的準確度[7]。DSP芯片的選擇對發音識別處理器的改進設計也非常重要,不僅關系到英語發音的處理速度,還牽涉到處理器的改進難度和進程。
發音識別處理器的改進要考慮芯片的處理速度和識別精度,對于一個自動英語發音系統來講,發音識別的處理速度是最重要的,必須要求處理器在限定的時間內完成相應的處理任務,否則就很難保證英語發音處理的實時性。發音識別處理器在設計時,根據DTW算法以及處理的時間要求來決定處理器芯片的識別速度。一般情況下,浮點DSP芯片的英語發音識別精度要高于定點DSP芯片的英語發音識別精度,在英語發音錯誤自動校正方面具有較高的校正準確率[8]。處理器芯片的內部結構圖如圖1所示。
基于英語發音錯誤自動校正的處理器芯片主要針對數據處理速度快、硬件資源廣的特點,選擇滿足英語發音數據處理的處理器芯片。英語發音錯誤自動校正系統的大量運算就是英語發音錯誤的數據處理,因此考慮處理速度因素后,決定選擇TDSP?TF887作為處理器芯片的選擇方案[9]。發音識別處理器架構是基于最佳代碼密度而設計的一種混合16/32位指令級架構,這種架構適合于復雜英語發音錯誤數據的處理能力,可以提高英語發音錯誤自動校正的準確率。
以上針對原始語音識別傳感器的缺點,優化設計了傳感器的內部結構,完成了語音識別傳感器的優化設計;又結合英語語音實時處理的要求,選擇合適的處理器芯片,加快識別的速度和精度,完成發音識別處理的改進設計,從而實現了系統的硬件設計。
2? 英語發音錯誤自動校正系統軟件設計
2.1? 英語發音采集程序設計
英語發音錯誤信號采集是英語發音錯誤自動矯正系統的第一個過程,該采集程序可以自動搜索出發音錯誤的語音信號,不僅提高了英語發音錯誤的校正效率,還提高了校正的精準度。如果程序中沒有語音設備,系統就會顯示參數錯誤[10]。所以在程序運行前安裝語音設備在安裝語音設備的基礎上,將英語發音錯誤信號參數初始化,確保接收到的英語發音是系統支持的格式。為識別到的英語發音緩沖區分配儲存空間,開始計算錯誤信號參數,最后停止信號采集[11?12]。英語發音采集程序運行流程如圖2所示。
2.2? 提取英語發音錯誤信號參數
如何提取發音錯誤信號,以及提取的參數內容,都會影響系統的校正準確度[13]。提取英語發音錯誤信號參數得到有價值的英語發音錯誤信息,從而可以確保校正的準確度。具體提取步驟如下:
1) 首先將采集到的英語發音錯誤信號進行預加重、分幀、加窗處理,其中英語發音錯誤信號的采樣點數為256,之后對其進行傅里葉變換得到錯誤信號的頻譜。
2) 求英語發音錯誤信號的功率譜。
3) 將求得的功率譜進行梅爾濾波器運算,得到一個運算結果,將結果取對數得到一個對數頻譜。
4) 將得到的對數頻譜進行由時域到頻域的變化,用于錯誤信號的離散余弦變換[14],公式如下:
[Cn=Smcosπnm+0.5M] (1)
式中:[Sm]表示對數頻譜;[cosπnm+0.5M]為錯誤信號的離散余弦變換。
5) 將每一幀發音錯誤信號都采用上述特征提取,得到一個最有價值的英語發音錯誤信號。
英語發音錯誤信號的提取可以通過計算錯誤信號的功率譜,實現英語發音錯誤的自動校正,降低計算復雜程度的同時,也提高了英語發音錯誤的校正準確率[15]。綜上所述,依托語音識別傳感器優化設計和發音識別處理器改進設計,完成了系統的硬件設計;基于英語發音采集程序設計和提取英語發音錯誤信號參數,完成了系統的軟件設計,在DTW算法基礎上,實現了英語發音錯誤自動校正系統設計。
3? 系統測試
3.1? 設定實驗參數
為了驗證基于DTW算法的英語發音錯誤自動校正系統對英語發音錯誤校正的準確度,選擇牛津大學出版社的英語詞典,里面包含23 156個詞語,包括32篇英語發音適讀文章和18篇測試資料。設置如下參數:英語發音的振動音頻在[-100,100]之間;衡量英語發音的有效參數[wn=11]為8.5;[max X]的極限值分別為3.2,3.6,4.0,4.2。
3.2? 構建英語發音數據庫
英語發音數據庫是校正系統的輸入內容,包括標準發音數據庫、詞典數據庫和待測語音庫。詞典數據庫采用BEEP數據庫,將英語發音數據庫設置成開放式,所有人均可提交英語發音內容并擴展。
為了評價基于DTW算法的英語發音錯誤自動校正系統的校正準確度,引入準確率和召回率來衡量英語發音錯誤自動校正的準確度,準確率和召回率公式如下:
[準確率=查找出真正錯誤的個數查找到英語發音錯誤總數×100%]? (2)
[召回率=查找出真正錯誤的個數待校正英語發音中的錯誤個數×100%] (3)
3.3? 實驗結果
利用上述指標,在英語發音數據庫中完成系統測試實驗,結果如圖3所示。從圖3可以看出,傳統校正系統對英語發音錯誤的校正準確率和召回率都很低,英語發音錯誤自動校正的準確率最高只有62.6%,10次測試結果中,英語發音錯誤自動校正準確率的平均值為59.02%;而采用基于DTW算法的英語發音錯誤自動校正系統對英語發音錯誤的校正準確率和召回率基本上都超過了90%,準確率最高達到了96.3%,10次測試結果中,英語發音錯誤自動校正準確率的平均值為92.99%。因此,可以得出基于DTW算法的英語發音錯誤自動校正系統可以提高英語發音錯誤校正的準確度。
4? 結? 語
本文提出基于DTW算法的英語發音錯誤自動校正系統設計。在完成硬件設計和軟件設計后,實現了基于DTW算法的校正系統設計。測試結果表明,該系統相比于傳統校正系統英語發音校正的準確率提升了36.53%。
參考文獻
[1] 王興剛.英文發音中錯誤語音自動識別系統設計[J].現代電子技術,2018,41(10):179?182.
[2] 李春蘭.英語口語自動發音校對系統設計[J].現代電子技術,2017,40(24):59?61.
[3] 趙丹,鐘楠.在線連續交互式英語語音智能識別系統設計[J].現代電子技術,2017,40(15):137?140.
[4] 田林,盛風濤,黃天姿.基于4?氨基吖啶酮小分子傳感器的設計、合成及識別性能研究[J].化學試劑,2017,39(4):405?408.
[5] 李林,魏新華,毛罕平.冬油菜田雜草探測光譜傳感器設計與應用[J].農業工程學報,2017,33(18):127?133.
[6] 李智,滕科嘉,李銳華.液氧煤油發動機地面試驗低溫壓力傳感器校準系統設計[J].低溫工程,2017,11(6):56?62.
[7] 李功麗,戴紫彬.基于流體系架構的分組密碼處理器設計[J].計算機研究與發展,2017,54(12):2824?2833.
[8] 王旭,付家為,何虎.混合架構通用數字信號處理器設計[J].計算機工程與設計,2017,38(1):70?74.
[9] 陳黎明,陳鋮穎,楊駿.用于智能傳聲器的低功耗語音降噪處理器設計[J].上海交通大學學報,2018,52(9):1098?1103.
[10] 李明凱,劉鐵軍,周民.基于USB及CPLD的超聲信號采集器設計及應用[J].儀表技術與傳感器,2018(5):86?90.
[11] 楊紅莉,曾憲陽,郁漢琪.高速攝像頭數據采集系統設計及算法研究[J].電子器件,2017,40(5):1161?1166.
[12] 苗海林,殷楠,李玉峰.多火災危險特征信息采集系統設計[J].船海工程,2018,47(6):108?110.
[13] 朱普茂,章鵬,丁頻一.馬丁代克深度輪誤差校正系統設計[J].傳感技術學報,2017(6):867?871.
[14] 李維凱,張瑋,殷達鈺.CSRm束流累積階段閉軌校正系統設計[J].強激光與粒子束,2019,31(3):64?68.
[15] 沈凱,姚志成,何岷.彈載相控陣雷達近場校準系統設計研究[J].計算機仿真,2018,35(8):11?14.