嚴新華
(商洛學院 現代教育技術中心,陜西商洛 726000)
計算器是計算機上常用的工具軟件,在日常工作和生活中帶給人們極大的方便。Windows操作系統就自帶了一款計算器,除了這款計算器之外,許多開發者也開發了各種不同的計算器。這些計算器都采用鍵盤和鼠標輸入,用鼠標點擊輸入效率很低,而用鍵盤輸入很繁瑣,輸入數據較多時手指容易疲勞,容易輸錯,用戶體驗很差。如果能用語音控制輸入,只要說出需要計算的數值和運算就能看到相應的結果,就能使用戶使用起來更加方便,使用戶可以輕松愉快地完成運算工作。而語音識別技術經過多年的發展已經逐漸進入實用階段[1],IBM、微軟等公司都推出了自己的語音識別和合成引擎。本文就基于微軟公司的Speech SDK 5.1研究和設計了一款語音控制的計算器,經測試輸入準確率高,使用方便,能夠給用戶帶來更加良好的使用體驗。
微軟的Speech SDK 5.1是一套語音應用程序開發包,可以識別多種語言,包括英文、中文和日文等[2]。SDK里提供了語音識別與合成的引擎組件和應用程序層接口,還包括詳細的技術資料和幫助文檔[3]。它完全遵循COM標準,底層的協議都采用COM組件的形式,與應用程序層完全獨立[4]。和語音相關的工作由COM組件完成,包括語音識別引擎(Speech Recognition,簡稱SR)和語音合成引擎(Text To Speech,簡稱TTS),分別管理語音的識別與合成[5]。這使得應用程序設計人員可以忽略復雜的語音技術,直接調用相關的語音應用程序接口(SAPI)來實現語音功能,從而專注于語音應用程序的開發?!?br>