羅國強 方斌 李家華
摘要:AI技術的問世為現代社會經濟帶來了較大的進步與發展,現階段語音識別技術在準確率以及速度上還需要進一步完善,而深度學習依舊停留在理論層面的研究,未應用到實際產品中。另外,深度學習技術可以將云計算和數據資源整合到一起,提高對數據資源的識別速度和精確性。為了促使語音識別技術朝向更高層次發展,需要從語音收集與特征篩選、模擬訓練和語音識別兩方面進行。
關鍵詞:AI技術;語音識別技術;現狀;途徑
中圖分類號:TP18;TN912.34 文獻標識碼:A 文章編號:1007-9416(2019)12-0224-01
0 引言
在現代科學技術水平不斷提升的背景下,社會的科技實力逐步增強,促進著我國社會慢慢的朝向智能化方向發展,智能領域包含的內容豐富多彩,機器學習就是其中的一種,并成為了智能領域研究的關鍵項目,在促進我國智能領域的發展上也起到了重大的作用。目前,科學家在語言識別以及互聯網搜索等項目上取得了較大的突破,在依托AI技術的幫扶下,可以達到機器與人類的語言交流以及汽車自動駕駛的層面,同時在不斷發展的背景下,機器人慢慢的具備了人類無法達到的功能。為了更好的促進AI技術的發展,必須要加強對語音識別技術的研究,本文從AI技術背景下語音識別技術研究現狀與途徑,以此為語音識別技術的進一步發展提供幫助。
1 基于AI技術的語音識別技術研究現狀
在20世紀50年代中后期,AI技術也稱為人工智能技術正式被人類提出來,并在當時引發了相當大的反響,許多科學家以及專家學者都參與到機器模擬智能方面的研究上,與此同時AI技術依據自身獨特的優勢在各個行業領域中獲得廣泛應用,推動著許多行業領域的改革創新,也促進著社會經濟的快速發展,特別是對語音識別技術的研發。
1.1 語音識別技術理論層面的研究
現階段,我國的科學技術實力得到較大的增強,以往比較陳舊的語言識別技術已經不能夠滿足現代社會的發展速度,盡管現在許多智能終端設備上都帶有語音識別功能,能夠完成人類與機器之間的信息交流,但是語音識別的準確率以及速度還有待加強,而目前的語音識別算法與相關技術已經很難再繼續發展[1]。在這樣的背景下,深度學習成為了語音識別技術進一步發展的重要方式,能夠像人類大腦一樣進行模式學習以及信息感知等,并且具備了大量的理論研究。然而,深度學習大多停留在理論階段,還沒能廣泛的應用到實際產品中。為了解決這一的問題,促進理論和產品的相互融合,更好的滿足現代社會發展的需求,必須要加強語言識別功能中關鍵部位的研發,如語音信號產生與傳播等,從而促進語音識別技術能夠獲得更好的發展[2]。
1.2 語音識別技術應用方面的研究
伴隨著我國科學技術水平以及互聯網技術的迅速發展,促使我國逐漸的從信息化社會過渡到智能化社會,加強語音智能技術的研究也是時代發展的必然需求,能夠很好的滿足人類的使用需求,幫助人們可以從多種方式與手段得到初始語音信息。對現有的關于語音識別技術的研究進行整合,大部分研究項目都處于理論辯證階段與簡單算法方面,從而很難真正發揮出數據資源的優勢。現如今隨著深度學習技術的應用,可以很好的將云計算和數據資源整合到一起,從而提高對數據資源的識別速度和精確性,使得語音資源能夠得到較好的應用,并促使語音識別技術能夠朝向更高層面發展。
2 AI技術背景下語音識別途徑
2.1 語音收集與特征篩選
系統在進行語音信息資源的收集過程中,需要經歷采樣與端點測試兩個環節。首先,采樣環節通常是依托聲卡來實現對語音信息資源的歸納與整合,并將收到的信息進行相應的處理使之呈現出數字化形態[3]。其次,端點測試環節通常是對語音信息出現的初始與末尾階段進行核實,是進行信息資源處理前的重要準備工作。一般情況下端點檢測功能的實現是基于能量與過零率相聯系的算法方式。此外,要確保語音識別系統能夠正常工作,還必須要解決信息特征篩選問題,信息特征篩選結果的準確性以及篩選速度直接影響到語音識別的精確性和效率,這是因為只有實現了信息特征的精準篩選才能夠將龐大的語音信息進行區分,提取出有用的信息,同時將不完整、無用的信息排除掉,從而確保語音信息資源采集環節的有序運行[4]。
2.2 模擬訓練和語音識別
在這個部分重點涉及到兩個方面的內容,分別是訓練以及識別。首先訓練是根據系統的要求選擇一項適宜的識別路徑,并通過訓練和聚類的措施來得到這些漢字的相關信息,同時將這些信息資源作為初始應用值儲存到系統中。在進行數據信息辨別時,必須要將待辨別的漢字資源存儲到系統文件中,以此來建立參考模板資源庫。其次識別主要是將需要進行識別的文字和參考模板數據庫中的文字信息進行比對,并根據比對的相似度確定被識別文字的內容,目前主要有三種識別方式[5]:以模擬訓練階段獲取的語言信息為基礎并存儲到系統中,當要進行文字識別時,選取計分與距離最小的文字;利用計分求法的途徑將需要識別的文字信息通過態圖模型開展計算,從而得到輸出概率;根據語言特征的差異性進行適宜的劃分,然后對每個區域特征中的平均值進行計算。
3 結語
綜上所述,AI技術的應用對促進我國社會經濟快速發展具有重要作用,必須要加強智能機器人技術的研發,并推廣到語音識別等領域研究中,促進語音識別技術的創新與進步,最終帶動社會各行各業的革新。
參考文獻
[1] 房愛東,張志偉,崔琳,等.基于人工智能的語音識別系統及應用研究[J].宿州學院學報,2019,34(08):62-65.
[2] 王婉琦.人工智能在語言服務業中的應用現狀與前景研究[J].南方論刊,2018(05):22-23.
[3] 何波.基于單片機的人工智能語音識別機器人的設計分析[J].電子世界,2018(08):72+74.
[4] 陳凱泉,沙俊宏,何瑤,等.人工智能2.0重塑學習的技術路徑與實踐探索——兼論智能教學系統的功能升級[J].遠程教育雜志,2017,35(05):40-53.
[5] 胡郁,袁春杰,王瑋.人工智能技術在傳媒領域的應用——以智能語音技術為例[J].新聞與寫作,2016(11):15-17.
Research Status and Approaches of? Speech Recognition Technology under the Background of? AI Technology
LUO Guo-qiang1,FANG Bin2,LI Jia-hua1
(1.College of? Information Engineering, Guangzhou Vocational and Technical University of? Science and Technology, Guangzhou? Guangdong? 510550;2.School of? Information Engineering, Guangzhou City Construction College,Guangzhou Guangdong? 510925)
Abstract:The advent of AI technology has brought great progress and development to modern society and economy. At this stage, speech recognition technology needs to be further improved in terms of accuracy and speed. Deep learning still stays at the theoretical level and has not been applied to actual products. in. In addition, deep learning technology can integrate cloud computing and data resources to improve the speed and accuracy of identifying data resources. In order to promote the development of speech recognition technology to a higher level, it needs to be conducted from two aspects: speech collection and feature screening, simulation exercises, and speech recognition.
Key words:AI technology; speech recognition technology; status quo; way