999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于人機互動的語音識別技術綜述

2018-04-18 02:13:27江蘇旅游職業學院
電子世界 2018年21期

江蘇旅游職業學院

江蘇大學電氣信息工程學院 李雪林

1 引言

語言是人類進行交往最基礎的一種方式。伴隨AI人工智能的突飛猛進,計算機已經能夠具備與人進行言語溝通的能力,語音識別技術成為實現人機交往的核心技術。自動語音識別技術,本質就是利用計算機將語音信號自動轉換為文本的一項技術。

語音識別是涉及多種類交叉學科的高新技術,應用到發聲機理和聽覺機理、人工智能、信號處理、模式識別、概率論和信息論等等。其應用領域廣泛,在現代自動化解耦控制系統和第三產業都應用到語音識別系統,在信息化發展的大潮中,語音識別技術越來越凸顯出重要作用。

2.語音識別技術的發展歷史

語音識別技術的發展歷史可以追溯到1952年,在美國的貝爾實驗室,戴維斯等科研人員首創了能對10個英文字母發音的識別系統。英國科學家丹尼斯等人研制了基于計算機運用的語音識別系統。上世紀70年代以后由于電腦的普及,語音識別研究突飛猛進,并取得了在短語、單詞的識別方面實質性的重大突破。到了1980年以后,多詞匯、連續語句、非指定人連續語音的識別成為語音識別研究的重點領域。并且,語音識別技術在研究發展方向上也發生了重要轉向,由匹配模式研究方向開始轉為統計模型的研究方向。

上世紀末,語音識別系統在研究的宏觀方面并沒有什么實質性進展。不過,基于語音識別技術的而發明的產品已經開始應用。

語音識別系統技術研究在我國發展起始于1958年,中國科學院聲學所利用電子管電路制造出能夠識別10個元音的語音識別系統。中國科學院聲學所在1973年正式開始基于計算機技術進行語音識別研究。上世紀改革開放以來,計算機應用技術和應用電子技術在我國不斷發展,國內許多科研院所都開始了語音技術的研究。我國對語音識別技術高度重視,在1986年把語音識別作為“863”計劃列為研究課題。并且以此為契機,每隔兩年召開一次關于語音識別技術系統方面的專題國際交流會議。由此標志著,我國科研機構關于語音識別技術的研究進入了一個嶄新的發展階段。

3.語音識別系統的結構

語音識別系統主要組成包括語音信號采樣模塊、語音信號前期處理模塊、語音信號特征參數提取模塊、語音信號識別核心模塊、語音信號識別后期處理模塊。

模式識別匹配是語音識別的主要過程。首先對人的語音進行分析,提取特點建立針對性的語音模型,通過語音模型建立語音識別所需的模式。利用語音識別的整體模型,在語音識別過程中將得到的語音信號的特征與前期建立的語音模式進行匹配比較,通過預設的搜索策略和匹配策略,可以得出最好的且與輸入的語音信號相匹配的模式。最后,根據定義,通過一系列查表就可以輕松得出計算機輸出的識別結果。

4.語音識別系統的類別

語音識別的目標決定了語音識別系統的類別,語音識別系統的類別主要分為三大類,孤立詞檢索(isolated word recognition),關鍵詞檢索(keyword spotting)和連續單詞檢索。

孤立詞檢索的方式是將知道的孤立的單詞檢索識別出來,如“人機”、“智能”等;關鍵詞檢索的目標是連續語音,但它并不識別所有的文字,只是檢測已知的關鍵詞有沒有出現和在哪里出現,例如在一段語句中檢索“電腦”、“應用”這兩個詞;連續單詞檢索的目標則是檢索任意的連續的語音,檢索整個句子或一大段話。

5.語音識別技術類型

目前應用最多的語音識別技術類型主要包括幾種:

5.1 動態時間規整算法(DynamicTime Warping,DTW),在一定的時間序列中,目標要比較和檢索的兩段相似性的時間序列,由于隨機性它們的長度不可能完全相等,表現在語音識別領域則是不同人的說的同一段語音但語速不同。并且可能相同的單詞發音速度也會出現差別,比如有的人會把“A”這個音發音很短,有的人而把“B”發音很長。面對這些隨機的復雜情況下,以往的歐幾里得距離方法已經無法有效地算出兩個隨機時間序列之間的距離(即相似性),這時候利用DTW方法可以把時間序列根據需要進行動態的延伸或者縮短,這樣就可以對兩個時間序列性之間的相似性進行分析比較計算。

5.2 隱馬爾可夫模型(HMM),通過觀測向量序列可以間接的觀察到HMM的狀態,HMM的狀態是由觀測向量的概率密度分布決定的,任意一個觀測向量對應著一個特定的概率密度分布所代表的狀態序列。HMM模式庫是反復訓練樣本形成的。HMM模型參數是由訓練輸出的吻合概率最大的信號建立,并非已經儲存好的模型參數,在語音識別識別過程中將需要識別的語音序列與HMM模型參數之間進行分析計算,將相似概率比較后得到的最大值所對應的狀態序列作為最佳語音識別然后輸出,因此HMM是一種優秀可靠的算法。

5.3 矢量量化算法(VectorQuantization),矢量是由標量數據組構成的,通過整體量化,在不損失太多信息的前提下大幅度壓縮數據。矢量量化應用在孤立詞檢索、短句的語音識別中。方法是將提取的特征參數或語音信號波形作為標量數據組成一個矢量然后進行整體量化。把矢量空間分割成一些小區域,每個小區域由一個矢量代表,量化時分到小區域的矢量就用這個指定矢量代替??蒲腥藛T還發明了其他降低復雜度的方法,包括無記憶的、有記憶的、模糊的矢量量化方法。

5.4 人工神經網絡(ANN)是一種比較新的語音識別方法。人工神經網絡是由大量處理單元互聯組成的非線性、自適應信息處理系統,ANN的特點是輸入—輸出映射能力和分類能力強大,非常適合在語音識別中應用。通過對人腦思維機制模仿,具有強大的分類決策能力和對不確定信息的描述能力。

5.5 支持向量機(Supportvector machine),結構風險最小原理和VC維理論是其理論基礎,在有限的樣本信息在復雜性和學習能力之間尋優,從而達到最好的尋優能力,有效克服了傳統經驗風險最小化方法的缺點。在非線性及高維模式、小樣本識別領域展現了高超的技能,現已大規模的應用到模式識別系統領域。

6.小結

移動互聯技術的日新月異,人工智能的飛速發展,基于人機互動的語音識別技術成為人機交互的重要手段之一。語音識別算法模型不斷改進、AI技術不斷的加強,在不久的未來,基于人機互動的語音識別技術將成為人類生活不可或缺的組成部分。

主站蜘蛛池模板: 人妻中文字幕无码久久一区| 成人av专区精品无码国产| 国产精品偷伦视频免费观看国产| 国产成人禁片在线观看| 亚洲日本www| 日韩一级二级三级| 国产精品亚洲综合久久小说| 无码AV日韩一二三区| 91免费国产高清观看| 国产免费福利网站| 色综合天天综合| 国产微拍一区二区三区四区| 欧美成人A视频| 午夜色综合| 中文字幕有乳无码| 国产丝袜第一页| 人人艹人人爽| 国产福利在线免费| 三上悠亚在线精品二区| 欧美精品影院| 久久久久免费精品国产| 成人年鲁鲁在线观看视频| 精品国产网| 欧美在线国产| 国产本道久久一区二区三区| 亚洲日韩精品综合在线一区二区| 热久久这里是精品6免费观看| 69国产精品视频免费| 天堂亚洲网| 97视频精品全国在线观看| 国产福利微拍精品一区二区| 精品福利视频网| 免费毛片全部不收费的| 一级黄色网站在线免费看| 国产精品第页| 爆乳熟妇一区二区三区| 白浆视频在线观看| 日本免费精品| 视频在线观看一区二区| 一级一级特黄女人精品毛片| 日本不卡在线| 人妻免费无码不卡视频| 亚洲人成在线免费观看| 国产在线日本| 不卡午夜视频| 色哟哟国产精品一区二区| 国产无人区一区二区三区| 国产av无码日韩av无码网站| 亚洲AⅤ无码日韩AV无码网站| 天天爽免费视频| 国产一级在线观看www色| 国产精品性| 国产精品污视频| 国产区成人精品视频| 亚洲国产91人成在线| 亚洲精品中文字幕无乱码| 精品国产香蕉在线播出| www欧美在线观看| 在线看片免费人成视久网下载| 激情在线网| 欧美在线中文字幕| 国产午夜人做人免费视频中文| 亚洲无码91视频| 91视频青青草| 欧美综合成人| 日韩专区欧美| 97se亚洲综合在线天天| 国内丰满少妇猛烈精品播| 国模私拍一区二区| 天天综合天天综合| V一区无码内射国产| 国产福利免费在线观看| 亚洲欧美日韩天堂| 亚洲无码免费黄色网址| 99精品高清在线播放 | 国产在线精品99一区不卡| 漂亮人妻被中出中文字幕久久| 久久香蕉国产线| 久久国产成人精品国产成人亚洲| 国产av无码日韩av无码网站| 欧美精品在线免费| 2019国产在线|