張琦
摘要:隨著科學(xué)技術(shù)不斷發(fā)展,人工智能技術(shù)和語(yǔ)音識(shí)別技術(shù)應(yīng)運(yùn)而生,這也標(biāo)志著社會(huì)發(fā)展和進(jìn)步到達(dá)了一個(gè)新的歷史階段。語(yǔ)音識(shí)別技術(shù)是人工智能基礎(chǔ)的支撐技術(shù),本文將針對(duì)人工職能與語(yǔ)音識(shí)別技術(shù)進(jìn)行探討和研究。
關(guān)鍵詞:人工智能;語(yǔ)音識(shí)別;應(yīng)用
人工智能技術(shù)是基于計(jì)算機(jī)科技基礎(chǔ)上,對(duì)人類思維模式進(jìn)行模擬而構(gòu)建起來的具有智能化的人工系統(tǒng),人工智能是計(jì)算機(jī)科技更高層次上的應(yīng)用。語(yǔ)音識(shí)別技術(shù)是人工智能技術(shù)的細(xì)分領(lǐng)域之一,同時(shí),語(yǔ)音識(shí)別也是實(shí)現(xiàn)人工智能的重要基礎(chǔ)技術(shù)支撐之一。
一、人工智能技術(shù)基本內(nèi)容
(一)基礎(chǔ)支撐層
1.基礎(chǔ)算法
算法是人工智能技術(shù)的基礎(chǔ),是通過對(duì)解決問題的方法加以描述以及規(guī)范輸入,利用計(jì)算機(jī)在有效有限時(shí)間內(nèi)找到所需求的結(jié)果。近年來,各學(xué)科的高度融合促進(jìn)了人工智能技術(shù)的不斷發(fā)展,尤其是“深度學(xué)習(xí)”技術(shù)的出現(xiàn),使人工智能能夠通過不斷學(xué)習(xí)實(shí)現(xiàn)基礎(chǔ)算法更新。深度學(xué)習(xí)是通過權(quán)重對(duì)動(dòng)作符合情況進(jìn)行判斷,對(duì)最優(yōu)動(dòng)作進(jìn)行選擇進(jìn)而實(shí)現(xiàn)人工智能算法不斷提高,最終達(dá)到超越人類智能的效果[1]。
2.計(jì)算力
計(jì)算力是單位時(shí)間內(nèi)實(shí)現(xiàn)計(jì)算的次數(shù),計(jì)算力越強(qiáng),人工智能體現(xiàn)出的靈活性越高,實(shí)現(xiàn)的智能判斷效率越高。以往的智能受到計(jì)算力限制,無法發(fā)揮出人工智能的優(yōu)勢(shì),隨著近年來云計(jì)算的發(fā)展,計(jì)算機(jī)對(duì)數(shù)據(jù)處理能力得到大幅度提升,每秒鐘近10萬(wàn)億次的計(jì)算能力給人工智能提供了基礎(chǔ)支撐。
3.大數(shù)據(jù)
大數(shù)據(jù)是對(duì)海量信息進(jìn)行收集、處理和分析,對(duì)有價(jià)值的信息進(jìn)行深入挖掘。人工智能通過各類傳感器獲得大量數(shù)據(jù)信息,這些信息包括圖像、語(yǔ)音和文字等數(shù)據(jù),通過大數(shù)據(jù)對(duì)這些信息進(jìn)行分析處理,選擇具有價(jià)值的數(shù)據(jù)作為云計(jì)算的訓(xùn)練樣本,進(jìn)而推動(dòng)了人工智能發(fā)展。
(二)技術(shù)支撐
1.計(jì)算機(jī)視覺技術(shù)
計(jì)算機(jī)視覺技術(shù)是將圖片分解成許多個(gè)便于管理的子任務(wù),這種通過對(duì)子任務(wù)進(jìn)行處理和識(shí)別,進(jìn)而得到對(duì)物體的判斷。近年來計(jì)算機(jī)視覺技術(shù)在醫(yī)療成像、人臉識(shí)別等方面得到了廣泛應(yīng)用,公安系統(tǒng)利用監(jiān)視設(shè)備和計(jì)算機(jī)視覺技術(shù)進(jìn)行案件偵破,也取得了良好的效果。計(jì)算機(jī)視覺識(shí)別技術(shù)給人工智能提供了獲取外界信息的途徑。
2.自然語(yǔ)言處理技術(shù)
3.語(yǔ)音識(shí)別技術(shù)
語(yǔ)音識(shí)別技術(shù)通過對(duì)來自外界聲音的處理,運(yùn)用移動(dòng)窗將接收到的聲音進(jìn)行分幀,形成各種相應(yīng)的波形,結(jié)合波形有效性,對(duì)這些波形進(jìn)行選取形成矩陣,利用這些音素對(duì)語(yǔ)言加以識(shí)別[2]。
二、人工智能技術(shù)應(yīng)用與發(fā)展
(一)人工智能技術(shù)應(yīng)用
1.無人駕駛技術(shù)
無人駕駛技術(shù)就是人工智能在現(xiàn)實(shí)生活中的具體應(yīng)用。近年來,無人駕駛技術(shù)不僅實(shí)現(xiàn)了交通領(lǐng)域和工業(yè)領(lǐng)域中的自動(dòng)化和智能化,也應(yīng)用在軍事和科研領(lǐng)域,無人機(jī)技術(shù)不但能夠?qū)崿F(xiàn)高空偵查,確定危險(xiǎn)軍事目標(biāo),能夠結(jié)合人工智能判斷實(shí)現(xiàn)空中打擊。此外,無人機(jī)技術(shù)在城市規(guī)劃和地質(zhì)科考方面應(yīng)用也十分廣泛。
2.智能機(jī)器人
人工智能的出現(xiàn)推進(jìn)了智能機(jī)器人的發(fā)展。智能機(jī)器人能夠通過人工智能實(shí)現(xiàn)信息采集和分析計(jì)算,得出準(zhǔn)確的判斷結(jié)果,完成各項(xiàng)所需工作。目前,智能機(jī)器人在公共服務(wù)領(lǐng)域和工業(yè)生產(chǎn)中都獲得了應(yīng)用。一些國(guó)家甚至利用智能機(jī)器人參與到養(yǎng)老護(hù)理中,不僅降低了對(duì)人工的占用,還克服了人工作業(yè)時(shí)間和空間上的限制,能夠?qū)崿F(xiàn)全天候的服務(wù)。
(二)人工智能技術(shù)發(fā)展
人工智能的出現(xiàn)改變了人類生產(chǎn)和生活方式,社會(huì)發(fā)展不再單純依賴于人類自身行為,機(jī)器設(shè)備可以做出類似人類的思維和判斷,甚至人工智能會(huì)超越人類的思維,形成優(yōu)化的思維方式和判斷。例如:人類發(fā)明的機(jī)器人能夠通過不斷的深入學(xué)習(xí),優(yōu)化自身計(jì)算,在與人類圍棋大戰(zhàn)中,人工智能戰(zhàn)勝了當(dāng)代的圍棋大師。人工智能可以有效推動(dòng)社會(huì)進(jìn)步。但是,人類智能的過度開發(fā)和應(yīng)用也給社會(huì)發(fā)展帶來潛在威脅,人類就業(yè)情況,生存環(huán)境安全性都將受到重大影響。
二、語(yǔ)音識(shí)別技術(shù)基本內(nèi)容
(一)語(yǔ)音識(shí)別基本原理
人類語(yǔ)音經(jīng)過接收系統(tǒng)輸入到語(yǔ)音識(shí)別系統(tǒng);語(yǔ)音識(shí)別系統(tǒng)會(huì)將人類的聲音切割成片段,每個(gè)小片段將作為一個(gè)幀,同時(shí),系統(tǒng)會(huì)對(duì)辨識(shí)度不高的首尾靜音部分進(jìn)行清除,避免對(duì)識(shí)別效果帶來影響。接下來,系統(tǒng)會(huì)對(duì)各個(gè)語(yǔ)音信號(hào)進(jìn)行分析,從中提取具有特征的參數(shù),將這些具有特征的參數(shù)與語(yǔ)音模型進(jìn)行對(duì)比,結(jié)合語(yǔ)音規(guī)律分析出最終結(jié)果,形成相應(yīng)文本。
(二)語(yǔ)音識(shí)別技術(shù)發(fā)展存在的難點(diǎn)
1.噪音處理
在進(jìn)行聲音采集中,人類的聲音往往與自然界其他聲音相混雜,這些噪音可能是來自外部環(huán)境的背景聲音,也可能是來自人類呼吸等帶來的雜音,這些無效的聲音將給語(yǔ)音識(shí)別帶來影響。隨著當(dāng)前語(yǔ)音識(shí)別技術(shù)的提高,雖然能夠避免一些輕微噪音帶來的錯(cuò)誤分析,但是還無法從根本上加以杜絕。對(duì)噪音進(jìn)行有效識(shí)別也是語(yǔ)音識(shí)別技術(shù)發(fā)展方向之一。
2.魯棒性
語(yǔ)音識(shí)別系統(tǒng)魯棒性是指在受到外界環(huán)境和語(yǔ)音干擾情況下,語(yǔ)音識(shí)別保持穩(wěn)定的能力。影響到語(yǔ)音識(shí)別穩(wěn)定性的因素包含較多,人類語(yǔ)音的標(biāo)準(zhǔn)化程度,外部環(huán)境干擾的大小都將決定不精確參數(shù)的增加。提高語(yǔ)音識(shí)別系統(tǒng)的穩(wěn)定性和適應(yīng)控制將是未來語(yǔ)音識(shí)別技術(shù)研究方向。
3.語(yǔ)音模型
語(yǔ)音模型是通過聲音采集設(shè)備將聲音信息轉(zhuǎn)化成數(shù)字信息的模型。不同的聲音,其模型也具有較大差異。當(dāng)前的語(yǔ)音識(shí)別技術(shù)只能針對(duì)簡(jiǎn)單環(huán)境下的語(yǔ)音進(jìn)行識(shí)別,環(huán)境的干擾將會(huì)降低語(yǔ)音識(shí)別的準(zhǔn)確性和識(shí)別效率。因此,要提高語(yǔ)音識(shí)別的功能,需要對(duì)語(yǔ)音模型不斷優(yōu)化,
(三)語(yǔ)音識(shí)別在生活中的應(yīng)用
語(yǔ)音識(shí)別技術(shù)的發(fā)展促進(jìn)了人與計(jì)算機(jī)設(shè)備之間的交互,目前已經(jīng)出現(xiàn)了很多應(yīng)用語(yǔ)音作為輸入方式的軟件。工作人員利用語(yǔ)音接收系統(tǒng),可以迅速將聲音轉(zhuǎn)換成文本,不僅提高了工作效率,也讓雙手得到解放。另外,通過語(yǔ)音識(shí)別能夠?qū)Σ煌Z(yǔ)言進(jìn)行翻譯,促進(jìn)不同語(yǔ)言人群的溝通交流[3]。
結(jié)束語(yǔ):
現(xiàn)代科技發(fā)展促進(jìn)了人工智能和語(yǔ)音識(shí)別技術(shù)發(fā)展,改變了傳統(tǒng)的生產(chǎn)、生活方式,促進(jìn)了社會(huì)發(fā)展。相信,隨著人工智能技術(shù)和語(yǔ)音識(shí)別技術(shù)的不斷優(yōu)化提高,與傳統(tǒng)產(chǎn)業(yè)進(jìn)一步相結(jié)合,將會(huì)獲得廣泛的應(yīng)用,讓人類社會(huì)呈現(xiàn)出全新的發(fā)展面貌。
參考文獻(xiàn)
[1]胡郁.人工智能與語(yǔ)音識(shí)別技術(shù)[J].電子產(chǎn)品世界,2016(4):23-25,27共4頁(yè).
[2]何婉榕.關(guān)于人工智能與語(yǔ)音識(shí)別技術(shù)的研究[J].科技尚品,2017(3):182-182.
[3]房愛東,張志偉,崔琳,etal.基于人工智能的語(yǔ)音識(shí)別系統(tǒng)及應(yīng)用研究[J].宿州學(xué)院學(xué)報(bào),2019(8).