999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能中遠場語音識別技術的研究

2020-12-31 19:30:20彭洪松李洪斌稅國梅
數字通信世界 2020年5期
關鍵詞:引擎人工智能

彭洪松,李洪斌,李 莉,稅國梅

(四川九州電子科技股份有限公司,綿陽 621000)

0 引言

“機器能聽懂我們說話嗎?機器能知道我們想做什么?”,答案是人工智能機器能。那人工智能是如何聽懂人的語言,這就是遠場語音識別技術。遠場語音識別技術顧名思義即在較遠或者較寬敞的空間內,進行語音采集和識別的技術。依靠遠場語音識別技術,人工智能機器可以聽見人說話,提取有用信息,獲取人的意圖。

1 遠場拾音技術

顧名思義是指遠場(5-8m 范圍)語音的采集技術。5-8m 的遠場拾音距離基本滿足常見空間場景中的語音交流。主要采用麥克風陣列形式,通過2-7顆麥克風按照一定位置排布形成陳列,通過軟件算法的支撐,將多路麥克風采集的語音信號進行復用,實現降噪,方向定位,波束成型等,持續提升語音體驗。

與近場語音采集相比,遠場拾音技術中增加了多路信號和軟件算法。因為近場情況下音源單一,信噪比(SNR)比較高,信號清晰。遠場識別情況下聲源位置不定,噪聲源比較多,噪聲大,信噪比(SNR)下降劇烈,這種情況下傳統的方法效果不理想。近幾年來,隨著遠場拾音技術的發展,麥克風陣列排布和軟件算法越來越豐富,遠場拾音能力提升明顯。但即便是這樣,仍然有很大的挑戰,尤其是背景噪聲很大的環境里,如家里開空調、開電扇,或者是在汽車里面等,效果仍然還有很大的提升空間。

2 回聲消除技術

語音交互是全雙工的過程,即在播放的同時可以拾音。近場拾音環境下,播放音樂或是語音播報的時候可以通過按鍵停止,但這限制了人工智能的智慧化程度;前面我們介紹了遠場拾音技術,遠場拾音技術的目的盡可能多的采集有用的信息,那無用信息包括哪些呢?包括環境噪音,這個主要通過算法解決;但更嚴重的是人工智能設備自身發出聲音,這個聲音離麥克風距離近、音量大,干擾非常嚴重;要想實現不受限制的語音控制,必須得實現回聲消除。回聲消除的常見方案是從人工智能設備喇叭側拉一組參考信號給主控,直接告訴主控這個聲音是我自己的,不是有用信息。這種方案會有一定的效果。回聲消除的難點在于功放、喇叭的非線性失真,即參考信號與實際聲音會存在一定的差異。例如音響設備重低音比較好,結構等就容易形成共振,這樣參考信號的真實性就會大打折扣,此時就需要軟件回聲消除算法做一定的補償。

3 喚醒引擎技術

喚醒引擎可以理解為喊名字,可以想象成課堂點名。比如蘋果的“嗨Siri”、百度的“小度小度”、Google 的“OK Google”等。喚醒引擎的目的是告訴人工智能機器,接下來的話是對你講的哦,認真聽好了。喚醒引擎通常工作于本地,通常是遠場語音采集后,他要判斷人說的話是不是喚醒詞(喚醒詞就是上面的“嗨Siri”、“小度小度”、“OK Google”等),如果是喚醒詞,那么后續的語音就進行上傳識別,否則后續的語音不進行處理。

喚醒引擎技術難點體現在以下幾個方面:

3.1 功耗要低

語音采集和喚醒引擎都屬于長時間的監聽過程,需要設備保持常態化運行。iphone4s 出現“嗨Siri”,但直到iphone6s 之后才允許不接電源的情況下直接喊“嗨Siri”進行語音喚醒,在此之前都需要接入電源的情況下進行語音喚醒。這是因為iphone6s 上有一顆專門進行語音激活的低功耗芯片,在未被喚醒前,除低功耗芯片外,主設備可以進入休眠模式,既實現了設備超長待機,又保證了設備的可靠性。當然,不是所有人工智能設備都必須外掛低功耗芯片,部分多核處理器,可以將喚醒引擎運行在協處理器中,實現其他核的待機,以實現低功耗的目的。

3.2 計算量要小

計算量小一方面是低功耗芯片或者協處理器運算能力的限制,另一方面是實時率的要求。即1s 的語音至少要在1s 之內計算完畢,這樣才能保障可實用。

3.3 喚醒效果

理想狀況下的喚醒引擎應該是一呼即應,不喊它的時候它乖乖的不要插話。古人云:動若脫兔,靜若寒蟬。但事與愿違,喊它的時候它不答應這叫做漏喚醒,沒喊它的時候它跳出來講話叫做誤喚醒。漏喚醒和誤喚醒這倆老兄是此消彼長的關系:比如喚醒詞很長有10個字,那么誤喚醒肯定很低,但同時漏喚醒也就多了,喊了好幾次都不理你是不是很氣人!再比如喚醒詞很短只有一個字,這個時候漏報是少了,每次喊都很快回應你,但是誤報也多了呀,大半夜突然誤喚醒應答也是相當驚悚的。因此喚醒引擎需經過上百萬次訓練,匹配各類聲音信息,保證喚醒和誤喚醒率。

4 云平臺的語意解析

語意解析,不論是遠場還是近場,基本都是在云端完成的。云平臺依靠大數據,多模型和高速率運算,將采集到的語音信息進行語義檢查和處理,提取關鍵字,獲取用戶意圖,實現了語義識別。你可以把云平臺理解為人的大腦,大腦聰明程度決定了人工智能的智慧程度。云平臺的語義解析能力涉及到大數據、模型和運算速率等各個方面,這里單獨介紹下語音分離模型。單個人說話,云端解析不會存在干擾;但如果多個人說話,尤其是幾個說話人距離較近時,波束成型技術也無能為力,這就需要云平臺的語音分離技術。語音分離是指多人同時說話,語音有重疊,這種情況下云平臺根據每個個體聲音的響度、音調和音色將語音拆分重組,將混合音還原為每個人的單通道聲音信息。從目前各家云平臺的實測結果來看,性能還有提升的空間。

5 結束語

智能音箱的普及,家庭語音助手作為一個切入點,讓我們體驗到了人工智能帶來的優質生活。語音作為最常用和最便利的交流方式,遠場語音識別技術仍然會是人工智能中的重要組成部分。

猜你喜歡
引擎人工智能
以學促干 挺膺擔當 激活砥礪前行的紅色引擎
我校新增“人工智能”本科專業
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
三生 三大引擎齊發力
藍谷: “涉藍”新引擎
商周刊(2017年22期)2017-11-09 05:08:31
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 04:56:22
無形的引擎
河南電力(2015年5期)2015-06-08 06:01:46
主站蜘蛛池模板: 少妇露出福利视频| 激情亚洲天堂| 国产成人一区在线播放| 日韩精品一区二区三区大桥未久| 四虎国产在线观看| 久久久久亚洲精品成人网| 91国内在线视频| 波多野结衣久久精品| 国产欧美自拍视频| 成人综合久久综合| 亚洲成人福利网站| 欧美日韩免费观看| 国产拍揄自揄精品视频网站| 高潮毛片免费观看| 在线观看国产网址你懂的| 2022精品国偷自产免费观看| 国产99欧美精品久久精品久久| 重口调教一区二区视频| 国产尤物视频在线| 久久国产乱子伦视频无卡顿| 亚洲国产系列| 天天综合天天综合| 日韩精品一区二区三区swag| 五月婷婷综合网| 国产一级毛片高清完整视频版| 欧美不卡视频一区发布| 青青操国产视频| 亚洲一区二区三区在线视频| 国产性生交xxxxx免费| 乱人伦99久久| 伊人精品视频免费在线| 精品国产www| 亚洲中文字幕手机在线第一页| 国产成人免费手机在线观看视频 | 国产麻豆福利av在线播放| 日韩午夜伦| 乱系列中文字幕在线视频| 国产成人精品视频一区二区电影| 五月婷婷导航| 亚洲色无码专线精品观看| 国产免费久久精品99re不卡| 欧美黄网在线| 亚洲欧美激情小说另类| 欧美精品成人| 亚洲首页在线观看| 五月婷婷亚洲综合| 免费无遮挡AV| 广东一级毛片| 日韩精品亚洲人旧成在线| 国产一区二区福利| 蜜桃视频一区二区| 久久永久精品免费视频| 1024国产在线| 中文字幕欧美日韩| 国产自产视频一区二区三区| 久久久久九九精品影院| 97综合久久| 欧美日韩一区二区在线播放| 伊大人香蕉久久网欧美| 日韩高清欧美| 亚洲欧洲自拍拍偷午夜色| 国产高清在线观看91精品| 免费可以看的无遮挡av无码| 亚洲啪啪网| 色综合热无码热国产| 在线无码九区| 欧洲成人免费视频| 国产精品无码一二三视频| 成·人免费午夜无码视频在线观看 | 亚洲天堂网在线播放| 亚洲第一视频网| 国内熟女少妇一线天| a级毛片在线免费| 欧美中文一区| 国产精品久久久久久久久久久久| 91九色国产在线| 九九热精品免费视频| 丰满人妻被猛烈进入无码| 专干老肥熟女视频网站| 亚洲欧美综合精品久久成人网| av大片在线无码免费| 久草热视频在线|