曹 延,曾如翔,陳響亮,洪 濤*,張維剛,何正罡
(1.中國計量大學,杭州 310018;2.浙江方圓檢測集團股份有限公司,杭州 310018)
語音識別技術憑借其便捷性,在智能家居領域迅速發(fā)展[1-2]。據調查,2021 年中國智能家居設備市場出貨量2.5 億臺,同比增長21.1%。截至2027 年,智能家居市場規(guī)模將達到2 078.8 億美元[3]。智能燃氣灶是隨智能家居發(fā)展,興起的新型智能化產品,與傳統(tǒng)燃氣灶具相比,其獨特的語音識別功能為使用人群帶來諸多便利[4]。但與智能燃氣灶快速發(fā)展不匹配的是其語音識別功能檢驗方法的缺失。
目前,智能家居領域內較完備的標準是SJ/T 11688—2017《智能電視智能化技術評價方法》。該標準由全國音頻、視頻及多媒體系統(tǒng)與設備標準化技術委員會制定,其中包含了語音交互、體感交互的測試方法,但測試對象僅限于智能電視,無法滿足智能燃氣灶語音識別可靠性測試要求。而應用最為廣泛的標準是GB/T 36464.2—2018《信息技術 智能語音交互系統(tǒng)第2 部分:智能家居》。此標準規(guī)定了語音輸入準則、喚醒成功率、交互成功率等計算方式和遠場拾音距離,但智能燃氣灶實際應用距離小于3 m,且未詳細規(guī)定測試點位。基于此,本文根據智能燃氣灶的實際使用情況,從測試環(huán)境、測試點位、語音口音等角度對智能燃氣灶語音識別測試方法進行探究。
根據智能燃氣灶實際使用環(huán)境和相關測試標準,搭建測試環(huán)境和語音采集環(huán)境,并按語音識別功能的命令集,采集不同音頻數據,搭建數據庫。進一步連接符合精度要求的設備,選擇合適的試驗方法,搭建檢測系統(tǒng),進行試驗,再對實驗結果分析評價。研究技術路線如圖1 所示。

圖1 研究技術路線
為保證測試可靠,選取CRY605 型人工嘴,通過BNC 接口與上位機輸出串口連接,接收上位機發(fā)出的語音集信號單元并正常發(fā)聲,總諧波失真不大于1%;M3 型揚聲器通過USB 接口與上位機輸出串口連接,接收上位機發(fā)出的噪聲集信號單元并正常發(fā)聲,總諧波失真不大于1.5%。
考慮到影響因素眾多,按傳統(tǒng)的遍歷試驗會造成試驗次數繁多,所耗成本巨大,因而利用正交試驗法挑選試驗條件,安排試驗計劃,并通過較少次數的試驗,簡化試驗條件,選取最優(yōu)化的試驗方案。
根據實驗結果,計算測試樣機的總識別成功率。運用Minitab 軟件對試驗數據的進行正交分析,以此評價試驗數據及結果的可靠程度。
為降低環(huán)境底噪對測試的影響,選取靜音室作為所需噪聲集及命令集的錄制環(huán)境,并對所錄制音頻進行濾波優(yōu)化處理。濾波優(yōu)化模塊采用二階有源帶通濾波器,以實現音頻數據的濾波優(yōu)化。此外,為了保證空氣的吸收作用可小至忽略,要求所選靜音室混響時間在2 kHz 處小于1.5 s,在4 kHz 處小于0.8 s。
按GB 3096—93《城市區(qū)域環(huán)境噪聲標準》中對城市5 類環(huán)境噪聲標準值的規(guī)定,結合家用智能燃氣灶使用場景,控制噪聲集平均聲壓級范圍在40~50dB(A)。為保證信噪比達到標準規(guī)定的10 dB(A),控制測試命令集平均聲壓級范圍50~60 dB(A)。上述噪聲集通過人工嘴播放。
由于智能燃氣灶大多置于廚房內,通過對國內普通住宅廚房平均面積的調查,搭建模擬廚房時,控制其為面積5~8 m2的常見U 型廚房[5]。為真實還原智能燃氣灶實際使用環(huán)境,考慮廚房內物品對語音信號的吸收、反射等作用對測試的影響,為模擬廚房配備了必要家居,包括洗漱臺、櫥柜等。
2.3.1 噪聲數據庫
依據家用智能燃氣灶實際使用場景常見的噪聲,收集16 種噪聲,建立噪聲數據庫。根據實際調研,按其對測試影響的程度,最終選取正常底噪、油煙機噪聲、語言噪聲和水流聲4 項具有代表性噪聲用于測試時模擬實際噪聲。
2.3.2 語音數據庫
由于目前缺乏智能燃氣灶語音測試標準、完善的訓練音頻庫和評估庫,無法直接調用已有的標準測試音頻進行測試。因此,在對市面上智能燃氣灶產品功能進行調研后,得出測試用的集內命令集。另外,針對用戶常用的命令,組成測試所用集外命令集。
影響智能燃氣灶的語音識別喚醒成功率和交互成功率的因素包括口音、距離、高度和背景噪聲,每一種影響因素都有多水平層次。若按傳統(tǒng)控制變量試驗,將四大影響因素的每一水平分別組合,會得到144 種試驗方案,總試驗次數達到43 200 次,耗時長。因此引入正交試驗,利用一套規(guī)格化的表格,選出少數幾個代表性強的試驗條件概括所有因素的所有水平對試驗的影響情況。具體試驗步驟如圖2 所示。

圖2 正交試驗設計流程圖
首先分析常規(guī)影響因素,確定各因素的不同水平,選取最接近標準正交試驗表,應用擬水平法,建立因素水平表,進行正交試驗,將結果記錄并分析。
按照智能燃氣灶實際使用情況進行布局后,將聲級計放置于智能燃氣灶收音麥克風,距離小于5 cm,但不與收音麥克風接觸,用于測量播放語音和噪聲的分貝值。
因廚房平均面積為5~8 m2,考慮家用智能燃氣灶實際使用場景,測試時控制智能燃氣灶使用距離不超過1.5 m,語音識別測試均為近場測試[6],距離因素取50、100、150 cm 三水平。考慮我國中年男性和女性的平均身高為169.7、158 cm[7],高度因素取155、165、175 cm 三水平。
根據影響因素及其水平建立因素水平表。如表1所示,表中A 因素與B 因素只有三水平,選取最具可能性的水平作為第四水平,建立正交設計表。

表1 因素水平表
按照上述正交設計表進行測試,具體流程如下:
1)連接噪聲播放設備,對其進行調試,使其輸出音頻聲壓級滿足試驗要求的45±1 dB,通過位于智能燃氣灶收聲處的聲級計示值對其進行合格性判定。
2)連接語音播放設備,對其進行調試,使其輸出音頻聲壓級滿足試驗要求的55±1 dB。通過位于智能燃氣灶收聲處的聲級計示值對其進行合格性判定。
3)按正交設計表依次進行試驗,每種測試條件隨機播放100 條喚醒語句,視智能燃氣灶3 s 內正常響應為喚醒成功。
4)記錄16 種測試條件的喚醒成功率和交互成功率。
實驗數據記錄及分析表見表2—表5。

表2 智能燃氣灶語音識別數據表
從極差的角度進行分析。從表2 可看出影響喚醒成功率最大的是C 因素,C2 水平下效應最低,其次是B 因素和D 因素,效應最低水平為B1、D4;影響集內語音和集外語音交互成功率最大的是D 因素,極差遠大于其他三者,效應最低的水平均為D3。
從方差的角度進行分析。各因素相應自由度、均方根、F 值和p 值的計算結果見表3、表4、表5。在取置信水平α 為0.05 時,各因素p 值均大于0.05,表明無顯著影響;但當α 取0.1 置信水平時,針對集內語音和集外語音的交互成功率,D 因素p 值小于0.1,表明有顯著影響,即口音因素對交互成功率最大,與極差分析結果一致。

表3 喚醒成功率方差分析表 %

表4 交互成功率(集內)方差分析表

表5 交互成功率(集外)方差分析表
綜上,對于智能燃氣灶的語音喚醒成功率,各因素影響不顯著,高度、底噪、口音影響略大于距離;而針對集內和集外語音的交互成功率,口音影響顯著,且交互成功率較低。因此,智能燃氣灶廠商在進行產品優(yōu)化設計時,應當加強智能化設計,同一指令進行語序變化時,還能進行有效識別;在出廠檢驗時,要重點模擬不同高度和口音環(huán)境,進行有效的功能檢測,以滿足顧客需求。
語音識別技術在家用電器領域的應用正不斷擴大,智能燃氣灶作為智能廚房的重要組成部分之一,其語音識別測試方法的開發(fā)與完善將推動智能燃氣灶生產企業(yè)及第三方檢測機構的迅速發(fā)展。本文提供了一套具體的智能燃氣灶語音測試方法,通過模擬環(huán)境的搭建、背景噪音的疊加以及測試語音庫的搭建等措施,滿足智能燃氣灶語音測試對測試環(huán)境、背景噪音等方面的要求,并進行具體實驗,為相關企業(yè)產品的設計與開發(fā),以及第三方檢測機構對智能燃氣灶語音識別功能的檢測提供了參考方案。