林發輝
【摘要】 本文對室內語音無線識別及求救設備的設計思路和主要技術進行了分析和設計。設備運行過程中,以單片機為主控芯片,主要應用語音識別和無線傳輸兩個環節完成呼救音的識別和呼救監控的觸發,能夠將求救信息及時傳遞給救援人員,保證了家居安防和人們的生命財產安全。
【關鍵詞】 單片機 語音識別 無線求救 室內安全
一、前言
及時報警在家居安防監控過程中非常重要。在很多場合下,遇險后報警人是無法通過正常方式報警的,例如入室搶劫時被害人會被蒙住嘴和眼睛,突發疾病的人無法清晰、大聲的求救。因此,在出現突發情況時,簡單的聲音呼救是沒有效果的,必須通過一定的識別設備,及時接收并識別輕微的、模糊的聲音,這對提高家居環境的安全度具有重要的意義。在實際應用過程中,識別設備在接收到真的呼救信號后,能夠觸發監控探頭將現場的圖像記錄下來,并將信息及時傳遞到救援機構或報警人親屬,這樣就能讓報警人獲得便捷、快速和有效的保護。本文基于單片機構建了一套室內語音識別及無線求助系統,該系統實現了室內報警語音的識別和報警信號的傳輸,創新地將無線通信技術和語音識別技術結合起來。從實際情況出發,使得家居用戶在緊急情況發生時不需要尋找報警和通訊設備,只需要動口就能完成求救工作。
二、系統框架分析
2.1主控芯片
本系統主要基于STM8系列的單片機對室內語音識別系統進行設計。單片機作為系統的主控芯片,對整個系統的架構設計優化、信息傳輸速度提升、系統開發維護都具有重要的作用。該系列的單片機包含8位框架結構,其中,CPU包含6個寄存器,這些寄存器對提高數據的訪問和處理能力十分重要。另外,該系列單片機具有支持20個尋址方式和80個基本語句的指令集,并且CPU的所有寄存器都具有可尋址地址。而且,該系統的單片機保密功能良好,目前處于世界領先的地位,對保護我們的知識產權,維護項目成果在市場競爭中的正當性具有重要的意義。
2.2系統流程控制
當出現求救信號后,系統首先使用麥克風采集室內的語音信息,然后在通過無線傳輸模塊將聲音信號轉化成電信號并傳送給單片機,在微控制器——單片機的控制下,首先由語音識別模塊對聲音信號進行判斷和分析,如果確認收到的信號為求救信號,則當單片機收到語音識別模塊確認后,將控制通信模塊將求救信息發送出去。同時,設備的液晶顯示屏上會出現求救時間的發生時間,設備喇叭會發出報警聲,直到使用按鍵輸入后才能取消報警。詳細的系統流程控制圖如圖1所示。
三、語音識別控制
本系統中的語音識別是設備的重要組成部分。使用語音識別是提高室內安防效果的重要途徑。按照實際的需求,報警對象可以發出一些簡單的聲音入室搶劫時被害人會被蒙住嘴和眼睛,突發疾病的人無法清晰、大聲的求救。這種聲音模式是不引人注意的,用力幅度也是比較小的,但是其中仍然包含可用的音頻數據。這種聲音數據在呼救現場不會引起人們的注意,沉悶而且單調,同時,這種聲音還有其他的一些特點,例如,呼救音在時域上具有非常強的穩定性。

在時域上,能夠針對此類信號提取短時平均過0率和能量。而且,按照實際的需要,此類語音識別主要針對特定人語音的識別,只有設定的呼救者發出呼救并被確認以后,語音識別模塊才能被觸發并使整個系統開始工作。具體實現的功能需求包括:能夠對呼叫的語音信號進行識別。識別技術對語音文本的內容要求不高,只要能夠識別簡單的音素及其組合即可。這時人們在特殊環境下必須發出的聲音的。但是,只能采用特意拖長的發音時間及反復的相同的語音信號進行呼救;能夠對說話的人的身份進行識別的功能,以確定特定的呼救用戶;對識別的結果提供一種觸發手段,例如遠程報警、觸發報警鈴、打開視頻監控等。
本裝置語音識別的過程如圖2所示。
語音識別最主要的部分是對特征的提取和模式的匹配。所謂特征提取,又包括語音前端處理與特征提取。前者指語音采樣、分幀、A/D變換、特征提取和端點檢測等。首先要識別特定人的聲音,并對聲音進行采樣。系統語音的采樣和A/D變換都是通過硬件完成的。采集的數據表明:成年人的有意識低音能夠延續7.5左右,而普通的無求救意識發音不會存在如此上的時間,而且也不會保持持續的穩定的頻率和振幅。除此之外,呼救音的具體長短能夠根據口型、聲帶、肺活量和堵塞物的進行分析。例如,不同的堵塞物,或者不同的堵塞方式,都會造成差異的波形變異特征,這種數據規律是可尋的。因此,語音識別的著眼點就在于疊加多個特征量,形成多層次的識別模型。
四、數據無線傳輸控制
無線數據傳輸模塊主要基于GPRS網絡進行信號傳輸。這種傳輸方式成本較低,適用于短距離傳輸的情況,非常適合家居語音識別及求救系統的應用環境。GPRS在進行無線信息傳輸時,目前常用的是多媒體服務MMS,因此我們只需要將報警信息按照MSS協議進行打包,就能快速完成信息的傳輸過程。其中,報警信息數據包括WSP和WTP兩種結構。
在本系統研發過程中,我們應用NRb24LO1無線傳輸模塊,這個模塊屬于2.4G信息傳輸,內容集成了PCB天線,調制過程為GFSK,在國際通用頻段ISM上共有125個頻點,能夠保證2M數據的高速傳輸。該模塊還將高度信號處理功能集成進來,這里面主要包括自動應答和自動重發數據包等。
模塊內置的點對點通信控制和CRC容錯機制,能夠保證數據的安全、穩定傳輸,另外,還包括了載波檢測和傳輸錯誤計數等功能,能夠進行跳頻設置。模塊的SPI結構能夠與單片機直接相連或使用單片機進行模擬,內部的FIFO能夠處理各種高、低速的接口,并選擇性打開某些接收通道,因此能夠適應各類型單片機的使用。
五、結論
總的來說,本設備以單片機為控制核心,并在它的基礎上完成了語音識別模塊和無線傳輸模塊的設計開發,系統運行所需的成本較小,而且由于使用單片機進行集中控制,系統具有反應迅速、呼叫方便、操作便捷的特點,且可以設置呼叫不被察覺的模式,從而真正實現了安全求救的目的。另外,該設備的語音識別誤報率較低,市場推廣前景十分廣闊。
參 考 文 獻
[1]張雄偉,陳亮,楊吉斌.現代語音處理技術及應用[M].北京:機械工業出版社,2003.
[2]陳濤.基于DSP的語音信號識別系統的研究與實現[D].成都:成都理工大學,2010.
[3]林瑋,楊莉莉,徐柏齡.基于修正MFCC參數漢語耳語音的話者——識別[J].南京大學學報(自然科學版),2006,(01):54-62.