在很多武俠小說中,經常會看到一些武林高手雖然站在遠處,卻能通過讀唇語知曉別人說了什么。時至今日,這項“特異功能”不再只是武俠小說中擁有的情節,下面就來認識一下這項神奇的唇語識別技術吧。
唇語識別技術是一項集機器視覺與自然語言處理于一體的技術,唇語識別技術通過機器視覺技術,從圖像中連續識別出人臉,并提取此人連續的口型變化特征,隨即將連續變化的特征輸入到唇語識別模型中,識別出講話人口型對應的發音,從而計算出可能性最大的表達語句。此外,唇語識別技術的精確度研發基于1萬小時新聞式的唇語節目,目前英文準確度已經達到80%,中文準確度已經達到71%。
唇語識別技術在噪音太大或只有攝像頭等無法準確捕捉聲音的場合中具有很強的實用性。在馬路、會議室、商場等噪音較大的場景里,唇語識別技術可以規避噪聲對用戶說話內容獲取的影響,確保語音輸入的準確率;此外,目前在電梯、馬路等監控場景中只有攝像頭,并沒有麥克風,通過唇語識別技術可以獲取指定用戶的講話信息,為公共安全提供有效支持。
唇語識別技術又可以應用于哪些領域呢?場景教育、身份識別、公共安全、移動支付、軍事情報等領域中都可以應用唇語識別技術。比如,通過唇語識別技術支持下的口型支付密碼,消費者動動嘴唇就能進行支付;而在軍事情報領域中,唇語識別技術則讓遠距離獲取情報成為可能;若在公安系統中加入唇語識別技術,公安人員則可通過平臺獲取視頻中犯罪嫌疑人的語言信息,這將極大助力犯罪緝查工作的開展。