999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“動動嘴皮子”AI就能知道你在說什么

2023-04-25 12:01:29蒲陽伯
計算機與網絡 2023年5期
關鍵詞:人工智能模型

蒲陽伯

AI讀唇語并非只能被用于破譯“隱藏劇情”。據統計,我國聽力殘障人口超過2 054萬,除了主要的手語交流外,讀唇語也是他們重要的溝通方式。但人工解讀唇語容易受到個人經驗、視覺感受能力、語言理解能力等因素影響,在正確率方面差強人意,于是人們開始嘗試利用AI技術來解讀唇語。

比唇語專家更懂唇語

“所謂AI讀唇語,即人工智能唇語識別,其核心技術框架為視覺識別和自然語言處理。”北京理工大學計算機學院副教授、網絡與安全研究所所長閆懷志介紹道,具體而言,就是利用機器視覺技術,將人臉從圖像中連續識別出來,并提取其中連續的口型變化特征,輸入至唇語識別模型,辨識出該人物口型對應的發音,進而輸出可能性最大的表達語句。

“視覺識別和自然語言處理分別有著龐大的技術體系和不同的技術路線,但究其本質,都是通過大量的唇語數據來訓練AI模型,力求文本輸出的準確性。”閆懷志補充道。

近幾年,不斷有AI巨頭開始在唇語識別賽道上作出嘗試。谷歌旗下Deep Mind公司就與英國牛津大學合作,研發出了一款AI讀唇語軟件,通過讓AI讀唇語軟件“收看”數千小時的電視節目來訓練其唇語識別能力。有意思的是,在隨機抽取200個視頻片段的讀唇語測試中,AI讀唇語軟件的準確率達到了46.8 %,而經過專業訓練的人類讀唇語專家,準確率僅為12.4 %。

為何AI讀唇語能夠悄然興起?閆懷志給出了自己的分析:一是強烈的需求牽引,二是巨大的技術推動。從需求牽引來說,唇語識別不僅可為部分殘障人士提供方便,更可以在公共安防等諸多領域發揮巨大作用。從技術推動來說,由于AI算法、算力以及數據瓶頸被不斷突破,使得AI技術在唇語識別領域取得較大成功成為現實。

眾多難題有待突破

不過,閆懷志也表示,目前我國人工智能唇語識別技術尚處于起步階段,若想利用人工智能準確地識別唇語,還有很長的路要走。

從語言本身來看,人類語言具有較高的復雜性,在人類話語所涉及的所有音標中,僅有30 %左右是直接由人類嘴唇來控制的,70 %是難以通過肉眼,甚至是機器視覺區分的齒音、舌音以及喉音。而且,不同人說話的語氣、方言、連詞、口音乃至胡須遮蓋等因素,都會導致嘴型的細微變化,而恰恰是這種細微變化,會嚴重影響人工智能對于唇語的識別和判斷。

從技術層面來看,人工智能采集唇語的環境通常較為復雜,若想精準識別難度很高。以目前的人工智能技術而言,對于長句、復雜句式等的識別水平不盡如人意,更不用說還存在著多場景識別、多人像唇語識別等問題。閆懷志表示,只有解決了上述問題,AI讀唇語才能得到突破性提升,邁向成熟發展階段。

那么,人類不同語種之間千差萬別,AI能讀懂每個語種的唇語嗎?閆懷志介紹,此前較為成功的AI讀唇語系統大多僅限于英語模型,這是因為多數AI模型都是基于英語數據訓練而得。但是,從技術框架上來說,不同語種的訓練模型是基本一致的,或者說可以依賴于同一類技術手段來實現。

當然,為了適應不同語種的唇語識別,也需要作一些適應性調整:一方面要選擇對應語種的數據進行有針對性的訓練;另一方面,還需要對AI模型進行調整,比如納入時間屏蔽、優化語言模型以及改進超參數等。

此外,同一語種也會有不同口型,即便口型類似,也可能代表著完全不同的意思。因此,成熟的AI讀唇語系統需要大量的唇語特征樣本數據,并盡可能地覆蓋多種應用場景、多類型的說話人群,借此來提升訓練后的唇語識別模型的泛化能力,提高AI讀唇語對于不同口型和不同表意語言的識別準確率。

亟須監管的技術雙刃劍

盡管存在種種難題,但仍有越來越多的AI企業開始涉足并計劃深耕人工智能唇語識別賽道。目前來看,各大AI巨頭的選擇不盡相同,具體可分為唇語數據、唇語視頻識別、唇語理解等。

閆懷志表示,目前許多人工智能唇語識別技術領域已實現初步突破,全鏈條集成前景可期,產業集群正在逐步形成。

從應用場景來看,AI讀唇語在社會公益、公共安全等領域都已開始嶄露頭角。從目前各大巨頭的布局以及相關技術的發展趨勢來看,AI讀唇語預期可在身份識別、國家安全、智慧系統等方面具有廣闊的應用前景。“可以想見,由于公益、公共安全和國家安全等領域巨大潛在需求的牽引,以及AI技術飛速發展的強力推動作用,在不久的將來,AI讀唇語有望實現快速推廣與深度普及,產業前景十分可期。”閆懷志說。

例如,在安防安監領域,很多安監場景噪音較大或僅有視頻信號,無法準確捕捉聲音,人工智能唇語識別技術就能派上用場。在身份識別領域,可以利用AI讀唇語來實現口型支付密碼輸入,“動動嘴唇”就能實現身份識別和支付交易。在公共安全領域,利用AI讀唇語,可以在各類視頻中分析案件當事人的唇語信息,輔助案件偵查工作。在智慧系統領域,可利用AI讀唇語來實現“無聲勝有聲”———只依靠口型來控制智能設備,比如智能家電等。

當然,技術應用是把雙刃劍。很多人擔心,AI讀唇語會使人們對話中的隱私內容遭到泄露,無論當事人是公開發言、竊竊私語或是自言自語。“張張嘴”就被別人竊取聊天內容,仔細想來確實可怕。

閆懷志表示,這種擔心并非杞人憂天。AI讀唇語導致的隱私泄露,一方面可能是有人惡意進行唇語獲取識別,另一方面也可能是正常使用的AI讀唇語系統,但其中的存儲、使用等環節保護不當,導致相關數據被竊取或濫用,進而對個人權益造成損害。而且,由于涉及到當事人的對話內容,具有明顯的方向性,這種隱私泄露的危害性可能要比普通的個人信息泄露更為嚴重。

因此,閆懷志建議,應從隱私安全保護的角度,在管理層面加強相關法律法規的制定,嚴格規范和約束AI讀唇語的應用場景、范圍和目的,加大對技術惡意利用的監管和懲戒力度。此外,還要在技術層面加強AI讀唇語系統的安全保護體系建設,以技術手段提高系統的識別精準度,避免技術濫用,切實保障用戶對話的內容安全。

猜你喜歡
人工智能模型
一半模型
我校新增“人工智能”本科專業
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
3D打印中的模型分割與打包
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 04:56:22
主站蜘蛛池模板: 中日无码在线观看| 精品久久久久久成人AV| 一本大道香蕉中文日本不卡高清二区| 美女视频黄又黄又免费高清| 亚洲午夜福利精品无码| 免费一级毛片完整版在线看| 丰满人妻久久中文字幕| 国产爽爽视频| 国产成人综合欧美精品久久| 四虎永久免费网站| 草逼视频国产| 亚洲免费福利视频| 国产色婷婷视频在线观看| 小说 亚洲 无码 精品| 国模极品一区二区三区| 五月激情婷婷综合| 亚洲精品亚洲人成在线| 综合五月天网| 国产一区二区三区在线无码| 天天干天天色综合网| 欧美日韩中文国产| 国产成人精品无码一区二| 97国产在线视频| 天堂va亚洲va欧美va国产| 青青草国产免费国产| 1769国产精品免费视频| 好久久免费视频高清| 综合久久五月天| 国产一级二级三级毛片| 日韩亚洲综合在线| hezyo加勒比一区二区三区| 99久视频| 中文字幕在线日韩91| 日本午夜影院| 久久香蕉国产线看精品| 久久无码av一区二区三区| 特黄日韩免费一区二区三区| 最新精品国偷自产在线| 精品午夜国产福利观看| 国产特级毛片aaaaaaa高清| 四虎精品黑人视频| 激情无码字幕综合| 91在线播放免费不卡无毒| 色综合天天综合中文网| 亚洲视频二| 超碰aⅴ人人做人人爽欧美| 在线看国产精品| 亚洲无码高清视频在线观看| 激情爆乳一区二区| 国产人成在线观看| 国产原创自拍不卡第一页| 青草视频网站在线观看| 亚洲欧洲自拍拍偷午夜色| 精品国产aⅴ一区二区三区| 热久久这里是精品6免费观看| 欧美日韩国产成人高清视频| 国产亚洲美日韩AV中文字幕无码成人| 国产亚洲精久久久久久久91| 国产精品妖精视频| 亚洲一区二区日韩欧美gif| 思思热精品在线8| 亚洲国产中文欧美在线人成大黄瓜 | 国产真实乱人视频| 亚洲二三区| 无码丝袜人妻| 91小视频在线观看| 91在线精品麻豆欧美在线| 日韩av电影一区二区三区四区| 亚洲国产清纯| 欧美一区精品| 亚洲日韩AV无码精品| 99在线免费播放| 三级毛片在线播放| 丝袜国产一区| 久久香蕉国产线| 亚洲精品中文字幕无乱码| 国产欧美日韩91| 亚洲久悠悠色悠在线播放| 国产成人综合久久| 亚洲天堂自拍| 国产麻豆另类AV| 99成人在线观看|