
人臉識別技術利用基于人臉特征點的算法進行識別,因此人臉特征點是其中一種主要的數據形式。每次你上傳一張照片到 Facebook、Instagram,或者其他地方,你都會將照片中人的面部特征點和照片中其他物體的特征點提供給這些學習系統。為了解決這個問題,多倫多大學的 Parham Aarabi 教授和研究生Avishek Bose 領導的研究小組開發了一種算法來動態干擾這項技術。
這種技術原理基于“對抗性訓練”,本質上是建立起兩種相互對抗的算法。Aarabi 和 Bose 創建了兩個神經網絡,一個是識別人臉的網絡,另一個是破壞其既定目標的神經網絡。這兩個網絡互相學習,相互提升效果。Bose 在接受 Eureka Alert 的采訪時說:“具有破壞性的人工智能可以‘攻擊’人臉識別時神經網絡所尋找的東西。例如,如果檢測 AI 正在尋找眼角,它會調整眼角,這樣眼睛就不那么明顯了。它會在照片中產生非常細微的干擾,但對探測器來說,這些干擾足以愚弄整個系統。”
在實踐中,這意味著用戶可以使用一個過濾器 (比如 Instagram 或Snapchat 上的普通視覺過濾器),改變圖像中人眼無法察覺的特定像素,使人臉識別技術失效。在一個包含600 多張不同種族、光照和環境的人臉圖像的測試集上,該系統能夠將可檢測的臉從 100% 降低到 0.5%。