近幾年,人工智能技術發展的如火如荼。就在前不久,兩年一度的世界計算機視覺領域頂級會議ECCV2020的各項挑戰賽結果出爐。其中,在圖像分類賽中,阿里安全的高效AI分類技術超越三星、深蘭科技、同濟大學等國內外多支隊伍的同類技術,獲得冠軍。
目前人工智能的崛起以海量的帶標簽訓練數據作為基石,海量數據可以保障AI模型的效果,但是數據的收集和標注需要昂貴的人力成本,進行訓練則需要消耗大量計算資源。ECCV2020分類比賽的難題是,與其他比賽動輒使用十幾萬的數據不同,ECCV2020的分類比賽共有1000個類別,每個類別僅有50張圖片作為訓練數據。比賽要求選手在不使用任何預訓練模型和額外數據情況下,從零訓練模型。這意味著訓練難度巨大,幾乎是不可能完成的任務。
不過,這也正是ECCV2020為了考驗參賽隊伍如何對來之不易的訓練數據進行充分利用,促使AI神經網絡進行高效學習,降低神經網絡訓練過程中的人力和計算資源消耗,也就是說,參賽隊伍要打造一個高效能、低成本的分類AI。
阿里安全圖靈實驗室算法工程師夜清介紹,阿里安全智能算法團隊從三個技術方向進行了突破:利用隨機抽取的兩張訓練圖像,使用數據增強并進行拼接,最大程度豐富訓練樣本資源;設計獨特的神經網絡結構,加入顯著性特征模塊挖掘樣本的特點,提升分類性能;利用分層語義結構,讓AI模型更好地挖掘數據,實現更好的學習效果。
阿里安全圖靈實驗室資深算法專家華棠認為,高效AI分類技術極大程度上解決了計算資源消耗和數據標注的人力成本問題,為自動駕駛、物體識別、智慧城市等領域提供了新的思路和方法。……