計算機視覺是人工智能研究的基礎領域之一,也為深度學習等方面的巨大進步做出了貢獻。
斯坦福大學計算機科學系教授李飛飛認為,這些進步幾乎都依賴于對“北極星”(指代科學研究的關鍵問題)的追求。
近日,她發表了一篇題為《尋找計算機視覺“北極星”》的文章,闡述了計算機視覺中對象識別的最新發展觀點、ImageNet 數據集的簡要歷史與相關工作進展。
李飛飛表示,關鍵問題的提出會推進計算機視覺,甚至整個人工智能領域的發展。
目前,人工智能領域正在快速發展,從垃圾郵件過濾器、個性化零售到自動駕駛等,人工智能的成功實施無處不在。就像阿爾伯特·愛因斯坦所說:“提出一個問題往往比解決一個問題更重要。”

李飛飛團隊(前排右二)
但這些實踐背后涉及的科學問題或者哪些問題最需要解決可能并不總是顯而易見的。一旦制定了某領域的一個基本問題——確定一顆“北極星”,就可以推動該領域跨越式發展。
李飛飛提到,她在計算機視覺上的研究,一直由自己的系列“北極星”所驅動。
視覺能力是智能的核心,正如眼睛的進化是造就包括人類在內的許多不同物種的關鍵。人類可以使用視覺感知來理解世界,并與它互動。那么,怎么讓人工智能去看呢?這里面需要解決許多問題,而對基本問題的選擇是計算機視覺科學探索的重要組成部分。
“起初,怎么樣讓計算機正確識別給定圖像中的內容是我們特別想要了解的問題。2000年代初,由于互聯網和數碼相機的快速發展,數字圖像的數量呈爆炸式增長,從而產生了自動對照片集進行編目,并使用戶能夠搜索這些圖像集等需求,而這就需要用到對象識別。……