讓計(jì)算機(jī)能像人類一樣“看”到一幅圖片的興趣中心?這并非不可能。
在一些專業(yè)圖片公司里,很多員工每日做著簡單而枯燥的工作,對各種圖片進(jìn)行歸類、標(biāo)注,撰寫描述信息。計(jì)算機(jī)何時(shí)才能夠像人類一樣看懂一幅圖片?

市場現(xiàn)狀是,搜索引擎能夠認(rèn)字,卻無法識(shí)圖。無論是基于桌面的圖片管理軟件還是基于互聯(lián)網(wǎng)的圖片搜索,都還停留在一個(gè)淺顯的層次,主要依靠圖片本身的文件名稱和簡介來獲取一幅圖片的含義。給搜索引擎一張圖片,它很難像搜索關(guān)鍵字那樣,搜索出與之相關(guān)的圖片。
圖片搜索可以變得更智能嗎?微軟亞洲研究院的研究員張磊博士為《互聯(lián)網(wǎng)周刊》帶來了肯定的答案。新一代圖片搜索技術(shù)已經(jīng)可以像人一樣,“看”到一幅圖片的興趣中心,判別它是人物肖像照或是風(fēng)景照、攝于室內(nèi)還是戶外。甚至,在人的協(xié)助下,計(jì)算機(jī)還能夠在許多張合影中找尋到同一張人臉。這些聽起來不可思議的事情,已經(jīng)在微軟的實(shí)驗(yàn)室里變成了現(xiàn)實(shí),甚至有些技術(shù)已應(yīng)用到部分產(chǎn)品當(dāng)中。
通常,用數(shù)碼相機(jī)拍攝的照片都帶有時(shí)間戳,因此當(dāng)系統(tǒng)將其按照時(shí)間分組時(shí),較為容易實(shí)現(xiàn)。在時(shí)間軸上,各張照片的時(shí)間戳分布是不均勻的,而根據(jù)其時(shí)間間隔密度,系統(tǒng)便可以把一段時(shí)間內(nèi)拍攝的照片自動(dòng)分組。這樣用戶可以很容易按照時(shí)間意義上的事件來選出需要的照片。
而在按照室內(nèi)/室外、城市/風(fēng)景進(jìn)行分組時(shí),實(shí)現(xiàn)起來則稍有難度?!?br>