網(wǎng)絡(luò)購(gòu)物還用再為不知道關(guān)鍵詞而手足無(wú)措嗎?未來(lái)通過(guò)圖像搜索,想圖就能購(gòu)物。
2010年春晚,牛莉、郭冬臨的小品《一句話的事》反響平平,但播出后一位網(wǎng)友在時(shí)尚論壇發(fā)出了《牛莉的大衣什么牌子?真好看!》的帖子,卻在網(wǎng)絡(luò)上掀起了一陣人肉大潮,搜遍各大品牌官網(wǎng)與秀場(chǎng)圖片,第二天網(wǎng)友終于找出了這件大衣的品牌:Prada。
這樣的情形不少人應(yīng)該都經(jīng)歷過(guò):看到明星穿著自己喜歡的衣服,想買同款或相似款,但又不知其品牌;看到一張喜歡的圖片,想設(shè)為壁紙,卻因?yàn)橄袼靥突蛩『艽笥貌涣耍还浣謺r(shí)看上了某位路人穿的衣服,不好意思上前詢問(wèn),但又不知道怎么找到相似款式;想在購(gòu)物網(wǎng)站上搜索一件衣服、一雙鞋,但又不知道用什么關(guān)鍵詞最貼切;看到美麗的景點(diǎn)、建筑,卻不知其名,所在何處……
不再需要為關(guān)鍵詞冥思苦想,不再需要進(jìn)行大規(guī)模人肉搜索,以上這種種問(wèn)題,未來(lái)都可能通過(guò)圖像搜索,用“以圖搜圖”的方式來(lái)解決。
以圖搜圖,顧名思義,用戶可以通過(guò)上傳本地圖片或輸入網(wǎng)絡(luò)圖片的URL地址來(lái)搜索相同或相似的圖形圖像,是搜索引擎的一種細(xì)分。
圖像搜索在互聯(lián)網(wǎng)領(lǐng)域早已不是什么新鮮事,國(guó)內(nèi)外各大搜索引擎谷歌、百度、搜狗等,都推出了自己的圖像搜索,還有一些獨(dú)立的圖像搜索引擎,如Tineye等。通過(guò)這些圖像搜索引擎,用戶可以發(fā)現(xiàn)圖片的來(lái)源與相關(guān)信息,尋找更高分辨率版本的圖片,搜索相似風(fēng)格或色調(diào)的圖片,還可以用來(lái)追蹤圖片(如自己的照片)在互聯(lián)網(wǎng)的傳播等。
以圖搜圖是如何運(yùn)作的?以谷歌的圖像搜索引擎為例,其并非通過(guò)文件名、所在域名或是被嵌入頁(yè)面的關(guān)鍵字來(lái)識(shí)別。當(dāng)用戶啟動(dòng)圖片搜索,谷歌在后臺(tái)通過(guò)復(fù)雜的算法分析該圖片,將其分離成不同的特征(features)小塊,捕捉到圖片的顏色、紋理和圖形等特征。然后后臺(tái)服務(wù)器會(huì)將這些信息與來(lái)自互聯(lián)網(wǎng)的幾百億張圖片進(jìn)行特征匹配,將查詢結(jié)果反饋給用戶。
相對(duì)于這一類單純圖像搜索,圖片購(gòu)物搜索引擎,例如今年7月上線的淘寶圖想(http://imagine.taobao.com/),則將圖像搜索與電子商務(wù)緊密地結(jié)合了起來(lái)。
打開(kāi)圖想,通過(guò)上傳圖片或粘貼圖片地址進(jìn)行搜索,結(jié)果會(huì)以環(huán)狀云圖的方式呈現(xiàn),最內(nèi)圈商品相似度最高,向外依次遞減。每個(gè)搜索出的商品都顯示了價(jià)格,用戶可以直接點(diǎn)擊進(jìn)入購(gòu)物頁(yè)面。
圖像搜索由于需要海量數(shù)據(jù)庫(kù)、先進(jìn)的圖像特征識(shí)別技術(shù)以及超大規(guī)模實(shí)時(shí)計(jì)算能力,所以門檻很高,且目前技術(shù)也還不夠完善。而淘寶圖片導(dǎo)購(gòu)組負(fù)責(zé)人認(rèn)為,淘寶做圖像搜索有著先天的優(yōu)勢(shì):“淘寶的網(wǎng)頁(yè)都是統(tǒng)一化的,每個(gè)商品圖片已經(jīng)打上了相應(yīng)的標(biāo)簽(tag),這些標(biāo)簽有助于圖片的識(shí)別,不會(huì)是漫無(wú)目的地去搜索。”
圖想將物品分成兩類:一類為剛體物品,剛體物品是不變形的,例如電腦、茶杯等;而非剛體的外形則很易變,如衣服。就搜索來(lái)說(shuō),剛體搜索較為簡(jiǎn)單,非剛體搜索對(duì)技術(shù)的要求更高。
從另一個(gè)維度,物品可以被分為標(biāo)品和非標(biāo)品。電子商務(wù)網(wǎng)站都會(huì)為商品打上SKu(最小存貨單位)標(biāo)簽,這類為標(biāo)品;而也有很多商品,比如衣服,由于廠家、品牌太多,更新?lián)Q代太快,尺寸類型太多等原因,很難打上標(biāo)簽,這類則為非標(biāo)品。圖想認(rèn)為非標(biāo)類商品超過(guò)了電子商務(wù)零售50%的市場(chǎng)份額,由于難以用關(guān)鍵詞準(zhǔn)確描述,是圖像搜索的主要搜索對(duì)象。
淘寶圖想的嘗試,是因?yàn)槠淇吹搅藞D像搜索在商業(yè)化應(yīng)用方面的廣闊前景。上述負(fù)責(zé)人認(rèn)為,圖像搜索的市場(chǎng)巨大,“凡是電子商務(wù)零售市場(chǎng),都可以成為圖像搜索市場(chǎng),標(biāo)品、非標(biāo)品,剛體、非剛體都可以成為搜索對(duì)象”。另外,據(jù)圖想粗略估算,互聯(lián)網(wǎng)上大概有20%的圖片都是具有導(dǎo)購(gòu)功能的,即搜索起來(lái)能夠給電子商務(wù)帶來(lái)成交可能性。舉例來(lái)說(shuō),一些山水圖片可能較難帶來(lái)成交,但很多人物圖片、社會(huì)新聞?lì)悎D片等,是具有一定導(dǎo)購(gòu)功能的。圖想認(rèn)為,來(lái)自電子商務(wù)網(wǎng)站的圖片只是最基礎(chǔ)、最少的一部分,在電商網(wǎng)站以外的海量具有導(dǎo)購(gòu)功能的圖片價(jià)值可能更大。
而對(duì)于大規(guī)模的商業(yè)化運(yùn)作,上述負(fù)責(zé)人坦言,淘寶的圖像搜索“就像是剛生下來(lái)的孩子,先活好再說(shuō),我們現(xiàn)在不太會(huì)考慮商業(yè)化方面的東西,目前把用戶體驗(yàn)做好是第一位的。只要用戶喜歡的東西,一定有商業(yè)價(jià)值”。
對(duì)于圖像搜索用戶體驗(yàn)的提升,可以從三個(gè)維度進(jìn)行衡量:精確度、反應(yīng)速度與廣度。精確度對(duì)于搜索是最重要的,在未來(lái)圖想可能將圖像搜索與文本搜索做結(jié)合,進(jìn)一步提高搜索精確度,例如以圖搜索的同時(shí)加上一個(gè)或幾個(gè)關(guān)鍵詞。反應(yīng)速度方面,圖想希望做到能在3秒內(nèi)呈現(xiàn)搜索結(jié)果。廣度方面,目前每次搜索都需要用戶選擇對(duì)應(yīng)類目,圖想希望以后能夠不限類目進(jìn)行搜索,用戶操作更簡(jiǎn)便,但同時(shí)對(duì)后臺(tái)的計(jì)算能力要求也更高。
圖像搜索作為革命性的應(yīng)用,各大互聯(lián)網(wǎng)巨頭在該領(lǐng)域的探索體現(xiàn)了它的巨大價(jià)值,在未來(lái)幾年內(nèi),圖像搜索技術(shù)將會(huì)不斷完善,而對(duì)圖像搜索商業(yè)價(jià)值的想象與挖掘亦在不斷進(jìn)行中,前景令人期