周占寧
【摘要】本文對(duì)電子商務(wù)中基于內(nèi)容的圖像檢索應(yīng)用進(jìn)行了分析,文章闡述了基于內(nèi)容的圖像檢索技術(shù)的應(yīng)用現(xiàn)狀,并且對(duì)基于內(nèi)容的圖像檢索技術(shù)(CBIR)進(jìn)行了研究,最后提出了特征向量提取的要點(diǎn)。
【關(guān)鍵詞】電子商務(wù);基于內(nèi)容的圖像檢索;應(yīng)用現(xiàn)狀;技術(shù);特征提取要點(diǎn)
在現(xiàn)代社會(huì),市場(chǎng)經(jīng)濟(jì)體系得到了不斷的完善,各種新的經(jīng)濟(jì)形式涌現(xiàn)出來(lái),電子商務(wù)就是非常突出的例子。在電子商務(wù)企業(yè)的發(fā)展經(jīng)營(yíng)中,建立完善的商品運(yùn)營(yíng)體系是非常重要的,其中要用到大量的信息技術(shù),搭建好信息傳輸、圖像檢索等平臺(tái),使得商家和消費(fèi)者之間形成良好的溝通。
一、基于內(nèi)容的圖像檢索技術(shù)的應(yīng)用現(xiàn)狀
電子商務(wù)購(gòu)物網(wǎng)站本身具有一定的特別之處,而為了更全面地展現(xiàn)出商品信息,往往是將圖片作為其基本的信息載體。因?yàn)榧夹g(shù)的原因,商品信息的檢索大多是依靠文本標(biāo)注的方法來(lái)完成的,而這種標(biāo)注方法雖然能夠獲得比較全面的信息,但是準(zhǔn)確度并不高,這最終降低了商品信息的傳輸和檢索效率。以?xún)?nèi)容為主體的圖像檢索技術(shù)最早是運(yùn)用在一些特殊行業(yè),如公安刑偵的頭像對(duì)比、安防工作的指紋對(duì)比等等。在商務(wù)工作中,國(guó)內(nèi)發(fā)展比較先進(jìn)的圖像搜索引擎是“安圖搜”,它是集傳圖、視覺(jué)搜索為一體的全網(wǎng)比較購(gòu)物搜索引擎。
二、基于內(nèi)容的圖像檢索技術(shù)(CBIR)研究
(一)CBIR技術(shù)概念界定
以?xún)?nèi)容為基礎(chǔ)的圖像檢索技術(shù)將圖像內(nèi)容自身的特點(diǎn)當(dāng)做索引,這就避免了以文本為索引的單一、模糊問(wèn)題。CBIR是合集成技術(shù),它整合了顏色、紋理、形狀等不同的特征屬性,而這些特征是用向量方式被保存數(shù)據(jù)庫(kù)中的,在檢索時(shí),用戶只需要輸入模糊的特征,引擎自行通過(guò)匹配計(jì)算得到特征結(jié)論,并據(jù)此得到與之相關(guān)的圖像結(jié)果,按照特征相似度的高低,對(duì)其按先后進(jìn)行排序、呈現(xiàn)。
(二)商品圖像特征提取層次模型
在圖像數(shù)據(jù)庫(kù)中,對(duì)目標(biāo)特征進(jìn)行提取,而圖像特點(diǎn)的提取可以歸納為三個(gè)層次,其一是可視化層次,其中包括了商品的色彩、紋理、形狀、輪廓等直觀的外在特點(diǎn),這種提取方式最簡(jiǎn)單、最直接,使用的頻次也最高。其二是中間對(duì)象的層次,這是將圖像的單個(gè)地區(qū)或者目標(biāo)物體當(dāng)作索引工具,在操作時(shí)技術(shù)難度會(huì)更高。其三是高級(jí)抽象層次,這是在局部特征提取的前提下所展開(kāi)的抽象化描述,圖像的語(yǔ)義信息會(huì)更豐富,比如給圖像增添的的可以體現(xiàn)情感色彩的部分語(yǔ)義。
(三)組合特征提取算法分析
從電子商務(wù)商品的銷(xiāo)售特點(diǎn)來(lái)說(shuō),對(duì)實(shí)體圖像進(jìn)行呈現(xiàn),可以從多個(gè)方面來(lái)說(shuō),包括顏色、形狀等,所以以?xún)?nèi)容為基礎(chǔ)的圖像搜索方法中,也往往會(huì)和多個(gè)層次的特點(diǎn)提取操作相聯(lián)系,避免用單一檢索方法所帶來(lái)的局限性。而組合特征技術(shù)就是指對(duì)顏色、形狀特征向量二者加以聯(lián)合,構(gòu)成一種綜合性的商品特征。借助這種組合性質(zhì)的特征提取方法,可以綜合調(diào)動(dòng)兩種方法各自的優(yōu)勢(shì)。在圖像檢索技術(shù)中,顏色是最常見(jiàn)的特征類(lèi)型,在確定了具有該種顏色特征的產(chǎn)品范圍后,在此基礎(chǔ)上增加形狀特征等限定詞,縮小搜索范圍,使對(duì)象更加精確化。
三、特征向量提取的要點(diǎn)
(一)顏色特征向量提取
對(duì)商品來(lái)說(shuō),顏色本身是商品外在特征上非常重要的一種,而雖然各種商品都有其特定的特點(diǎn),但顏色是圖像內(nèi)容中最基礎(chǔ)的因素之一,并且構(gòu)成了人們辨識(shí)圖像的重要感知方式。在圖像的多種特點(diǎn)中,顏色是相對(duì)具有穩(wěn)定性的一種。基于內(nèi)容的圖像檢索技術(shù)通常依據(jù)HSV顏色模型算法設(shè)計(jì),在操作時(shí),重點(diǎn)分析圖像的色相(huge)、飽和度(saturation)和色調(diào)(value)三個(gè)角度的情況。
(二)形狀特征提取
形狀也是商品非常關(guān)鍵的一大外在特點(diǎn),現(xiàn)在,根據(jù)商品形狀上的區(qū)別,對(duì)圖像進(jìn)行檢索,大概可以分成根據(jù)圖像局部形狀特點(diǎn)、以及根據(jù)圖像整體形狀特點(diǎn)進(jìn)行檢索兩種方法。其中,局部的檢索指的是工作人員在提取時(shí),可以得到圖像中商品的部分形狀區(qū)域或形狀邊界等完整信息特征,并且借助該區(qū)域和相關(guān)特征得到完整的圖像內(nèi)容。而這種局部形狀的理念,需要對(duì)整個(gè)圖像內(nèi)容做細(xì)化處理和適當(dāng)切割,而檢索的范圍也會(huì)因此被細(xì)化、受到局限。與之對(duì)應(yīng)的,全局化的形狀特征檢索無(wú)省略了圖像細(xì)化這個(gè)步驟,可以直接借助體現(xiàn)圖像形狀的全局特征向量完成對(duì)應(yīng)的圖像檢索工作,這種方法的運(yùn)用,更多地出現(xiàn)在比較大型的通用圖像數(shù)據(jù)庫(kù)中。
(三)圖像相似性比對(duì)
基于內(nèi)容的圖像檢索技術(shù)主要采用比對(duì)兩幅圖像的相似性的檢索方法。在檢索過(guò)程中,采用逐步求精的辦法,在匹配需求過(guò)程中不斷與用戶進(jìn)行交互。用戶可以瀏覽系統(tǒng)反饋的查詢(xún)結(jié)果,相似度最大的商品排在前面。若需進(jìn)一步明確查詢(xún)結(jié)果,則可在前期檢索結(jié)果的基礎(chǔ)上通過(guò)調(diào)整特征提取方法重新進(jìn)行檢索匹配,直至找到自己心儀的商品為止。目標(biāo)圖像與特征庫(kù)中圖像的匹配比對(duì)方法就是采用前面計(jì)算所得的顏色特征向量和形狀特征向量與特征庫(kù)中的數(shù)據(jù)進(jìn)行相似度匹配,通常采用Euclidean距離算法計(jì)算。
四、結(jié)語(yǔ)
綜上所述,加強(qiáng)對(duì)電子商務(wù)中基于內(nèi)容的圖像檢索應(yīng)用問(wèn)題的分析,意義重大。相關(guān)工作人員需要明確基于內(nèi)容的圖像檢索技術(shù)的應(yīng)用現(xiàn)狀;并且對(duì)基于內(nèi)容的圖像檢索技術(shù)(CBIR)進(jìn)行研究,把握CBIR技術(shù)概念界定、商品圖像特征提取層次模型、組合特征提取算法等等內(nèi)容;在此基礎(chǔ)上,探討特征向量提取的要點(diǎn),如顏色特征向量提取、形狀特征提取、圖像相似性比對(duì)等等。
參考文獻(xiàn)
[1]朱林婷,丁榮濤.基于內(nèi)容的圖像檢索在電子商務(wù)中應(yīng)用初探[J].商場(chǎng)現(xiàn)代化,2011(11):138~139.
[2]孫振權(quán),肖詩(shī)斌,呂學(xué)強(qiáng).基于內(nèi)容圖像檢索的特征融合技術(shù)研究[J].圖像圖形技術(shù)研究與應(yīng)用,2010(01):156~161.