999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于雙倍比特量化分類索引技術(shù)的圖像檢索研究

2021-05-17 03:51:02魯明宋馥莉劉平勝蘭勇
河南科技 2021年3期

魯明 宋馥莉 劉平勝 蘭勇

摘 要:本文對圖像數(shù)據(jù)進行雙倍比特量化分類,增強了每個維度數(shù)據(jù)的差異程度。為了最大限度地提升量化后的查詢精度,其間采用量化后比對結(jié)果和量化前的查詢數(shù)據(jù)進行非等距計算,提高索引的查詢精度。試驗證明,最近鄰查詢的準確率較傳統(tǒng)二進制映射中的雙倍比特量化大大提高了性能。

關(guān)鍵詞:二進制量化;雙倍比特量化;加權(quán)距離度量

中圖分類號:TP301.6文獻標識碼:A文章編號:1003-5168(2021)03-0015-04

Research on Image Retrieval Based on Double Bit

Quantitative Classification Index Technology

LU Ming1 SONG Fuli1 LIU Pingsheng2 LAN Yong3

(1. The Open University of Henan,Zhengzhou Henan 450008;2. Zhongshan Torch Polytechnic,Zhongshan Guangdong 528436;3. Tianjin University of Finance and Economics Pearl River College , Tianjin 301800)

Abstract: In this paper, the double-bit quantization classification of image data had enhanced the degree of difference in data in each dimension. In the meantime, in order to maximize the query accuracy after quantification, the comparison result after quantization and the query data before quantification were used to perform non-equal distance calculations to improve the query accuracy of the index. Experiments showed that the accuracy of nearest neighbor query greatly improved the performance compared to the double-bit quantization in traditional binary mapping.

Keywords: binary quantization;double bit quantization;weighted distance metric

視覺圖像檢測[1]和圖像檢索[2-3]的核心工作存在相似性,二者都需要在高維數(shù)據(jù)庫中檢索和匹配相似的特征數(shù)據(jù)。它的目的是在大型高維數(shù)據(jù)庫中搜索相似的數(shù)據(jù)來查詢數(shù)據(jù)。最近鄰算法作為大型多維度數(shù)據(jù)庫的常用算法,其性能和效率問題愈發(fā)顯現(xiàn)[4]。

1 概述

針對最近鄰算法圖像檢索效率低的問題,本文在高維圖像檢索過程中引入了二進制編碼形式。二進制代碼是執(zhí)行效率最高的一種編碼形式,可以應(yīng)用于圖像數(shù)據(jù)的二進制量化和索引技術(shù)[5]中。二進制量化是將圖像數(shù)據(jù)存儲格式中原始浮點相似的特征數(shù)據(jù)轉(zhuǎn)化映射為近似的二進制碼,然后針對生成的二進制代碼設(shè)計出高效快捷的圖像檢索算法,以適應(yīng)大規(guī)模數(shù)據(jù)環(huán)境[6]下的圖像檢索需求。如圖1所示,本文提出了一種雙倍比特量化的索引查詢技術(shù),具體創(chuàng)新主要有兩點。

1.1 雙倍比特量化的方法

將浮點高維特征空間投影到高維向量二元映射,屬性間的區(qū)別在于添加了中間高維向量空間,每一維的數(shù)據(jù)有兩位的二進制代碼。雙倍比特量化可以應(yīng)用于不同的二進制量化技術(shù)、不同的類型和不同的尺寸特征。

1.2 非對稱距離查詢算法

對于每次查詢,可以在漢明最近鄰的空間選擇雙倍比特量化舉措,繼而在漢明最近鄰候選集空間通過浮點計算非對稱距離,對查詢函數(shù)(中間數(shù)據(jù))和二進制碼特征庫進行重新排序,從而提高查詢精度指標。

本文使用的要領(lǐng)具有三個顯著優(yōu)勢。一是雙倍比特量化方法能夠高效降低量化耗損,提高查詢精度;二是雙倍比特量化和非對稱距離算法可以應(yīng)用于現(xiàn)有的二進制量化和索引方法;三是雙倍比特量化易于實現(xiàn)。基準數(shù)據(jù)集試驗表明,雙倍比特量化方法可以使最近鄰查詢精度提升15%~25%。

2 研究現(xiàn)狀

2.1 二進制量化

目前,研究者提出了很多著名的二進制映射方法,其主要分為兩類,即基于隨機的映射和基于學(xué)習(xí)的映射。基于隨機的映射主要有局部敏感哈希(LSH)和位置敏感聚類(Locality Sensitive Clustering, LSC)。LSH使用內(nèi)積來比較兩個向量的相似程度,通過多元正態(tài)分布取得多個哈希函數(shù),并將其稀疏之特質(zhì)映射到超平面。隨機映射與處理數(shù)據(jù)無關(guān),處理速度快,但只有在維度足夠高時才有好的檢索效果。基于學(xué)習(xí)的二進制映射技術(shù)在維度低的情況下能滿足查詢精度的要求,但試驗效率較低,而且中間向量的每一維數(shù)據(jù)在傳統(tǒng)的量化方法下只能被簡要地映射為兩類(為0或者1),這樣的量化方法不能很好地保持原始特征之間的相似關(guān)系。位置敏感聚類方法主要包括三部分:第一,生成位置敏感哈希函數(shù);第二,桶標記的產(chǎn)生,即利用位置敏感哈希函數(shù)對每個點進行映射得出桶標記;第三,桶標記的合并。由于桶標記的個數(shù)多于實際的類數(shù)目,需要選擇合適的合并區(qū)間對桶標記進行合并,合并后的桶標記對可用來對數(shù)據(jù)點進行分組,得出最終的類標簽。

4.1 試驗設(shè)置

試驗在BIGANN SIFT 1M和Caltech101兩個數(shù)據(jù)集上開展,如表2所示。試驗的硬件環(huán)境是Intel Xeon E5-2620*2(7.2 GT/s,2.00 GHz,15M cache,6cores),內(nèi)存為64 GB。

4.2 雙倍比特量化分類索引

下面使用多種二進制映射方法來驗證本文所提二進制映射的優(yōu)化方法,包括局部敏感哈希(LSH)、主成分分析(PCA)和迭代量化(PCA-ITQ)。

每個試驗包括1 000個查詢,以查詢的平均準確率和平均召回率當作性能指標來明確雙位量化。試驗在兩個數(shù)據(jù)集(BIGANN SIFT 1M和Caltech101)比照使用差異二進制映射方式。為了獲得雙倍二進制碼,訓(xùn)練集中的高維特征被映射為中間數(shù)據(jù),并根據(jù)每個維度的正負符號獲得中值。繼而,以與訓(xùn)練集相同的方式將特征庫中的特征和查詢特征變換為中間數(shù)據(jù),通過雙倍比特量化將數(shù)據(jù)轉(zhuǎn)化為二進制碼。最后,計算并查詢二進制碼與每個二進制碼的加權(quán)海明距離。在兩個數(shù)據(jù)集上,使用原始二進制映射算法和雙倍比特量化方法比較結(jié)果如表3和表4顯示。

試驗結(jié)果表明,傳統(tǒng)二進制映射的性能有了很大的提高。在使用原始二進制映射算法時,數(shù)據(jù)集BIGANN 1M SIFT的結(jié)果(百分比)如表3所示。二進制代碼分別是32位、64位、128位和256位。二值投影算法分別為ITQ、RR、SH、LSH和PCA。T@1表示top-1的準確率,B@10表示top-10的召回率。SB代表單位量化,DB代表雙倍比特量化。

在使用雙倍比特量化方法時,數(shù)據(jù)集Caltech GIST datasets的結(jié)果(百分比)如表4所示。二進制代碼分別為64位、128位、256位和320位。二進制投影算法分別是ITQ、RR、SH、LSH和PCA。T@1表示top-1的準確率,B@10表示top-10的召回率。SB代表單位量化,DB代表雙位量化。

每個試驗有1 000個查詢。本研究只對結(jié)果進行了重新排序,召回率仍舊保持固定不變,所以本試驗以準確率作為檢測指標。在兩個有差別的數(shù)據(jù)集(BIGANN SIFT 1M和Caltech101)中,本文使用不同的二值映射方式,結(jié)果發(fā)現(xiàn),使用不對稱距離進行重新排序的結(jié)果優(yōu)于直接獲取的成果。

5 結(jié)論

在大規(guī)模數(shù)據(jù)環(huán)境下進行快速最近鄰查詢時,需要量化普通二進制數(shù)據(jù),但是查詢信息的原始特征信息弱化會導(dǎo)致查詢精度降低。研究者充分利用二進制運算規(guī)則簡單、適于邏輯運算的特點,提出了一種雙倍比特量化分類索引方法,解決了該問題。本文對量化分類后的二進制數(shù)據(jù)和查詢信息未量化前的數(shù)據(jù)進行距離計算,大大提高了查詢的精度和準確性。大數(shù)據(jù)集試驗證明,該方法可以提升15%~25%的最近鄰查詢精度。

參考文獻:

[1]賈佳,唐勝,謝洪濤,等.移動視覺搜索綜述[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,2017(6):1007-1021.

[2]RUBLEE E,RABAUD V,KONOLIGE K,et al.ORB:an efficient alternative to SIFT or SURF[C]//International Conference on Computer Vision.2012.

[3]ZITNICK C L.Binary Coherent Edge Descriptors[C]//European Conference on Computer Vision,2010.

[4]馬艷萍,姬光榮,鄒海林,等.數(shù)據(jù)依賴的多索引哈希算法[J].西安電子科技大學(xué)學(xué)報,2015(4):159-164.

[5]李雯,鄧涵,許玉珍.基于雙倍比特量化與分段哈希索引的軍事圖像過濾[J].航天控制,2019(4):59-65.

[6]宋馥莉,閆培玲.雙倍比特量化近似查詢索引算法研究[J].河南科技,2019(25):28-31.

主站蜘蛛池模板: 91系列在线观看| 亚洲首页在线观看| 中文字幕亚洲电影| 亚洲精品另类| 午夜视频在线观看区二区| 麻豆a级片| 日韩高清在线观看不卡一区二区| 亚洲国产系列| 国产剧情国内精品原创| 视频国产精品丝袜第一页| 国产精品久久久精品三级| 亚洲综合日韩精品| 成人福利免费在线观看| 亚洲日韩图片专区第1页| 成人久久精品一区二区三区| 97人人做人人爽香蕉精品| 亚洲 日韩 激情 无码 中出| 夜夜操国产| 久久精品国产在热久久2019| 国产精品亚洲一区二区三区z| 久久精品波多野结衣| 成人午夜精品一级毛片| 国产精选自拍| 中文字幕免费在线视频| 91综合色区亚洲熟妇p| 久久窝窝国产精品午夜看片| 国产成人麻豆精品| 亚洲天堂首页| 欧美视频免费一区二区三区| 国产高潮流白浆视频| 久久亚洲国产视频| 日韩精品一区二区三区大桥未久| www.youjizz.com久久| 精品午夜国产福利观看| 免费在线观看av| 午夜国产小视频| 欧美精品成人一区二区在线观看| 国产成人综合亚洲欧洲色就色| 亚洲熟女中文字幕男人总站| 大陆精大陆国产国语精品1024| 亚洲综合一区国产精品| 婷婷六月天激情| 女人18毛片一级毛片在线 | jizz亚洲高清在线观看| 人妻一本久道久久综合久久鬼色| 国产精品短篇二区| 亚洲最黄视频| 国产成年女人特黄特色大片免费| 国精品91人妻无码一区二区三区| 亚欧美国产综合| 国产区在线观看视频| 日韩视频福利| 国产特级毛片aaaaaaa高清| 激情六月丁香婷婷四房播| 色悠久久久| 国产亚洲精品在天天在线麻豆 | 国产成人精品2021欧美日韩| 欧美一区精品| 丝袜美女被出水视频一区| 亚洲国产午夜精华无码福利| 国产理论一区| 超碰免费91| 欧美 亚洲 日韩 国产| 成人亚洲国产| 欧美第二区| 超碰精品无码一区二区| 国产网站免费看| 啊嗯不日本网站| 囯产av无码片毛片一级| 国产在线第二页| 国产黄色免费看| 综合网天天| 欧美午夜网| 国产男女免费完整版视频| 欧洲一区二区三区无码| 国产福利2021最新在线观看| 一级全免费视频播放| 国产美女人喷水在线观看| 欧美成人精品一级在线观看| 亚洲精选无码久久久| 人人看人人鲁狠狠高清| 成人无码区免费视频网站蜜臀|