


摘要:由于傳統(tǒng)的多媒體信息檢索方法,在進(jìn)行多媒體信息檢索時(shí)無法對模糊語義多媒體信息特征距離的計(jì)算不精準(zhǔn),因此多媒體信息模糊相似度低,無法實(shí)現(xiàn)對多媒體信息的精準(zhǔn)檢索。針對這一問題,根據(jù)模糊語義距離在多媒體信息檢索中的應(yīng)用,提出基于模糊語義距離的多媒體信息檢索方法。首先,確定多媒體信息特征的模糊空問;計(jì)算模糊語義多媒體信息特征距離;根據(jù)多媒體信息的模糊相似度完成檢索。實(shí)驗(yàn)結(jié)果表明:設(shè)計(jì)的檢索方法多媒體信息檢索模糊相似度最高可達(dá)0.873,實(shí)驗(yàn)對照組最高僅為0.425,設(shè)計(jì)的檢索方法檢索能力更強(qiáng),可以實(shí)現(xiàn)對多媒體信息的精準(zhǔn)檢索。
關(guān)鍵詞:模糊語義距離;多媒體;信息檢索;特征距離
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2020)20-0195-02
多媒體信息在傳統(tǒng)信息的基礎(chǔ)上增加了Binary Large Ob-ject數(shù)據(jù)類型,主要用于對多媒體信息中的圖像數(shù)據(jù)、文本數(shù)據(jù)以及聲音數(shù)據(jù)等的表示[1]。模糊語義距離實(shí)際上指的就是模糊測度,通過具體數(shù)值來表示相似性之間的度量。模糊語義距離作為一種應(yīng)用廣泛的度量方法,其最基本也是最主要的就是確定特征的模糊空間。可以肯定的是,語義的模糊性并不會影響信息檢索的準(zhǔn)確性。模糊語義距離在多媒體信息檢索中的應(yīng)用也主要體現(xiàn)在通過模糊語義距離確定多媒體信息特征的模糊空間,可以通過判斷模糊空間中多媒體信息特征確定的大小程度,進(jìn)而判斷多媒體信息特征的相似權(quán)值[2]。在多媒體信息實(shí)際檢索過程中,對多媒體信息的模糊查詢概念是不可避免的,在沒有完備檢索條件的前提下,檢索到最接近或者說最相似的多媒體信息檢索結(jié)果[3]。因此,本文根據(jù)模糊語義距離在多媒體信息檢索中的應(yīng)用,提出基于模糊語義距離的多媒體信息檢索方法。
1基于模糊語義距離的多媒體信息檢索方法
1.1確定多媒體信息特征的模糊空間
假定在一個(gè)多媒體信息V中,包含個(gè)多媒體信息特征。在每一個(gè)多媒體信息特征中都可以通過進(jìn)行測量,那么之間的連線就構(gòu)成了多媒體信息特征的空間。再通過模糊語義距離中的模糊子集[ail,ai2,…,ain]對多媒體信息特征的空間進(jìn)行模糊語義描述,可得到多媒體信息特征的模糊空間為[ai1×ai2×…×ain]。多媒體信息特征的模糊空間示意圖,如圖1所示。
在圖1中,A、B、C為映射多媒體信息特征的模糊空間的三條直線。通過圖1不難看出,多媒體信息特征的模糊空間的性能會隨著多媒體信息特征空間維數(shù)的增加而下降,大多用于對單一多媒體信息特征進(jìn)行描述,綜合多媒體信息特征描述較少。
1.2計(jì)算模糊語義多媒體信息特征距離
在確定多媒體信息特征的模糊空間的基礎(chǔ)上,通過模糊語義距離衡量兩個(gè)多媒體信息特征模糊空間的模糊相似度[4]。模糊語義距離包括三種距離,分別為Hamming距離、Euclid距離以及Minkowski距離。本文針對Hamming距離對多媒體信息特征進(jìn)行測距。設(shè)模糊語義多媒體信息特征Hamming距離為Sim(x,y),則Sim(x,y)的計(jì)算公式,如公式(1)所示。
在公式(1)中,n指的是多媒體信息特征矢量;i指的是多媒體信息特征個(gè)數(shù),為實(shí)數(shù);w指的是多媒體信息特征模糊空間的平滑系數(shù);m指的是多媒體信息特征模糊空間的摩擦系數(shù);k指的是多媒體信息特征權(quán)值系數(shù);g指的是多媒體信息特征隸屬度函數(shù);μ指的是多媒體信息特征維數(shù);x指的是模糊語義多媒體信息特征Hamming距離橫坐標(biāo);y指的是模糊語義多媒體信息特征Hamming距離縱坐標(biāo)。對公式(1)進(jìn)行基于模糊語義距離的公式轉(zhuǎn)換,得到的模糊語義多媒體信息特征距離最終計(jì)算公式,如公式(2)所示。
公式(2)就是本文提出的基于模糊語義距離的多媒體信息檢索方法對模糊語義多媒體信息特征距離的計(jì)算表達(dá)式。根據(jù)模糊語義距離的三種屬性,可得模糊語義多媒體信息特征的具體距離信息,如表1所示。
結(jié)合表1信息,不同的模糊語義距離屬性對模糊語義多媒體信息特征距離會造成一些微小的影響。在利用公式(2)計(jì)算模糊語義多媒體信息特征距離時(shí),多媒體信息特征檢索條件可能不是完整的,甚至有可能遇到連多媒體信息模糊描述的語義都不能提供。所以,必須將這些不能確定值的多媒體信息特征在棋糊語義距離的計(jì)算中刪除,確保模糊語義多媒體信息特征距離計(jì)算結(jié)果不受其干擾。
1.3檢索多媒體信息模糊相似度
在利用模糊語義距離檢索多媒體信息中,通過計(jì)算多媒體信息模糊相似度,檢索用戶感興趣的多媒體信息特征。設(shè)多媒體信息模糊相似度為c,則其計(jì)算公式,如公式(3)所示。
在公式(3)中,u指的是模糊語義多媒體信息特征相似權(quán)值。通過多媒體信息模糊相似度,檢索多媒體信息模糊相似度最高的多媒體信息。同時(shí),每個(gè)多媒體信息模糊相似度的重要性依賴于多媒體信息特征的模糊空間中查詢特征矢量的位置,多媒體信息模糊相似度越大,對多媒體信息檢索的精度也就越高。
2實(shí)驗(yàn)
2.1實(shí)驗(yàn)準(zhǔn)備
為構(gòu)建實(shí)驗(yàn),本文在Windows計(jì)算機(jī)系統(tǒng)上采集了7584個(gè)多媒體信息樣本作為實(shí)驗(yàn)對象。根據(jù)多媒體信息樣本的特征作為識別依據(jù),確定多媒體信息特征的模糊空間。本次實(shí)驗(yàn)選取的多媒體信息樣本具體參數(shù),如表2所示。
結(jié)合表2信息,分別使用傳統(tǒng)檢索方法以及本文設(shè)計(jì)檢索方法進(jìn)行實(shí)驗(yàn),設(shè)置傳統(tǒng)的檢索方法為實(shí)驗(yàn)對照組。驗(yàn)證硬件環(huán)境包括:處理器Inter(R) Core(TM) Duo CPU;支持8線雙絞線同軸電纜光纖專網(wǎng)、CPRS/DCMA無線公網(wǎng)、無線專網(wǎng)。實(shí)驗(yàn)軟件為Multimedia Data系統(tǒng),主要用于對多媒體信息檢索的仿真模擬。實(shí)驗(yàn)主要內(nèi)容為測試兩種檢索方法的多媒體信息檢索模糊相似度,從而評定檢索精準(zhǔn)度更高的檢索方法。在此次的實(shí)驗(yàn)中,共進(jìn)行9次實(shí)驗(yàn)。針對Multimedia Data仿真實(shí)驗(yàn)軟件測得的多媒體信息模糊相似度,記錄實(shí)驗(yàn)結(jié)果,進(jìn)而判斷兩種檢索方法對于多媒體信息的檢索能力。
2.2實(shí)驗(yàn)結(jié)果分析與結(jié)論
根據(jù)上述設(shè)計(jì)的實(shí)驗(yàn)步驟,采集9組實(shí)驗(yàn)數(shù)據(jù),將兩種檢索方法下的多媒體信息模糊相似度進(jìn)行對比,多媒體信息模糊相似度對比結(jié)果,如表3所示。
通過表3可得出如下的結(jié)論:本文設(shè)計(jì)的檢索方法多媒體信息檢索模糊相似度最高可達(dá)0.873,實(shí)驗(yàn)對照組最高僅為0.425,設(shè)計(jì)的檢索方法檢索能力更強(qiáng),可以實(shí)現(xiàn)對多媒體信息的精準(zhǔn)檢索。通過實(shí)驗(yàn)驗(yàn)證結(jié)果證明,所沒計(jì)的檢索方法其各項(xiàng)功能均可以滿足設(shè)計(jì)總體要求,可以廣泛應(yīng)用于多媒體信息檢索方面。
3結(jié)束語
綜上所述,模糊語義距離在多媒體信息檢索應(yīng)用中的具體優(yōu)勢已經(jīng)顯現(xiàn)出來。多媒體信息檢索模糊相似度的高低是保證多媒體信息檢索精度的主要衡量標(biāo)準(zhǔn),而針對多媒體信息檢索方法進(jìn)行基于模糊語義距離的設(shè)計(jì)可以大幅度提高多媒體信息檢索精度。基于模糊語義距離的多媒體信息檢索方法不但能夠完成傳統(tǒng)多媒體信息檢索方法所不能完成的任務(wù),還能以模糊語義距離為核心算法,為多媒體信息檢索領(lǐng)域的研究提供學(xué)術(shù)意義。本文唯一不足之處在于沒有對模糊語義距離在多媒體信息可視化檢索中的應(yīng)用進(jìn)行深入分析,相信這一點(diǎn),也可以作為多媒體信息檢索領(lǐng)域日后的重點(diǎn)研究方向之一。
參考文獻(xiàn):
[1]張靜,靳淇兆,王洪振,等.多尺度信息融合的遙感圖像語義分割模型[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2019,31(9):1509-1517.
[2]楊建宇,周振旭,杜貞容,等.基于SegNet語義模型的高分辨率遙感影像農(nóng)村建設(shè)用地提取[J].農(nóng)業(yè)工程學(xué)報(bào),2019,35(5):251-258.
[3]何曉慶,唐李杏,張雅晴.基于知識轉(zhuǎn)移的翻轉(zhuǎn)課堂在信息檢索課教學(xué)中的應(yīng)用——以四川大學(xué)圖書館為例[J].四川圖書館學(xué)報(bào),2018,1(3):012-015.
[4]朱衛(wèi)東,蘭月華,蔡德清.面向科研創(chuàng)新的研究生信息檢索實(shí)習(xí)模式構(gòu)建研究——以Web of Science檢索平臺在線分析為例[J].老區(qū)建設(shè),2019,1(10):075-078.
【通聯(lián)編輯:張薇】
收稿日期:2020-03-15
作者簡介:黨鵬飛(1984-),男,河南周口人,本科,中級工程師,研究方向:數(shù)據(jù)統(tǒng)計(jì)分析技術(shù)。