摘要:在建設(shè)微生物菌種資源平臺的基礎(chǔ)上, 設(shè)計開發(fā)微生物菌種資源數(shù)據(jù)庫管理系統(tǒng),實現(xiàn)基于內(nèi)容的Web圖像智能檢索系統(tǒng)。該檢索系統(tǒng)采用B/S體系架構(gòu),可根據(jù)微生物菌種文本信息或圖像的形狀、紋理和顏色特征進行檢索,有效提高了微生物菌種圖像信息搜索的查準(zhǔn)率、查全率和查找速度。
關(guān)鍵詞:微生物菌種資源;基于內(nèi)容的圖像檢索;瀏覽器/服務(wù)器
中圖分類號:TP391文獻標(biāo)志碼:A
文章編號:1001-3695(2007)07-0286-03
微生物信息網(wǎng)站可以為用戶提供翔實、共享的微生物資源數(shù)據(jù)等信息。為更好地實現(xiàn)微生物菌種資源共享, 科技部已立項建立國家自然科技資源E-平臺。其中包括微生物資源數(shù)據(jù)的信息共享。開發(fā)性能良好的微生物菌種資源平臺及微生物菌種圖像資源智能檢索系統(tǒng)是其有效途徑。本檢索系統(tǒng)是微生物菌種資源平臺的重要構(gòu)件,基于分布式微生物菌種資源庫為用戶提供智能化的微生物菌種圖像資源搜索服務(wù),可有效提高微生物菌種圖像信息搜索的查準(zhǔn)率、查全率和查找速度。圖像信息的智能檢索采用基于內(nèi)容的圖像檢索技術(shù)實現(xiàn),提取圖像形狀、紋理、顏色等方面的特征[1]。
1圖像特征的提取
特征提取算法必須尋求適合微生物菌種圖像的特點。一般微生物菌種的形態(tài)各異、差別較大,如酵母菌形態(tài)接近橢圓,赤霉菌形態(tài)似鏈狀、線形,螺旋菌形態(tài)為紡椎形等,所以可以使用形狀索引[2]從整體上提取形態(tài)特征參數(shù)。另外通過研究微生物菌種顯微圖像,可以看出圖像中微生物分布集中。對于稠聚現(xiàn)象較嚴(yán)重的圖像,可以使用共生矩陣[3]的方法提取圖像的紋理特征參數(shù)。由于微生物細(xì)胞含有大量水分,對光線的吸收和反射與水溶液的差別不大,與周圍背景沒有明顯的明暗差,都必須經(jīng)過染色后才能在顯微鏡下進行觀察和鑒別。可以使用顏色矩[4]的方法提取圖像的顏色特征參數(shù)。但是無論是使用顏色、形狀還是紋理特征,每種特征都有各自的不足之處。在實際應(yīng)用中,可以采用多種特征檢索相綜合的方法,即給每種方法賦予一定的權(quán)值,再結(jié)合用戶檢索時的反饋信息,不斷調(diào)整這些參數(shù)以達到最優(yōu)效果,提高檢索精度。
1.1形狀特征的提取
為了表達圖像中各種目標(biāo)的形狀信息,一般需要先對圖像進行分割,然后對提取出來的獨立目標(biāo)進行形狀描述。由于微生物菌種圖像往往比較復(fù)雜,并且圖像內(nèi)容本身是多種多樣的,很難有一個很好的分割算法適合于不同類型的圖像。本系統(tǒng)試圖從整體上提取形狀特征,采用形狀索引(Shape Index)來提取全局形狀特征。
圖像對不同尺度的高斯導(dǎo)數(shù)濾波器的響應(yīng)很好地刻畫了圖像的強度信息[2]。L. Florack認(rèn)為圖像的局部特征可以由該圖像對一系列不同尺度的高斯導(dǎo)數(shù)濾波器的響應(yīng)來表示[5]。通過計算圖像的局部特征,然后比較不同圖像的局部特征的分布可以獲得圖像之間的全局相似性[2]。這種方法的思想就是:用一系列不同尺度的高斯導(dǎo)數(shù)濾波器對圖像進行濾波,得到邊緣信息;把不同尺度下的這些邊緣信息組合成一個特征向量,就可以用來描述圖像的全局形狀信息。算法步驟如下:
2圖像智能檢索系統(tǒng)結(jié)構(gòu)
本文采用以上算法設(shè)計了一個基于內(nèi)容的圖像檢索系統(tǒng),結(jié)構(gòu)如圖1所示。
圖1基于內(nèi)容的圖像檢索系統(tǒng)結(jié)構(gòu)
該系統(tǒng)由以下四個模塊組成:
(1)用戶模塊。它是用戶和檢索系統(tǒng)間的接口。用戶通過用戶模塊向系統(tǒng)提交要檢索的圖片,檢索結(jié)果也將呈現(xiàn)在用戶模塊的界面上。用戶模塊具有一定的交互功能,可不斷改變圖像各特征的檢索權(quán)值,以此獲得越來越好的檢索結(jié)果。
(2)交互查詢模塊。接收來自用戶模塊的檢索圖像后,先送到圖像分析模塊進行圖像分析,提取圖像的特征;然后將查詢的特征向量與圖像庫中的特征向量進行相似性計算,選出最相似的幾幅(根據(jù)情況而定)圖像作為檢索結(jié)果,從圖像庫中提取出來送給用戶模塊。
(3)圖像分析模塊。圖像庫中的圖像和待查詢圖像的特征提取由此模塊來完成。這個模塊采用了相關(guān)的設(shè)計模式[6]來進行設(shè)計,具有很強的復(fù)用性和可擴展性。
(4)圖像數(shù)據(jù)庫模塊。包括各種表,主要有圖像位置表、形狀特征表、紋理特征表、顏色特征表。圖像位置表記錄數(shù)據(jù)庫中圖像的路徑;每個圖像抽取出的形狀特征、紋理特征和顏色特征分別記錄在形狀特征表、紋理特征表和顏色特征表中。
3系統(tǒng)實現(xiàn)及展望
以國家制定的微生物菌種資源共性描述規(guī)范為基礎(chǔ),建立微生物菌種多媒體信息數(shù)據(jù)庫。微生物菌種資源庫圖像智能檢索系統(tǒng)采用.NET技術(shù)開發(fā), C#編程語言和當(dāng)前最先進的B/S三層體系架構(gòu)[7,8],以Windows 2000 Server作為操作系統(tǒng)運行平臺, IIS為Web服務(wù)器, 相關(guān)支持庫采用SQL Server 2000數(shù)據(jù)庫管理系統(tǒng),實現(xiàn)了微生物菌種資源庫的多媒體信息的智能檢索,如圖2所示。它不僅滿足了用戶的需求, 而且提高了菌種管理的水平,取得了比較滿意的結(jié)果。所有圖像信息資源可供眾多用戶在線快速查詢搜索,能通過信息交流平臺,使用戶實現(xiàn)分布式數(shù)據(jù)庫訪問。
今后需要做的工作主要有以下兩點:
(1)圖像數(shù)據(jù)庫模型的建立。本系統(tǒng)的解決方案主要是圖像的存儲由文件系統(tǒng)來實現(xiàn),圖像的特征存儲與管理仍然由關(guān)系數(shù)據(jù)庫來完成。這種解決方案在處理圖像時會遇到很多問題,如怎樣快速地讀寫圖像數(shù)據(jù)、查詢優(yōu)化、抽取和存儲圖像特征、相似度計算等。這些問題較好的解決方法是建立面向?qū)ο髷?shù)據(jù)庫。但也有不少問題,如面向?qū)ο髷?shù)據(jù)庫技術(shù)還需要完善;即使完善了,面向?qū)ο髷?shù)據(jù)庫和關(guān)系數(shù)據(jù)庫還會共存,它們之間相互存取操作問題還需解決。
(2)反饋技術(shù)。用戶的反饋信息在檢索計算中不可忽視,它可以提高檢索的效率和效果。本系統(tǒng)的檢索算法也用到反饋技術(shù),但只是將其作為輔助手段,反饋技術(shù)不能很好地優(yōu)化檢索算法。怎樣設(shè)計用戶的反饋方式并充分利用反饋信息將是要重點研究的課題。
(a) 待檢索圖片
(b) 上傳待檢索圖片并進行特征匹配
(c) 檢索結(jié)果頁面(按匹配相似度順序排列)
參考文獻:
[1] 李向陽,莊越挺,潘云鶴.基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J].計算機研究與發(fā)展,2001,38(3):344-354.
[2]RAVELA S,MANMATHA R.On computing global similarity in images[C]//Proc of the 4th IEEE Workshop on Applications of Computer Vision.Princeton, USA:[s.n.],1998.
[3]HARALICK R M,SHANMUGAM K,DINSTEIN I.Texture features for image classification [J].IEEE Trans on Sys Man and Cyb,1973,3(6):768-780.
[4]STRICKER M,ORENGO M.Similarity of color images[C]//Proc of IST/SPIE Conference on Storage and Retrieval for Image and Video DatabasesⅢ.San Jose,CA:[s.n.],1995.
[5]FLORACK L.The syntactical structure of scalar images[D].Holland:University of Utrecht, 1993.
[6]GAMMA E,HELM R,JOHNSON R,et al.設(shè)計模式——可復(fù)用面向?qū)ο筌浖幕A(chǔ)[M].英文版.北京:機械工業(yè)出版社,2002.
[7]馮芳芳.ASP.NET精講[M].北京:清華大學(xué)出版社,2004.
[8]鄭阿齊.SQL Server實用教程[M].北京:電子工業(yè)出版社,2003.
注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文”