摘 要:提出了一種定量的邊緣檢測(cè)算法性能評(píng)估方法。該方法不需要邊緣基準(zhǔn)圖等先驗(yàn)知識(shí),通過引入ROC曲線技術(shù),合成邊緣參考圖,并將AUC指標(biāo)作為定量參數(shù)而完成待評(píng)估邊緣檢測(cè)算法的性能評(píng)估。初步的實(shí)驗(yàn)結(jié)果表明,本文方法的結(jié)論與相關(guān)判斷相吻合。該方法自動(dòng)化程度高,評(píng)價(jià)結(jié)果客觀合理,有較強(qiáng)的工程應(yīng)用性。
關(guān)鍵詞:邊緣檢測(cè)性能評(píng)估ROC曲線卡方檢驗(yàn)
中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1674-098X(2011)07(a)-0128-02
邊緣是圖像中最重要的特征之一,它表示信號(hào)的突變情況,反映了圖像的大量信息。邊緣檢測(cè)的結(jié)果直接影響了后續(xù)的目標(biāo)識(shí)別、圖像分割和圖像匹配等研究。因此,邊緣檢測(cè)一直是圖像處理、機(jī)器視覺等領(lǐng)域最活躍的研究課題之一。由于實(shí)際圖像中的邊緣類型不盡相同,同時(shí)還存在的不同類別的噪聲,因此邊緣檢測(cè)又是一個(gè)困難的問題。經(jīng)典的邊緣檢測(cè)方法包括Roberts算子、Sobel算子、Prewitt算子、Kirsch算子、Laplacian算子、LOG算子、Canny算子等。近年來隨著數(shù)學(xué)理論及人工智能的發(fā)展,又涌現(xiàn)出許多新的邊緣檢測(cè)方法,如小波變換的邊緣檢測(cè)法與基于神經(jīng)網(wǎng)絡(luò)等邊緣檢測(cè)方法。
邊緣檢測(cè)結(jié)果易受到測(cè)試圖像類型與檢測(cè)閾值等因素的影響,因此不同的邊緣檢測(cè)算法有著各自的適用環(huán)境,有必要建立一個(gè)可以統(tǒng)一定量的評(píng)估標(biāo)準(zhǔn),完成對(duì)各類檢測(cè)算法的性能評(píng)估。目前,常見的邊緣檢測(cè)性能評(píng)估主要分為主觀判定法和客觀判定法。主觀判定法由人工判斷邊緣檢測(cè)質(zhì)量,該方法缺乏客觀定量的評(píng)估標(biāo)準(zhǔn),評(píng)估結(jié)果也因人而異。客觀判定法又可分為兩小類:一是存在邊緣基準(zhǔn)圖的方法,這種方法大多采用模擬圖像進(jìn)行實(shí)驗(yàn);二是直接根據(jù)檢測(cè)邊緣的形態(tài)來評(píng)定其質(zhì)量,這類方法不需要邊緣基準(zhǔn)圖,但是在實(shí)際應(yīng)用中不能準(zhǔn)確評(píng)估邊緣的定位誤差。
本文提出一種客觀定量的評(píng)估方法,利用ROC曲線技術(shù)計(jì)算性能度量指標(biāo),從而完成對(duì)邊緣檢測(cè)算法的性能評(píng)估。該方法不直接需要邊緣參考圖等先驗(yàn)知識(shí),并直接對(duì)真實(shí)影像進(jìn)行評(píng)估測(cè)試,滿足了實(shí)際工程的需要。
1 ROC分析技術(shù)
1.1 混淆矩陣
以兩類別分類問題為例,設(shè)任意樣例I的真實(shí)類別為{p,n},p代表真實(shí)正例,n代表真實(shí)負(fù)例。利用已知分類器對(duì)樣例進(jìn)行分類,得到分類預(yù)測(cè)類別{Y,N},Y代表分類正例,N代表分類負(fù)例,共得到圖1的混淆矩陣所表示的四種結(jié)果,其中代表真實(shí)正例被分類為正例的個(gè)數(shù),代表真實(shí)正例被分類為負(fù)例的個(gè)數(shù),代表真實(shí)負(fù)例被分類為正例的個(gè)數(shù),代表真實(shí)負(fù)例被分類為負(fù)例的個(gè)數(shù)。為真實(shí)正例的總個(gè)數(shù),為真實(shí)負(fù)例的總個(gè)數(shù)。
由混淆矩陣可直接計(jì)算虛警率與正確檢測(cè)率等分類性能評(píng)估指標(biāo)
(1)
與等指標(biāo)是在某個(gè)分類算法的固定閾值下求得,當(dāng)閾值發(fā)生改變時(shí),這些指標(biāo)數(shù)值也會(huì)隨之發(fā)生變化。因此,基于單個(gè)指標(biāo)的評(píng)估方法對(duì)類別先驗(yàn)概率和門限都不具有穩(wěn)健性,其應(yīng)用也受到很大的限制。
1.2 ROC曲線
受試者工作特征分析技術(shù)(Receiver Operating Characteristic,簡(jiǎn)稱ROC)在五十年代起源于統(tǒng)計(jì)決策理論,用來說明分類器正確檢測(cè)率和虛警率之間的關(guān)系,目前在醫(yī)學(xué)、模式識(shí)別、機(jī)器學(xué)習(xí)等領(lǐng)域得到了廣泛的應(yīng)用。
ROC曲線是以為橫軸、為縱軸形成的一個(gè)二維空間,在此空間中將不同閾值對(duì)應(yīng)的(,)點(diǎn)標(biāo)出,并用直線連接各相鄰點(diǎn)構(gòu)建而成的一條曲線。它能夠揭示當(dāng)算法閾值發(fā)生變化時(shí)虛警率和檢測(cè)率的折衷關(guān)系,全面直觀的揭示了該算法在多個(gè)閾值下的整體性能,與虛警率、檢測(cè)率等單指標(biāo)相比具有如下優(yōu)點(diǎn):(1)ROC曲線反映了虛警率和檢測(cè)率的折衷關(guān)系,其形狀不會(huì)隨先驗(yàn)概率的改變而發(fā)生變化;(2)ROC曲線的建立與錯(cuò)誤分類代價(jià)無關(guān),而現(xiàn)實(shí)中錯(cuò)誤分類代價(jià)很難獲取;(3)在測(cè)試數(shù)據(jù)的類別分布比例相差很大時(shí),能準(zhǔn)確表達(dá)分類器的性能。
2 評(píng)估方法的實(shí)現(xiàn)
2.1 主要流程
評(píng)估方法的主要工作流程如下所示(參見圖2)。
(1)將待評(píng)估的邊緣檢測(cè)算子,分別按一定的間隔設(shè)置不同的閾值(范圍覆蓋常用的取值區(qū)域)對(duì)輸入影像進(jìn)行檢測(cè),分別得到邊緣檢測(cè)結(jié)果;(2)對(duì)邊緣檢測(cè)結(jié)果集進(jìn)行統(tǒng)計(jì)分析,得到候選邊緣檢測(cè)圖;(3)計(jì)算不同等級(jí)的候選邊緣檢測(cè)圖與整個(gè)邊緣檢測(cè)圖集之間的關(guān)聯(lián)性,據(jù)此得到最佳邊緣等級(jí),從而得到“理想”的邊緣檢測(cè)參考圖;(4)將某邊緣檢測(cè)算法在不同閾值下的邊緣檢測(cè)圖與邊緣檢測(cè)參考圖進(jìn)行分析,得到多個(gè)工作點(diǎn)的正確提取率(檢測(cè)率)與虛警率,并連接成為ROC曲線圖;(5)計(jì)算ROC曲線的AUC評(píng)估參數(shù),完成對(duì)具體邊緣檢測(cè)算法的性能評(píng)估。
2.2 邊緣參考圖的合成
2.2.1 ROC分類。
將邊緣檢測(cè)問題看作是僅考慮目標(biāo)(邊緣點(diǎn))和非目標(biāo)(非邊緣點(diǎn))的二分類的目標(biāo)識(shí)別問題。針對(duì)輸入的具體邊緣等級(jí)(),分別用、、、來表示混淆矩陣中的四種分類情況。其中表示該像素在CGTi和Dj中均為邊緣檢測(cè)點(diǎn);表示該像素在CGTi中為邊緣檢測(cè)點(diǎn),在Dj中為背景點(diǎn);表示該像素在CGTi和Dj中均為背景點(diǎn);表示該像素在CGTi中為背景點(diǎn),在Dj中為邊緣檢測(cè)點(diǎn)。
計(jì)算上述指標(biāo)的概率、、、:
(2)
式中:為圖像的寬度與高度;為邊緣檢測(cè)圖的總幅數(shù);與分別表示候選邊緣檢測(cè)結(jié)果中的邊緣點(diǎn)與非邊緣點(diǎn);與分別表示邊緣檢測(cè)圖中的邊緣點(diǎn)與非邊緣點(diǎn)(背景)。
最后,計(jì)算出對(duì)應(yīng)的檢測(cè)概率TPR和虛警概率FPR
(3)
式中:,。
2.2.2 基于卡方檢驗(yàn)的最佳閾值求解
每個(gè)候選邊緣檢測(cè)結(jié)果均具有一對(duì)統(tǒng)計(jì)指標(biāo)參數(shù),即檢測(cè)概率TPR和虛警概率FPR。為了確定最佳候選邊緣檢測(cè)結(jié)果,使得邊緣檢測(cè)參考圖在具有較高正確檢測(cè)率的同時(shí)能保證虛警概率相對(duì)較低,本文引入卡方檢驗(yàn)(Chi-square test)方法求解最佳邊緣等級(jí)。卡方檢驗(yàn)是現(xiàn)代統(tǒng)計(jì)學(xué)的創(chuàng)始人之一、英國(guó)人K.Pearson提出的一種具有廣泛用途的假設(shè)檢驗(yàn)方法。可以分為成組比較(不配對(duì)資料)和個(gè)別比較(配對(duì),或同一對(duì)象兩種處理的比較)兩類。
2.3 基于AUC指標(biāo)的性能評(píng)估
將待評(píng)估的邊緣檢測(cè)算子看作是一個(gè)二分類器,其分類的結(jié)果也就是邊緣檢測(cè)的結(jié)果。為了能夠在任何比例分布和任何錯(cuò)誤代價(jià)比的情況下直接比較多個(gè)分類器,必須使用具體的指標(biāo)來量化分類器性能。目前常用的方法是計(jì)算ROC曲線下面積(Area Under Curve,AUC)。AUC是曲線下區(qū)域與單位面積的比,它的值在0.0~1.0之間,反映了識(shí)別算法正確區(qū)分真假目標(biāo)能力的大小,并且等于任意選取的目標(biāo)樣本特征值大于任意選取的非目標(biāo)樣本特征值的概率。Bradley通過大量的比較實(shí)驗(yàn)認(rèn)為AUC比準(zhǔn)確度更適合作為分類評(píng)價(jià)標(biāo)準(zhǔn)。AUC的算法并不復(fù)雜,通常使用如式(6)所示的微元法通過累加曲線下梯形的面積來近似計(jì)算。顯然,工作點(diǎn)越多,近似程度越好。
(6)
式中:為工作點(diǎn)的總個(gè)數(shù),為第工作點(diǎn)的正確檢測(cè)率,為第工作點(diǎn)的虛警率。
對(duì)某一待評(píng)估邊緣檢測(cè)算子,采用不同的閾值得到原始影像的邊緣檢測(cè)結(jié)果,對(duì)應(yīng)前文得到的邊緣參考圖,可計(jì)算得到虛警率與正確檢測(cè)率,也就是對(duì)應(yīng)ROC空間中的一個(gè)工作點(diǎn)。這樣,n個(gè)閾值即能得到n個(gè)工作點(diǎn),將其連接并計(jì)算AUC評(píng)估指標(biāo),即可得到該邊緣檢測(cè)算子的整體性能。工作點(diǎn)越多,AUC評(píng)估指標(biāo)計(jì)算的越精確。
3 實(shí)驗(yàn)與分析
實(shí)驗(yàn)采用常用的Roberts算子、Sobel算子、Laplacian算子、LOG算子、Canny算子以及數(shù)學(xué)形態(tài)學(xué)梯度法共6種邊緣檢測(cè)算法。每種算法按一定的間隔設(shè)置8個(gè)閾值并對(duì)輸入的spot影像(圖2(a))進(jìn)行邊緣檢測(cè),共得到48個(gè)邊緣檢測(cè)結(jié)果;對(duì)邊緣檢測(cè)結(jié)果圖集進(jìn)行像素統(tǒng)計(jì)與ROC分類,得到候選邊緣檢測(cè)圖;計(jì)算每一等級(jí)的候選邊緣檢測(cè)圖與邊緣檢測(cè)結(jié)果圖集之間的卡方檢驗(yàn)參數(shù),并取出最大值作為最優(yōu)邊緣等級(jí),其對(duì)應(yīng)的候選邊緣檢測(cè)圖即可作為“理想”的邊緣檢測(cè)參考圖(圖2(b))。
合成邊緣參考圖后,針對(duì)某待評(píng)估邊緣檢測(cè)算法,將8個(gè)不同閾值設(shè)為工作點(diǎn),計(jì)算對(duì)應(yīng)邊緣檢測(cè)結(jié)果的檢測(cè)概率TPR和虛警概率FPR,并將其連接生成ROC曲線。最后計(jì)算AUC指標(biāo),得到該邊緣檢測(cè)算法的性能參數(shù)。圖3為6種邊緣檢測(cè)算法的ROC曲線。Roberts算子、Sobel算子、Laplacian算子、LOG算子、Canny算子以及數(shù)學(xué)形態(tài)學(xué)梯度法的AUC指標(biāo)分別為0.831、0.842、0.823、0.939、0.912與0.875。由此可見,6種待評(píng)估的邊緣檢測(cè)算法中,LOG算子由于其抗噪能力強(qiáng),總體性能最佳,Canny算子與數(shù)學(xué)形態(tài)學(xué)梯度法居其次,Sobel算子與Roberts算子再次之,而Laplacian算子由于對(duì)噪聲太敏感,其性能最差。
4 結(jié)語
基于ROC曲線研究了一種定量的邊緣檢測(cè)算法評(píng)估方法。該方法不需要直接的邊緣參考圖信息,同時(shí)能對(duì)真實(shí)的輸入影像進(jìn)行測(cè)試,完成對(duì)不同邊緣檢測(cè)算法的性能評(píng)估。其研究?jī)?nèi)容對(duì)于針對(duì)某種應(yīng)用環(huán)境選擇合適的邊緣檢測(cè)算子甚至是合適的相關(guān)閾值均具有良好的參考價(jià)值。此外,由于實(shí)驗(yàn)采用的測(cè)試圖像有限,只針對(duì)常見的6種邊緣檢測(cè)算法進(jìn)行評(píng)估,因此本文方法還需在實(shí)際的應(yīng)用進(jìn)一步地驗(yàn)證與完善。
參考文獻(xiàn)
[1]宋國(guó)鄉(xiāng),姜東煥,孫曉麗.小波尺度空間中的邊緣檢測(cè)算法[J].計(jì)算機(jī)應(yīng)用研究,2007,24(3):97~99.
[2]雷麗珍.數(shù)字圖像邊緣檢測(cè)方法的探討[J].測(cè)繪通報(bào),2006(3):40~42.