高瑋瑋,左晶
1. 上海工程技術(shù)大學(xué) 機(jī)械工程學(xué)院,上海 201620;2. 江蘇省中醫(yī)院 眼科,江蘇 南京 210029
目前,糖尿病已是一種嚴(yán)重威脅人類健康的頑疾。據(jù)預(yù)測,將來全球糖尿病患者將會占總?cè)丝诘?.4%[1]。我國情況更為嚴(yán)峻,糖尿病患者已達(dá)9240 萬,位居全球之首[2]。糖尿病還會帶來一系列并發(fā)癥,其中以糖尿病視網(wǎng)膜病變(簡稱“糖網(wǎng)”,Diabetic Retinopathy,DR)發(fā)生率最高。糖網(wǎng)影響視力,目前已成為成人致盲的首要原因[3]。因?yàn)樘悄虿』颊呔媾R著發(fā)展為DR 的高風(fēng)險(xiǎn),且DR 具有進(jìn)行性和不可逆性,故對于已患糖尿病的患者而言,如何在還未發(fā)生視力損傷的情況下及時(shí)準(zhǔn)確地篩查出其是否患有DR,不僅為及早診斷、及早治療從而挽救患者視力提供先機(jī),還可節(jié)約大量寶貴的醫(yī)療資源[4]。目前,臨床存在多種糖網(wǎng)篩查手段及方法[5-6],其中眼科醫(yī)生普遍認(rèn)為眼底照相檢查最適合用于DR 的篩查和隨診[7]。但該方法現(xiàn)階段基本依靠人工閱片,這嚴(yán)重制約了DR 篩查大規(guī)模的實(shí)施。故早在20 世紀(jì)七八十年代就有研究人員提出利用計(jì)算機(jī)采用數(shù)字圖像處理與分析技術(shù)來實(shí)現(xiàn)這一任務(wù),其中又以對硬性滲出(Hard Exudates,EXs)區(qū)域自動檢測的研究最為廣泛、深入。
最初,研究人員探求利用灰度級特征提取黑白眼底圖像中的EXs 區(qū)域,不過這需依據(jù)直方圖人為選擇分割所需閾值[8];Philips 等[9]也提出了基于灰度值的EXs 分割方法,但需手動圈定ROI;后來,Gardner 等[10]利用BP 神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了EXs 的自動檢測;Sinthanayothin 等[11]提出利用與“Moat Operation”結(jié)合的循環(huán)區(qū)域增長法實(shí)現(xiàn)EXs 的自動檢測,但其檢測結(jié)果很大程度上依賴所選取的種子點(diǎn)位置和停止準(zhǔn)則;Osareh 等[12]利用FCM 算法分別結(jié)合神經(jīng)網(wǎng)絡(luò)與SVM 完成了EXs 的自動識別;Zhang 等[13]在Luv彩色空間利用改進(jìn)的FCM 算法與SVM 完成了EXs 的自動識別;Niemeijer 等[14]運(yùn)用數(shù)學(xué)形態(tài)學(xué)以及K 近鄰分類器實(shí)現(xiàn)EXs 的自動識別;Jaafar 等[15]提出的方法首先通過局部對比度獲取EXs 候選區(qū)域,在此基礎(chǔ)上利用拆分合并算法篩選出真正的EXs;Soares 等[16]提出采用尺度空間曲率以及動態(tài)閾值的方法自動分割眼底圖像中EXs;Esmaeili等[17]所提出的方法通過曲波變換方法獲取了眼底圖像中的該病灶。目前,國內(nèi)在該方面的相關(guān)研究報(bào)道不多,主要有林蔚[18]提出利用基于K 近鄰圖的區(qū)域合并算法實(shí)現(xiàn)眼底圖像中EXs 的分割,高瑋瑋等[19]提出的基于數(shù)學(xué)形態(tài)學(xué)的EXs 自動檢測方法。
篩查意味著所要處理的數(shù)據(jù)對象數(shù)量龐大,即在臨床中要求篩查系統(tǒng)所使用的算法不僅具有很強(qiáng)的普適性,而且還得具有較高的效率。因此,糖網(wǎng)自動篩查系統(tǒng)中的算法應(yīng)當(dāng)具備較強(qiáng)的可靠性和高效性,為此充分利用訓(xùn)練好的模式分類器強(qiáng)大、高效的識別能力,提出一種基于閾值分割及模式分類器的EXs 自動檢測方法,并結(jié)合建立基于眼底圖像的糖網(wǎng)自動篩查系統(tǒng)這一應(yīng)用背景,深入對比研究多種EXs 自動檢測方法的性能,以期實(shí)現(xiàn)能應(yīng)用于臨床的糖網(wǎng)自動篩查系統(tǒng)。
源圖像為126 幅由Canon CF-60 DSI 眼底照相機(jī)拍攝的分辨率為3504×2336 像素的JPG 彩色眼底圖像,具體來源于蘇省南京市某醫(yī)院。在實(shí)際使用時(shí),對原圖進(jìn)行了裁減并進(jìn)行了壓縮,即實(shí)際處理圖像的分辨率為800×600像素。將這126 幅眼底圖像交由眼科醫(yī)師判定,其中早期DR 眼底圖像有68 幅,均有EXs(圖1)出現(xiàn),其余為正常眼底圖像。

圖1 彩色眼底圖像及EXs細(xì)節(jié)
將這126 幅眼底圖像隨機(jī)分為兩組,其中,第一組(包括40 幅早期糖網(wǎng)病人眼底圖像和30 幅正常眼底圖像)為分類器提供訓(xùn)練樣本,確定分類器結(jié)構(gòu);第二組(共56 幅,分別為28 幅早期DR 病灶圖像以及28 幅正常眼底圖像)用來評測方法的自動檢測性能。
實(shí)驗(yàn)采用Intel Core Duo E7500 CPU,6GB RAM 的計(jì)算機(jī),MATLAB R2010a 的軟件環(huán)境。
基于閾值分割及模式分類器的EXs 自動檢測方法首先利用閾值分割獲取EXs 候選區(qū)域;然后,對候選區(qū)域的特征集進(jìn)行優(yōu)選;最后,利用優(yōu)化后的特征集及相應(yīng)人工判定結(jié)果分別建立RBF 神經(jīng)網(wǎng)絡(luò)分類器及SVM 分類器,從而實(shí)現(xiàn)對EXs 的自動檢測,具體如圖2 所示。

圖2 基于閾值分割及模式分類器的EXs自動檢測算法流程圖
閾值分割是一種最簡單直接的圖像分割方法,可實(shí)現(xiàn)對背景以及噪聲的有效濾除。目前常用的有直方圖法、最大類間方差法(Otsu)、迭代法等。其中Otsu 閾值法是基于類間方差最大的非參數(shù)、無監(jiān)督的自適應(yīng)閾值選擇方法,運(yùn)算速度快,是一種較好的閾值分割法。但不足的是它只考慮了類間距,沒有考慮類的內(nèi)聚性,故當(dāng)圖像的噪聲干擾較大時(shí),不能得到理想的分割結(jié)果,但它對類間方差為單峰的圖像能產(chǎn)生較好的分割結(jié)果(通過分析多幅眼底圖像G 通道灰度直方圖發(fā)現(xiàn),眼底圖像G 通道的灰度直方圖都近似呈單峰狀,如圖3c 所示。波峰對應(yīng)背景像素,與波峰右側(cè)相關(guān)的就是想要提取的白色區(qū)域,即EXs 候選區(qū)域),鑒于此,選用一種改進(jìn)的二維Otsu 自適應(yīng)閾值分割方法[20]來對眼底圖像G 通道進(jìn)行粗分割并“剔除”視盤(對于視盤的分割采用前期研究[19]中提出的方法)來獲取EXs 候選區(qū)域。該方法在克服了傳統(tǒng)Otsu 閾值分割信息不完備的同時(shí)還具有較強(qiáng)的抗噪性能,故對EXs 的分割效果好,圖3a 的粗分割結(jié)果具體見圖3d。

圖3 眼底圖像G通道直方圖及粗分割結(jié)果
利用該閾值分割方法對作為訓(xùn)練樣本的70 幅眼底圖像進(jìn)行粗分割,并從中去除視盤從而獲取了2570 個(gè)EXs 候選區(qū)域(據(jù)眼科醫(yī)師判斷,其中1160 個(gè)為真EXs,1410個(gè)為假EXs)。
對上述獲取的EXs 候選區(qū)域而言,為利用模式分類器將其中的真、假EXs 準(zhǔn)確區(qū)分開來,需利用這些區(qū)域的特征作為模式分類器的輸入對其進(jìn)行訓(xùn)練。對EXs進(jìn)行識別時(shí),眼科醫(yī)生往往會從亮度、面積、邊緣等入手,而這些方面可通過以下24 個(gè)特征進(jìn)行一定程度的表述[21-22],具體見表1。

表1 EXs特征集
特征用來設(shè)計(jì)、訓(xùn)練模式分類器,但隨著特征數(shù)量的增加,誤分類的可能性亦會隨之升高,故需對上述提取出的24 個(gè)特征進(jìn)行選擇。常規(guī)的特征選擇算法——判別分析法(Discriminate Analysis,DA)要求數(shù)據(jù)呈多元正態(tài)分布以及滿足方差齊性的要求。而另一種特征選擇算法——邏輯回歸分析法(Logistic Regression,LR)對數(shù)據(jù)的分布限制條件較少,當(dāng)數(shù)據(jù)不為正態(tài)分布或者各類的協(xié)方差差別較大時(shí),LR 性能更優(yōu)[23]。利用軟件SPSS 18.0 對粗分割階段獲取的2570 個(gè)EXs 候選區(qū)域的24 個(gè)特征進(jìn)行分析,得到數(shù)據(jù)的具體情況是:對上述特征進(jìn)行Kolmogorov-Smirnov 檢驗(yàn)和Shapiro-Wilk 檢驗(yàn),發(fā)現(xiàn)均不符合正態(tài)分布;另外,Leven’s 方差齊性檢驗(yàn)表明除μR、μG、、CR、CG、CP外的其它特征均不符合方差齊性要求。另外,是否為EXs 可概括為一個(gè)二分的分類變量,故此處采用LR 對提取出的24 個(gè)特征進(jìn)行選擇最為合適。
對粗分割階段獲取的2570 個(gè)EXs 候選區(qū)域的24 個(gè)特征,利用二項(xiàng)Logistic 回歸模型采用“逐步回歸”的方法進(jìn)行選擇(其中a進(jìn)取0.05,a出取0.1),具體選擇結(jié)果見表2。

表2 特征選擇結(jié)果
模型建好后,采用-2對數(shù)似然值(對數(shù)似然比值乘以-2)來度量模型對數(shù)據(jù)的擬合度。經(jīng)過優(yōu)化的特征集與完整特征集對訓(xùn)練樣本的擬合度(-2 對數(shù)似然值)為990.277,分類準(zhǔn)確性為88.0%。可見,兩特征集的擬合度相差無幾;但就對訓(xùn)練樣本的分類結(jié)果而言,明顯優(yōu)化特征集性能更優(yōu)。
將2570 個(gè)候選區(qū)域經(jīng)過優(yōu)化的特征參數(shù)與對該區(qū)域是否為EXs 的人工判定結(jié)果分別作為訓(xùn)練集的輸入和輸出,對RBF 神經(jīng)網(wǎng)絡(luò)以及SVM 進(jìn)行訓(xùn)練及預(yù)測。
2.4.1 RBF神經(jīng)網(wǎng)絡(luò)分類器的訓(xùn)練及預(yù)測
RBF 神經(jīng)網(wǎng)絡(luò)分類器訓(xùn)練時(shí),隱層節(jié)點(diǎn)個(gè)數(shù)Num 不斷增加,直至網(wǎng)絡(luò)輸出誤差小于所設(shè)定期望值goal。此外,還需對參數(shù)spread 進(jìn)行合理設(shè)置。在利用“newrb”命令建立RBF 網(wǎng)絡(luò)模型時(shí),采用10 倍交叉驗(yàn)證(將2570 個(gè)EXs 候選區(qū)域隨機(jī)分為10 組,依次將其中9 組做訓(xùn)練,1組做測試)對網(wǎng)絡(luò)進(jìn)行訓(xùn)練及預(yù)測。令擴(kuò)展速度spread[1,5]在間以步長0.1 進(jìn)行取值,對每一個(gè)取值進(jìn)行上述10 倍交叉驗(yàn)證,分別得到網(wǎng)絡(luò)在最不理想情況下的預(yù)測結(jié)果(圖4)。圖4 表明,當(dāng)spread 為2.3 時(shí),得到的網(wǎng)絡(luò)在最不理想情況下的分類準(zhǔn)確率最高,為93.27%,此時(shí)靈敏度為92.61%,特異性為95.13%。故當(dāng)spread 選取此值時(shí),無論采用何種樣本對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,預(yù)測結(jié)果均可達(dá)到令人滿意的水平。

圖4 擴(kuò)展速度不同取值時(shí)10倍交叉驗(yàn)證情況下的網(wǎng)絡(luò)最不理想預(yù)測結(jié)果
當(dāng)訓(xùn)練結(jié)束后即可得到確定的RBF 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),此時(shí)當(dāng)輸入新的樣本時(shí)即可進(jìn)行是否為EXs 的自動判別。
2.4.2 SVM分類器的訓(xùn)練及預(yù)測
在SVM 中常用的核函數(shù)中,高斯徑向基核函數(shù)具有較強(qiáng)的非線性映射能力、較少的超級參數(shù)、數(shù)值實(shí)現(xiàn)也較為簡單,故在本研究中選用基于高斯徑向基核函數(shù)作為該方法中SVM 的核,在此基礎(chǔ)上要得到結(jié)構(gòu)確定的SVM 分類器需確定兩個(gè)參數(shù):懲罰參數(shù)和核函數(shù)參數(shù)。為獲取分類性能最佳的SVM 模型,需得到最佳的懲罰參數(shù)和核函數(shù)參數(shù)。由于遺傳算法(Genetic Algorithm,GA)具有很強(qiáng)的全局搜索能力,且這種搜索能力不依賴于特定的求解模型故采用GA 對SVM 的這兩個(gè)參數(shù)進(jìn)行優(yōu)化,具體優(yōu)化流程如圖5 所示。

圖5 GA優(yōu)化C及γ的算法流程圖
利用候選區(qū)域經(jīng)過優(yōu)化的特征集以及相應(yīng)的人工判定結(jié)果分別作為訓(xùn)練集的輸入和輸出,對SVM 進(jìn)行訓(xùn)練及預(yù)測,具體參數(shù)分別為C=2.39,γ=1.25。尋優(yōu)結(jié)果顯示SEval、SPval、ACCval 的 值 分 別 為95.13%、98.01%、96.72%。同樣,訓(xùn)練完畢后即得到了確定的SVM 模型,即可對新的輸入樣本進(jìn)行是否為EXs 的自動識別。
作者此前研究并發(fā)表了一種基于數(shù)學(xué)形態(tài)學(xué)的EXs 自動檢測方法[19],為探求最為滿足實(shí)際需求的EXs 自動檢測方法,有必要對包括數(shù)學(xué)形態(tài)學(xué)方法在內(nèi)的多種EXs 自動檢測方法進(jìn)行對比研究。
利用數(shù)學(xué)形態(tài)學(xué)方法和建立好的RBF 神經(jīng)網(wǎng)絡(luò)分類器以及SVM 分類器分別來識別第二組眼底圖像中的EXs,具體結(jié)果是:對于病灶圖像(共28 幅),兩種方法均檢測到了EXs;對于健康眼底圖像(共28 幅),數(shù)學(xué)形態(tài)學(xué)方法在2 幅中圖像中檢測到了EXs,而閾值分割及模式分類器方法則在3 幅圖像(其中2 幅與數(shù)學(xué)形態(tài)學(xué)方法一致)中檢測到了EXs。具體檢測結(jié)果見表3,其中,同一眼底圖像的EXs 具體檢測結(jié)果如圖6 所示。此外,文獻(xiàn)[12]提出的FCM 結(jié)合BP 神經(jīng)網(wǎng)絡(luò)方法、文獻(xiàn)[18]提出的基于K近鄰圖的區(qū)域合并算法對該組圖像的檢測結(jié)果也見表3。

表3 EXs具體檢測結(jié)果

圖6 EXs自動檢測結(jié)果
由表3 發(fā)現(xiàn),所提出的兩種EXs 分割算法均已達(dá)到英國糖尿病協(xié)會(British Diabetic Association)于1997 年提出的DR 病灶自動篩查算法標(biāo)準(zhǔn)[24]:靈敏度最低80%,特異性最低95%。此外,從表3 還可發(fā)現(xiàn):基于閾值分割及模式分類器(包括RBF 神經(jīng)網(wǎng)絡(luò)分類器和SVM 分類器)方法的檢測精度優(yōu)于文獻(xiàn)[12,18],略低于文獻(xiàn)[19],但檢測效率均優(yōu)于文獻(xiàn)[12,18-19];而對于這兩種分類器之間而言,由表3 可發(fā)現(xiàn)(具體參見病灶區(qū)域水平評價(jià)指標(biāo)),SVM 分類器的識別率明顯較RBF 神經(jīng)網(wǎng)絡(luò)分類器更高。此外,對于糖尿病患者而言,其視網(wǎng)膜病變情況會受病情治療、控制與病程等因素影響,故只有保證較高的檢查頻率才能及時(shí)、有效地發(fā)現(xiàn)視網(wǎng)膜的相關(guān)病變。因此就DR自動篩查的實(shí)際應(yīng)用而言,基于閾值分割及SVM 分類器的EXs 自動檢測方法性能更佳。
眼底圖像中EXs 的自動識別是構(gòu)建糖網(wǎng)自動篩查系統(tǒng)的重要環(huán)節(jié),直接影響系統(tǒng)的篩查性能。只有快速、有效的自動檢測方法才能滿足臨床對篩查的要求。據(jù)此充分利用訓(xùn)練好的模式分類器強(qiáng)大、高效的識別能力,提出一種基于閾值分割及模式分類器的EXs 自動檢測方法,并與包括基于數(shù)學(xué)形態(tài)學(xué)的EXs 自動檢測方法在內(nèi)的多種EXs 檢測方法進(jìn)行了對比研究。實(shí)驗(yàn)結(jié)果表明,與其他硬性滲出分割方法相比,基于閾值分割及模式分類器(包括RBF 神經(jīng)網(wǎng)絡(luò)分類器和SVM 分類器)方法在保證較高檢測精度的同時(shí)效率也較高;而對于RBF 神經(jīng)網(wǎng)絡(luò)分類器和SVM分類器之間而言,明顯SVM 分類器的性能更優(yōu)。故就糖網(wǎng)自動篩查的臨床應(yīng)用而言,基于閾值分割及SVM 分類器的EXs 自動檢測方法性能更優(yōu)。該研究工作為構(gòu)建基于眼底圖像的糖網(wǎng)自動篩查系統(tǒng)提供了可靠的技術(shù)支持。對糖網(wǎng)自動篩查系統(tǒng)而言,在實(shí)現(xiàn)了高效的EXs 自動檢測基礎(chǔ)上,剩下的其他早期糖網(wǎng)病灶,如視網(wǎng)膜內(nèi)出血等的高效自動檢測則將是下一步的研究重點(diǎn)。