徐游民,劉志,何瓊,羅建文
清華大學 醫學院 生物醫學工程系,北京 100084
中風是中國第一大殺手[1],中風的一個主要原因是頸動脈粥樣硬化斑塊的破裂[2]。因此,評估頸動脈粥樣硬化斑塊的破裂風險(即易損性)對預防中風至關重要。目前,頸動脈粥樣硬化斑塊的危險性評估主要是根據超聲成像對斑塊大小和狹窄程度的檢測[3]。在臨床上,當斑塊引起的頸動脈狹窄程度大于70%時,醫生會建議患者做頸動脈內膜剝脫術或血管支架移植手術[4]。然而有研究表明,很多發生腦血管事件的患者的頸動脈狹窄程度低于50%[5]。因此,單一頸動脈狹窄程度的判斷標準不夠準確。另有一些研究表明,經過組織學驗證,易損斑塊通常有大的脂質核、薄的纖維帽、斑塊內出血、炎癥和新生血管等特征,而穩定斑塊通常有鈣化、厚的纖維帽以及沒有脂質核,因此評估斑塊成分可以有效區分斑塊的易損性[6]。
目前,多種影像技術可以應用于頸動脈易損性評估,如超聲(Ultrasound,US)、磁共振成像(Magnetic Resonance Imaging,MRI)、正電子發射型計算機斷層顯像(Positron Emission Tomography,PET)和X射線電子計算機斷層掃描(X-Ray Computed Tomography,X-CT)等[7]。PET 對檢查者操作要求高,且存在電離輻射。CT同樣存在電離輻射,且對脂質和纖維化成分缺乏足夠的對比度[8]。MRI被認為是評估頸動脈粥樣硬化斑塊成分的一種可靠的成像方式[9]。通過對頸動脈內膜剝脫術得到的斑塊樣本進行組織學分析發現,MRI可以有效地評價頸動脈斑塊的特征,進而對斑塊易損性進行評估[10]。MRI無電離輻射,但是掃描時間長,檢查費用昂貴。而超聲成像性價比高,成像速度快,無電離輻射,適合于大規模人群的篩查及病情的持續監測。有研究證明,不同的斑塊成分有不同的彈性模量(如楊氏模量)。因此,超聲彈性成像可用于斑塊成分的檢測[11]。de Korte等[12]利用血管內超聲彈性成像成功區分了穩定和易損斑塊,但是血管內超聲成像有創,且成本高,也不適用于頸動脈。因此,我們需要一種性價比高、無創的血管成像方式去評估頸動脈斑塊的易損性。
近些年來,無創超聲頸動脈彈性成像的研究越來越多。它的基本原理是:首先在體外無創地獲取頸動脈(斑塊)的超聲射頻數據,然后用運動估計算法進行處理,得到位移和應變(或應變率)分布[13],反映其彈性模量分布。一些研究結果證明,超聲頸動脈彈性成像可以有效評估斑塊的易損性[14],然而,這些研究只是驗證了應變或應變率等單一特征(比如最大值、均值、中值、標準差等)對于評估頸動脈斑塊易損性的可行性,并沒有對未知易損性的頸動脈斑塊(即測試數據集)進行檢測。
隨著計算機技術的發展,機器學習的方法被廣泛應用于醫學影像研究中。國內外開展了很多醫學圖像自動分析及計算機輔助診斷的研究[15],幫助醫生自動檢測相關疾病。采用機器學習的方法可望實現應變或應變率的多特征分析,達到對測試數據集中的斑塊自動檢測的功能。支持向量機(Support Vector Machine,SVM)是目前應用較為廣泛的一種機器學習方法[16]。與傳統的機器學習方法以及人工神經網絡方法相比,SVM在樣本數相對較少、特征維數高的情況下,仍然具有很好的識別能力。同時,SVM通過“核函數”和“大間隔”的思想,有效地解決了以下兩個問題。首先,通過核函數,將原空間的非線性問題轉化成新空間中的線性問題,因此,計算可以在低維空間里進行,大大減少了計算復雜度;其次,通過最大化分類間隔,使其在高維空間里仍可以保持很好的分類結果[17]。因此,國內外有越來越多的學者將SVM方法應用于醫學影像領域[18-19]。但是,到目前為止,SVM還沒有應用于頸動脈易損斑塊的自動檢測中。本研究以高分辨率MRI的診斷結果作為參考,通過SVM的方法對已知易損性的頸動脈斑塊的超聲彈性成像結果進行訓練,得到一個頸動脈易損斑塊的自動識別模型,并對測試數據集中的斑塊進行自動檢測。
本研究涵蓋了197個年齡在58到86歲之間的志愿者,他們在6個月內均沒有發生過明顯心血管事件(比如心臟病、中風、心肌梗死和短暫性腦缺血等)。隨后,有經驗的臨床醫生用配備L9-3線陣探頭的飛利浦iU22超聲成像系統采集每個志愿者頸動脈長軸方向的超聲射頻數據,以用于后續頸動脈斑塊的應變率估計。
同時,每個患者也接受配備自主設計的36 通道神經血管線圈的飛利浦 Achieva TX 3.0 T MRI系統對頸動脈進行掃描。MRI有三個多對比度的三維黑血序列,分別是3D-MERGE、VISTA和SNAP[20-22]。MRI沿橫截面采集,覆蓋整個頸動脈,包括頸總動脈、頸動脈分叉、頸內動脈和頸外動脈。
為了便于超聲彈性成像的分析以及考慮到較大的斑塊更具有臨床意義,本研究選擇厚度大于2.5 mm的斑塊(即剔除了無頸動脈粥樣硬化斑塊以及動脈粥樣硬化斑塊比較小的數據),共計52位志愿者的80例斑塊數據用于后續的分析。
MRI的判讀是在飛利浦工作站上重建MRI切片,并在空間上匹配3D-MERGE,SNAP,VISTA 圖像[20-22],對比斑塊的信號強度,根據標準的判別流程識別鈣化(Calcification,Ca)、斑塊內出血(Intraplaque Hemorrhage,IPH)和富含脂質的壞死核(Lipid-Rich Necrotic Core,LRNC)等斑塊成分。手動分割LRNC和血管壁,獲得LRNC與血管壁橫截面面積之比,將出現IPH或者LRNC面積超過20%的斑塊歸為易損斑塊[23]。最后,80例斑塊中,50例判讀為穩定斑塊,30例判讀為易損斑塊。
頸動脈斑塊的應變率估計流程如下所述。首先利用光流法,從連續采集的斑塊超聲射頻數據中依次估計出相鄰兩幀間的二維位移(包括軸向和側向位移)和應變(包括軸向和側向應變)。由于側向估計結果較差,本研究只采用軸向應變估計結果[24]。為了消除不同幀頻的影響,對應變結果進行歸一化,得到應變率結果(應變率=應變×幀頻)。在所有幀的應變率估計完成之后,確定每個心動周期中絕對應變率最大的那一幀,然后對其進行斑塊分割。斑塊的分割由兩位有豐富經驗的研究者結合斑塊的B超圖和應變率圖來完成。最后,將斑塊的應變率結果提取出來,用于后續的特征提取及斑塊易損性分析。
本研究采用最大絕對應變率(Maximum Absolute Strain Rate,MaxASR)、絕對應變率中值(Median Absolute Strain Rate,MedASR)、絕對應變99%分位數(99thPercentile of Absolute Strain Rate,99thASR)、絕對應變均值(Mean Absolute Strain Rate,MeanASR)和絕對應變標準差(Standard Deviation of Absolute Strain Rate,SDASR)[25]作為頸動脈斑塊的應變率特征。
使用受試者工作特征(Receiver Operating Characteristic,ROC)曲線下的面積(Area Under Receiver Operating Characteristic Curve,AUC)[26],分析不同應變率特征對斑塊進行分類的效果。首先,通過設定不同的閾值,畫出某一特征對斑塊進行分類的ROC曲線;然后,計算其對應的AUC;通過比較不同特征的AUC大小,評估特征與易損斑塊識別的相關性,以此剔除與易損斑塊識別關系不大的特征,避免影響后續分類器的設計。
假定有線性可分的訓練樣本集:

其中每個樣本都是d維向量,y是樣本標簽。存在一個超平面:


當原始樣本集是非線性的,可以引入核函數,新空間的決策函數為:

本研究采用的核函數為徑向基(Radial Basis Function,RBF)核函數

本研究先分析各單一特征的AUC,排除AUC值最小的特征,并將剩下的特征按AUC值從大到小排序,分別將前兩個特征、前三個特征、......、前n個特征組合在一起,然后利用SVM方法分別基于單一特征、各個特征組合對斑塊進行分類。當多特征組合的線性程度降低時,采用RBF核函數,將原始特征空間的非線性問題轉換為新特征空間的線性問題。當核函數為RBF時,的選擇非常重要。太小時,RBF只會作用于支持向量樣本附近,使得該方法在訓練樣本上有很高的準確率,而在測試樣本上分類效果很差;太大時,平滑效應太大,無法在訓練集上得到特別高的準確性,進而影響在測試集上的分類效果[17]。本研究以基于RBF核函數的SVM在測試集上的準確性為指標,選擇最優的,最后用優化后的RBF核函數,基于各個特征組合對頸動脈易損斑塊進行識別。
由于樣本量較少,為了保證數據充分利用,本研究采用留一法對數據集進行交叉驗證。留一法的原理是把n個樣本中的n-1個樣本作為訓練集,將剩下的一個作為測試集,這樣就有n次訓練過程,且每個樣本都預測了一次,然后取預測結果的平均值作為最后預測結果[27]。本研究使用靈敏性(Sensitivity,SEN)、特異性(Specificity,SPC)、準確性(Accuracy,ACC)作為SVM分類的評價指標,具體定義如下:

其中TP、FN、TN和FP分別為真陽性、假陰性、真陰性和假陽性。
由單一特征得到的ROC曲線和AUC結果如圖1、表1所示。可以看出,頸動脈斑塊彈性成像的99thASR的AUC值最大(0.817),說明該特征與易損斑塊識別的關聯性最高;而MedASR的AUC值最小(0.719),表明該特征與易損斑塊識別的相關性最低。因此,我們剔除了MedASR這個特征,最終選擇了99thASR、MaxASR、SDASR和MeanASR這四個特征用于后續的SVM分析。

圖1 各個特征的ROC曲線

表1 各個特征的AUC值
基于各個特征,線性核函數的SVM在測試集上的分類結果如表2所示。可見,當選擇的特征分別為99thASR、MaxASR、SDASR時,其準確率最高(78.8%),而靈敏性、特異性相差不大。

表2 基于各單一特征的線性核函數的SVM在測試集上的分類結果(%)
根據各個特征的AUC值大小排序,取99thASR、MaxASR為兩特征組合,取99thASR、MaxASR和SRASR作為三特征組合,最后將99thASR、MaxASR、SRASR和MeanASR作為四特征組合。
基于兩特征、三特征和四特征組合,線性核函數的SVM在測試集上的分類結果如表3所示。對比表3與表2可知,當基于兩特征組合時,線性核函數的SVM的準確性較單個特征時略微提高,但基于三特征、四特征組合時,靈敏性、準確性比基于兩特征組合更低。

表3 基于兩特征、三特征和四特征組合,線性核函數的SVM在測試集上的分類結果(%)

圖2 靈敏性、特異性、準確性隨值的變化曲線
表4 基于多特征,采用最優值的RBF核函數的SVM在測試集上的分類結果(%)

表4 基于多特征,采用最優值的RBF核函數的SVM在測試集上的分類結果(%)
注:① 99thASR+MaxASR;② 99thASR+MaxASR+SDASR;③99thASR+MaxASR+SDASR+MeanASR。
特征 靈敏性 特異性 準確性兩特征組合① 66.7 88.8 80.0三特征組合② 70.0 88.0 81.3四特征組合③ 70.0 88.0 81.3
本研究以高分辨率MRI診斷結果作為參考,根據AUC分析超聲頸動脈彈性成像獲得的應變率特征與頸動脈易損斑塊識別的相關性,選擇99thASR、MaxASR、SDASR和MeanASR等四個特征用于后續分析;進一步,按照AUC值大小順序形成兩特征、三特征和四特征組合,利用線性核函數的SVM分別基于單一特征和多特征對斑塊進行分類。結果表明,三特征、四特征組合的線性核函數的SVM的靈敏性、準確性比兩特征的要差,說明當線性核函數的SVM分類結果較差的特征加入時,組合的特征線性程度會降低。最后,以靈敏性和準確性為指標,對RBF核函數的參數進行優化,用四特征組合獲得更好的斑塊分類結果。
采用RBF核函數的SVM方法能夠實現頸動脈易損斑塊的自動識別,并通過“大間隔”和“核函數”的思想,在保證靈敏性和準確性的情況下,大大減少運算時間。表5是當99thASR、MaxASR、SDASR和MeanASR四特征組合在一起時,線性核函數的SVM、RBF核函數的SVM、logistic回歸(Logistic Regression,LR)[28]及K最近鄰(K-Nearest Neighbor,KNN)[17]方法的分類結果與耗時對比。

表5 基于四特征的不同分類方法在測試集上分類結果與耗時
其中,logistic回歸分類由隨機梯度下降法實現,KNN方法中選擇了最優的K值,K=3。由表5可見,RBF核函數的SVM方法在保證高靈敏性、準確率的條件下,耗時更低;其時間復雜度主要跟支持向量的個數(一般小于樣本數量)有關。logistic回歸分類過程需要利用梯度下降法,在每次更新回歸系數時遍歷整個數據集,如果樣本量及樣本維度增大,時間復雜度大大增高[28]。對于KNN方法,新樣本需要和每一個樣本計算距離,再通過排序找出前K個最近鄰,對于大樣本而言計算量也非常大[17]。當樣本量增大時,RBF核函數的SVM方法在保證高的靈敏性、特異性、準確性的情況下,能夠快速計算,因此該 方法性能更優。
本研究存在一些局限性。首先,本研究采用頸動脈長軸方向的掃描,只能涵蓋前壁和后壁的斑塊,而無法包含血管側壁的斑塊,可能會對模型的訓練造成影響。其次,本研究使用的特征來源于手動分割的頸動脈斑塊應變率結果;手動分割受人為因素影響較大,容易將邊界處的噪聲劃入斑塊區域,影響本研究分類的準確性。再次,本研究所使用的特征均為一階應變率特征;用灰度共生矩陣、Hough變換、小波變換等方法可以提取斑塊的二階特征[29],可能可以提高SVM分類的準確性。此外,本研究的樣本量比較少;當樣本量足夠大后,可以采用SVM自動識別方法對斑塊成分進行進一步的統計分析,可能可以提高訓練模型對斑塊易損性識別的準確性。
本研究以高分辨率MRI的診斷結果作為參考,開展了基于超聲彈性成像的支持向量機對頸動脈易損斑塊進行自動識別的研究。首先,利用AUC來評估超聲彈性成像獲得的應變率特征與易損斑塊識別的相關性,選出四個特征。接著,采用基于RBF核函數的SVM方法,并利用訓練得到的模型對測試數據進行自動識別。結果表明,當這四個特征組合在一起時,采用最優值的RBF核函數,SVM方法對80例頸動脈斑塊進行分類的效果最好。本研究初步驗證了基于超聲彈性成像的支持向量機用于頸動脈易損斑塊自動識別的可行性。