張弛,張政,張蕾,朱磊,汪豐
1. 東南大學 生物科學與醫學工程學院,江蘇 南京 210096;2. 上海市第一人民醫院 放射科,上海 201620
隨著生活水平的提高,人們的飲食習慣逐漸發生改變,長期攝入高糖高脂食物,導致人體內脂質物質積累過多,脂肪沉積在某些特定的器官、組織內部,造成異位脂肪沉積及脂肪變性[1]。而肝部不同程度脂肪變性會導致脂肪肝、肝纖維化、肝硬化甚至肝癌等[2]。脂肪變性導致疾病的發生為不可逆過程,因此對于輕中度脂肪變性的研究具有較大臨床意義。
組織學檢查是診斷肝臟脂肪變性程度的金標準[3],但由于穿刺組織活檢為有創操作,且存在取樣、判讀誤差和可重復性差等缺點[4],目前臨床上主要采用超聲影像進行檢查,但超聲影像分析在脂肪含量低于20%的時候,敏感度最高55%;CT檢查在診斷輕度肝脂肪變性時準確性較差,MRI可利用脂肪與水分子中氫質子在不同磁場強度下進動頻率的差異,對包括輕度肝臟脂肪變性在內的病變也能得出更加可靠的影像學診斷結果[5-7]。
根據全國調查結果顯示,中國成人血脂異常總體患病率高達40.40%,較2002年呈大幅度上升[8]。代謝疾病愈加威脅人類的身體健康。這些疾病會導致血管、眼、神經系統的慢性損害和功能障礙,給患者帶來極大的痛苦,而肝臟脂肪變性程度與代謝異常疾病具有高相關性,研究肝臟脂肪變性程度對于代謝相關疾病的診斷具有臨床意義[9-10]。
近幾十年隨著影像領域新的硬件、標準化協議的不斷出現和發展及與醫療大數據的結合,影像組學開始興起并快速發展,通過從影像圖像中高通量提取大量特征,給出更完善的分析結果[11-12]。
本研究擬使用影像組學方法,獲取患者腹部MRI影像中肝臟的感興趣區域,提取影像組學特征,包括強度特征、紋理特征等等,并對特征進行篩選,再利用多種機器學習方法進行建模并進行模型評估,最終對肝臟脂肪變性輕中度進行分類研究。
回顧性分析2018年6月至8月于上海市第一人民醫院進行MR上腹部mDixon成像序列掃描的成人患者。排除標準:具有肝臟其他疾病以及因惡性腫瘤正在接受化學、放射治療的患者。本次研究共入組50位患者,其中38位輕度肝部脂肪變性患者,12位中度肝部脂肪變性患者。患者肝部脂肪變性等級均由專業醫師依據患者的超聲影像與MR影像資料聯合判斷所給出的等級評判結果。
使 用 3.0T MR機(Ingenia,Philips) 進行上腹部MR影像采集,序列采集參數如下:回波數為6;TE=n×1.15 ms,n=1,…,6; 翻轉角 5°;TR=10.3 ms;FOV=400×350×210 mm3,矩陣 320×256×70,掃描時間為16 s,屏氣掃描,接收線圈為腹部32通道表面線圈。
本研究采用影像組學與集成學習方式,流程主要包括:① 患者影像數據預處理;② 提取影像組學特征;③ 特征處理;④ 集成學習建模分類。流程圖如圖1所示。

圖1 本文影像組學與集成學習流程圖
數據預處理主要包括肝部影像數據提取和數據擴增。
(1)肝部影像數據提取。對患者的影像數據使用3D slicer軟件勾畫感興趣區(Region of Interest,ROI)。ROI選取患者mDixon序列中肝部實質區域,避開大血管、局灶性病變和顯著的偽影。每位患者共選取肝部區域的6個ROI,其中4個位于右葉實質(肝Ⅴ,Ⅵ,Ⅶ,Ⅷ段),2個位于左葉實質(肝Ⅱ,Ⅲ段)。每個ROI的大小均為16×16像素。
老人們常常擔心自己部族的文化會消亡。年輕人的生活方式通常更現代,但這也付出了代價,少數民族的文明全球化了。
(2)數據擴增。由于患者數目較少,因此通過數據擴增的方式增加樣本數量。具體的方法包括在提取ROI的上下兩層數據中分別再次進行勾畫,將數據進行擴增;添加隨機高斯噪聲等。擴增后的數據量為初始數據量的4倍。
利用Python編碼并進行特征提取,對每位患者的6個ROI分別提取影像組學特征,包括強度特征及紋理特征。強度特征主要描述ROI區域內體素強度的一階統計特征值,包括平均值、最大值和最小值等。紋理特征包括灰度共生矩陣、灰度游程矩陣、灰度區域大小矩陣、領域灰度差矩陣、灰度相關矩陣。使用Python共提取出126項特征,其中強度特征18項,紋理特征共108項。
由于提取出的特征在維度和取值范圍上具有較為明顯的差異,為了使機器學習分類模型達到更好的分類結果,需要提前對所有特征進行處理,主要包括特征篩選[13]和歸一化處理。
特征篩選的目的為通過對過于冗余的特征進行剔除,減少模型建立過程中無用的計算量。特征篩選不存在對特征值的修改,而更加側重于尋找那些對模型的性能提升較大的少量特征。由于本研究中研究的是二維圖像數據,因此影像組學特征中一些描述三維的特征向量可以進行剔除,如平坦度等。經過特征篩選,剔除27項特征,剩余93項特征。
歸一化處理主要針對不同特征最大值和最小值范圍差距過大進行處理,如果兩種特征取值范圍差距過大,會導致分類模型的訓練過程中產生不必要的針對特征量綱的計算,一定程度上影響分類結果。將特征處完成后整理為數據集,以供機器學習分類模型進行訓練和測試。
特征處理完畢后,需要建立機器學習模型對特征進行分類。本研究采用集成學習方法進行機器學習分類。相較于傳統機器學習分類方法,集成學習通過特定的規則生成多個學習器,再利用一定的組合策略將這些學習器進行組合從而獲取最終的結果。集成學習中的多個學習器一般為同質的“弱學習器”。基于該弱學習器,通過樣本集擾動、輸入特征擾動、輸出表示擾動、算法參數擾動等方式生成多個學習器,進行集成后獲得一個精度較好的“強學習器”,即最終集成學習模型。
本研究所采用的集成學習方法包括三種:自適應提升法(Adaptive Boosting,AdaBoost)[14]、梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)[15]、極端梯度提升法(Extreme Gradient Boosting,XGBoost)[16],這三種方法都是基于Boosting(提升方法)的集成學習方法,訓練多輪弱分類器,每一輪根據上一輪的分類結果動態調整每個樣本在分類器中的權重,從而得到K個弱分類器,這些弱分類器都有各自的權重,通過加權組合的方式得到最終的分類結果(綜合所有的基模型預測結果)。AdaBoost通過每次迭代訓練中改變數據分布,根據判斷每次訓練集中的每個樣本的正確性以及上次的總體分類的準確率來確定每個樣本的權值,再將修改權值的新數據送給下層分類器進行訓練,然后將每次訓練得到的分類器線性組合起來作為最終的決策分類器。GBDT算法的核心則是在迭代過程中利用下一個弱分類器去擬合誤差函數對預測值的殘差(這個殘差就是預測值與真實值之間的誤差),通過不斷減小殘差來達到最終的分類。XGBoost與GBDT核心思想類似,區別在于XGBoost在代價函數中加入了正則項,可以控制模型的復雜度,且在每次迭代之后,XGBoost為葉子結點分配學習速率,降低每棵分類決策樹的權重,為之后的訓練提供更好的空間,而從權衡方差偏差來看,XGBoost降低了模型的方差,使訓練模型更加精簡,并能夠有效防止過擬合,泛化性能優于GBDT。
本研究采用3項指標對三種集成學習分類算法的性能進行評估,包括準確率(Accuracy,ACC),精確率(Precision),召回率(Recall),F1 score。各項指標值定義如公式(1)~(4):

其中,TP(True Positive)表示被模型預測為正的正樣本數,FP(False Positive)表示被模型預測為正的負樣本數,FN(False Negative)表示被模型預測為負的正樣本數,TN(True Negative)表示被模型預測為負的負樣本數。
本研究利用AdaBoost、GBDT與XGBoost三種集成學習算法分別將處理過后的患者肝部MRI影像組學特征進行分類,獲得分類結果。訓練過程中訓練集與測試集劃分比例為4:1。訓練集數據進行交叉驗證得到穩定的模型,并利用測試集評估三種分類模型的效果(表1)。XGBoost算法性能最佳,分類準確率達到81.9%。

表1 三種算法分類性能表(%)
通過模型效果對比,XGBoost算法在肝臟脂肪變性輕中度分類效果最佳,因此將XGBoost模型中影像組學特征的重要性進行排序,排序結果如圖2所示。特征的重要性代表了該項特征在總體模型中權重的大小,重要性越高則表明該項特征對肝臟脂肪變性程度輕中度分類發揮更大的作用。其中重要性最高的五項分別為強度特征中的90Percentile(用于描述ROI區域內總體的體素的強度分布)、灰度區域大小矩陣中的Small Area High Gray Level Emphasis(用于衡量ROI中具有較高灰度值的較小尺寸區域的聯合分布比例)、灰度游程矩陣中的Run Percentage(用于衡量ROI區域紋理的粗糙度)、強度特征中的Energy(用于衡量ROI區域平均體素強度)、灰度共生矩陣中的Cluster Tendency(衡量ROI區域內具有相似灰度值的聚類趨勢)。這五項特征重要性之和大于19%,即在總體肝臟脂肪變形程度輕中度分類模型之中所占權重接近1/5。

圖2 特征重要性由高至低排序結果
三種不同的集成學習方法中最高分類準確率為XGBoost方法,準確率達到81.9%。XGBoost相較于AdaBoost與GBDT加入了二階導數,對于影像組學特征的分類起到了更好的效果。影像組學與集成學習相結合的方法對于肝部脂肪變性輕中度分類起到了較好的結果。
通過對這三種模型性能指標的對比,選出更適合本研究患者數據的算法,并對XGBoost分類模型中影像組學特征重要性進行排序,篩選出了權重更大的一些影像組學特征。根據特征重要性排序,在重要性最高的五項特征中,90Percentile與Energy這兩項特征均為描述總體的體素分布情況或平均強度的特征,而除此之外的三項特征分別衡量高灰度值的較小尺寸區域的分布、紋理粗糙度及相似灰度值的聚類趨勢,這說明僅僅依靠體素的強度大小對肝臟脂肪變性進行研究具有一定的局限性,而MRI數據中還有著更多的有效特征可以進行提取并用來對脂肪變性進行更準確的分析研究。除此之外,包括灰度共生矩陣、灰度游程矩陣及灰度區域大小矩陣包含的特征也占據不小的比重。與此同時,這也表明肝臟脂肪變性的影像學表現還有著許多值得進一步研究的信息,例如紋理粗糙度和相似灰度值聚類趨勢等特征,這些深層特征在分類模型的特征重要性分數中排名靠前,對于肝臟脂肪變性輕中度分類占據較高重要性,一定程度上也可能表征出肝組織的結構的變化,或是脂肪等物質在肝部的堆積情況等等,包括其他影像組學特征也可能為肝臟脂肪變性及相關疾病的診斷提供有效建議。
目前對于肝部脂肪變性研究的影像學手段一般多為超聲檢查及CT檢查,但超聲影像與CT對于輕中度脂肪變性的敏感度較低,而本研究中通過基于MRI的影像組學方法對于輕中度脂肪變性的分類準確率最高達到81.9%,可以有效解決這一問題。相較于傳統依靠醫學影像中體素值強度的分析,影像組學更深入挖掘了影像中的一些深層次特征[17-18],通過分析這些特征所代表的影像學意義,有助于更全面的針對肝部脂肪變性的影像學研究。
肝臟脂肪變性程度輕中度分類對于患者是否發生代謝異常的早期篩查具有一定的意義,而影像組學能有效提取患者的影像數據中的多維度特征[19-20],從而更好地進行影像分析,借助集成學習的高效分類更能進一步提取到有價值的信息,對輕中度脂肪變性的患者提供一些飲食習慣的建議或其他臨床干預手段,減少患者由輕中度脂肪變性發展為更嚴重的肝纖維化、肝硬化甚至肝癌等的概率。
目前研究結果還存在一些不足之處,由于研究前期入組的患者數量較少,無法完全發揮集成學習的優勢,后續研究將會繼續收集不同程度肝臟脂肪變性患者的腹部MRI數據,增加樣本數量,進一步提高分類精度,并深入分析影像組學特征的意義,挖掘肝臟脂肪變性影像資料中更多可靠、有效的信息,為影像學檢查提供參考。
本文通過結合影像組學與集成學習的方法對肝臟脂肪輕中度變性的患者進行分類,并對模型中重要性較高的影像組學特征進行分析。影像組學與集成學習方法為脂肪變性分級提供了一種較為可靠的輔助診斷手段,隨著后續研究入組患者數量增多,集成學習方法將會發揮更大的優勢,使分類結果更加準確可靠。通過挖掘患者影像數據中更多深層次信息,也為臨床診斷提供更多有效幫助,除此之外,對輕中度脂肪變性的研究也能夠為患者脂質代謝相關疾病的臨床干預或治療時機提供指導。