閻華偉,張吉,林志禧,金獻測,韓策
溫州醫科大學附屬第一醫院 放療中心,浙江 溫州 325015
先進的放射治療技術,如調強放射治療(intensity-modulated radiation therapy,IMRT)和容積調制弧形治療(volumetric modulated arc therapy,VMAT)已有許多臨床應用。然而,這些技術在計劃和出束方面都非常復雜,必須在實施之前進行安全的保證[1]。基于患者特定的質量保證(quality assurance,QA)測量被用于確認劑量傳遞的準確性。該過程通常涉及使用伽馬通過率(gamma pass rate,GPR)評估將計算的劑量分布與測量的劑量分布進行比較[2]。因此,針對調強計劃的劑量驗證是極其重要的環節。根據美國醫學會物理學家協會(AAPM)TG218建議,對于該部分提出了相應的臨床限值[3]。使用人工智能(artificial intelligence,AI)和機器學習(machine learning,ML)來幫助預測和進行決策已經在一系列學科中廣泛應用,包括腫瘤放射治療學和醫學物理學,其中也有涉及到質量保證部分。因此,本研究擬提取VMAT放療計劃的復雜度參數,利用一種通用的機器學習方法,對3%/3 mm、3%/2 mm和2%/2 mm三種不同標準下的GPR分別進行數值跟分類預測。
1.1 一般資料 收集2019年3月至2020年8月在溫州醫科大學附屬第一醫院接受雙弧VMAT治療的141例患者,其中男56例(39.71%),女85例(60.28%),包括99例盆腔腫瘤患者(宮頸、子宮內膜、直腸、前列腺等部位)、42例頭頸部腫瘤患者(鼻咽、口咽、喉咽等部位),分別占70.21%和29.79%。患者均采用仰臥位、熱塑體模固定,CT模擬定位掃描層厚設定為3 mm。由腫瘤放射治療副主任醫師進行靶區及OAR勾畫,盆腔患者的PTV處方劑量均為45 Gy/25次,1.8 Gy/次,頭頸部的PTV處方劑量均為60 Gy/30次,2.0 Gy/次。所有計劃均采用6 MV X射線束,Elekta Synergy直線加速器(瑞典Elekta公司),配備了80片多葉準直器(MLCi2TM,瑞典Elekta公司),由MONACO(Monaco 5.1.1,瑞典Elekta公司)治療計劃系統(treatment planning system,TPS)設計完成。優化過程中,劑量網格尺寸為3.0 mm,光滑度(smooth)設定為低。所有的VMAT調強放療計劃在主管醫師審核通過后進行傳統方式的模體驗證。將3D二極管陣列的ArcCHECK(Model 1220)在直線加速器下模擬患者擺位,并調用調強治療計劃模擬患者治療出束,然后采用SNC Patient(v.6.2.1,Sun Nuclear Corporation)軟件進行雙弧復合調強驗證和分析。閾值設定為10%,計算3%/3 mm、3%/2 mm和2%/2 mm三種不同標準下的全局GPR。見表1。

表1 不同標準下的GPR測量值
1.2 實驗設計 本研究設計路線見圖1。

圖1 研究設計路線圖
1.3 特征提取 從放射TPS中導出放療DICOM-RT文件中的信息,包括RTplan、RTStructure、RTDose、RTimage等,使用Matlab2016a(美國Mathwork公司)根據自己編寫的軟件代碼進行讀取和處理,從而得到13個調強放療計劃的復雜度參數,具體參考本課題組之前的研究結果[4],見表2。

表2 調強計劃復雜度參數匯總
1.4 特征選擇及模型建立 將患者病種、模體劑量驗證不同條件下的GPR、調強計劃的復雜度參數等信息進行一一對應并整合,在RStudio中進行進一步處理。數據按照7∶3的比例進行隨機劃分,70%作為模型的訓練集,利用該部分對數據集建模,并調整權重參數;剩下的30%作為測試集,利用該部分來評估最終模型的泛化能力。本研究對于GPR預測分為數值預測跟分類預測兩部分。在GPR數值預測方面,將計劃復雜度參數與GPR之間進行Pearson相關分析;若P<0.05,分別篩選出3%/3 mm、3%/2 mm、2%/2 m三個標準下潛在的有意義的特征。在GPR分類預測方面,根據TG218分別設定3%/3 mm、3%/2 mm、2%/2 mm標準下95%、95%和90%作為臨床界值,以判定調強計劃是否可以執行,從而分為“通過”“失敗”兩類,采用LASSO以幫助選擇不同條件下的關鍵特征。本研究構建基于支持向量機(support vector machines,SVM)的GPR預測模型,分別進行數值預測跟二元分類預測。在數值預測中,SVM的類型設定為“C-cllassification”,核函數設定為“radial”;在分類變量中,類型設定為“espregression”,核函數設定為“radial”。
1.5 模型評估 使用各種指標對模型的準確性進行評估。針對GPR數值準確性,平均值、標準差、均方根誤差、平均絕對誤差作為評價指標;對于GPR分類預測準確性,繪制受試者工作特征(receiver operating characteristic,ROC)曲線,使用曲線下面積(area under curve,AUC)進行評價。
1.6 統計學處理方法 采用Matlab 2016a(美國Mathwork公司)讀取和處理計劃復雜性特征;使用R軟件(version 3.0.1,MathSoft)執行以下過程:通過使用“caret”包來實現Pearson相關分析作為GPR數值的特征篩選;通過使用“glmnet”包來實現LASSO回歸作為GPR分類的特征篩選;分別使用“e1071”包和“pROC”包支持向量機模型和ROC曲線。P<0.05為差異有統計學意義。
2.1 GPR數值預測 在3%/3 mm、3%/2 mm、2%/2 mm條件下,模型分別篩選出11、11、11個關鍵參數。不同標準下,伴隨著分析條件越嚴格,預測的偏差越大,在訓練集和測試集中均得到體現。見表3。

表3 不同標準下訓練集與測試集中的GPR數值預測(%)
2.2 GPR分類預測 在3%/3 mm、3%/2 mm、2%/2 mm條件下,模型分別篩選出4、6、3個關鍵參數。在上述的條件下,訓練集中的AUC分別0.82、0.91、0.79;測試集結果分別0.79、0.78、0.77。見表4和圖2。

圖2 不同條件下訓練集和測試集的ROC曲線分析結果

表4 不同標準下訓練集與測試集中的GPR分類預測
現階段,針對患者的調強放療計劃的劑量驗證需要專門在直線加速器下,在每個計劃執行前,使用體模或其他驗證設備對其模擬真實情況進行測量并分析。考慮到該過程質量保證的重要性及必要性,并給臨床帶來了沉重的工作負擔。因此,如何更加方便、高效地完成是目前亟待解決的問題。一些研究已經證實,在質量保證中,調強計劃的復雜性和GPR之間存在一定的關系[5-7]。已有研究表明,隨著劑量分布適形度的增加,調強放療計劃的復雜度也隨之增加,對計劃的準確實施產生一定的影響[8-9]。
近幾年,機器學習已逐漸被廣泛應用于腫瘤調強放療的質量保證,預測GPR的準確性已經發展成為一種比傳統更有效的質量保證方法[10-11]。在本研究中,我們收集了盆腔、頭頸部等多部位的調強放療計劃,并提取復雜性參數作為構建模型的輸入端,通過機器學習-支持向量機的方法分別預測3%/3 mm、3%/2 mm和2%/2 mm三種不同條件下的GPR的數值與分類的準確性。
在GPR數值預測方面,構建支持向量機的機器學習方法模型顯示,3%/3 mm條件下的測試集中預測誤差為0.49%±2.19%,這與前人的一些研究成果相近。如ONO等[12]應用回歸樹分析(regression tree analysis,RTA)、多元線性回歸分析和神經網絡(neural networks,NNs)3種機器學習模型對GPR的預測誤差分別為0.6%±2.4%、0.5%±2.4%和0.2%±2.1%。另外,3%/3 mm、3%/2 mm和2%/2 mm三種標準下,測試集中的平均絕對誤差分別為1.56%、2.68%、3.67%,這與LI等[13]對VMAT計劃采用泊松套索回歸(poisson lasso,PL)模型驗證集中的平均絕對誤差相近,符合隨著條件越嚴苛,預測偏差越大的結果。
對于GPR分類預測方面,三個標準下的,測試集的AUC結果都接近0.8。其中,在3%/2 mm條件下,測試集的AUC結果分別0.79,敏感度、特異度分別為1.00 和0.57。LI等[13]研究的驗證集結果顯示,PL模型的特異度和敏感度分別為1.00和0.33。
已有研究證明,2%/2 mm標準比3%/3 mm標準更能敏感地檢測出臨床相關誤差[14]。因此,構建適用多條件下的GPR的預測模型是非常有必要的。此外,美國影像與放射腫瘤學中心(imaging and radiation oncology core,IROC)一項研究表明,治療計劃的復雜性不能預測來自多個機構的IROC擬人頭頸部模體認證的效果[15]。這表明使用計劃復雜性特征可能存在不穩定,結合其他特征或者選擇其他更加穩定的特征進行預測,也是我們以后研究的方向。
綜上所述,這項研究證明基于機器學習對調強放療計劃進行劑量驗證具有一定的臨床應用價值,為質量保證提供了一種新思路與新方法,可以提高直線加速器跟物理師的工作效率,縮短患者等待放療的時間,更為腫瘤患者得到合理的綜合治療提供支持。