梁 羽 ,岳林先,曹文斌,王 娟,游勤霞,王亞萍,楊 磊,陳 琴△
(1.四川省人民醫院超聲科,成都 610072;2.四川省成都市第三人民醫院超聲科 610031;3.四川省成都市第一人民醫院超聲科 610000)
近年來甲狀腺疾病發病率呈現快速上升的趨勢,其中甲狀腺結節患病率最高約占1/5,人群中甲狀腺癌的粗略發生率約7.56/10萬,在中國全部癌癥中排名第七[1-2]。甲狀腺結節影像報告和數據系統(thyroid imaging of reporting and data system,TI-RADS)在臨床中廣泛應用,但由于超聲醫師的經驗和超聲設備性能造成診斷的不確定性,導致不同地區間、醫院之間和醫師之間超聲結果差異較大,帶給患者和臨床醫師很大困惑。近幾年,人工智能在醫學影像領域的迅速興起,尤其人工智能在甲狀腺結節的輔助診斷上已呈顯優勢,對于降低超聲結果差異有很大幫助。目前人工智能報道大都是單中心回顧性研究,為減小選擇性偏倚,本研究同期納入3家醫院的不同醫師和不同設備,以Kwak和ACR TI-RADS分類為標準,采用人工智能安克偵計算機輔助診斷(computer-aided diagnosis,CAD)系統,比較超聲醫師與該人工智能系統對甲狀腺結節診斷的效能,現報道如下。
于2019年11月初對成都地區3家三甲醫院超聲醫師統一進行Kwak TI-RADS分類[3-4]及ACR TI-RADS分類[5]標準培訓,規范甲狀腺超聲操作及數據收集流程。隨后,選取2019年11月至2020年1月該3家醫院的經過細針穿刺活檢或手術病理確診的甲狀腺疾病患者為研究對象,最終納入252個甲狀腺結節,每個結節留存縱、橫切面圖各1幅,記錄當時醫師超聲報告的TI-RADS分類,最后由安克偵CAD系統集中時間盲法讀圖并出具TI-RADS分類報告。
1.2.1甲狀腺結節超聲圖像數據庫建立
甲狀腺結節超聲圖像納入標準:(1)甲狀腺結節均有穿刺或手術病理結果者;(2)甲狀腺結節最大直徑小于60mm;(3)超聲圖像必須包含整個結節,圖像清晰,結節清楚;(4)具有標準的縱、橫切面二維超聲圖;(5)超聲圖像中無血流信號、測量數據、彈性和造影信息;(6)超聲圖像中應包括甲狀腺前方肌肉回聲信息。排除標準:(1)甲狀腺結節無穿刺和手術病理結果者;(2)有穿刺結果而缺乏超聲圖像者;(3)有超聲報告無原始圖像者;(4)圖中結節包括不完整者。最終建立252個甲狀腺結節的504張標準圖像數據庫。
1.2.2甲狀腺結節圖像分析
(1)甲狀腺結節分類標準:按照Kwak及ACR TI-RADS分類標準執行。(2)人工智能安克偵CAD分類原理(圖1):核心算法采用經典機器學習算法,其分析參數建立在診斷甲狀腺結節良惡性的主要超聲特征的基礎之上,與Kwak及ACR TI-RADS分類采用的超聲特征基本一致,主要包括:實性低回聲、形態不規則、邊緣模糊、縱橫比大于1、微鈣化。

A:原始甲狀腺超聲影像;B:安克偵自動分析甲狀腺結節超聲影像特征,可量化和彩色視覺化各項特征指標;C:根據影像特征加以量化數據分析,并提示惡性風險評估;D:自動生成提示腫瘤良惡性的數字化診斷報告。
1.2.3甲狀腺超聲TI-RADS分類報告統計分析
研究分成低年資超聲醫師和安克偵CAD,比較兩者TI-RADS分類診斷效能。
252個甲狀腺結節中女207例(82.1%),男45例(17.9%),女∶男為4.6∶1,年齡22~79歲,平均(43.8±12.4)歲,結節最大直徑4~60 mm,平均(13.6±9.1)mm。在病理類型上,143(56.7%)個良性結節,109(43.3%)個惡性結節,其中乳頭狀癌98個(38.9%),濾泡狀癌10個(3.9%),髓樣癌1個(0.4%),結節性甲狀腺腫113個(44.8%),腺瘤10個(4.0%),炎性病變20個(7.9%)。
與低年資超聲醫師比較,安克偵CAD各TI-RADS分類的惡性百分比更符合Kwak或ACR TI-RADS分類規定的惡性風險,見表1。
與低年資超聲醫師比較,安克偵CAD對Kwak或ACR TI-RADS分類的診斷的曲線下面積(AUC)更高,差異有統計學意義(P<0.05),見表2。

表1 不同診斷模式運用Kwak和ACR TI-RADS分類法與甲狀腺結節病理結果的符合度

表2 不同診斷模式對甲狀腺結節TI-RADS分類的診斷價值
一致性檢測結果顯示,按臨床最佳診斷節點標準(4B類、4類),安克偵CAD(Kappa值=0.72)優于低年資超聲醫師(Kappa值=0.39);按統計學最佳診斷節點標準(4B類或4C類,5類),安克偵CAD(Kappa值=0.87)同樣優于低年資超聲醫師(Kappa值=0.53),見圖2。

圖2 不同診斷模式下Kwak或ACR TI-RADS分類的ROC曲線比較
甲狀腺人工智能研究主要是通過傳統機械學習和深度學習兩個途徑來實現,兩種研究途徑最終目的都是達到對甲狀腺結節TI-RADS分類或結節良惡性的智能診斷,已經在我國部分醫院進入臨床應用階段的計算機輔助系統主要是安克偵CAD,其主要功能是對甲狀腺結節進行智能TI-RADS分類,輔助超聲醫師診斷[6]。在多次甲狀腺人機讀片大賽或臨床應用研究上,計算機輔助診斷系統在短時間內診斷甲狀腺結節良惡性的準確率基本可以媲美專業甲狀腺超聲醫師[7-8],部分研究團隊結果甚至超越專業甲狀腺超聲醫師,表現出巨大臨床應用潛力[9-10]。
本研究結果表明:安克偵CAD各TI-RADS分類的惡性百分比更符合診斷標準規定的惡性風險,而低年資超聲醫師在Kwak TI-RADS分類法4A類惡性百分比(36.8%)遠高于規定的惡性風險(5%~10%),在ACR TI-RADS分類法3類惡性百分比(42.1%)遠高于規定的惡性風險(≤5%),說明安克偵CAD診斷更符合TI-RADS分類診斷標準。同時,安克偵CAD對甲狀腺TI-RADS分類的診斷效能的ROC曲線面積全面優于低年資超聲醫師,在最優診斷節點下對甲狀腺TI-RADS分類的靈敏度、特異度及準確性優于低年資超聲醫師,顯示出一定的臨床應用價值。且安克偵CAD還科學驗證了甲狀腺Kwak與ACR TI-RADS分類法診斷效能基本一致,兩種TI-RADS分類方法的一致性Kappa值高達0.87,高于低年資超聲醫師Kappa值0.53,說明安克偵CAD能消除低年資超聲醫師主觀因素的干擾誤判,選擇任意一種TI-RADS分類法都能達到甲狀腺結節準確診斷。
實際上,1家醫院一般傾向選擇應用一種TI-RADS分類法,超聲醫師對一種TI-RADS分類法比較熟悉,掌握應用也比較熟練、準確。目前國內大部分醫院甲狀腺超聲醫師[11-12]更傾向選擇類似乳腺BI-RADS分類的Kwak TI-RADS分類法,對ACR TI-RADS分類法掌握及臨床應用不及Kwak TI-RADS分類法,而安克偵CAD一次超聲診斷就能高效、準確地提供多種TI-RADS分類結果供臨床選擇,可以輔助超聲醫師對不同TI-RADS分類更精確診斷,具有潛在的臨床應用優勢。
此外,甲狀腺計算機輔助診斷的臨床應用也面臨諸多挑戰。(1)在臨床實際運用中不同醫院、不同醫師雖然對TI-RADS分類臨床最佳節點選擇存有爭議[13-14],但普遍接受Kwak TI-RADS 4B類及ACR TI-RADS 4類作為臨床最佳診斷節點[11]。本研究中,安克偵CAD最佳診斷節點Kwak TI-RADS 4C類及ACR TI-RADS 5類,高于臨床實際應用的診斷節點,說明安克偵CAD傾向提高結節的TI-RADS分類級別,臨床實際應用就會造成部分結節因TI-RADS分類升高、惡性風險增加而選擇穿刺活檢或手術治療,易造成甲狀腺結節過度診療,不能使患者受益。(2)許多研究表明臨床醫師即使將ACR TI-RADS 5類作為臨床診斷節點,也還需要結合患者的臨床病史及實際情況,并不會貿然建議患者穿刺活檢或手術治療[14-15]。(3)計算機輔助診斷所必要的超聲標準圖像受限于超聲醫師、超聲儀器的主客觀影響,不能智能診斷所有甲狀腺圖像,對于甲狀腺結節過小或者過大在圖像勾畫上都會存有診斷誤差,影響智能診斷[16]。
綜上所述,安克偵CAD診斷甲狀腺結節TI-RADS分類的一致性及診斷效能整體優于低年資超聲醫師,可以輔助低年資超聲醫師提高甲狀腺TI-RADS分類的準確性和一致性,減少依靠主觀經驗而造成的診斷誤判,具有一定的臨床應用價值,但不能完全取代超聲醫師的臨床診斷,超聲醫師結合CAD的人機結合診斷可能才是符合臨床實際需求的診斷方式。