朱維健



【摘 要】:目的:通過查詢文獻資料來分析當前人工智能在病理學診斷DNA錯配修復方面的應用與進展 方法:檢索文獻資料和信息選定了深度殘差學習算法,研究者從癌癥基因組圖譜中獲取了病理切片數據,包括315個胃癌樣本,360個結直腸癌樣本和378個冷凍結直腸癌樣本。樣本進一步經過自動腫瘤檢測儀處理,分別生成了100570、93408、60894個顏色歸一化色塊,作為深度學習的“原料”,隨后分別對DNA錯配修復和MSS(微衛星穩定)樣本進行DNA錯配修復評分。結果:直接從病理切片識別DNA錯配修復,利用深度殘差學習算法識別結直腸癌中DNA錯配修復準確率達84%。結論:這意味著我們或許可以越過免疫組化或基因檢測,直接利用人工智能機器提取腫瘤組織特征,對病理切片進行分析,更快捷地識別出那些適合使用免疫治療的患者??紤]到DNA錯配修復在各癌種中的普遍性,后續人工智能的應用可能潛力無限。
【關鍵詞】:人工智能 ;DNA錯配修復 ;腫瘤切片
Abstract: Objective : Application and Progress of Artificial Intelligence in Pathological Diagnosis DNA Mismatch Repair by Searching Literature. Methods : Searching literature and information to select a deep residual learning algorithm, the researchers obtained pathological section data from the cancer genome atlas, including 315 gastric cancer samples ,360 colorectal cancer samples and 378 frozen colorectal cancer samples. the samples were further processed by an automatic tumor detector to generate 100570,93408,60894 color-normalized color blocks as “raw materials” for deep learning, followed by DNA mismatch repair and MSS( microsatellite stable) samples with a DNA mismatch repair score, respectively. Results : Detection DNA mismatch repair directly from pathological sections using deep residual learning algorithm to identify colorectal cancer DNA mismatch repair accuracy reached 84%. Conclusion : This means that we may be able to go beyond immunohistochemistry or genetic testing, directly using artificial intelligence machines to extract tumor tissue features, analyze pathological sections, and more quickly identify patients suitable for immunotherapy. considering the universality of DNA mismatch repair in various cancer species, subsequent ai applications may have unlimited potential.
keywords: artificial intelligence ; DNA mismatch repai ; Tumor sections
1 資料與方法
1.1 一般資料:
通過查詢近年來文獻資料包括《中華醫學遺傳雜志》、《中華醫學雜志》、《腫瘤研究與臨床》、《癌癥》《吉林醫學》、《現代預防醫學》、《中國醫學論壇報》等核心期刊和互聯網醫學信息追蹤關于腫瘤DNA錯配修復和不穩定的最新進展。中美兩國的科研人員在國際期刊《美國科學院院報》(PNAS)發表了DNA錯配修復的最新研究成果,利用精確地單分子研究技術報告了DNA錯配修復研究的突破性發現。來自北卡大學教堂山分校的杜克醫學中心和北卡州立大學的研究人員發現DNA錯配位置處形成的鉗狀復合物沿著DNA鏈移動如何修復錯配堿基。 查閱德國亞琛工業大學、美國德克薩斯大學的研究報告,利用人工智能從病理切片中識別DNA錯配修復。研究者從癌基因圖譜(TCGA)中獲取病理切片數據進行三次外部驗證,數據分別來自DACHS研究的378例樣本和來自日本KCCH研究隊列(185列)樣本和UCEC研究隊列(327)例樣本,以及基因檢測和免疫組化檢測結果等資料。
1.2 方法:檢索文獻資料和信息選定了深度殘差學習算法,研究者從癌癥基因組圖譜中獲取了病理切片數據,包括315個胃癌樣本,360個結直腸癌樣本和378個冷凍結直腸癌樣本。樣本進一步經過自動腫瘤檢測儀處理,分別生成了100570、93408、60894個顏色歸一化色塊,作為深度學習的“原料”,隨后分別對MSI(DNA錯配修復)和MSS樣本進行MSI評分。
2 結果
直接從病理HE切片中識別DNA錯配修復(MSI)利用深度殘差學習算法,識別直腸癌DNA錯配修復(MSI)準確率達到84%??紤]到DNA錯配修復(MSI)在各種癌癥中的普遍性,人工智能的后續應用潛力無限。
3 結論
這意味著我們或許可以跳過免疫組化或基因檢測,直接利用人工智能機器提取腫瘤組織特征,對病理切片進行分析,更快捷地識別出那些適合使用免疫治療的患者。
研究者在一個小樣本數據集中測試了5種不同的算法,最終名為Resnet18的深度殘差學習(deep residual learning)算法脫穎而出,曲線下面積(AUC)竟然高于0.99。深度殘差學習采用跳躍鏈接方法,對有效數據保留更好,同時結構更加簡單,訓練速度也更快。選定了算法,研究者從癌癥基因組圖譜(TCGA)中獲取了病理切片數據,包括315個福爾馬林固定石蠟包埋(FFPE)胃癌樣本(TCGA-STAD),360個FFPE結直腸癌樣本(TCGA-CRC-DX)和378個冷凍結直腸癌樣本(TCGA-CRC-KR)。這些樣本又進一步經過自動腫瘤檢測儀處理,分別生成了100570、93408、60894個顏色歸一化色塊,作為深度學習的“原料”,隨后分別對(DNA錯配修復)MSI和MSS(微衛星穩定)樣本進行(DNA錯配修復)MSI評分。
測試結果顯示,針對FFPE結直腸癌樣本,(DNA錯配修復)MSI圖像的MSI評分為0.61,MSS圖像的(DNA錯配修復)MSI評分為0.29;對于冷凍的結直腸癌樣本,二者數據分別為0.5和0.22。可見該算法并不受樣本處理方法的限制,都有足夠的區分度。再看準確性,對胃癌、FFPE結直腸癌和冷凍結直腸癌三組樣本,AUC則分別達到0.81、0.84、0.77。接下來,研究者對算法進行了三次外部驗證。第一組樣本數據來自DACHS研究,包括378份樣本,使用FFPE結直腸癌樣本訓練出的模型,AUC達到了0.84。研究者還嘗試了用冷凍樣本訓練出的模型和胃癌樣本訓練出的模型,效果均略有不足,說明模型準確性受到組織類型和樣本處理方法的影響。
第二組數據來自日本橫濱的KCCH隊列。選擇它的原因主要是亞裔的胃癌組織學和臨床過程與非亞裔差別很大。來自TCGA的胃癌樣本中有80%是非亞裔,100%亞裔的KCCH隊列(n=185)驗證結果AUC為0.69。考慮到(DNA錯配修復)MSI是一種泛癌種的生物標志,研究者選了第三組數據,來自UCEC隊列的327個子宮內膜癌樣本。經訓練的模型在剩余樣本中AUC為0.75。由此可見,這種算法模型可能受癌種、樣本類型、患者人種的影響,如果要拓展使用,可能需要更大的數據集來訓練。研究者還計算了該檢測需要的組織樣本大小,結果顯示下限約為100×256μm見方。這個大小的組織通過活檢就可以取得,可以說是非常方便了。最后,研究者對比了模型計算的(DNA錯配修復)MSI評分與轉錄組和免疫組化數據的差異。相關區域胃癌的淋巴細胞基因特征、結直腸癌的PD-L1和IFN-γ表達、腫瘤低分化、免疫細胞浸潤等特征都是符合組織病理學理論的。
癌癥的免疫治療開拓了一片新天地,不過至今尋找能從免疫治療獲益的患者仍舊是關鍵難題。正在召開的ASCO也把尋找新的免疫治療生物標志物列為2020年研究首要任務。而現有的生物標志物檢測也遠還沒有惠及到大多數患者。人工智能可能是解決這一問題的最好方案。低成本、無需額外的實驗過程、樣本方便獲取……相信經過更大數據集的訓練和前瞻性驗證,它能夠真正把免疫治療帶向更多人。
參考文獻
Rahman, R., Asombang, A. W. & Ibdah, J. A. World J. Gastroenterol. 20, 4483–4490 (2014).
Le, D. T. et al. N. Engl. J. Med. 372, 2509–2520 (2015).
He, K., Zhang, X., Ren, S. & Sun, J. In Proc. IEEE Conference on Computer Vision and Pattern Recognition 770–778 (2016).
Bonneville, R. et al. JCO Precis. Oncol. 2017, 1–15 (2017).
Darvin, P., Toor, S. M., Sasidharan Nair, V. & Elkord, E. Exp. Mol. Med. 50, 165 (2018).
Coudray, N. et al. Nat. Med. 24, 1559–1567 (2018).
Schaumberg, A. J., Rubin, M. A. & Fuchs, T. J. Preprint at
Chang, P. et al. AJNR Am. J. Neuroradiol. 39, 1201–1207 (2018).
錯配修復/微衛星不穩定性對晚期結直腸癌化療敏感性及預后影響的研究[D]. 揚州大學,2018.
中華實驗外科雜志,2010,(8).doi:10.3760/cma.j.issn.1001-9030.2010.08.007.