張小松,杜 蕓,董 燕,畢 蕙
(1.北京大學第一醫院婦產科,北京 100034;2.河北省腫瘤醫院細胞學室,河北 石家莊 050011;3.中國婦幼保健協會人工智能項目辦公室,北京 100089)
宮頸癌是威脅女性健康的主要惡性腫瘤之一,據統計2020年全球新發宮頸癌60.4萬例,死亡34.2萬例,中、低收入國家是高發地區[1]。2016年我國宮頸癌新發病例11.93萬例,死亡病例3.72萬例[2],位居女性惡性腫瘤死亡順位第6位[3]。
宮頸癌篩查是宮頸癌防控的主要措施之一,隨著人工智能(artificial intelligence,AI)技術的發展,AI輔助宮頸細胞學診斷技術已經開始在宮頸癌篩查工作中使用,為促進宮頸癌篩查工作的開展提供了更多的選擇性。為進一步提高和規范AI輔助宮頸細胞學診斷技術的工作質量和應用,2023年12月中國婦幼保健協會和中國婦幼保健協會婦女病防治專業委員會共同發布了《人工智能輔助宮頸細胞學診斷技術的應用及質量控制專家共識》(以下簡稱《共識》)[4]。本文旨在對《共識》進行解讀,便于相關專業人員在工作中進一步理解和實踐。
宮頸癌作為威脅女性健康的主要惡性腫瘤,其主要病因已經明確,即高危型人乳頭瘤病毒(high-risk human papillomavirus,HR-HPV)的持續感染。目前,隨著HPV預防性疫苗的應用,我國宮頸癌防控已經逐步形成了三級預防體系:一級預防措施包括健康教育和HPV疫苗接種,二級預防措施是宮頸癌篩查,三級預防措施主要是治療宮頸浸潤癌[5]。宮頸癌篩查仍然是宮頸癌防控的主要措施之一。宮頸癌篩查方法主要包括HPV檢測和宮頸細胞學檢查,兩種方法既是初篩方法,也是分流方法。宮頸細胞學檢查的質量在宮頸癌篩查工作中十分重要,其主要與細胞學醫生的能力和水平有關。由于我國幅員遼闊,不同地區醫療水平不同,細胞學醫生水平參差不齊,尤其是基層地區,細胞學醫生的數量和能力有所欠缺,影響了當地宮頸癌篩查的質量[6-7]。
2020年11月,世界衛生組織(World Health Organization,WHO)正式發布了全球首個消除宮頸癌的戰略,即《從公共衛生問題中加速消除宮頸癌的全球戰略》,提出了2030年全球宮頸癌防控“90-70-90”目標,其中目標之一是70%的女性在35歲和45歲各接受一次高質量的宮頸癌篩查[8]。我國積極響應WHO“加速消除宮頸癌”的全球戰略,并于2023年由10個部委聯合發布了《加速消除宮頸癌行動計劃(2023—2030年)》[9],也提出我國宮頸癌篩查的目標是2025年適齡婦女宮頸癌篩查率達到50%,2030年達到70%。相關研究顯示,2018—2019年35~64歲女性宮頸癌篩查的覆蓋率僅為36.8%[10],距70%的篩查目標仍有較大差距。因此,為實現上述目標,宮頸癌篩查的質量和效率需要進一步提升。
在此背景下,AI輔助宮頸細胞學診斷技術的發展及應用,有望成為促進我國高質量高效率開展宮頸癌篩查工作的措施之一。我國《加速消除宮頸癌行動計劃(2023—2030年)》中也提出探索人工智能、互聯網等新技術應用于宮頸癌篩查和診療服務[9]?!豆沧R》發布主要的目的就是在當前形勢下,為AI輔助宮頸細胞學診斷技術在實際工作中的應用及質量控制提供參考。
在《共識》中對于AI輔助宮頸細胞學診斷的定義進行了闡述。首先,AI輔助宮頸細胞學診斷系統仍然屬于病理學圖像診斷,且屬于醫療器械范疇。我國對于AI醫療器械也有相關定義,是指“基于醫‘療器械數據’,采用人工智能技術實現其預期用途(即醫療用途)的醫療器械”[11],從其定義中可以理解AI醫療器械既包括“AI獨立軟件”醫療器械,也包括“AI組件”醫療器械,后者也稱醫療器械嵌入式軟件[12]。AI輔助宮頸細胞學診斷技術包括軟件和硬件部分,主要是由掃描工作站、數字診斷和數據存儲三部分組成,因此屬于含有病理圖像AI分析軟件的醫療器械?!豆沧R》還參考了其他相關專家共識[13]對AI輔助宮頸細胞學診斷的定義。
需要注意的是目前AI輔助宮頸細胞學診斷技術還是屬于輔助診斷,沒有診斷權限,意味著AI輔助細胞學是篩選出陽性或陰性細胞,但最終需要細胞學醫生進行診斷,并出具報告。
AI輔助宮頸細胞學診斷系統需要準確分割細胞核,通過特征提取和分類來判斷細胞是否有病變。目前主要的核分割算法包括簡單線性迭代聚類(simple linear iterative clustering,SLIC)方法、基于區域的分割方法、卷積神經網絡(convolutional neural networks,CNN)和聚類方法[14]等。隨著AI輔助宮頸細胞學診斷技術的開展,相關應用場景的探討也日益增多。
王娜等[15]研究者對于202例宮頸液基薄層細胞學標本采用多流CNN細胞分類算法進行判讀,并與人工判讀結果進行比較,結果顯示多流CNN二分類和多分類算法的符合率分別為68.13%和73.08%。二分類算法的靈敏度、特異度、陰性預測值分別為100.00%、62.09%、100.00%;多分類算法的特異度相對較高,未見上皮內病變細胞或惡性細胞(negative for intraepithelial lesion or malignancy,NILM)、無明確診斷意義的不典型鱗狀細胞(atypical squamous cells of undetermined significance,ASC-US)、低級別鱗狀上皮內病變(low-grade squamous intraepithelial lesion,LSIL)、高級別鱗狀上皮內病變(high-grade squamous intraepithelial lesion,HSIL)、非典型鱗狀細胞不除外鱗狀上皮內高度病變(atypical squamous cells-cannot exclude HSIL,ASC-H)分別是96.55%、73.75%、98.29%、98.90%、99.45%。Bao等[16]基于188 542例宮頸樣本,深度學習模型診斷HSIL及以上病變的靈敏度為90.10%,且發現模型閱片水平相當于經驗豐富的細胞學專家,甚至具有更高的特異度。朱孝輝等[17]分析了16 317例基于深度學習模型的AI診斷宮頸上皮內病變的樣本及資料,結果顯示AI輔助診斷系統預測宮頸上皮內病變靈敏度為92.90%,預測其他病變靈敏度為83.55%,陰性樣本特異度為87.02%;而細胞病理醫生運用AI輔助診斷系統分別為99.34%、97.79%及99.10%。Xue等[18]對3 514名婦女的研究結果顯示,AI液基細胞學的敏感性與人工閱片相似(86.49%vs.83.78%,P=0.744),但在檢測宮頸上皮內瘤樣病變(cervical intraepithlial neoplasia,CIN)2級及以上時高于HPV16/18分型(86.49%vs.54.05%,P=0.002)。雖然AI液基細胞學的特異性顯著低于HPV16/18分型(51.33%vs.87.17%,P<0.001),但其檢測CIN2及以上病變的特異性高于人工閱片(51.33%vs.40.93%,P<0.001)。Wilbur等學者[19]對12 313例宮頸細胞涂片采用人工閱片和AI輔助宮頸細胞學診斷閱片進行比較,結果發現與人工閱片相比,AI輔助宮頸細胞學診斷組的HSIL陽性靈敏度增加了19.6%,LSIL陽性靈敏度增加了9.8%,但特異度略有降低,對于非典型鱗狀細胞(atypical squamous cells,ASC)陽性的靈敏度和特異度無統計學差異。
從上述研究可以看到,與傳統的人工閱片相比,AI的敏感性相當或略高,特異性有些研究提示略低,有些研究提示顯著增高。研究結果的差異與研究采用的AI方法和研究設計不同有關,但總體來說AI的準確性與人工閱片相當或略高,特異性有待進一步研究。
由于宮頸細胞學檢查需要病理細胞學醫生閱片后做出診斷,結果容易受主觀因素影響,因此細胞學醫生的能力和臨床經驗十分重要。此外,由于宮頸癌篩查的工作量巨大,細胞學醫生容易疲勞,也會影響診斷結果的判斷,因此在細胞學閱片中要求細胞學醫生每天閱片不超過100張[20],但又會影響工作效率。而AI輔助細胞學診斷不存在人員疲勞的問題,且數字診斷標準統一,可以避免上述問題的發生。
國內也有相關研究的報道,朱孝輝等[17]研究結果提示,細胞病理醫師運用人工智能輔助診斷系統比人工閱片節省約6倍的閱片時間。郭曉等[21]報道2 719例細胞學圖片由2名細胞病理醫師閱片需要227h完成,而AI輔助閱片用時136h,節省了時間。因此,效率增加是AI的優勢之一。
AI輔助宮頸細胞學診斷技術作為宮頸細胞學輔助診斷工具,應按照宮頸細胞學檢查管理及質量控制要求,應用于宮頸癌機會性篩查及組織性篩查中,可以作為初篩,或HPV檢測分流及HPV聯合篩查的方法,但需要病理醫師最終確認診斷。考慮到AI輔助宮頸細胞學診斷技術具有工作效率高,不存在閱片疲勞及診斷標準統一的優勢,更適宜應用于工作量大的人群組織性篩查或篩查數量較大的機會性篩查中,尤其是在細胞學醫生能力不足和數量缺乏地區。
目前國內外對于人群組織性篩查也有相關研究報道。有學者應用云技術和人工智能的自動化細胞學診斷平臺對湖北省83個縣(市)的年齡在20~72歲的703 103名女性進行宮頸癌篩查,結果顯示以宮頸活檢組織病理學結果作為金標準,AI自動化診斷平臺的敏感性和特異性分別為99.18%和44.42%[22]。而陰性預測值和陽性預測值分別為41.27%和99.28%。與人工閱片相比,在NILM、ASC-US、ASC-H、LSIL、HSIL的診斷一致率分別為99.10%、87.49%、84.15%、85.31%和94.20%。與單純HPV檢測相比,Parham等[23]學者在本地區宮頸癌篩查工作中,采用HPV檢測加上自動視覺評價算法的方法,結果顯示人類免疫缺陷病毒(human immunodeficiency virus,HIV)陽性且HPV16陽性的女性宮頸癌前病變及以上級別的檢出風險由48%增加到72%。
質量控制是保證宮頸癌篩查質量的重要措施之一。對于人工閱片的宮頸細胞學的質量控制主要包括管理、人員能力建設及宮頸細胞學制片閱片等[20]。對于AI輔助宮頸細胞學診斷技術來說,除上述質量控制內容和人工閱片相同,《共識》也進行了詳細的闡述。對于AI硬件和軟件系統的質量控制也應包括在其中,但目前實際工作中由于AI系統采用的方法不同,相關的參數并不統一,另外不同系統采集細胞學圖像的質量也不統一,因此亟需統一AI輔助宮頸細胞學診斷技術系統的參數和細胞學圖集。
綜上所述,《共識》對于人工智能技術在宮頸癌篩查中的應用和質量控制提供了參考,大規模人群的組織性篩查更能充分發揮AI輔助宮頸細胞學診斷技術高效率、診斷標準統一的優勢,但仍然需要在質量控制、信息管理等方面進行深入探討,并需要更多真實世界的研究數據提供更全面的循證醫學證據。