劉中華,王小莉,呂國榮,杜永兆2,,4,柳培忠2,,4,吳秀明,何韶錚
1.福建醫科大學附屬泉州第一醫院超聲科,福建泉州362000;2.泉州醫學高等專科學校母嬰健康服務應用技術協同創新中心,福建泉州362000;3.華僑大學醫學院,福建泉州362000;4.華僑大學工學院,福建泉州362000;5.福建醫科大學附屬第二醫院超聲科,福建泉州362000
胎兒顏面部超聲標準切面(Fetal Facial Ultrasound Standard Plane,FFUSP)在胎兒顏面部結構畸形篩查與診斷中發揮重要作用[1]。近年來利用人工智能(Artificial Intelligence,AI)實現了FFUSP的自動識別[2],但AI在超聲圖像質量控制及醫生培訓的應用尚少見報道[3-4]。本研究分析AI自動識別分類FFUSP在超聲圖像質量控制和醫師規范化培訓方面的價值。
以妊娠20~24周正常FFUSP圖像為研究對象,包括鼻唇冠狀切面(Nasolabial Coronal Plane,NCP)、正中矢狀面(Median Sagittal Plane, MSP)、經眼球橫切面(Ocular Axial Plane,OAP)、非標準切面(Non-Standard Plane,N-SP)4個切面圖像。圖像按照用途分為標準集圖像與實驗集圖像,分別用于AI模型訓練、測試及評價不同經驗醫生與AI識別分類FFUSP能力。所有圖像均來自于福建醫科大學附屬泉州第一醫院超聲圖文工作站,使用儀器為GE Volusen E8超聲儀及Philips EPIQ5超聲儀。
圖像納入標準:①圖像清晰,目標結構位于圖像正中占據整個圖像1/2以上,背景純凈無偽像;②圖像內無疊加彩色血流圖像,無測量卡鉗、文字標識等人工注釋;③產后證實胎兒無顏面部及其它結構畸形。圖像排除標準:①由于孕婦肥胖、圖像抖動等原因導致圖像模糊、拖尾,目標結構顯示欠清晰;②超聲檢查或產后證實胎兒異常。最終納入標準集圖像1 906張,實驗集圖像4 532張。
本研究AI 模型使用局部二值模式(Local Binary Pattern,LBP)和梯度方向直方圖(Histogram of Oriented Gradient,HOG)提取訓練集圖像紋理特征[5-6],通過支持向量機(Support Vector Machine,SVM)學習其紋理特征[7],實現FFUSP的自動分類,最后通過預測分類測試集圖像評估模型(圖1)。

圖1 AI模型識別FFUSP流程Fig.1 Process of identifying FFUSP by AI model
實驗集圖像由產前超聲專家以《中國胎兒產前超聲檢查規范》[8]為依據分為OAP 組、MSP 組、NCP組、N-SP 組(圖2)。AI 模型構建成功后,由3 名僅完成住院醫師規范化培訓的醫生組成的初級醫生組、3名經過半年以上產科超聲檢查??婆嘤柕尼t生組成的中級醫生組及AI分別獨立對實驗集圖像進行識別分類,比較分析初級醫生組、中級醫生組及AI 對FFUSP 各切面分類的敏感度、特異度、陽性預測值、陰性預測值、準確率,觀察AI 與不同經驗醫生對FFUSP識別分類能力差別。

圖2 FFUSP各切面超聲圖像Fig.2 Ultrasonic images of each kind of FFUSP plane
采用SPSS22.0軟件進行統計學分析。計量資料用均數±標準差表示,符合正態分布,使用t檢驗或方差分析。計數資料以例(n)或率(%)表示,組間比較采用χ2檢驗。AI對FFUSP分類與專家分類的一致性分析采用Kappa檢驗。AI與初級醫生、中級醫生對FFUSP的識別能力比較采用McNemar檢驗,并比較相應ROC曲線下面積(AUC)。P<0.05為差異有統計學意義。
標準集圖像1 906張,按8:2比例分為訓練集和測試集;實驗集圖像4 532張。各圖像集各切面分布見表1。

表1 各圖像集各切面分布情況Tab.1 Distribution of each kind of plane in each image set
AI對測試集圖像各切面分類的敏感度、特異度、陽性預測值、陰性預測值、準確率均達90%以上,與專家分類一致性強(P<0.001,表2)。

表2 AI對測試集各切面識別水平Tab.2 Recognition level of each kind of plane in test set by AI
(1)中級醫生對各切面識別能力均優于初級醫生(P<0.05)。AI對FFUSP 各切面總體識別能力均優于中級醫生與初級醫生(P<0.05);AI 對NCP、MSP識別敏感度和特異度均優于中級醫生(P<0.05),對OAP 識別敏感度優于中級醫生(P<0.05),兩者間特異度差異無統計學意義(P=0.125)(表3)。

表3 不同級別醫生與AI對實驗集各切面識別水平(n=4 532)Tab.3 Recognition level of each kind of plane in experimental set by doctors and AI (n=4 532)
(2)AI 對各切面識別水平與專家分類一致性強(P<0.05),k值分別為NCP:0.886、MSP:0.937、OAP:0.771。
AI對FFUSP實驗集圖像分類效率顯著優于各組醫生人工識別效率(P<0.001),專家與中級醫生識別效率無顯著差異(P=0.364),專家識別效率優于初級醫生(P=0.012),見表4。

表4 實驗集分類時間Tab.4 Time for classification of images in experimental set
醫生在超聲檢查中對FFUSP 的準確識別對胎兒顏面部畸形篩查起到決定性作用,但不同經驗的醫生對超聲切面的識別能力存在差異[9]。本研究中經過產科超聲系統培訓的中級醫生對FFUSP的識別與分類能力明顯優于未經系統培訓的初級醫生體現了這一差異。對超聲醫生進行規范化的專科培訓能夠明顯提高超聲醫生對標準切面的識別能力,進而提高超聲醫生的檢查水平[10]。進行超聲圖像質量控制亦能改善胎兒超聲檢查質量,整體提高檢查的準確性[11],因此在臨床工作中需要對超聲醫生進行高效率培訓并對其所獲取的超聲圖像進行質量控制。然而超聲醫生培訓以及超聲圖像質量控制均是由人工進行,除了受到師資力量不足以及培訓時間不足等因素影響[12-13],還極易受主觀因素影響,并且耗費大量的人力物力,難以進行大范圍的標準化??婆嘤柤皥D像質量控制。
AI是計算機程序執行與人類智能相關行為如推理、學習、適應、感知和交互的能力。近年來AI技術逐漸應用于醫學影像自動識別及疾病輔助診斷[9,14-17],并實現胎兒超聲標準切面的識別與分類[18]。本研究利用AI對FFUSP進行識別分類以進行超聲圖像質量控制評價,采用基于傳統手工特征串聯加主流分類器的方法構建FFUSP識別分類模型。這一方法克服了卷積神經網絡模型訓練過程復雜、運算速度慢等問題,節省了時間、空間資源。結果表明AI分辨FFUSP各切面的準確率達90%以上,尤其MSP、NCP達到95%以上,與專家分類相比均有極強的一致性。當AI具有較高水準的分辨超聲圖像能力時,可輔助超聲醫生優化超聲圖像并提高診斷的準確性[14,19]。利用AI輔助教學能夠提高超聲醫生整體素質[4]。本研究中AI對FFUSP的分類能力明顯優于初級醫生和中級醫生,尤其對于結構復雜的MSP,初級醫生與中級醫生的識別水平均較低,而AI經過標準化訓練后對該切面的識別水平明顯高于兩者。AI在效率上明顯高于人工,對實驗集的分類用時不到20 min,平均每張圖像識別時間為0.21 s;而專家對同一實驗集圖像分類效率為每張圖片2.73 s。實際工作中進行大規模胎兒超聲圖像采集和質量控制的工作量遠遠大于本實驗集內所包含的圖像,這對人工操作人員的體力和腦力勞動均是極大挑戰,因此AI輔助具有重要現實意義。
綜上所述,AI 對正常FFUSP 識別分類具有較高的準確性,可作為胎兒超聲規范化培訓和圖像質量控制的輔助工具。然而本研究仍然存在一些不足之處,如僅對FFUSP 進行粗略分類,且僅對正常胎兒切面進行識別與分類,尚未涉及精細結構及顏面部畸形識別。未來將訓練AI 對重要解剖結構的精準識別,以期利用AI輔助超聲診斷胎兒顏面部畸形。