任家銀,郭際香
(1.四川大學華西口腔醫學院,成都610065;2.四川大學計算機學院,成都610065)
根據2017 年9 月衛計委發布的第四次全國口腔健康流行病學調查結果[1],近年來我國口腔疾病的患病率呈明顯上升趨勢,口腔疾病患者數量龐大。2017 年口腔門診、急診人次達1.44 億,增長近10 個百分點,而且診療人數還不包括大量口腔診所等機構。此外,一些口腔健康觀念的落后導致我國口腔患者的診療率偏低,而且隨著人口的逐漸老齡化,口腔醫療的需求將大幅增長。然而據統計,我國每百萬人口擁有的口腔醫生僅137 名,遠低于發達國家500-1000 名的水平,口腔醫療人員非常缺乏。
作為人工智能領域的主流技術,深度學習在在醫療影像分割、病灶檢測、識別和診斷等領域取得了巨大的飛躍[2-3]。深度學習技術已逐步應用于醫學的諸多領域,在肺結節檢測、乳腺癌識別、皮膚癌識別、眼底病識別、病理識別等領域取得了諸多成果。人工智能與醫學的結合,不僅獲得越來越多的計算機領域科研工作者的關注,在醫學界也掀起了一波智能醫學的研究熱潮。國內外各大頂尖醫院都開始與人工智能公司合作,希望借助人工智能技術,對疾病進行有效的診斷、治療、預測和管理。
頜骨疾病是口腔領域常見的多發疾病,口腔全景片是其檢查的主要手段。及時從全景片中檢測頜骨疾病,有助于減輕醫療人員工作量,提高工作效率,在一定程度上緩解日益緊張的口腔醫療資源。本文以深度學習中卷積神經網絡為基礎,設計分類網絡,以正確識別和分類正常全景片和三種常見的頜骨疾病,包括骨髓炎、囊腫、牙源性腫瘤。
近三十年來隨著醫學影像技術的迅猛發展和影像設備的日趨成熟及普及,核磁共振成像(Magnetic Resonance Image,MRI)、計算機斷層掃描(Computer Tomography,CT)、錐狀射束電腦斷層掃描(Cone Beam Computer Tomography,CBCT)、正電子發射斷層掃描(Positron Emission Tomography,PET)、超聲(Ultrasound)、X射線(X-ray)等醫學影像技術,已成為開展臨床檢查、疾病診斷、手術方案制定、治療決策、預后評估和隨訪不可或缺的組成部分,且日益重要。全世界每天生成大量醫學影像數據,如何利用當前人工智能領域的主流技術深度學習方法處理分析醫學影像大數據,為臨床醫學中各種重大疾病的篩查、診斷、治療提供行之有效的方法,是當前醫學圖像處理領域的研究熱點和前沿問題。
在深度學習(Deep Learning,DL)中,深度卷積神經網絡(Deep Convolutional Neural Networks,DCNNs)由于其強大的特征表達和提取能力,先后在自然圖像和醫學圖像的處理上都獲得了巨大成功。它能夠從醫學影像大數據中自動學習、提取隱含的特征,近幾年已迅速成為醫學圖像分析的核心、關鍵技術。基于深度學習的醫學圖像定位與檢測、分類與識別、分割、配準是當前醫學圖像分析的主要任務,涵蓋醫學的諸多領域,如腦、眼科、肺癌、乳腺、心臟、腹腔等。
基于深度學習技術的醫學圖像的分類與識別可以自動輔助診斷病人病情的輕重程度,給出治療建議。2016 年,谷歌公司的科學家們在《JAMA》雜志上報道了利用深度卷積神經網絡從10 萬余張視網膜眼底圖像中診斷糖尿病性視網膜病變及黃斑水腫[4],獲得了較好的敏感性和特異性。2017 年,斯坦福大學的研究者們在《Nature》雜志上報道了利用深度學習技術在皮膚癌診斷的三個關鍵性診斷任務[5],即角化細胞癌的分類、黑素瘤的分類和通過皮膚鏡檢查的黑素瘤分類中獲得了媲美皮膚科醫生的結果。同年,Golden 等人[6]在《JAMA》雜志發表了通過深度學習,可以迅速地閱讀病理照片,從而診斷乳腺癌患者腋窩淋巴結有無癌細胞擴散,其結果要優于病理醫師用顯微鏡的常規做法,且大大提高了診斷速度,減輕了病理學家的負擔。
病灶的定位是臨床診療中非常重要的步驟,醫學圖像的定位和檢測可以把圖像中所有的病變區域檢測出來并給出詳細的位置,在肺癌篩查中獲得成功應用。2016 年,ISBI 組織的LUNA16 人工智能肺結節檢測競賽,吸引了一大批國內外人工智能研究團隊的參與[7],基于深度學習的肺結節檢測技術極大地提高了肺癌篩查的效率,緩解了目前該領域醫生缺乏、工作量大、診斷時間長等一系列問題。此外,基于深度學習的醫學圖像分割和配準更是緩解了傳統圖像分割和配準算法中沉積多年的問題。醫學圖像分割的準確率不斷上升,為醫學診斷提供了極大的幫助。在口腔領域,深度學習的應用尚少,現有的研究主要集中在面部標志點的檢測上[8],為正畸、整形方案的制定提供了準確的指導。
綜上所述,深度學習技術在醫學圖像的分析中有極為重要的意義和臨床價值,本文研究探索深度卷積于網絡在口腔疾病診斷中的應用,以期在一定程度上減輕醫生工作量,有助與緩解口腔醫療領域的不斷增長需求和日益緊張的醫療資源之間的問題。
卷積神經網絡(Convolutional Neural Network,CNN)是一種成功并廣泛應用于醫學圖像分類的經典深度學習模型,該模型主要包括卷積(Convolution)層、池化(Pooling)層以及全連接(Fully Connected)層,是一種具有深度結構的前饋神經網絡。CNN 在1988 年被LeCun 等人[9]提出并應用于手寫體識別中。卷基層利用不同的卷積核來對圖像進行特征處理和抽象,提取不同層次的本質特征。在卷積層之后,通添加池化層,通過不斷降低維數,以減少網絡中的參數和計算次數,縮短了訓練時間并控制過度擬合。CNN 網絡通常包含不同層數個交叉相連的卷積層、池化層,以綜合利用提出的信息。對于分類而且,CNN 在卷積和池化之后,連著全連接層與分類器。全連接層通常為多層神經網絡,此外為了避免網絡在訓練樣本不充足時出現過擬合情況,一般在全連接層中采用Dropout(隨機丟失技術),也使得網絡提出的圖像特征更具有魯棒性。目前對于各種卷積神經網絡來說,激活函數多采用ReLU激活函數,分類器通常采用Softmax 或支持向量機。本文以卷積神經網絡為基礎,設計實現口腔全景片的四分類識別網絡,用以正確把收集的口腔全景片分為正常、骨髓炎、囊腫、牙源性腫瘤共計四類。如圖1 所示,本文設計了一個9 層的卷積網絡分類模型,輸入為單張牙齒全景片,模型包含3 個卷基層,2 層全連接,及輸出層。該模型使用Adam 算法為損失函數計算梯度,以0.001 的學習率最小化交叉熵。
本文收集了來自四川大學華西口腔醫學院的近671 張全景片,并由專業醫生做了詳細標注。如表1 所示,數據包括正常全景片和三種病變骨髓炎、囊腫、牙源性腫瘤的全景片,同時骨髓炎和牙源性腫瘤下又包含了亞分類標注,但是由于各亞分類數據過少,有的僅有幾張或十幾張圖像,所以本文僅進行了四分類實驗。671 張圖像被分成訓練集和測試集,其中訓練集占80%用于訓練分類網絡模型,測試集占20%用于進行模型測試。實驗在一臺帶GPU 1080 顯卡的PC 上完成。

圖1 牙齒全景片分類模型

表1 實驗數據描述
本采用的分類評價指標為:精準率Precision、召回率Recall、F1Score 和準確率Accuracy。計算公式分別定義如下,其中TP(True Positive)表示分類正確的正樣本;TN(True Negative):表示分類正確的負樣本;FP(False Positive)表示分類錯誤的正樣本;FN(False Negative)表示分類錯誤的負樣本。

實驗結果如表2 所示,整體準確率在80%。囊腫病變的精準率和召回率最好,牙源性腫瘤的結果較差,其原因在于分類的數據不均衡。本僅是對牙齒全景片分類做一個初步的嘗試和驗證,未采用數據曾廣和非均衡樣本下的分類算法,后續將進一步豐富實驗過程。雖然本實驗結果應用到實際臨床中還有所欠缺,但初步結果尚可,囊腫的精準率達90%。

表2 四分類實驗結果
基于深度學習方法的醫學圖像分類是當前計算機輔助醫學方面的研究熱點,深度學習算法在醫學圖像處理領域具有重要的理論意義和實際應用價值。本文采用深度學習方法中經典的卷積神經網絡對牙齒全景片圖像的病變分類做了初步嘗試。通過輸入口腔全景片,由分類模型判斷其是否有病變,屬于哪一種病變。初步結果顯示,分類模型結果較好。在后續的研究工作,將進一步收集更多的數據,豐富頜骨疾病類別;也將深入研究深度學習方法,從多方面提升頜骨疾病診斷效果,以期進一步實現臨床應用。