張浣青
[摘 要] 近些年來,深度學習迅速成為機器學習領域最為炙手可熱的一個分支,深度學習概念提出之后,語音識別和計算機視覺等方面得到了飛速的發展。而隨著現如今醫療信息化和數字化診斷的發展,醫療監測指標的不斷增長,數據量越來越龐大,需要深度學習強大的數據處理能力為醫療領域提供有力的支持。本文從深度學習兩個經典模型——DBN和CNN出發,介紹了深度學習在醫療信息領域中的應用,并對深度學習在醫療信息領域的發展進行了展望。
[關鍵詞] 深度學習;CNN;DBN;醫療信息
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 13. 076
[中圖分類號] TP391.4 [文獻標識碼] A [文章編號] 1673 - 0194(2018)13- 0169- 02
0 引 言
數據作為人工智能的燃料,其重要性不言而喻。現如今,隨著各個行業間信息化程度的加深,積累的數據量越來越多,然而數據的處理能力卻遠遠跟不上數據量的指數型增長。為了得到準確的結果,就必須收集更多的數據,而數據越多則處理速度越慢。這與我們收集數據的初衷背道而馳。而深度學習的出現解決了如何快速處理海量數據的問題。
近些年來,隨著科技的進步,醫療行業得到了突飛猛進的發展,在醫療行業展開工作的同時,更多的信息也不斷涌現,這些醫療信息的重要性不言而喻。因此,若能使用深度學習技術輔助疾病診斷,高效地處理患者資料中的數據,篩選出有利用價值的信息,挖掘出有價值的診斷規則,進而更好地做出疾病診斷結論,提高診斷效率,其前景是非常廣闊的。
1 深度學習
深度學習的學名又叫深層神經網絡(Deep Neural Network),由人工神經網絡模型發展而來。深度學習根據其解決問題、應用領域的不同分為多種深度神經網絡模型。其中較為熱門的當屬卷積神經網絡(Convolutional Neural Network, CNN)和深度置信網絡(Deep Belief Networks, DBN)。
1.1 深度信念網絡DBN
DBN由若干層神經元組成,其組成元件是限制玻爾茲曼機(Restricted Boltzmann Machine,RBM)。DBN是一種貪婪的逐層學習的算法,可以使深度置信網絡的權重達到最優化[1]。
要闡述DBN模型的構建過程,首先需要了解RBM。RBM是一種神經感知器,有兩層網絡組成,一層叫顯層(visible layer),用于輸入訓練數據。一層叫隱層(hidden layer),用于做特征檢測器。將若干個RBM進行“串聯”,則上一個RBM的隱層即為下一個RBM的顯層,上一個RBM的輸出即為下一個RBM的輸入。
1.2 卷積神經網絡CNN
CNN是一種熱門的深層深度學習模型,卷積神經網絡核心的關鍵思想是局部連接、權值共享、池化和多層堆疊。權值共享是CNN相較于其他模型具有獨特優越性的關鍵。它減少了神經網絡中參數的個數,從而降低了網絡的復雜度,使其更類似現實的生物神經網絡。
CNN模型一般來說含有三個部分:卷積層、池化、全連接層。卷積層中神經網絡不再對圖片中的每個像素對處理,而是通過一個濾波器(即卷積核)對圖片中每一小塊像素區域進行掃描,提取局部特征和其位置關系。在獲取了這些特征后,再進一步對這些特征進行分類。
2 深度學習在醫療信息領域的應用
電子病例中包含了大量的數字和文本信息,是醫務人員為患者開展相關治療的實錄,包括患者癥狀、用藥記錄、治療情況等等。通過對信息進行抽取,得到有用的醫療數據,并加以有效利用,既可以為醫療提供決策支持,更可以為患者提供個性化診療方案,實現精準醫療。
臨床數據,尤其是重癥監護病房(ICU)電子病歷,通常由多變量時間序列組成。ZacharyC.Lipton 等首次提出評估使用長短期記憶模型(LSTM, Long-Short Term Memory)識別多變量序列的臨床病歷的能力。他們使用診斷的多標簽分類,訓練模型分類為128種診斷,其模型效果優于此前使用多層感知器的研究方法[2]。R Miotto 等提出了一種新的無監督深度特征學習方法,此方法可以在電子病歷中獲取一個病人的病理特征,使得針對性的臨床預測建模更加方便。他們訓練三層堆疊的降噪自動解碼器辨別70萬患者電子病歷中的層次規律和依存關系。他們將得到的模型稱為“深度患者”,其在嚴重糖尿病、精神分裂癥及各種癌癥的預測上表現出色[3]。Nguyen P 等提出了一種端到端深度學習系統Deepr,此系統可以從病歷記錄中提取病理特征并自動預測。其構建的“深度記錄”可以提高臨床診斷的準確性[4]。WU Y 等構建了一種針對中文電子病歷命名體識別的深度神經網絡。通過無監督學習將未標記的語料庫生成詞作為輸入層,實驗結果表明其模型優于其他CRF(Conditional Random Field,條件隨機場)模型[5]。吳嘉偉提出一種針對英文電子病歷的實體關系抽取的特征學習方法,針對電子病歷中文本結構稀疏的特點,將有限的上下文特征進行抽象表示,進而發掘出詞與詞之間的組合關系特征[6]。
3 結 語
目前,市場上已經有使用深度醫學技術于醫療的企業。例如IBM的Watson,它可以作為線上輔助醫療工具幫助醫生診斷病情。醫生將患者的病癥輸入,可以在Watson中得到包含一系列治療計劃的診斷反饋。目前Watson已經可以做到在十分鐘之內檢測出罕見的白血病。
盡管如今深度學習之風已經刮遍醫療行業的許多角落,但很多實際問題依然很難實現和操作。現如今,大部分深度學習研究還停留在訓練模型的階段,要轉化為真實有效的產品,通過從臨床驗證到監管批準的層層考驗還要有很長一段路要走。但我們有理由相信,將深度學習應用于醫療信息領域的前景是十分廣闊的。目前,我國正處于基層醫療水平參差不齊的狀態,深度學習技術或許能成為提高基層醫療水平,擴大基層醫院業務范圍,實現精準醫療的有力工具。
主要參考文獻
[1]Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets[J]. Neural Computation, 2014, 18(7):1527-1554.
[2]Lipton Z C, Kale D C, Elkan C, et al. Learning to Diagnose with LSTM Recurrent Neural Networks[J]. Computer Science, 2015.
[3]Miotto R, Li L, Kidd B A, et al. Deep Patient: An Unsupervised Representation to Predict the Future of Patients from the Electronic Health Records[R]. Scientific Reports, 2016.
[4]Nguyen P, Tran T, Wickramasinghe N, et al. Deepr: A Convolutional Net for Medical Records[J].IEEE Journal of Biomedical and Health Informatics,2016,21(1).
[5]Wu Y,Jiang M, Lei J, et al. Named Entity Recognition in Chinese Clinical Text Using Deep Neural Network[J]. Studies in Health Technology and Informatics, 2015,216:624-628.
[6]吳嘉偉,關毅,呂新波.基于深度學習的電子病歷中實體關系抽取[J]. 智能計算機與應用,2014,4(3):35-38.