包頭醫學院計算機科學與技術系 唐思源
基于人工神經網絡的肺癌細胞圖像特征的提取與識別
包頭醫學院計算機科學與技術系 唐思源
目的:探討基于人工神經網絡的肺癌細胞圖像特征的提取與識別。方法:建立基于人工神經網絡和計算機圖像處理的肺癌細胞病理電腦診斷系統,對120例經皮肺穿刺標本的肺癌細胞學涂片進行圖像特征的提取與識別,并與術后病理組織診斷結果進行對比分析。結果:(1)肺癌細胞病理電腦診斷系統能夠較為準確的提取肺癌細胞圖像特征,完成對肺部病灶癌細胞和非癌細胞的識別。(2)運用肺癌細胞病理電腦診斷系統診斷肺癌主要病理類型鱗狀細胞癌、腺癌、未分化癌、小細胞癌的結果與術后病理組織診斷結果的總符合率93.33%。結論:基于人工神經網絡和計算機圖像處理對肺癌細胞的圖像特征進行提取和識別,對肺癌患者實施診斷,準確率高,能夠為肺癌的早期診斷提供客觀參考依據。
肺癌;人工神經網絡;計算機圖像處理;細胞圖像特征;提取;識別
伴隨著信息網絡技術和科學技術的迅速發展,計算機在肺癌臨床診斷中的應用日益深入[1]。人工神經網絡(Artif i cial Neural Network;ANN)是上個世紀80年代興起的人工智能領域的研究內容,其主要是利用計算機從信息處理的角度對人腦神經元網絡進行抽象,建立某種簡單的模型,并按照不同的連接方式組成不同結構的網絡[2]。早期主要被應用于工程界與學術界,現階段已經取得了很大的研究進展,在醫療領域的疾病診斷中也得到了應用[3]。肺癌是對我國人群生命健康危害最大的惡性腫瘤疾病,實現該疾病的早期診斷具有重要的臨床意義[4]。基于上述研究現狀,本研究對基于人工神經網絡的肺癌細胞圖像特征的提取與識別進行探討,旨在明確能夠提高肺癌患者早期確診率的診斷方法。
本研究選取2014年3月至2016年7月期間在包頭醫學院第一附屬醫院行經皮肺穿刺活檢的120例肺癌患者作為研究對象。納入標準:(1)經皮肺穿刺活檢和術后病理組織診斷結果均為肺癌;(2)未發生轉移;(3)未合并患有其他嚴重器質性疾病;(4)同意參與本次研究。排除標準:(1)經皮肺穿刺活檢診斷為肺部良性疾病;(2)疾病發展至終末期;(3)拒絕參與本次研究。120例患者中,包括男性患者69例,女性患者41例,年齡區間35~70歲,平均年齡為(48.14±5.32)歲。采集患者肺組織后,迅速制作成肺癌細胞學涂片,進行常規固定和HE染色,常規脫水封片,保存待用。
建立基于人工神經網絡和計算機圖像處理的肺癌細胞病理電腦診斷系統,對120例經皮肺穿刺標本的肺癌細胞學涂片進行圖像特征的提取與識別,并與術后病理組織診斷結果進行對比分析,具體研究過程如下:
本研究建立的肺癌細胞病理電腦診斷系統的硬件配置包括計算機系統、顯微鏡、攝像鏡頭、圖像采集卡。診斷時,實時獲取患者肺癌細胞涂片上的視頻信號,進行圖像采集和處理后轉化為紅(R)、綠(G)、藍(B)真彩色圖像,上傳至計算機診斷系統中進行圖像特征提取和識別,具體流程見圖1所示。
人工神經網絡模仿大腦神經網絡和功能而建立,通過采集數據并進行學習的方法為數據系統提供樣本,再依靠樣本不斷學習和訓練,得到計算模型,建立網絡結構。神經網絡系統可以用大量樣本不斷學習和訓練實現對肺癌細胞圖像特征的識別,并最大程度的減少錯誤識別,而這一系統需要基于肺癌細胞病理電腦診斷系統實現。肺癌細胞病理電腦診斷系統通過圖形采集選擇高質量的肺癌細胞涂片的原始圖像,進行預處理和灰度轉換。采應用直方圖和雙閾值對圖像進行分割,將質量不合格的細胞區域篩除。將已經錄入專家庫的正常細胞和肺癌細胞的核、漿進行對比和排列,應用八鏈碼表示法提取肺癌細胞的圖像特征作為參照,從形態和色度方面對肺癌細胞進行初步識別,對肺癌細胞和非肺癌細胞進行判斷。然后應用計算機專家系統對判定為肺癌的細胞的形態、位置、染色質分布進行推理診斷,進一步對肺癌細胞和非肺癌細胞進行判斷。最后應用人工神經網絡模擬人腦結構和大腦的信息傳導方式,建立數據分析模型,通過特征提取有效待檢細胞的14個特征向量,其中包括6個形態特征、6個色度特征和整幅圖像的細胞區域灰度平均值和紅色分量平均值,模擬人腦思維,對樣本進行學習和訓練。本系統的診斷程序為先進行全片掃描,通常每次檢查100~200個細胞,然后對細胞進行形態學和色度學檢查,應用專家系統識別肺癌細胞和非肺癌細胞,再通過人工神經網絡識別和判斷肺癌細胞類型,經過層層識別和判斷,得出最終診斷結果。本系統識別診斷的工作程序見圖2所示。

圖1 肺癌細胞病理電腦診斷系統診斷流程圖

圖2 肺癌細胞病理電腦診斷系統識別診斷的工作程序
本研究觀察基于人工神經網絡和計算機圖像處理的肺癌細胞病理電腦診斷系統的肺癌診斷結果與患者術后病理組織診斷結果的符合率以及該系統診斷肺癌的敏感性和特異性。
運用肺癌細胞病理電腦診斷系統診斷肺癌主要病理類型鱗狀細胞癌、腺癌、未分化癌、小細胞癌的結果與術后病理組織診斷結果的總符合率93.33%,具體研究數據見表1所示。

表1 肺癌細胞病理電腦診斷系統的肺癌診斷結果與患者術后病理組織診斷結果的符合率統計
肺癌是全球范圍內發病率和病死率增長最快的惡性腫瘤疾病。近50年來,世界范圍內多個國家的肺癌發病率和病死率均呈現出逐年上升的趨勢,現階段該疾病已成為威脅人類生命健康最常見的惡性腫瘤疾病[5]。長期觀察發現,肺癌具有起病隱匿的特點,多數患者在疾病中晚期時確診,治療難度明顯增大,預后較差。因此,實現肺癌的早期診斷、及時治療十分必要[6]。總結我國臨床的肺癌診治經驗發現,該疾病早期診斷的誤診率較高,如何提高肺癌的早期診斷準確率已成為我國醫療領域近年來的熱點研究內容[7]。國內外研究學者認為任何惡性腫瘤疾病的早期診斷均不能依靠一種診斷方法,肺癌的早期診斷也是如此,需要多種診斷方法的相互輔助實現[8]。
本研究對基于人工神經網絡的肺癌細胞圖像特征的提取與識別進行探討,并分析該系統在肺癌患者臨床診斷中的應用價值。研究過程中應用計算機系統對肺癌細胞學涂片的圖像信息進行提取和識別,該種圖像特征分析方法在速度和準確性方面均明顯優于肺癌病理學專家的肉眼識別。統計得出肺癌細胞病理電腦診斷系統的肺癌診斷結果與患者術后病理組織診斷結果的符合率為93.33%,120例肺癌患者共包括鱗狀細胞癌、腺癌、未分化癌、小細胞癌四種肺癌病理類型,表明通過應用肺癌細胞病理電腦診斷系統獲取的肺癌圖像信息進行肺癌診斷,能夠對不同病理類型的肺癌進行判斷。國外研究學者D. Jude[9]等基于人工神經網絡提取和識別肺癌細胞圖像的特征,并根據圖像特征對患者實施診斷,診斷準確率高于80%。本文研究結果與國外研究學者D. Jude等的研究結果具有較大程度的相似性。分析能夠得到上述研究結果的原因為:細胞核的大小、形態等特征是鑒別細胞良惡性的重要參考指標,在定性診斷中應用的描述方法,往往存在一定程度的描述誤差,缺乏嚴格的數據參考。而基于人工神經網絡建立系統對肺癌細胞圖像特征進行提取、識別,采用的人工智能和圖像處理技術,能夠有效克服傳統描述方法在直接處理、結構性信息描述方面存在的弊端。
對上述研究內容及結果進行總結性分析,本研究認為基于人工神經網絡和計算機圖像處理對肺癌細胞的圖像特征進行提取和識別,對肺癌患者實施診斷,準確率高,能夠為肺癌的早期診斷提供客觀參考依據,具有推廣應用價值。但由于本次研究所選取樣本量較少,研究過程有待進一步規范,且現階段臨床上關于該方面的課題研究較少,因此本研究所得研究的客觀性仍需通過后續進行大量的實踐研究進行驗證。
[1]龔平,郭華雄,王文清等.基于人工神經網絡的肺癌細胞形態學診斷模型的建立及應用[J].中華生物醫學工程雜志,2012,18(1):73-76.
[2]C.Iglesias,J.Martinez Torres,P.J.Garcia Nieto et al.Turbidity Prediction in a River Basin by Using Artificial Neural Networks:A Case Study in Northern Spain[J].Water resources management,2014,28(2):319-331.
[3]黃利娟,梁學柱,查君敬等.基于BP神經網絡的肺癌手術患者住院費用影響因素分析[J].中國病案,2014,15(6):53-55.
[4]田剛,周明術,杭永倫等.腫瘤標志對肺癌診斷價值PLS-DA和ANN-MPL模型評估[J].中華腫瘤防治雜志,2014,21(5):380-383,392.
[5]Jose Miguel Flores-Fernandez,Enrique J. Herrera-Lopez,Francisco Sanchez-Llamas et al.Development of an optimized multi-biomarker panel for the detection of lung cancer based on principal component analysis and artificial neural network modeling[J].Expert Systems with Applicati on,2012,39(12):10851-10856.
[6]王威,段曉冉,譚善娟等.基于3種基因啟動子甲基化聯合端粒長度構建肺癌篩查神經網絡模型[J].鄭州大學學報(醫學版),2014,13(2):176-179.
[7]李學滄,賈識楨.基于卷積神經網絡的小細胞型肺癌輔助檢測方法[J].中國數字醫學,2013,7(10):65-67,72.
[8]Feng,F.,Wu,Y.,Nie,G.et al.The effect of artificial neural network model combined with six tumor markers in auxiliary diagnosis of lung cancer.[J].Journal of medical systems,2012,36(5):2973-2980.
[9]D.Jude Hemanth,C.Kezi Selva Vijila,A.Immanuel Selvakumar et al.Performance Improved Iteration-Free Artificial Neural Networks for Abnormal Magnetic Resonance Brain Image Classification[J].Neurocomp uting,2014,130(Apr.23):98-107.
本文受內蒙古自治區自然科學基金項目(項目編號:2016 MS0601),包頭醫學院科學研究基金項目(項目編號:BYJJ-QM 201637)資助。
唐思源(1981-),女,碩士,副教授,主要研究方向為:醫學圖像處理。