999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用二維格子復雜性挖掘肝癌CT圖像預后信息

2018-06-21 13:19:36武瑞霞張子瑞陳宇彬葉蘇哲鄭明華柯大觀
溫州醫科大學學報 2018年6期
關鍵詞:符號特征

武瑞霞,張子瑞,陳宇彬,葉蘇哲,鄭明華,柯大觀

(1.溫州醫科大學 生物醫學工程學院,浙江 溫州 325035;2.溫州醫科大學附屬第一醫院 感染內科,浙江 溫州 325015)

醫學圖像模式識別已經成為生物醫學工程學和影像醫學的熱點領域[1-4],如何提取圖像的有效特征是該領域研究的重點。本研究中應用的格子復雜性(lattice complexity,LC)是一種通用的時間序列分析算法[5-6],作為廣義信息度量[7],特別適用于人體這類復雜系統所產生的數據。一維LC已在腦電數據分析上取得良好效果[8],有必要驗證其二維版本的表現。而預測肝癌患者術后存活時間本身是個醫學難題[9],本研究嘗試基于醫學影像圖像建立肝癌預后模型。

1 材料和方法

1.1 材料 作為回顧性研究,實驗中采用的患者資料和數據均來自溫州醫科大學附屬第一醫院,根據臨床資料的完整性選取了年齡27~79歲的92例原發性肝癌患者,其中男80例,女12例,每位患者擁有至少28張腹部CT掃描圖像。所有患者于2005年10月到2010年5月間接受了腫瘤切除手術。在3.5年的術后跟蹤隨訪中,有62例患者存活,30例死亡。本研究經溫州醫科大學附屬第一醫院倫理委員會審核批準。

1.2 方法 醫學圖像模式識別一般過程如圖1所示。將全體數據劃分為訓練集和測試集時通常是按比例隨機劃分,隨后保持不變。分類模型通過訓練集數據建立,而測試集用來驗證模型的泛化能力。當樣本量較小時,重新劃分會對結果有顯著影響。當只考慮驗證特征的有效區分度時,也可采用全部數據交叉驗證的手段。本研究首先用全部數據交叉驗證挑選出有效的特征參數,隨后一次性劃分訓練集和測試集做進一步檢驗。

圖1 圖像模式識別流程圖

1.2.1 醫學圖像預處理:由于LC在原理上對大片相同符號的片段不敏感,為了檢驗算法是否確實簡單易用,本研究沒有在原始CT圖像上進行目標定位和裁剪,而是直接將平掃的腹部CT圖像連同背景(見圖2)一起縮小為32像素×32像素并進行二值化。二值化的具體操作是先求整張圖片所有灰度值的均值,然后以此為“閾值”,把原始圖像里面≥均值的灰度值用“1”代替,反之用“0”代替。

圖2 原發性肝癌患者原始腹部CT圖

1.2.2 圖像維度轉換:二值化后的圖像被保存于二維矩陣中,矩陣中每個位置上的元素只有0或1兩個符號。需要先利用希爾伯特(Hilbert)曲線將二維矩陣數據轉換為一維符號序列以便進行復雜性度量的計算。二維Hilbert曲線作為一種空間填充曲線可以遍歷方形區域的每個位置[10-11],從而實現從二維到一維的數據轉換并保留原數據局部和整體的結構信息。圖3所示為三階Hilbert曲線。

圖3 三階Hilbert曲線

1.2.3 圖像復雜性特征提取:當前學界的共識是生命體之類的復雜系統應當處于一種“弱混沌”或者“混沌邊緣”的狀態[12-13]。LC在一定參數下對“混沌邊緣”敏感[5-6],因而在醫學領域有應用潛力。LC的主要思想是:凡是有確定性因果關系的,或是歷史上已經出現過的片段,都可以被壓縮,只有不可壓縮的符號數目才能代表符號序列的復雜程度。LC值依賴于一個控制參數r,稱為細粒化指數或細粒化序數(fine-graining order)。將一維符號序列細粒化,就是將序列中相鄰的r個符號視為整體來判斷前后次序之間的確定性因果關系。當細粒化達到一定程度時,序列中所有相鄰的r個符號都不相等或周而復始,此時LC值為1,而r就是臨界細粒化序數(critical fine-graining order)[5],表示為r*。

具體而言,LC值的求取過程是依次對序列中不可壓縮的“添加”符號計數的過程。假定存在一個通用的非線性迭代系統,通過輸入長度為r的初始符號序列來迭代產生后續的新符號[5-6],將新符號納入初始序列并拋棄原先初始序列的第一個符號,隨后繼續迭代。當確定性的因果規律被破壞時,我們先檢查前一次“添加”操作后的符號序列能否通過“復制”歷史來得到,如果不能“復制”,就認為新符號要通過外部“添加”獲得,用“∨”表示。“添加”操作將整個序列分成段落,分段數目就是LC值,代表了原符號序列中無法壓縮的信息含量。

對于如下一串符號序列:

如果取r為2,可將任意相鄰兩符號轉化為四進制數,細粒化后新序列可表示為:

則其LC值為4:

從左到右掃描序列,可以發現第一套迭代規則0→0被第五個0后出現的1破壞,只能“添加”這個1。第二套迭代規則中2→1被第二個2之后出現的0破壞,而檢查發現32120在整個掃描歷史0000132120中沒有先例,所以也不能“復制”,因而這個0也必須“添加”,以此類推。顯然,對于LC而言,無論參數r取多大,大量相同符號組成的前后“背景”會被視為簡單迭代規則的產物,基本上不影響計算結果。但r*受前置“背景”影響較大,上述例子中,序列S的r*值為6,即當r大于或等于前置的“背景”長度6時,整個序列的確定性因果律才能貫穿到底。本研究中,我們計算了所有患者每張圖像的r*并發現最小的r*等于69,于是就在1到69之間大致均勻地取了8個值作為r,求出對應的LC值作為模式識別特征。表1顯示了所有患者圖像的r*以及LC值的均數和標準差。為避免特征數值大小影響機器學習結果,加快計算速度,所有特征在使用前都做了歸一化,即數值被量化到0和1之間。

表1 患者圖像的復雜度特征

1.2.4 圖像特征分類:支持向量機(support vector machines,SVM)[14]在機器學習領域占有重要地位,適合小樣本數據的分類。本研究采用臺灣大學林智仁教授開發的LIBSVM工具箱[15]。核函數選用徑向基函數(radial basis function,RBF)。利用SVM建模的關鍵在于搜尋合適的懲罰因子“C”和RBF寬度參數“gamma”,后者通常用“G”表示。在搜尋的過程中,一般采用K-折交叉檢驗(K-fold cross validation)方法[14]。其做法是將樣本數據劃分為K個子集,每次先用其中K-1個子集作為訓練集訓練出模型,再用余下的一個子集作為測試集檢驗模型的識別準確率。不斷輪換測試集,最后輸出所有測試準確率的平均值作為選擇“C”和“G”的依據。但選擇特征時,準確率并非唯一標準,一般情況下“C”和“G”越小,越能避免“過學習”狀態,而太小也可能意味著存在“欠學習”的狀況,也會影響模型的泛化能力,其中“C”的作用更明顯。

在本研究中,先用全部92例患者數據進行十折交叉驗證,根據在“C”和“G”搜尋范圍內的最佳結果選出合適的細粒化序數。采取10折交叉驗證是因為納入模型的是全部的可觀的樣本量,這對實驗結果起到決定性作用。而作為一種補充,將對應的LC值作為后續測試的特征,再隨機劃分出46例訓練集和46例測試集,對訓練集選擇3折交叉驗證搜尋最佳的“C”和“G”,由訓練集數據建模后再用測試集來測試模型的泛化能力。

2 結果

2.1 全部數據十折交叉驗證結果 作為預熱,我們從每位患者的圖像中先抽了最中間的單幅圖像,利用不同r參數下的8個LC值和r*分別作為特征進行10折交叉驗證,發現除了r取9時平均準確率為69.6%,r*和其余參數下的LC值作為特征是無效的,對應的模型都只是將所有樣本識別為一類。當每位患者都采用28幅圖時,如表2所示,情況有了變化,r為19時的LC全部數據10折交叉驗證的平均準確率最高,選出的“C”和“G”大小比較合適,最終對全部數據建模后模型識別準確率也最高,實際上只錯了一個。接下來,我們選擇19作為細粒化序數來初步驗證LC特征的泛化能力。

2.2 測試集結果 將92例患者數據中2個類別都以1:1的比例劃分到訓練集和測試集中,兩集合正負樣本都各有31例和15例。以r*和r=19時對應LC值為特征,由于樣本量大減,我們采取訓練集3折交叉驗證的方法確定參數“C”和“G”,然后利用訓練集全體數據建模后對測試集進行分類測試。我們發現如果每位患者只取最中間的單幅圖時,兩個特征及其組合都不能有效區分兩類。當每位患者取28幅圖時,分類準確率結果見表3,當訓練的樣本數量降低一半后,參數為19的LC特征交叉驗證平均準確率也有所下降,這可能是訓練樣本數量不足所引起的。將模型應用在未經訓練的測試集上,識別準確率沒有降低,說明至少在這兩個集合上LC特征的模式識別效果是穩定的,不存在“過學習”問題。而r*的表現不如LC穩定,兩者結合也沒有顯示互補性。

表2 不同細粒化程度對全部數據交叉驗證結果和分類準確率

表3 復雜性特征的測試集分類準確率

3 討論

上述多組實驗結果表明,即便不做圖像分割,保留原有背景,直接將原始圖像大幅縮小并二值化,利用二維格子復雜性也能有效提取醫學圖像隱含的預后信息,可以用來建立SVM模型預測肝癌患者術后存活時間。由醫學圖像反映出來的人體結構的復雜性有其他特征所不能替代的作用。人體從一個受精卵開始發育為成熟個體并維持生理機能,可以看成確定性的迭代過程,具有分形結構,即在不同尺度下有自相似性。因而,在很多尺度下的醫學圖像復雜性都能提取出有臨床價值的信息。這是本研究將圖像尺寸大幅縮小、丟失了大量數值精度后仍然能夠捕捉到有效信息的原因。圖像縮小并二值化之后處理的速度很快,對外部噪音也有很強的魯棒性,意味著本研究的方法對設備不敏感。

本研究旨在對二維LC在醫學圖像上的應用價值進行初步驗證,由于數據和計算資源有限,實驗結果存在如下不足:①沒有充分測試更多不同參數下LC的效果,而是只選取了8個參數,除了LC與r*結合,也沒有測試不同參數下的LC特征組合;②沒有嘗試與臨床指標之間的特征組合,追求最佳識別效果;③盡管在理論和實驗上都證實LC對單調背景不敏感,但r*顯然受背景影響較大,可以嘗試去除背景或改變希爾伯特曲線的搜索方式來改善r*的表現;④將圖像大幅縮小雖然有種種優勢但也有可能錯失一些有用信息,在計算資源更豐富的前提下,有必要探索更合適的壓縮尺寸;⑤患者數量僅92例,且來源單一,樣本量太小可能導致偏差,如果能獲得更多病例或其他形式的醫學圖像如超聲醫學圖像、核磁共振圖像等等,會更有說服力。

未來的工作除了彌補上述不足,在預處理技術上仍然存在大幅改進的余地,比如先對圖像進行二維經驗模態分解(bidimensional empirical mode decomposition)[16]獲取不同層次的紋理圖像,在較大的圖像中設立可移動的窗口來提取局部復雜性特征并和全局特征相結合等等。

總之,由于二維LC算法簡單易用,對圖像預處理要求低,完全有資格成為正在興起的“影像組學”[4]特征。單就CT圖像而言,更有趣的可能是將LC推廣應用到三維圖像的分析上。三維重建后的立體圖像復雜性度量將有助于提取人體腹腔內部的立體結構信息,而不僅僅是平面結構信息,從而有更大的潛力為輔助診斷和預后建模提供幫助。

[1] BISHOP C M. Pattern recognition and machine learning[M].New York: Springer International Publishing AG, 2006.

[2] LANZARINI L C, DE GIUSTI A E. Pattern recognition in medical images using neural networks[J]. J Comput Sci Technol, 2001, 1(4): 45-54.

[3] NAGARAJ S, RAO G N, KOTESWARARAO K, et al. The role of pattern recognition in computer-aided diagnosis and computer-aided detection in medical imaging: a clinical validation[J]. Int J Comput Appl, 2010, 8(5): 18-22.

[4] GILLIES R J, KINAHAN P E, HRICAK H. Radiomics:Images are more thanpictures, they are data[J]. Radiology,2016, 278(2): 563-577.

[5] 柯大觀, 張宏, 童勤業. 格子復雜性和符號序列的細粒化[J]. 物理學報,2005, 54(2): 534-542.

[6] KE D G, TONG Q Y. Easily adaptable complexity measure for finite time series[J]. Phys Rev E, 2008, 77(6 pt 2):066215.

[7] KE D G. Unifying complexity and information[J]. Sci Rep,2013, 3: 1585

[8] 劉軍, 鄒倩, 柯大觀, 等. 基于腦電格子復雜性分析的麻醉深度監測研究[J]. 傳感技術學報, 2015, 28(12): 1747-1753.

[9] QIAO G, LI J, HUANG A, et al. Artificial neural networking model for the prediction of post-hepatectomy survival of patients with early hepatocellular carcinoma[J]. J Gastroen Hepato, 2014, 29(12): 2014-2020.

[10] SAGAN H. Hilbert’s space-filling curve[M]. New York:Springer International Publishing AG, 1994: 9-30.

[11] BUTZ A R. Alternative algorithm for Hilbert’s space- filling curve[J]. IEEE T Comput, 1971, 20(4): 424-426.

[12] LANGTON C G. Computation at the edge of chaos: Phasetransitions and emergent computation[J]. Physica D, 1990,42 (1): 12-37.

[13] ANANOS G F J, TSALLIS C. Ensemble averages and nonextensivity at the edge of chaos of one-dimensional maps[J].Phys Rev Lett, 2004, 93: 020601.

[14] 丁世飛, 齊丙娟, 譚紅艷. 支持向量機理論與算法研究綜述[J]. 電子科技大學學報, 2011, 40(1): 2-10.

[15] CHANG C, LIN C. LIBSVM: A library for support vector machines[J]. ACMT Intell Syst Technol, 2011, 2(3): 1-27.

[16] NUNES J, BOUAOUNE Y, DELECHELLE E, et al. Image analysis by bidimensional empirical mode decomposition[J].Image Vision Comput, 2003, 21(12): 1019-1026.

猜你喜歡
符號特征
抓住特征巧觀察
學符號,比多少
幼兒園(2021年6期)2021-07-28 07:42:14
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
“+”“-”符號的由來
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
變符號
倍圖的全符號點控制數
圖的有效符號邊控制數
主站蜘蛛池模板: 五月婷婷导航| 激情在线网| 国产视频一二三区| 国产在线八区| 男女男精品视频| 五月激情婷婷综合| 在线观看国产精美视频| 免费视频在线2021入口| 91亚洲国产视频| 毛片视频网址| 丁香亚洲综合五月天婷婷| 99精品国产自在现线观看| 亚洲精品国产成人7777| 亚洲国产日韩在线成人蜜芽| 亚洲综合九九| 99视频国产精品| 国产欧美日韩在线在线不卡视频| 免费一级毛片完整版在线看| 国产小视频在线高清播放| 高清乱码精品福利在线视频| 一级毛片高清| 国产精品30p| AⅤ色综合久久天堂AV色综合| 国产视频你懂得| 国产97视频在线观看| 亚卅精品无码久久毛片乌克兰| 国产成人91精品| 精品国产aⅴ一区二区三区| 国产精品3p视频| 伊人色在线视频| 一级毛片在线免费视频| 天天综合网亚洲网站| 国产精品无码一二三视频| 五月丁香伊人啪啪手机免费观看| 色老头综合网| 国产00高中生在线播放| 日韩视频免费| 久久久亚洲色| 精品综合久久久久久97| A级毛片无码久久精品免费| 国产一区二区网站| 秋霞午夜国产精品成人片| 国产成人综合亚洲网址| 免费看av在线网站网址| 91精品人妻一区二区| 青青草原国产一区二区| 日韩黄色大片免费看| 欧美性天天| 亚洲综合二区| 精品一区二区三区自慰喷水| 乱人伦视频中文字幕在线| 精品1区2区3区| 国产乱子伦视频在线播放 | www.91在线播放| 亚洲欧美日本国产综合在线 | 动漫精品中文字幕无码| 成人午夜网址| 欧美亚洲一二三区| 亚洲第一极品精品无码| 婷婷色中文网| 麻豆精品在线播放| 亚洲综合18p| 亚洲人成网18禁| 国产午夜无码专区喷水| 国产日产欧美精品| 久久国产免费观看| 欧洲极品无码一区二区三区| 亚洲bt欧美bt精品| 亚洲aaa视频| 亚洲成a人片7777| 亚洲国产91人成在线| 国产精品免费露脸视频| 中国一级毛片免费观看| 四虎永久在线| 国产区91| 91年精品国产福利线观看久久| 国产亚洲现在一区二区中文| 91精品国产无线乱码在线| 国产性生大片免费观看性欧美| 亚洲精品视频免费看| 亚洲精品色AV无码看| 在线观看的黄网|