999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隱結構分析建立中醫證候分型規則的三種方法*

2019-05-18 02:05:58許玉龍吳秀艷李延龍王天芳張連文薛曉琳
世界科學技術-中醫藥現代化 2019年1期
關鍵詞:癥狀分析模型

許玉龍,吳秀艷,李延龍,王天芳**,張連文,薛曉琳

(1.河南中醫藥大學信息技術學院 鄭州 450046;2.香港科技大學計算機科學與工程學系 香港;3.北京中醫藥大學 北京 100070)

中醫辨證過程實質上是在無金標準情況下對患者進行分類的問題[1,2],在研究中醫證候時,常用的方法有數據回歸分析、聚類分析、主成分分析、因子分析等[3],但這些技術在中醫證候分類研究時存在不足。回歸分析基于專家對過往病例的判斷建立辨證規則,缺乏客觀性;聚類分析主要用于對癥狀變量聚類,而辨證是把患者分類;主成分分析和因子分析是數據降維方法,不對患者進行分類,其工作原理也與中醫思維不符;因子分析研究都把癥狀視為實數值變量,并假設它們是由一組相互獨立的實數值隱變量(代表證候)通過線性關系確定的。

隱類分析是一種患者聚類方法,它把癥狀視為離散變量(一般是二值),其基本思想是:某患者是否屬于一個證候類型取決于一組癥狀的出現情況,這與中醫思維吻合。隱類分析在西醫研究中已得到廣泛運用,截止2011年,隱類分析關于在西醫研究中應用的文章有180 余篇,且增長速度較快。比如,學者Li et al[4]利用隱類分析研究了漢族婦女重型抑郁癥亞型問題,該問題與中醫辨證分型類似,都是要在無金標準的情況下對患者進行分類。關于隱類分析的原理,Li Y 說:“一般而言,臨床診斷的經驗,是由臨床專家通過觀察大量患者,總結關鍵癥狀和體征出現的規律(同質性)而逐漸形成的。隱類分析能以相對嚴謹地統計學方式,模擬上述過程[4]”。隱類分析的輸入是一組癥狀以及這些癥狀在患者身上出現情況的數據,其結果是在概率意義下把患者聚為若干個類。但是,隱類分析有一個嚴重的弱點,它依賴局部獨立假設,即在每個類中,觀測的癥狀值是相互獨立的[5]。換句話說,模型假設癥狀的出現與否直接由其所屬類別決定,而不受其它因素影響。但在實際中這個假設往往不成立,從而導致估計的偏差[5]。

隱樹分析法,又稱隱結構分析法[6,7],是對隱類分析法的改進,它放寬了隱類模型的局部獨立假設,使得模型能夠更好地與數據擬合,也更貼近中醫理論。近年來的相關研究表明[8-13],利用隱結構分析能較合理地模擬中醫辨證論治的過程,彌補常規方法存在的不足,適合于研究中醫證候問題。

表1 中醫證候以及其相應的癥狀

圖1 打開模型學習功能

隱結構法有單步隱樹分析和雙步隱樹分析兩個版本。顧名思義,雙步隱樹分析有兩個步驟:第一步是對所有癥狀數據進行隱樹分析,全面揭示數據的各個側面,得到總體模型;第二步審視第一步的結果,依據醫學知識,選擇與某證候相關的隱變量和癥狀,并建立一個針對該證候的隱樹模型,對患者進行聚類分析。隱類分析在對患者進行聚類時使用的是癥狀顯變量,而隱樹分析使用的變量部分是隱變量,從而局部假設得到放寬。單步隱樹分析的出發點與隱類分析一致,即與某證候相關的一組癥狀以及關于這些癥狀的病例數據。它通過分析這些數據,而不是包含所有癥狀的數據,一步建立針對該證候的隱樹模型,對患者進行聚類分析。

為介紹和驗證隱類分析、單步隱樹分析、雙步隱樹分析這三種方法在分析數據時的差異,以及其建立模型質量的優劣,本文針對801 例肝硬化患者的中醫癥狀數據,分別用上述三種方法進行分析,并對比得到的模型及其BIC分值,來揭示三種方法各自的特點,以便在研究和應用時做出適當的選擇。

1 三種方法介紹

隱類分析、單步隱樹分析和雙步隱樹分析的基本功能是[13,15]:依據用戶提供的癥狀數據,可將患者分別聚成兩個或多個類別,這些結果可用來確定證候的分布情況和特點。下面以801例肝炎肝硬化患者的癥狀數據為例,對上述三種方法做簡單介紹。

1.1 數據情況

本文使用的801 例數據源自2011 年11 月至2012年9月在解放軍302醫院、湖北省中醫院、首都醫科大學附屬北京地壇醫院、首都醫科大學附屬北京佑安醫院、北京中醫藥大學東方醫院、中國中醫科學院西苑醫院、首都醫科大學附屬北京中醫醫院及廣西中醫藥大學第一附屬醫院的門診或住院部采集的真實病例數據。數據包含97個癥狀,每條記錄對應在某患者身上出現的相關癥狀信息,癥狀出現時值為1,不出現時值為0。數據是無標簽的,即無辨證結論。

參考團隊中醫專家組的經驗和行業委員會發布的證候標準,依據待分析的癥狀信息,分別選出氣虛證、氣滯證、熱證、濕證、水停證、血瘀證、陽虛證、陰虛證,共8個證候所涉及的癥狀(表1)。

使用孔明燈隱結構分析軟件[15]對數據進行分析,其包含了隱類分析、單步隱樹分析、雙步隱樹分析三種方法。

1.2 隱類分析法

以氣虛證為例介紹隱類分析法。操作流程是首先在孔明燈軟件中,點擊“分析”—“隱樹模型學習”(圖1);讀入氣虛證涉及9個癥狀的數據文件,使用隱類分析算法LCM處理(圖2);接著點擊確定,運行后得到氣虛證的患者聚類模型(圖3)。注意,隱類模型是一種特殊的隱樹模型,所以在孔明燈軟件中歸于“隱樹分析之下”。

隱類分析得到的模型只包含一個患者聚類變量(隱變量“氣虛”),它直接與癥狀變量相連,表示它假設癥狀的出現與否直接由患者所屬類別完全決定,而不受其它因素影響。聚類模型把患者分成了3 類,稱為隱類S0、S1、S2(表2)。隱類S0、S1、S2的患者數占總數比率分別為0.36、0.51、0.13。在隱類S0 中,癥狀“神疲”、“乏力”、“便溏”、“懶言”出現的概率分別為0.16、0.44、0.13、0.07,這些癥狀出現的概率較小,可認為隱類S0為非氣虛人群。在隱類S1中,上述癥狀出現的概率分別為0.86、1、0.06、0.54,它們出現的概率都較大,認為是屬于氣虛人群。在隱類S2中,上述癥狀出現的概率分別為0.89、0.96、0.97、0.61,所有癥狀出現的概率都較大,也認為是屬于氣虛人群。在S2 類中,“便溏”出現的概率遠大于類S1,根據中醫知識,脾虛會造成“便溏”的出現,所以可認為S2類為脾氣虛人群。

1.3 單步隱樹分析法

使用單步隱樹分析時,用戶提供的輸入數據與隱類分析完全相同。以氣虛證為例,在孔明燈軟件中,點擊“分析”中的“隱樹模型學習”,該步驟與圖1 相同。讀入氣虛證涉及9 個癥狀的數據文件,使用單步隱樹分析算法(UC-LTM)分析處理(圖4),然后點擊確定,運行得到氣虛證患者聚類模型(圖5)。

單步隱樹分析使用UC-LTM(unidimensional cluster with latent tree model)算法[14]處理數據(圖5),模型包含有隱變量“Y1”和患者聚類變量“氣虛”。然后,利用模型對數據進行聚類分析,結果把患者聚成了S0和S1兩個隱類,各類中癥狀出現的概率(表2)。與圖3隱類分析得到的模型不同,圖5 的模型認為氣虛不直接影響所有癥狀,它通過一個隱變量“Y1”間接影響“便溏”、“泄瀉”等5 個癥狀。這樣,局部獨立假設得到了放寬。從表3 可知,隱類S0 占人群總數的36%,在隱類S0 中,癥狀“神疲”、“乏力”、“面色晦暗”、“懶言”出現概率分別為0.15、0.44、0.55、0.07;隱類S1 占人群總數的64%,在隱類S1中,上述癥狀出現概率分別為0.86、0.99、0.72、0.56。明顯地,隱類S1中所有癥狀出現概率全部大于隱類S0,即可以推斷隱類S1 為氣虛證人群,S0為非氣虛證人群。

1.4 雙步隱樹分析法

雙步隱樹分析[12,13,16]有兩大步驟,所以稱為雙步隱樹分析法。第一步,對數據中所有癥狀(而不是只針對某證候的癥狀,這與隱類分析和單步隱樹分析不同)進行分析,得到整體模型。第二步依據醫學專業知識,參照第一步的結果,選取與某證候有關的癥狀,利用它們和整體模型構造最終的患者聚類模型,然后對患者進行聚類。

圖2 讀入數據,選擇隱類分析LCM算法

圖3 隱類分析得到的氣虛證聚類模型

表2 圖3對應的隱類及其概率分布

圖4 讀入數據,選擇單步隱樹分析UC-LTM算法

圖5 單步隱樹分析得到的氣虛證聚類模型

表3 圖5對應的隱類及其概率分布

圖6 讀入數據,選擇雙步隱樹分析LTM-EAST算法

以氣虛證舉例,在孔明燈軟件中點擊“分析”中的“隱樹模型學習”,該步驟與圖1相同。然后,讀入所有的癥狀數據(注意不只是氣虛的數據),選擇EAST 或BI算法學習(圖6),點擊確定,運行后得到總體模型如圖7所示。依據表1中氣虛證涉及的癥狀,在總體模型中選取這些癥狀進行綜合聚類,得到最終的患者聚類模型如圖8所示,它包括隱變量Y1、Y2、Y3和患者聚類變量“氣虛”(證候隱變量)。注意,在圖8中神疲、乏力通過一個隱變量與證候間接相連,這是因為在第一步分析中,它們被放在同一個隱變量(Y26)下,表示它們來自數據的同一個側面。另一方面,自汗在第一步分析中與其它幾個癥狀一起被放在隱變量Y20 下,這些癥狀中只有自汗一個癥狀與氣虛有關,所以在綜合聚類模型中,它直接與證候隱變量相連。

與單步隱樹分析得到的模型相比,圖8 模型的中間層隱變量更多,它把“神疲”、“乏力”歸納為一個隱變量Y1;把“便溏”、“泄瀉”歸納為一個隱變量Y2;把“面色晦暗”、“面色淡黃”歸納為一個隱變量Y3,這些癥狀都分別反映相同或相近的側面。雙步隱樹分析利用圖8 模型對數據進行聚類分析,把患者聚類變量分成了S0和S1兩個隱類,每個類的特性(表3)。

從表4可以看出,隱類S0占患者群的39%,在隱類S0 中,癥狀神疲、乏力、泄瀉、懶言出現概率分別為0.24、0.51、0.06、0.04。隱類S1 占患者群的61%,在隱類S1中,上述癥狀出現的概率分別為0.85、0.98、0.18、0.6,他們在此類中出現的概率明顯高于隱類S0,即可推斷隱類S1為氣虛證人群,S0為非氣虛人群。與表2相比,表3中增加了泄瀉癥狀,且在隱類S1中該癥狀的出現概率明顯高于S0類。

2 三種方法的比較

2.1 關于其它證候的患者聚類模型

除了氣虛證,我們還對肝硬化患者群的其它證候分布情況進行了研究,相應模型(圖4),其中證候隱變量旁邊的數字為隱類個數。為節省空間,只展示氣虛證、熱證、濕證用三種方法得到的患者聚類模型。

隱類分析相比,兩種隱樹分析得到的患者聚類模型一般包含多個隱變量,從而放寬了局部獨立假設,另外,其得到的隱類個數也相對較少,便于對患者的分類(表5)。

2.2 模型評分的比較

在對數據進行聚類分析時,不同方法得到的模型不同,如何判斷模型的優劣?我們使用BIC(Bayes Information Criterion)評分[17]。BIC 評分是統計學中常用的模型評價準則,它要求模型與數據盡量擬合,但不能過于復雜。實際上在聚類算法中,類的個數也是由BIC評分來確定。

圖7 雙步隱樹分析得到總體模型

圖8 雙步隱樹分析綜合聚類后得到的聚類模型

表4 圖8對應的隱類及其概率分布

表6 給出了所有證候聚類模型的BIC 分,采用負分法計量,其分值越大越好。可以看出,使用隱類分析得到模型的分值普遍較小,即模型質量較差。單步隱樹分析得到模型的BIC得分接近或略好于雙步隱樹分析,具體而言,在氣虛證、濕證中,單步隱樹分析得到模型的分值較好;在氣滯和熱證中,雙步隱樹法得到模型的分值較好;在其它證候中,單步隱樹分析得到模型的分值稍微較好。總之,僅從表6模型的BIC分數來看,在三種方法中,單步隱樹分析和雙步隱樹分析得到的模型得分均優于隱類分析的模型,雙步隱樹分析得到模型的BIC分值接近或稍微差于單步隱樹分析。

表5 隱類分析、單步隱樹分析和雙步隱樹分析得到聚類模型

表6 三種方法得到聚類模型的BIC分數對比

2.3 模型結構的比較

首先以氣虛證為例,對表4 中的聚類模型圖4a、4b、4c進行對比分析。單步隱樹分析的聚類模型(4b)把“舌色淡白”、“面色淡黃”、“泄瀉”、“便溏”、“自汗”五個癥狀歸為一個隱變量Y1,他們都反映了患者的狀態,而其他所有癥狀與證候隱變量直接相連。雙步隱樹分析的聚類模型(4c)把“神疲”、“乏力”歸為一個隱變量Y1,他們從整體角度反映了患者的精神狀態;把“便溏”、“泄瀉”歸為一個隱變量Y2,他們從二便角度反映了脾陽虛情況;把“面色晦暗”、“面色淡黃”歸為一個隱變量Y3,他們都從面色角度反映了患者的病情特征。從上述對比可知,雙步隱樹分析得到的聚類模型較為復雜,它增加了隱變量個數,每個隱變量更明細反映了某種相似的側面。由于模型復雜,在計算BIC 分數時懲罰項較多,所以模型得分略差,但整體而言,雙步隱樹分析的聚類模型更為合理。

考慮熱證的聚類模型,發現單步隱樹分析的模型表4e 和雙步隱樹分析的聚類模型4f 中存在相同的隱變量,即他們把“口渴”、“口咽干燥”和“老舌”、“燥_糙苔”分別歸納到相同的隱變量下,這兩個隱變量均從口感和舌像角度反映了熱證的情況,從而驗證了兩種分析方法在考慮相似側面的一致性。兩個聚類模型區別為:雙步隱樹分析將“尿色深黃”、“便秘”歸為一個隱變量,將“發熱”、“數脈”歸為一個隱變量,較單步隱樹分析更清晰地揭示了在二便和整體上的表現,分類更為細致,更符合肝炎肝硬化的臨床表現,所以雙步隱樹分析的模型結構和BIC評分都優于另外兩種方法。

對濕證的模型結構比較,從模型的BIC評分來看,單步隱樹分析得到的模型優于雙步隱樹分析;但對模型表4h 和4i 比較發現,在4i 中,雙步隱樹分析模型把“納呆”、“厭油膩”歸為一個隱變量,較單步隱樹分析把“納呆”、“厭油膩”和“黃疸”歸為一個隱變量更為合理。因為黃疸是反映患者的整體情況,而納呆和厭油膩反映了患者的脾胃功能。另外,雙步隱樹分析把“齒痕舌”、“胖舌”歸為一個隱變量,更為精確地從舌質角度反映了濕證的情況。

綜上所述,從得到患者聚類模型及中醫詮釋考慮,雙步隱樹分析得到模型的結構更合理,較符合實際臨床,優于或不差于另外兩種方法;從得到模型的BIC得分和方法使用步驟來看,單步隱樹分析得到模型的得分較好、操作步驟較為簡單,優于另外兩種方法。隱類分析方法則較適合于在滿足局部獨立假設的情況下,進行簡單的數據分析。

3 總結

辨證論治是中醫的精髓,但目前尚無證候診斷的相關金標準,在臨床診病過程中,證候的確定較嚴重地受醫生主觀性影響。隱類和隱結構分析已被證明是研究此類問題的適宜方法,本文介紹了三種基于無標簽癥狀數據建立證候分型的隱類及隱結構方法,并在801 例肝炎肝硬化患者癥狀數據上進行測試,對三種方法的特點和效果進行比較分析,明確它們各自的優勢和不足,以便在臨床研究中供用戶選擇使用。這些方法的使用可以促進辨證分型的客觀化,提高臨床診療的一致性。

猜你喜歡
癥狀分析模型
一半模型
Don’t Be Addicted To The Internet
有癥狀立即治療,別“梗”了再搶救
保健醫苑(2022年1期)2022-08-30 08:39:40
隱蔽失效適航要求符合性驗證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
可改善咳嗽癥狀的兩款藥膳
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
3D打印中的模型分割與打包
主站蜘蛛池模板: 久久香蕉国产线看观看精品蕉| 狠狠v日韩v欧美v| 亚洲女同一区二区| 中文字幕无码av专区久久| 国产激情无码一区二区免费| 亚洲欧洲国产成人综合不卡| 一级毛片免费不卡在线| 国产乱人乱偷精品视频a人人澡| 在线免费不卡视频| 韩国v欧美v亚洲v日本v| 国产福利免费视频| 中文字幕天无码久久精品视频免费 | 亚洲AⅤ永久无码精品毛片| 午夜日b视频| 无码中字出轨中文人妻中文中| 波多野结衣AV无码久久一区| 精品无码日韩国产不卡av| 在线欧美a| 97青青青国产在线播放| 色妞www精品视频一级下载| 久久久久久国产精品mv| 亚洲精品va| 国产91高跟丝袜| 国产大片黄在线观看| 亚洲永久精品ww47国产| 精品国产Ⅴ无码大片在线观看81| 天天操天天噜| 中国特黄美女一级视频| 国产精品精品视频| 国产导航在线| 亚洲无码视频喷水| 97国产精品视频人人做人人爱| 国产亚洲欧美日本一二三本道| 国产精品久久久久久久伊一| 亚洲色图欧美一区| 91网址在线播放| 国产精品区网红主播在线观看| 免费视频在线2021入口| 亚洲国产AV无码综合原创| 亚洲成AV人手机在线观看网站| 99久久99视频| 日韩不卡高清视频| 国产系列在线| 国产精品jizz在线观看软件| 精品一区二区三区波多野结衣| 欧美色图久久| 亚洲精品国产首次亮相| 中文国产成人久久精品小说| av免费在线观看美女叉开腿| 99久久国产自偷自偷免费一区| 99人体免费视频| 久久久久久久久亚洲精品| 伊人激情综合网| 国产精品免费福利久久播放| 欧美激情伊人| 欧美日韩午夜视频在线观看| 亚洲青涩在线| 国产一级妓女av网站| 亚洲成肉网| 国产香蕉97碰碰视频VA碰碰看 | 日本国产精品| 亚洲欧美日韩高清综合678| 国产人碰人摸人爱免费视频| 中字无码精油按摩中出视频| 色综合久久88| 国产精品欧美在线观看| 国产在线第二页| 久久香蕉国产线| 亚洲 日韩 激情 无码 中出| 亚洲日韩AV无码一区二区三区人| 亚洲一区二区三区麻豆| 国产精品精品视频| 亚洲欧美另类视频| 亚洲男人的天堂在线| 免费无码又爽又黄又刺激网站| 亚洲三级电影在线播放| 午夜福利免费视频| 国产人在线成免费视频| 国产成人精品一区二区| 777午夜精品电影免费看| 青青操视频在线| 精品一区二区三区视频免费观看|