999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數(shù)據(jù)挖掘的圍絕經(jīng)期綜合征中醫(yī)證候分類算法分析

2016-01-11 08:56:48吳宏進(jìn)許家佗張志楓屠立平張婷婷徐蓮薇劉巧蓮
關(guān)鍵詞:中醫(yī)證候數(shù)據(jù)挖掘

吳宏進(jìn) 許家佗 張志楓 屠立平 張婷婷 徐蓮薇 劉巧蓮

摘要:目的 采用現(xiàn)代中醫(yī)診斷技術(shù)結(jié)合人工智能分析方法進(jìn)行圍絕經(jīng)期綜合征中醫(yī)辨證研究,以期建立最佳證候分類方法。方法 門診收集圍絕經(jīng)期綜合征患者四診信息,按照中醫(yī)辨證標(biāo)準(zhǔn)進(jìn)行證型分類,采用貝葉斯網(wǎng)絡(luò)算法、K最近鄰算法、支持向量機(jī)算法3種常用數(shù)據(jù)挖掘分類算法對(duì)圍絕經(jīng)期綜合征四診信息數(shù)據(jù)進(jìn)行分析。結(jié)果 分別得出在相同訓(xùn)練、測(cè)試樣本數(shù)據(jù)下3種算法建立圍絕經(jīng)期綜合征中醫(yī)證候模型所需時(shí)間、分類準(zhǔn)確性、覆蓋率及margin曲線,分析了訓(xùn)練樣本數(shù)量對(duì)3種算法的影響,并對(duì)3種算法所建立模型進(jìn)行了評(píng)價(jià)。結(jié)論 在圍絕經(jīng)期綜合征證候分類效果方面,貝葉斯網(wǎng)絡(luò)算法優(yōu)于其他2種方法。

關(guān)鍵詞:圍絕經(jīng)期綜合征;中醫(yī)證候;數(shù)據(jù)挖掘;分類算法;訓(xùn)練樣本;margin曲線

DOI:10.3969/j.issn.1005-5304.2016.01.009

中圖分類號(hào):R259.886 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1005-5304(2016)01-0039-04

Classification Algorithm Analysis of TCM Syndrome of Menopausal Syndrome Based on Data Mining WU Hong-jin1, XU Jia-tuo2, ZHANG Zhi-feng2, TU Li-ping2, ZHANG Ting-ting3, XU Lian-wei1, LIU Qiao-lian3 (1. Longhua Hospital Affiliated to Shanghai University of TCM, Shanghai 200032, China; 2. Shanghai University of TCM, Shanghai 201203, China; 3. Yueyang Hospital Affiliated to Shanghai University of TCM, Shanghai 200437, China)

Abstract: Objective To establish the optimum syndrome classification method by using the technology of modern TCM diagnosis and artificial intelligence analysis method for menopausal syndrome differentiation of TCM. Methods Diagnostic information of menopausal syndrome patients was collected and syndromes were classified according to TCM syndrome differentiation standard. Three kinds of common data mining classification algorithm, Bayesian network, K-nearest neighbors and support vector machine, were used for analysis on information data of the four methods of diagnosis of menopausal syndrome. Results The time, classification accuracy, coverage rate and margin curve of establishing TCM syndrome model by the three kinds of algorithm methods under the circumstances of same training and data. The influence of the number of training samples of 3 kinds of algorithm methods was analyzed, and the model established by the three kinds of algorithms was evaluated. Conclusion Bayesian network algorithm is better than the other two methods in the menopausal syndrome classification effect.

Key words: menopausal syndrome; TCM syndrome; data mining; classification algorithm; training samples; margin curve

圍絕經(jīng)期綜合征(menopausal syndrome,MPS)指婦女絕經(jīng)前后出現(xiàn)的一系列絕經(jīng)相關(guān)癥狀,是伴隨卵巢功能下降乃至衰竭而出現(xiàn)的影響絕經(jīng)相關(guān)健康的一組癥候群,初為月經(jīng)改變、潮熱、盜汗、失眠及

泌尿生殖道癥狀,遠(yuǎn)期可發(fā)生骨質(zhì)疏松和心血管疾患[1]。目前,國(guó)內(nèi)有關(guān)本病的中醫(yī)證候診斷尚無(wú)統(tǒng)一的規(guī)范的、客觀的標(biāo)準(zhǔn)。因此,本研究采用數(shù)據(jù)挖掘分類方法對(duì)MPS證候進(jìn)行分析。

數(shù)據(jù)挖掘方法主要有分類分析、聚類分析、關(guān)聯(lián)分析、序列模式分析等。其中分類分析就是找出描述并區(qū)分?jǐn)?shù)據(jù)類或概念的模型(或函數(shù)),以便能使用模型預(yù)測(cè)類標(biāo)記未知的對(duì)象類。本課題采用數(shù)據(jù)挖掘技術(shù)中比較成熟的K最近鄰、貝葉斯網(wǎng)絡(luò)、支持向量機(jī)算法,研究其在MPS中醫(yī)辨證中的應(yīng)用。

1 資料與方法

1.1 研究對(duì)象

2011年4月-2012年10月上海中醫(yī)藥大學(xué)附屬岳陽(yáng)醫(yī)院門診MPS患者367例,年齡40~60歲,中醫(yī)辨證為肝腎陰虛證94例、肝郁氣滯證89例、脾腎陽(yáng)虛證41例、心脾兩虛證71例、心腎不交證72例。

1.2 納入標(biāo)準(zhǔn)

⑴符合女性MPS診斷標(biāo)準(zhǔn)[2-4]:①年齡40~60歲婦女;②月經(jīng)紊亂3個(gè)月以上;③出現(xiàn)潮熱、烘熱汗出、煩躁易怒、焦慮、情志異常等癥狀;④實(shí)驗(yàn)室檢查示血清雌二醇(E2)降低,促卵泡素(FSH)明顯上升。同時(shí)符合上述3條即可診斷。⑵符合肝腎陰虛證、肝郁氣滯證、脾腎陽(yáng)虛證、心脾兩虛證或心腎不交證中醫(yī)辨證分型標(biāo)準(zhǔn)[4-5]。

1.3 排除標(biāo)準(zhǔn)

①雙側(cè)附件及子宮切除術(shù)后;②合并急性感染性疾病者;③明確診斷患有呼吸、心腦血管、肝、腎、血液、內(nèi)分泌等系統(tǒng)疾病者;④近3個(gè)月曾用過(guò)雌、孕激素替代治療者。

1.4 調(diào)查方法

1.4.1 問(wèn)診指標(biāo)及方法 采用問(wèn)卷調(diào)查形式,遵循臨床流行病學(xué)調(diào)研方法,設(shè)計(jì)統(tǒng)一的臨床診斷記錄表,由經(jīng)過(guò)培訓(xùn)的中醫(yī)診斷專業(yè)研究生逐一詢問(wèn)患者并填寫記錄表。該表是在前期文獻(xiàn)分析基礎(chǔ)上,結(jié)合本研究室《中醫(yī)四診信息采集表》(2007V2.0)和《健康狀態(tài)評(píng)價(jià)問(wèn)卷》(H20.V2009)[6],通過(guò)相關(guān)專家考評(píng)及數(shù)據(jù)收集反復(fù)修改而制定,包括患者年齡、職業(yè)、婚育狀況、文化程度、既往史、用藥史、癥狀體征、舌脈象等。中醫(yī)辨證由相關(guān)專業(yè)具有副主任以上職稱的3名醫(yī)師進(jìn)行辨證,取一致結(jié)果。

1.4.2 脈診指標(biāo)及方法 脈搏波采集分析設(shè)備采用上海中醫(yī)藥大學(xué)研制的DDMX-100型單道脈象儀(專利號(hào)ZL200520038993.8)。脈象定性分析指標(biāo)為從脈圖中讀取的脈位、脈力、至數(shù)、脈名等。由3名以上中醫(yī)診斷專家進(jìn)行判讀,取一致結(jié)果,判斷標(biāo)準(zhǔn)以《現(xiàn)代中醫(yī)脈診學(xué)》[7]中的脈象分類標(biāo)準(zhǔn)為主。

1.4.3 舌診指標(biāo)及方法 舌象采集儀器采用本課題研發(fā)的TDA-1舌象儀(產(chǎn)品尺寸20 cm×15 cm×10 cm,包括光源設(shè)計(jì)、CCD設(shè)備構(gòu)架、電源設(shè)計(jì)、外形設(shè)計(jì)等內(nèi)容),采用本研究室研發(fā)的《中醫(yī)舌診分析系統(tǒng)》(V2.0)舌象分析軟件進(jìn)行數(shù)據(jù)分析。舌象定性指標(biāo):舌色分為淡白舌、淡紅舌、紅舌、紅絳舌、黯紅舌、青紫舌6類,苔色分為薄白苔、白苔、薄黃苔、少苔4類。正常舌象為淡紅舌、薄白苔。舌象判斷由3個(gè)相關(guān)診斷專家按顏色分類進(jìn)行判斷,取一致結(jié)果。

1.5 數(shù)據(jù)挖掘方法

采用基于JAVA的開(kāi)源數(shù)據(jù)挖掘平臺(tái)WEKA3.6數(shù)據(jù)挖掘軟件[8],方法分別為貝葉斯網(wǎng)絡(luò)算法、K最近鄰算法、支持向量機(jī)算法。

1.6 實(shí)驗(yàn)分析

實(shí)驗(yàn)數(shù)據(jù)為367例病例的四診信息,包括癥狀信息(包含51個(gè)特征屬性)、脈搏波參數(shù)(包含24個(gè)特征屬性)、舌圖像參數(shù)(包含18個(gè)特征屬性)。對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,并根據(jù)WEKA所要求的格式(.arff)將數(shù)據(jù)分為頭信息和數(shù)據(jù)集信息2個(gè)部分;采用十折交叉驗(yàn)證方法進(jìn)行分析。正確率為該屬性被正確分類的概率,錯(cuò)誤率指在所有被分配為該屬性的記錄中的錯(cuò)誤率,精確度計(jì)算該屬性的總體精確度,覆蓋率評(píng)估模型在該屬性上的覆蓋率。

2 結(jié)果

2.1 3種算法分類結(jié)果

K最近鄰算法所耗費(fèi)的建模時(shí)間最短,而支持向量機(jī)算法建模時(shí)間最長(zhǎng),正確分類例數(shù)及總正確率最多的算法為貝葉斯網(wǎng)絡(luò)算法,標(biāo)準(zhǔn)誤差最小的是貝葉斯網(wǎng)絡(luò)算法,最大的是支持向量機(jī)算法,見(jiàn)表1。

2.2 貝葉斯網(wǎng)絡(luò)算法

脾腎陽(yáng)虛證正確分類例數(shù)最多、正確率最高,其次為肝郁氣滯證和心脾兩虛證,而肝腎陰虛證被誤分為心腎不交證的例數(shù)較多,分類正確率也相對(duì)較低(見(jiàn)表2、表3),考慮可能脾腎陽(yáng)虛證的特征值與其他證型區(qū)別較大,而肝腎陰虛證與心腎不交證的特征值存在相似之處,因此出現(xiàn)誤分的情況。圖1表明,該算法構(gòu)建模型在樣本數(shù)>180時(shí)分類趨于穩(wěn)定,計(jì)算代價(jià)也處于較低水平,樣本數(shù)<90時(shí)分類準(zhǔn)確率偏低且計(jì)算代價(jià)較高,樣本數(shù)>90時(shí)準(zhǔn)確性大幅度提高且計(jì)算代價(jià)大幅度下降。

2.3 K最近鄰算法

脾腎陽(yáng)虛證正確分類例數(shù)最多、正確率最高,其次為心脾兩虛證,而肝腎陰虛證被誤分為心腎不交證的例數(shù)較多,分類正確率也相對(duì)較低(見(jiàn)表4、表5)。圖2表明,該算法構(gòu)建模型在樣本數(shù)>104時(shí)分類趨于穩(wěn)定,計(jì)算代價(jià)也處于較低水平,樣本數(shù)<94時(shí)分類準(zhǔn)確率偏低,而且計(jì)算代價(jià)較高。

2.4 支持向量機(jī)算法

脾腎陽(yáng)虛證正確分類例數(shù)最多、正確率最高,其次為心脾兩虛證,肝腎陰虛證被誤分為心腎不交證的例數(shù)較多、分類正確率較低(見(jiàn)表6、表7)。圖3表明,該算法構(gòu)建模型在樣本數(shù)>80時(shí)分類趨于穩(wěn)定,計(jì)算代價(jià)處于較低水平。該算法在小樣本環(huán)境下表現(xiàn)出驚人的收斂速度,精確度迅速提高,計(jì)算代價(jià)大幅下降,但樣本數(shù)據(jù)增加后其精度和計(jì)算代價(jià)都較差。

2.5 3種分類算法模型評(píng)估

ROC曲線常用于比較2組或多組實(shí)驗(yàn)結(jié)果,并判斷實(shí)驗(yàn)結(jié)果合適分界點(diǎn),常用于診斷模型的評(píng)估,比較各種分類方法所建立模型的優(yōu)劣。分別采用貝葉斯網(wǎng)絡(luò)、支持向量機(jī)、K最近鄰算法,得出每個(gè)證型ROC曲線下面積,大致在0.7~1之間(見(jiàn)表8)。從面積診斷意義上來(lái)說(shuō),診斷價(jià)值較高。采用貝葉斯網(wǎng)絡(luò)算法得出各證型ROC曲線面積最大,K最近鄰算法得出各證型ROC曲線下面積最小。

3 討論

基于數(shù)據(jù)挖掘技術(shù)進(jìn)行的MPS中醫(yī)證候分類研究在中醫(yī)證候模型構(gòu)建速度方面,K最近鄰算法花費(fèi)時(shí)間最短,支持向量機(jī)算法花費(fèi)時(shí)間最長(zhǎng);在證候模型準(zhǔn)確度方面,貝葉斯網(wǎng)絡(luò)分類器所建立的證候模型準(zhǔn)確率最高,K最近鄰分類器所建立的證候模型準(zhǔn)確率最低;在魯棒性方面以支持向量機(jī)方法最佳,在極小的訓(xùn)練樣本下表現(xiàn)了極高的分類穩(wěn)定性,貝葉斯網(wǎng)絡(luò)算法的魯棒性最差,在訓(xùn)練樣本不足時(shí)準(zhǔn)確性難以提高。貝葉斯網(wǎng)絡(luò)與其他所有的分類算法相比,其網(wǎng)絡(luò)容易建立,沒(méi)有結(jié)構(gòu)學(xué)習(xí)過(guò)程,只需先驗(yàn)概率就可以完成,分類過(guò)程十分高效,具有最小的出錯(cuò)率[9-10]。因此,運(yùn)用貝葉斯網(wǎng)絡(luò)方法等數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘技術(shù),將數(shù)據(jù)挖掘結(jié)果結(jié)合專家經(jīng)驗(yàn)和臨床驗(yàn)證進(jìn)行反復(fù)修訂,是建立中醫(yī)學(xué)辨證論治規(guī)范化研究方法學(xué)平臺(tái)的重要手段[11]。支持向量機(jī)算法是模式識(shí)別中基于結(jié)構(gòu)風(fēng)險(xiǎn)最小原理的數(shù)據(jù)分類方法,可將變量集映射到高維特征空間中并進(jìn)行正確區(qū)分,其優(yōu)點(diǎn)在于解決小樣本、非線性及低維空間不易區(qū)分的難題。

實(shí)驗(yàn)表明,在對(duì)質(zhì)量較高、樣本量較大的數(shù)據(jù)集進(jìn)行分類時(shí),貝葉斯網(wǎng)絡(luò)算法是最佳選擇。而大多數(shù)情況下,能夠獲取的訓(xùn)練樣本總是很有限,數(shù)據(jù)中包含空值,支持向量機(jī)算法常被選擇應(yīng)用。因此,綜合本次研究結(jié)果,在應(yīng)用數(shù)據(jù)挖掘軟件進(jìn)行數(shù)據(jù)分析時(shí),應(yīng)根據(jù)數(shù)據(jù)類型、特點(diǎn),選用合適的分類算法,才能達(dá)到預(yù)期的效果。

參考文獻(xiàn):

[1] 豐有吉,沈鏗.婦產(chǎn)科學(xué)[M].2版.北京:人民衛(wèi)生出版社,2010:263.

[2] 曹澤毅.中華婦產(chǎn)科學(xué)[M].北京:人民衛(wèi)生出版社,1999:2281.

[3] 樂(lè)杰.婦產(chǎn)科學(xué)[M].7版.北京:人民衛(wèi)生出版社,2008:320.

[4] 中華人民共和國(guó)衛(wèi)生部.中藥新藥臨床研究指導(dǎo)原則:第三輯[M]. 1997:3.

[5] 張玉珍.中醫(yī)婦科學(xué)[M].北京:中國(guó)中醫(yī)藥出版社,2002:168.

[6] 朱紅紅.亞健康狀態(tài)的問(wèn)卷評(píng)價(jià)方法與流行病學(xué)特征研究[D].上海:上海中醫(yī)藥大學(xué),2010.

[7] 費(fèi)兆馥.現(xiàn)代中醫(yī)脈診學(xué)[M].北京:人民衛(wèi)生出版社,2003:163-165.

[8] WITTEN LH, FRANK E.數(shù)據(jù)挖掘?qū)嵱脵C(jī)器學(xué)習(xí)技術(shù)(第二版)[M].董琳,邱泉,于曉峰,等,譯.北京:機(jī)械工業(yè)出版社,2006.

[9] 羅敏霞.數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)的技術(shù)方法及應(yīng)用(上)[J].運(yùn)城學(xué)院學(xué)報(bào),2005,23(2):1-5.

[10] 盧志茂,劉挺,郎君,等.神經(jīng)網(wǎng)絡(luò)和貝葉斯網(wǎng)絡(luò)在漢語(yǔ)詞義消歧上的應(yīng)用對(duì)比[J].高技術(shù)通訊,2004,14(8):15-19.

[11] 胡金亮,李建生,余學(xué)慶.中醫(yī)證候診斷標(biāo)準(zhǔn)研究背景與現(xiàn)狀[J].河南中醫(yī)學(xué)院學(xué)報(bào),2005,20(3):77-79.

(收稿日期:2014-12-25)

(修回日期:2015-01-29;編輯:陳靜)

猜你喜歡
中醫(yī)證候數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
帕羅西汀聯(lián)合柴胡加龍骨牡蠣湯加味治療抑郁癥42例
麻黃附子細(xì)辛湯合右歸丸加減治療緩慢性心律失常臨床觀察
口干是否類風(fēng)濕關(guān)節(jié)炎中醫(yī)陰虛證候關(guān)鍵指標(biāo)的臨床研究
雙唑泰棉栓聯(lián)合中藥沖洗、定君生治療霉菌性陰道炎的臨床分析
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
心血管多重危險(xiǎn)因素與中醫(yī)“風(fēng)痰毒瘀虛”診斷結(jié)合的研究
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: a毛片在线| 成年女人a毛片免费视频| 日韩无码视频播放| 亚洲综合久久成人AV| 怡春院欧美一区二区三区免费| 青青操视频在线| 在线观看91香蕉国产免费| 国产尤物在线播放| 国产精品偷伦视频免费观看国产 | 无码精品福利一区二区三区| 性欧美精品xxxx| 被公侵犯人妻少妇一区二区三区| 无码粉嫩虎白一线天在线观看| 99福利视频导航| 久久精品免费国产大片| 国产精品久线在线观看| 亚洲大尺码专区影院| 亚洲一区二区成人| 亚洲国产清纯| 亚洲婷婷丁香| a级毛片网| 久久这里只有精品国产99| 精品一区二区三区波多野结衣| 免费福利视频网站| 日本黄色a视频| 日韩精品亚洲一区中文字幕| 国产亚洲成AⅤ人片在线观看| 98超碰在线观看| 日本爱爱精品一区二区| 国产黄网永久免费| 国产女人综合久久精品视| 美女亚洲一区| 天天做天天爱天天爽综合区| 亚洲性影院| 亚洲国产精品不卡在线| 久久久久久久久亚洲精品| 亚洲二区视频| 亚洲人在线| 五月婷婷综合色| 成年片色大黄全免费网站久久| 在线观看视频99| 97视频在线观看免费视频| 欧美日韩资源| 国产日韩欧美成人| 99热这里只有精品在线观看| 91 九色视频丝袜| 黑人巨大精品欧美一区二区区| 国产福利微拍精品一区二区| 91小视频在线观看| 亚洲IV视频免费在线光看| 欧美在线视频不卡第一页| 国产精品无码影视久久久久久久 | 精品久久香蕉国产线看观看gif| 亚洲福利一区二区三区| 国产小视频a在线观看| 日韩在线视频网站| 亚洲第一区欧美国产综合| 亚洲综合色婷婷中文字幕| 国产网站一区二区三区| 欧美成人综合视频| 综合色在线| 国产一二三区视频| 国产另类视频| 精品小视频在线观看| 亚洲国产精品美女| 亚洲三级网站| 国产成人一区二区| 激情亚洲天堂| 亚洲第一综合天堂另类专| 国产精品99久久久久久董美香| 免费在线国产一区二区三区精品| 亚洲国产欧洲精品路线久久| 国产精品亚洲五月天高清| 免费a在线观看播放| 五月激激激综合网色播免费| 欧美国产菊爆免费观看| 亚洲精品天堂自在久久77| 网友自拍视频精品区| 亚洲日本精品一区二区| 日韩av资源在线| 无码一区中文字幕| 亚洲中文字幕在线一区播放|