999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中醫師個體化辨證論治失眠診療數據預處理方法研究

2017-12-06 22:00:59李新龍劉巖王寧侯愛娟王世華周雪忠張潤順劉保延何麗云
中國中醫藥信息雜志 2017年12期
關鍵詞:數據挖掘規則數據庫

李新龍+劉巖+王寧+侯愛娟+王世華+周雪忠+張潤順+劉保延+何麗云

摘要:目的 基于辨證論治失眠診療前瞻性研究,探索適合中醫臨床診療數據的預處理方法。方法 運用中醫臨床科研信息共享系統,采用人機結合方式,通過數據清洗、規則編訂、醫師審核、規則修訂、程序化導入與批量化處理等步驟,對8名中醫師前瞻性失眠診療數據庫進行數據預處理。結果 制訂中醫師個體化辨證論治失眠癥狀類規則27 534條、診斷類規則1036條、治法類規則841條、處方名稱規則540條、中藥名稱規則885條。結論 預處理后各類術語概念得到不同程度的規范,同時保留了醫師個體化辨證論治的特點,可用于中醫辨證論治臨床診療數據個體化與標準化研究,為數據挖掘提供支持。

關鍵詞:預處理;數據挖掘;中醫臨床科研信息共享系統;辨證論治;失眠

DOI:10.3969/j.issn.1005-5304.2017.12.023

中圖分類號:R2-05;R256.23 文獻標識碼:A 文章編號:1005-5304(2017)12-0092-05

Study on Pre-processing Methods of Clinical Data from TCM Individual Treatment of Insomnia Based on Syndrome Differentiation LI Xin-long1, LIU Yan1, WANG Ning2, HOU Ai-juan1, WANG Shi-hua1, ZHOU Xue-zhong2, ZHANG Run-shun3, LIU Bao-yan1, HE Li-yun1 (1. Institute of Basic Research in Clinical Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China; 2. School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China; 3. Guanganmen Hospital Affiliated to China Academy of Chinese Medical Sciences, Beijing 100053, China)

Abstract: Objective To explore suitable pre-processing methods for the TCM clinical data based on prospective study on insomnia treated by syndrome differentiation. Methods Based on the TCM shared clinical and research information platform and by using man-machine combination method, data cleaning rules, physician review, rule revision, procedural import and batch processing were used to conduct pre-processing for data in prospective study on insomniac treated by syndrome differentiation of 8 TCM doctors. Results Totally 27 534 rules for symptoms data of individual treatment of insomnia were made and 1036 rules for diagnostic data, 842 rules for therapeutic ways, 540 rules for formula data, 3785 rules for data of Chinese materia medica. Conclusion Different kinds of terminology concepts were normalized at different levels, at the same time, characteristics of individualized treatment based on syndrome differentiation were reserved. Appropriate pre-processing methods can be used in the reaserch of individualization and standardization of TCM syndrome differentiation clinical data and can provide support for data mining.

Key words: data pre-processing; data mining; shared clinical and research information platform; treatment based on syndrome differentiation; insomnia

真實世界中醫師辨證論治臨床診療數據具有個體化差異大、多層次、多水平、不完整等特點,這既是中醫診療的一大特色,又是中醫傳承工作面臨的重要瓶頸。本課題組歷經10余年,為中醫真實世界臨

基金項目:國家自然科學基金重點項目(81230086);國家自然科學基金青年基金(81503679)

通訊作者:何麗云,E-mail:hely3699@163.comendprint

床研究專門設計開發了中醫臨床科研信息共享系統(以下簡稱“共享系統”)[1],具有臨床數據結構化采集、數據抽提轉化、數據挖掘分析等功能。共享系統旨在為真實世界臨床研究搭建共性技術平臺,已在20余家國家中醫臨床基地及全國近百家中醫醫療機構得到應用[2]。近年來,在名老中醫辨證論治療效評價及經驗挖掘方面,基于共享系統的數據挖掘發揮著重要作用[3-5],并逐步形成了“人機結合,以人為主”的中醫師臨床診療數據挖掘方法和理念[1,5]。作為數據挖掘關鍵環節,恰當的數據預處理方法是數據挖掘結果準確的有力保障。本研究從多名中醫師辨證論治失眠癥的臨床診療數據入手,對個體化辨證論治療效評價研究中的數據預處理方法進行探索,為中醫藥數據挖掘服務流程提供支持。

1 資料與方法

1.1 數據來源

基于國家自然基金重點項目“階梯遞進的辨證論治療效評價方法研究”[6],根據共享系統中預先制訂的半結構化診療信息模板采集數據(見圖1),并以“字段名+字段值”或“字段值+字段類型”形式存儲在數據庫不同數據表中。截至2016年5月,數據庫共存儲了8位醫師964例(2455診次)患者的診療數據。

醫師篩選標準:①主任或副主任醫師,中醫藥治療失眠相關疾病20年以上,具有成熟穩定辨證論治失眠的經驗;②失眠患者人群較為固定;③門診配備電腦,且可實時錄入連續合格病例;④門診擁有專門的科研助手(或者研究生)協助課題開展;⑤愿意參加本研究,依從性較好。

1.2 數據預處理軟件

采用自主研發軟件Medical Integrator Studio2.3[7]進行預處理,該軟件基于共享系統設計研發,與共享系統兼容性較好,具備常規預處理軟件數據抽取、數據轉換及數據裝載功能。

1.3 數據預處理流程(見圖2)

1.3.1 原始數據調取 不同醫師提交的臨床診療數據在原始數據庫永久性獨立存儲,預處理前首先要從原始數據庫調取數據至細節數據庫。細節數據庫是原始數據庫的鏡像,用于各種數據處理,當針對數據的操作發生錯誤時,具有通過原始數據庫進行溯源、糾錯和恢復等功能。

1.3.2 原始數據核查 從細節數據庫中將各醫師的無重復數據導出到Excel表,由于存在測試、漏填或錯填等無效數據,因此首先對數據進行核查,將數據質疑表分別發送給各醫師或其預先指定的助手,經其核實確認后反饋數據答疑結果,據此從細節數據集剔除無效數據。

1.3.3 預處理規則制訂 由于各醫師數據采用半結構化模板錄入,部分字段存在術語描述不統一、合并錄入、重復錄入等現象,相應處理規則分為轉化、拆分、刪除3種方式進行。預處理規則參照《中醫藥學名詞》[8]、《中醫臨床診療術語·疾病部分》(GB/T 16751.1-1997)[9]、《中醫臨床診療術語·證候部分》(GB/T 16751.2-1997)[10]、《中醫臨床診療術語·治法部分》(GB/T 16751.3-1997)[11]、《中醫基礎理論》[12]、《中醫診斷學》[13]、《方劑學》[14]、《中醫內科學》[15]、2015年版《中華人民共和國藥典》[16]、《中醫證候鑒別診斷學》[17]、《診斷學》[18]、《內科學》[19],國際疾病分類(international Classification of diseases,ICD)[20]等制訂。

1.3.4 預處理規則反饋與修訂 將數據預處理規則發送至各醫師,根據其反饋意見,確認或再修訂相應規則。此過程是預處理的關鍵環節,各醫師對數據預處理規則的判讀,是預處理后數據能真實反映醫師個體臨床實際診療特點的重要保障。

1.3.5 預處理規則導入與批量處理 將確認后的預處理規則導入細節數據庫的規則表中,對數據進行分類批量預處理。

1.3.6 預處理后數據核查 核查預處理后的數據,重點關注數據完整性和處理規則的一致性。

2 結果

2.1 數據庫結構劃分及規則匯總

各醫師臨床診療數據分別存儲在數據庫中的癥狀、診斷、治法(中藥或針灸)、方名(中藥或針灸)、中藥、西藥/中成藥、實驗室檢查、物理檢查等數據表中,共建立規則30 836條,各類數據預處理前后術語數量分布見表1。

2.2 癥狀類數據

癥狀類數據主要包括主訴、現病史、辨證論治清單、既往史、個人史、體格檢查、實驗室檢查、物理檢查等。數據的預處理可分為多義項的拆分、同義詞的合并、默認值、異常值的刪除,見表2。

2.3 診斷類數據

診斷類數據包括西醫診斷、中醫疾病診斷、中醫證候診斷3類,由于存在疾病和證候分類混淆、疾病診斷術語不統一、錯別字等問題,診斷數據的預處理主要從術語及類別的統一、更正和拆分三方面進行,見表3。其中證候診斷的預處理是重點和難點,本研究將證候拆分為病位、病性等基本證素[21]。病位、病性單一的證候,拆分為基本證素,如“肝腎陰虛證”拆分為“肝陰虛證”和“腎陰虛證”;病位或病性復雜的證候如“脾腎不足證”“心脾兩虛證”“肝郁脾虛證”則不進行拆分。

2.4 治法類數據

治法類數據的預處理主要包括對術語的拆分和統一,見表4。對相對獨立的治法進行拆分,對有明顯相關性的治法,如“補氣生血”“養心安神”“鎮心安神”“交通心腎”“疏肝解郁”“調和脾胃”“平肝潛陽”等則不予拆分。此外,對于拆分后容易產生歧義的治法不進行拆分,如“清熱化痰”規范為“清化熱痰”,“清熱利濕”拆分為“清熱”和“利濕”,而“養陰清熱”則不拆分。

2.5 方劑類數據

方劑類數據的處理主要包括方劑名稱的統一和拆分,見表5。本研究采用復雜網絡方法[22],根據實際方劑藥物組成對不同醫師有效處方進行數據挖掘,因此,對無明確方名者均統一為“自擬方”,未對其方名進行補充。endprint

2.6 中藥類數據

基于研究團隊前期中藥數據預處理基礎[23],中藥類數據從以下方面進行處理。①藥物名稱:參照2015年版《中華人民共和國藥典》[16](以下簡稱“《中國藥典》”),統一別名、錯別字、省略詞等,如“叢蓉”規范為“肉蓯蓉”,“勾藤”規范為“鉤藤”,“萸肉”規范為“山萸肉”,“元胡”“玄胡”“延胡索”統一為“延胡索”。②炮制方法:根據臨床實際,對炮制不同、藥效明顯不同者視作不同藥物,如“生地黃”與“熟地黃”,“生甘草”與“炙甘草”。③2015年版《中國藥典》中未收錄的中藥,需要檢索《中藥別名速查大辭典》,使用相對規范的中藥名稱,并在數據庫表中補充該藥物的性味、歸經、功效、常用劑量等內容,對中藥字典進行完善補充。④2種以上藥物合并書寫者拆分為單個中藥,如“合歡花皮”拆分為“合歡花”和“合歡皮”,“赤白芍”拆分為“赤芍”和“白芍”,“煅龍牡”拆分為“鍛龍骨”和“煅牡蠣”等。⑤刪除產地信息:如“川黃連”規范為“黃連”,“淮山藥”規范為“山藥”。⑥僅劑型不同者,視為同一味藥,如“三七末”“三七片”規范為“三七”,“西洋參粉”規范為“西洋參”等。

3 討論

本課題組前期以中醫專家和失眠患者為研究對象的隨機對照盲法研究中,同一患者在相同時間段內依次接受3位名老中醫的診斷,在保證中醫專家辨證論治診療實際狀態不被干擾的情況下,隨機服用其中1位醫師的方藥。結果顯示治療都有效的前提下,中醫證候診斷與治療方藥有所不同,甚至有較大差異[24]。在真實世界中通過較完善的試驗設計,用數據驗證了中醫辨證論治過程中的個體化診療實質,因此單純以強調“標準化”的臨床療效評價模式,如證候、干預措施標準化,難以反映中醫師個體化辨證論治的診療特色和精髓。而醫師有效辨證論治方案的形成,受到醫師自身個體化辨證論治知識體系的成熟度和臨床實際診療經驗豐富度的影響。因此,本研究在全國范圍內篩選了具有豐富臨床經驗的中醫名家,一方面其有較固定的患者群,另一方面也基本形成了自身的辨證論治知識體系。

在權衡醫師辨證論治個性化特征的保留與統計分析對數據規范性要求的基礎上,本研究在數據采集過程中,采用了半結構化的診療信息采集模板;在數據預處理的過程中,同樣貫徹了“人機結合,以人為主”的原則。經過預處理,各類術語概念得到不同程度的規范,同時又盡可能地保留了醫師個體化辨證論治的特點。因此在數據預處理的過程中建議堅持以下原則:①充分保留不同醫師辨證論治的個體化特征,充分尊重中醫師特定術語描述習慣,癥狀描述、辨證、治法術語的預處理規則均為每位醫師量身制訂。②參考相關標準和規范進行復合型術語拆分、同義術語統一等預處理。③建立預處理規則的反饋與確認機制,預處理規則需反饋醫師,經其確認或修訂,以保證處理后數據能夠如實反映其診療實際。④人工編訂與機器批量處理相結合,以保證預處理的準確性和效率。

綜上所述,“人機結合,以人為主”的策略適用于中醫臨床診療數據的預處理。恰當的預處理策略,是銜接中醫辨證論治臨床診療數據個體化與標準化橋梁的關鍵環節,是中醫藥數據挖掘技術能否正確實現的前期保證。

參考文獻:

[1] 劉保延,周雪忠,李平,等.個體診療臨床科研信息一體化平臺[J].中國數字醫學,2007,2(6):31,36.

[2] 張潤順,劉保延,周雪忠,等.基于中醫醫療與臨床科研信息共享系統的臨床研究要點[J].中醫雜志,2014,55(17):1457,1460.

[3] 周雪忠,劉保延,姚乃禮,等.中醫臨床數據庫及挖掘分析平臺的研究與應用探討[J].世界科學技術-中醫藥現代化,2007,9(4):74,80.

[4] 張潤順,王映輝,周雪忠,等.名老中醫經驗要素研究及智能挖掘平臺功能設計[J].世界科學技術-中醫藥現代化,2008,10(1):45-52,63.

[5] 王映輝,張潤順,吳潔,等.名老中醫經驗傳承研究模式探索[J].中國中醫基礎醫學雜志,2008,14(6):417-418.

[6] Individualized treatment with traditional Chinese medicine for the patients with insomnia disorder:a Cohort Study-Full Text View- ClinicalTrials.gov[EB/OL]. (2015-03-31)[2017-06-13]. https:// www.clinicaltrials.gov/ct2/show/NCT02402959?term=sleep&rcv_d=14&show_rss=Y.

[7] 劉保延,周雪忠,姚乃禮,等.MEDIS:以數據倉庫為核心的中醫臨床醫學智能平臺[C]//國際中醫藥工程學術會議會議論文集.上海:國際中醫藥工程學術會議,2010:182-187.

[8] 中醫藥學名詞審定委員會.中醫藥學名詞[M].北京:科學出版社, 2005.

[9] 中華人民共和國技術監督局.中醫臨床診療術·語疾病部分:GB/T 16751.1-1997[S].北京:中國標準出版社,1997.

[10] 中華人民共和國技術監督局.中醫臨床診療術語·證候部分:GB/T 16751.2-1997[S].北京:中國標準出版社,1997.

[11] 中華人民共和國技術監督局.中醫臨床診療術語·治法部分:GB/T 16751.3-1997[S].北京:中國標準出版社,1997.

[12] 孫廣仁,鄭洪新.中醫基礎理論[M].北京:中國中醫藥出版社,2012.

[13] 陳家旭.中醫診斷學[M].北京:中國中醫藥出版社,2015.

[14] 李冀.方劑學[M].北京:中國中醫藥出版社,2012.

[15] 吳勉華,王新月.中醫內科學[M].北京:中國中醫藥出版社,2012.

[16] 國家藥典委員會.中華人民共和國藥典[M].北京:中國醫藥科技出版社,2015.

[17] 姚乃禮,朱建貴,高榮林.中醫證候鑒別診斷學[M].2版.北京:人民衛生出版社,2002.

[18] 陳文彬,潘祥林,康熙雄,等.診斷學[M].7版.北京:人民衛生出版社, 2008.

[19] 陸再英,鐘南山,謝毅,等.內科學[M].7版.北京:人民衛生出版社,2008.

[20] WHO. International classification of diseases[EB/OL]. 2010 [2017-09-29]. http://www.who.int/classifications/icd/en/.

[21] 黃碧群,曲超,向歲,等.中醫證素辨證研究概況[J].湖南中醫藥大學學報,2013,33(1):24,31.

[22] 郭峰,王曉忠,馬燕,等.基于復雜網絡的曾斌芳治療慢性乙型肝炎用藥規律研究[J].中國中醫藥信息雜志,2017,24(2):94-97.

[23] 江麗杰.多醫師辨證論治失眠有效治療方藥的發現研究[D].北京:中國中醫科學院,2014.

(收稿日期:2017-02-10)

(修回日期:2017-03-08;編輯:向宇雁)endprint

猜你喜歡
數據挖掘規則數據庫
撐竿跳規則的制定
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據庫
財經(2017年2期)2017-03-10 14:35:35
TPP反腐敗規則對我國的啟示
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 亚洲欧美另类中文字幕| 国产精品免费p区| 亚洲欧美激情另类| 97人妻精品专区久久久久| 国产又大又粗又猛又爽的视频| 国产午夜福利在线小视频| 91久久精品国产| 免费无码AV片在线观看中文| 亚洲欧美国产视频| 国产精品太粉嫩高中在线观看| 亚洲成a人片在线观看88| 麻豆精品视频在线原创| 国产麻豆福利av在线播放 | 欧美在线黄| 99免费在线观看视频| 第九色区aⅴ天堂久久香| 国产99视频在线| 伊人狠狠丁香婷婷综合色 | 国产精品一区二区不卡的视频| 国产极品美女在线观看| 狠狠躁天天躁夜夜躁婷婷| 91蜜芽尤物福利在线观看| 国产毛片一区| 国产综合无码一区二区色蜜蜜| 伊人色在线视频| 亚洲综合色婷婷中文字幕| 激情無極限的亚洲一区免费| 亚洲欧美极品| av一区二区三区在线观看| 永久免费无码成人网站| 欧美www在线观看| 欧美全免费aaaaaa特黄在线| www.狠狠| 99久久国产综合精品2020| 国产jizz| 91日本在线观看亚洲精品| 波多野结衣在线se| 精品国产香蕉在线播出| 国产丝袜啪啪| 九九久久99精品| 欧美日韩国产系列在线观看| 丁香婷婷综合激情| 国产女同自拍视频| 2021国产精品自拍| 亚洲日韩精品综合在线一区二区| 国内精品小视频福利网址| 人妻精品全国免费视频| 1024你懂的国产精品| 欧美黄网站免费观看| 欧美精品aⅴ在线视频| 996免费视频国产在线播放| 精品少妇人妻一区二区| 91在线一9|永久视频在线| 色婷婷久久| 日本亚洲欧美在线| 风韵丰满熟妇啪啪区老熟熟女| 中文无码伦av中文字幕| 久久久久中文字幕精品视频| 亚洲精品大秀视频| 成人免费网站久久久| 亚洲精品国偷自产在线91正片| 在线观看国产一区二区三区99| 久青草网站| 欧美日韩一区二区三| 亚洲无码高清一区二区| 好久久免费视频高清| 欧美成人看片一区二区三区 | 欧美精品在线观看视频| 婷婷午夜影院| 国产在线精品人成导航| www欧美在线观看| 亚洲男人天堂久久| 在线色综合| 久久国产精品娇妻素人| 国产jizz| 成人福利在线视频| 亚洲五月激情网| 久久这里只有精品2| 无码av免费不卡在线观看| 中文毛片无遮挡播放免费| 伊人欧美在线| 国产成人高清精品免费软件|