王 利,何建成
·述 評·
大數據在中醫診斷中應用的可行性及展望
王 利,何建成
大數據時代的到來對生物醫學研究產生了重大影響。中醫診斷是中醫理論和臨床研究的核心與關鍵。作者從大數據與中醫診斷、大數據在中醫診斷中應用的可行性(中醫四診客觀化、中醫證候標準、證候類型與實驗指標關系和指導臨床治療)等方面進行概述,認為中醫診斷中計量診斷及多元統計方法量化的各項指標是構成大數據的基本元素,大數據的應用是中醫診斷客觀化和證候標準化的推動力。
大數據;中醫診斷;可行性;展望
大數據是指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,稱之“巨量資料”,其基本特征為數據規模大、種類繁多、價值密度低、處理速度快[1]。大數據是“互聯網時代”誕生的一個新型的技術資源,已被全球各領域熟知和應用。傳統中醫的認識體系較多從宏觀上觀察并進行詮釋,如望聞問切、整體觀念、辨證論治,目前諸多研究者結合現代科技的手段和方法進行中醫客觀化和標準化的研究。大數據時代已經到來,合理、有效地運用大數據來認識中醫診斷的各個環節,是當前研究的主要任務。作者分析大數據在中醫診斷中應用的可行性,并進行展望。
1.1 大數據的廣泛應用及條件 由于大數據的特點及其可從巨量的數據集中挖掘出有價值的信息,因此受到了各個領域的廣泛重視。一方面,指導或者引領著大眾的日常生活,如消費、服務行業以及投資等;另一方面,對生命科學的貢獻也是有目共睹,如基于生命科學中的基因組、轉錄組、蛋白質組、代謝組、表觀遺傳組數據等探索其中蘊含的規律,并建立多個大型國際數據共享平臺,為進一步發掘生命科學的奧秘奠定基礎。而大數據技術在生命科學領域的應用也給醫學的發展帶來了機遇[2],它可以將傳統醫學所提供的“碎片化”知識信息拼湊、聯系起來,由此我們才有可能更深入了解生命或是疾病展示給人類的、全面的、完整的真實圖景。
至于大數據應用的條件,首先是信息技術的應用和互聯網的發展,借助信息化、集成化技術,建立數據共享平臺;其次要同時發展交叉學科,充分利用云計算、人工智能技術等來更好地實現大數據的價值。而針對醫學領域,醫學術語的標準化和集成、融合技術、醫學大數據表述搜索與存儲訪問技術,組成大數據中心和知識庫構建及服務技術等[3]。
1.2 中醫診斷的發展現狀 中醫診斷是中醫認識和治療疾病的橋梁與依據,中醫診斷的客觀化、標準化研究,也是發展中醫、使中醫走向世界的關鍵內容。眾所周知,傳統中醫診斷不論是通過四診(望聞問切)收集的癥狀或者體征,還是通過整體觀念、辨證分析得出的證候特征、證型的診斷等方面信息,主觀性較強,可重復性較差。
隨著計量診斷、計算機診斷技術的發展,以及交叉學科的充分應用,中醫診斷在四診客觀化、證候標準化方面取得了不小的進展。如中醫舌診、脈診、問診等方面均進行了計量診斷方面的研究與臨床應用[4-5]。大數據時代的到來,無疑是中醫診斷客觀化和證候標準化發展的春天。
2.1 中醫四診客觀化 中醫四診客觀化研究就是對四診要素的定性和定量化研究,用客觀指標量化中醫四診內容,以使得出的診斷盡可能擺脫主觀因素的干擾而貼近疾病的本質[6]。隨著現代科技的發展和應用,以及生物醫學、色度學、計算機技術等在中醫領域中的應用,使中醫診斷客觀化成為可能,而大數據的應用將是其發展進步的強大推動力。
我們課題組[7]通過調研收集了臨床各科包括內、外、婦、兒常見病的常見癥狀,同時結合相關文獻及醫案,參考臨床專家意見,總結出常見癥狀460個,并分為主要癥狀、次要癥狀,且每個癥狀又分有、無2級。采取人機問答的形式,由測試人員與患者共同進行臨床檢測,對1 767例臨床患者進行測試,通過與專家判讀對比分析,發現該系統的符合率達90%,具有良好的穩定性[8],成功建立了數字化中醫問診診斷系統。王祉等[9]運用上海中醫藥大學自主研發的中醫舌、面、脈診數字化檢測儀及Z-box脈診儀檢測符合納入標準的36例冠心病患者,通過軟件分析獲取舌、面、脈診圖像參數,包括RGB色彩空間的R(red,紅色)、G(green,綠色)、B(blue,藍色)值,以及HSV顏色空間的H(hue,色調)、S(saturation,飽和度)、V(value,明度)值。經過中藥治療后的舌診圖像參數R、G、B、H、V值呈現下降趨勢,說明治療有效,患者的舌色由深轉淺,由暗轉明。脈診參數、主波上1/3高度處的寬度值與脈動周期的比值呈現下降趨勢,表示患者的血管壁彈性得到了改善。
中醫四診采集技術和方法的開發以及深入研究,為運用大數據提供了基礎數據支撐,經過大數據的處理和分析,反過來更好地指導四診技術的研發,進而促進中醫四診的客觀化發展,這是反復驗證和學習的過程。
2.2 中醫證候標準 運用現代數理統計分析方法對建立疾病基本證型的辨證標準有很大幫助,每個證候所對應的數值可構成大數據的基礎數據,從而打開了中醫證候與大數據結合的窗口。探索數據呈現的相關關系,是大數據的優勢;對中醫證候標準的問題進行定量分析等,是大數據與中醫學及計算科學相結合的新的應用。其減少了偏倚,提高了證候標準研究結果的客觀性和科學性。
我們課題組[10]制作了充血性心力衰竭(congestive heart failure,CHF)中醫證候量表,該證候量表包括9個維度、28個癥狀變量,收集多中心CHF住院患者450例用于量表的信度(克朗巴赫 α系數、Kappa值)、效度評價(各條目與維度之間的相關系數、因子分析),結果顯示該量表很大程度地包含了CHF常見證候的相關臨床癥狀信息,達到臨床測量的要求,可以應用到CHF患者中醫證候的臨床判定或者評價中。同時,我們課題組[11]應用該量表探討CHF氣虛血瘀證的中醫診斷標準,多中心采集臨床病歷750份,綜合篩選出該證候相關的條目與主、次癥;應用條件概率換算方法為相關條目賦值;結合受試者工作特征曲線確定本病證的臨床診斷界值,應用四分位數間距法確定證候輕中重程度;運用均值描述腦鈉肽參考范圍,完善其臨床診斷標準。
李毅等[12]為了探究乙型肝炎后肝硬化常見證候特異性的癥狀指標,運用主成分分析來綜合整理乙型肝炎后肝硬化各證的癥狀;而運用多元Logistic回歸模型判別分析,篩選出乙型肝炎后肝硬化證候的主、次癥狀:初步得出乙型肝炎后肝硬化5種基本證型的辨證標準。
2.3 證候類型與實驗指標關系 應用現代先進的實驗方法與儀器,有研究者探索了中醫證候類型與實驗室指標的關系,通過對大數據的分析,探討相互之間的關系,進一步探究證候的實質和生物學基礎。
陳昌華等[13]臨床收集27例肝血虛證患者,對每個患者的15項指標進行抽血檢測,運用多因素聚類分析方法,對典型的指標進行篩選,認為血漿去甲腎上腺素、三碘甲狀腺原氨酸下降以及血栓烷B2、細胞內環磷酸鳥苷、醛固酮升高可考慮為臨床肝血虛證的診斷參考指標。張盛杰等[14]為建立慢性乙型肝炎(chronic hepatitis B,CHB)中醫辨證規范,采用多中心、大樣本的流行病學調查方法,系統規范化采集CHB患者實驗室指標、生存質量量表等信息,并進行 Kappa檢驗,建立 SPSS數據庫,結果顯示CHB各證型與實驗室指標及生存質量積分之間存在一定的相關性。
迄今為止,探討中醫證候類型與實驗室指標關系的研究甚多,但突破性研究成果較少。如何綜合、合理運用大數據,應是今后研究者思考的一個問題。2.4 指導臨床治療 通過多元分析的方法,更加客觀揭示臨床辨證論治的優勢和特點,而結合應用大數據能讓獲得的基礎數據更加準確和客觀。其為臨床治療提供了有價值的證據。
我們課題組[11]根據CHF中醫證候量表、條目賦值表以及百分制換算,確定了氣虛血瘀證的臨床診斷界值為52分,其中52~58分為輕證、59~70分為中等程度證候、71~100分為重證,腦鈉肽參考值為209.33~316.57 pg/mL。臨床研究證明該診斷標準靈敏度、特異度、準確度均較高,具有較好的臨床適用性。
計算機和人工智能技術的廣泛應用,給大數據應用于生命領域研究提供了機會。由于信息技術的應用和互聯網的發展,生物醫學研究所能面對的數據量極度增加,這給大數據的充分應用提供了平臺。當然也為醫學信息化和醫學研究提出了新的要求[15]。基于計量診斷和多元統計方法等在中醫診斷發展的速度和潛力,使得大數據在中醫診斷中應用的可行性大大提高,尤其體現在中醫四診客觀化、中醫證候標準、證型與實驗指標關系以及指導臨床治療等幾個方面。
大數據與多元統計方法的結合能更好地服務于中醫診斷學,是實現中醫診斷客觀化、證候標準化的一種必然趨勢,是中醫走向世界、被世界認識和理解的途徑,也是中醫發展和創新的需求。但是大數據在中醫診斷中的應用仍存在很多問題,如臨床數據共享和標準統一以及要具體到中醫術語標準化、診療對應體系等一系列的數據化處理。一方面要加強中醫診斷相關大數據的整合與共享,包括把問診、處方以及治療信息電子化錄入,建立大數據的共享平臺,實現社區、醫院、區域的醫療數據共享系統;另一方面要加強信息技術與中醫基礎研究的融合,實現科研基礎數據、臨床診療數據的完美連接。有一點需要強調和說明,在應用大數據發展中醫診斷的過程中,應以中醫理論為指導,否則便失去了應用大數據的真正意義。
[1]董曉婷.大數據的定義特征及其應用分析[J].硅谷,2013,6(11):120,60.
[2]王震寰.計算醫學——應對大數據的挑戰向臨床轉化[J].蚌埠醫學院學報,2014,39(1):1-2.
[3]張建英,何建成.大數據在中醫學中應用的可行性分析與展望[J].中華中醫藥雜志,2017,32(1):17-20.
[4]周小青,吳正治,劉建新,等.常見舌苔舌上皮細胞化學的定性定量研究[J].中國中醫藥科技,1994,1(4):3-6.
[5]邊振,辛超,臧翠翠,等.淺析中醫脈診客觀化的新思路[J].遼寧中醫雜志,2015,42(1):70-71.
[6]王常松.對中醫“四診”客觀化研究的思考[J].中國中醫基礎醫學雜志,2009,15(2):85-86.
[7]梁建慶,何建成.基于數字化系統的中醫問診診斷客觀化研究[J].中華中醫藥雜志,2014,29(5):1534-1538.
[8]丁宏娟,何建成.計算機中醫問診系統的臨床驗證研究[J].遼寧中醫雜志,2010,37(11):2138-2139.
[9]王祉,董夢青,王憶勤,等.基于舌、面、脈診圖像參數的冠心病中醫療效評價研究[J].中華中醫藥雜志,2015,30(3):693-695.
[10]李小茜,劉偉,何建成,等.充血性心力衰竭中醫證候量表的信度與效度評價[J].中醫雜志,2015,56(7):594-597.
[11]李小茜,何建成,黃品賢,等.基于臨床流行病學調查的充血性心力衰竭氣虛血瘀證診斷標準[J].中國老年學雜志,2016,36(2):308-311.
[12]李毅,劉艷,寇小妮,等.基于多元統計方法對乙肝后肝硬化辨證標準的研究[J].中醫藥導報,2012,18(7):7-10.
[13]陳昌華,石林階,舒毅剛,等.肝血虛證15項實驗指標同步檢測的分析[J].湖南醫科大學學報,2001,26(4): 337-339.
[14]張盛杰,孫蓮娜,薛建華,等.慢性乙型肝炎中醫證型分布規律規范化初探[J].中西醫結合肝病雜志,2010,20 (6):324-328.
[15]李國棟.大數據時代背景下的醫學信息化發展前景[J].硅谷,2013,6(19):7-8.
The feasibility and prospect of the big data app lication in TCM diagnosis
WANG Li,HE Jiancheng
(Department of Diagnostics of Chinese Medicine,Shanghai University of Traditional Chinese Medicine,Shanghai201203,China)
The arrival of the era of big data has a significant impact on biomedical research. Traditional Chinesemedicine(TCM)diagnosis is the core and key of TCM theory and clinical research.The auther summarizes the big data and TCM diagnosis,feasibility of the application of big date in TCM diagnosis(the objective study of TCM four diagnostic methods,to investigate the syndrome criteria,the relationship between the syndrome type and the experimental index,and clinical treatment of TCM).It is believed that the quantitative diagnosis of TCM syndromes and the quantification ofmultivariate statisticalmethods are the basic elements for the formation of large data.The application of big data is the driving force of objectification and standardization of TCM diagnosis.
Big data;Traditional Chinese Medicine diagnosis;Feasibility;Prospect
R241
A
2095-3097(2017)02-0065-03
10.3969/j.issn.2095-3097.2017.02.001
2017-02-28 本文編輯:徐海琴)
“十二五”國家科技支撐計劃項目(2012BAI25B05);上海市衛生系統優秀學科帶頭人培養計劃資助項目(XBR2011070)
201203上海,上海中醫藥大學中醫診斷學教研室(王利,何建成)
何建成,E-mail:hejc8163@163.com