胡慧菁,羅家祺,劉苓霜,陳伯平,胡 菲,趙福東,姚永華
(1上海市市東醫院,上海200438;2上海中醫藥大學附屬普陀醫院中醫科,上海 200062;3上海中醫藥大學附屬龍華醫院,上海200032)
互聯網的發展加快了信息化向社會各方面和人們日常生活的滲透。2012年3月,奧巴馬[1]政府發布《大數據研究和發展倡議》,并將為此注資2億美元,這意味著美國政府對“大數據”的關注和重視,同時也昭示著“大數據”時代已經來臨。大數據技術可運用到各行各業。在醫療領域,醫療信息也是數據產生集中的地方,我國也很重視中醫醫療信息的數據挖掘。據報道[2],2012年廣州中醫藥大學附屬第一醫院在IBM公司的幫助下,搭建了國內第一個中醫行業運營數據分析系統,開創性的引導和促進醫療業務的數據分析和廣泛的業務洞察力。結合中醫文化傳承,其中的中醫文獻和中醫臨床中蘊含著豐富的文化內涵和醫療信息,這些固有的文化需要我們進行深入挖掘、傳承和發揚。
中醫文化有幾千年的歷史底蘊,在中醫藥的各個方面都有體現,主要通過中醫文獻的記錄和研讀,中醫臨床的師承和實踐的方式傳承。中醫以中華文化為背景,文獻內容、思維習慣和表達方式必然帶有中華歷史文化的蹤影。先秦時期,墨子就曾提出三表法。其第一表“本之于古者圣王之事”,即強調辨析事物首先要考察歷史。每次診察后要想制定較為周密有效的治療方案必須先了解以往醫案記錄的治療情況。文獻研究與臨床有著密不可分的聯系,可以說中醫文獻源于中醫臨床而又高于臨床。
一方面,中醫臨床中的病案、臨證經驗是中醫文獻的主要來源。文獻研究不僅是單純臨床中文字的提煉與整理,而且是人們從寶貴的臨床經驗中分析、總結出來的最精練的部分加以提升,逐步上升歸納為理論。中醫理論的形成都是通過臨床觀察、認識、實踐,然后再觀察、再認識、再實踐這樣歷代傳承性觀察認識總結歸納而成,由于有這種歷史傳承,所以我們要對中醫文獻進行研究。
另一方面,中醫文獻指導并啟發中醫臨床。中醫以中華文化為背景,文獻內容、思維習慣和表達方式必然帶有中華歷史文化的蹤影。就如中醫臨床每次診察若要想制定較為周密有效的治療方案必須先了解以往的治療情況。中醫文獻中的醫案就如同我們臨床醫生的多位導師,因為有了這些巨人的肩膀,臨證才能胸有成竹。
如果我們要更好地傳承和發揚中醫文化就必須深入挖掘中醫文獻和臨床中的精華。從大量醫療數據中提取相關信息,運用計算機分析并處理,發現其中隱含的客觀規律。通過建設支持醫療決策的信息資源庫把文獻信息和臨床信息綜合轉化為能夠服務臨床的數據,從而指導現代中醫臨床,發揚中醫文化。在大數據理論的啟發下,2012年國家科技部開展了“中醫藥基礎學科名詞術語規范研究項目”[3]。該項目對10個中醫學子學科的8000條名詞術語進行規范化整理分析,建立同義詞數據庫,從而創新的開展了中醫大數據研究的一個范例。
什么樣的數據能稱為大數據,它與中醫數據有何相關性?帶著這個問題我們查閱了相關文獻。麥肯錫公司指出大數據是超過普通數據庫軟件工具采集、存儲、管理和分析的海量數據集合[4]。高德納(Gartner)信息咨詢公司則把大數據簡單定義為龐大、多樣和復雜的信息[5]。維基百科給我們一個較全面的定義:大數據指在通常情況下無法用常規的數據庫管理工具和數據處理軟件進行采集、管理、存儲、檢索、共享、傳遞、分析和可視化處理的大型和復雜數據集合[6]。從其特點來看,表面上來說,大數據是指超出常規電腦內存處理能力的巨大的信息量[7],其具有整體數據、模糊數據、相關關系數據這三大特征。更有直觀的說法,大數據具有容量大、種類多、流動性大、高價值的特性[8]。 外國學者[9]認為,大數據具有全面性、模糊性,通過數據的分析探求因果關系,其核心就是通過相關關系的分析來預測事物的變化發展規律。而中醫的數據或者說中醫藥信息也有相似之處。崔蒙等[10]分析中醫藥信息具有認識論信息、現象信息、整體信息、時間信息四個特征。朱毓梅等[11]認為中醫的相關性思維方式與大數據的思想方法存在一致性。因此主張對大量不同中醫專家的診療信息數據上進行大數據的分析,可以構建具有預測功能的專家診療系統。在此方式方法的指導下,可以構建龐大的中醫古籍數據庫,并進行大數據分析下的知識發現,從而對中醫知識進行提煉和升華。中國中醫科學院常務副院長劉保延的觀點認為,從中醫的角度來認識,大數據就是多樣、海量、動態的信息,其內容包括患者的運動方式、狀態及其空間的性狀態勢(癥狀、體征、理化特性),運動在時間上的過程及規律(如實時、動態、縱向、反應)等,以及中醫治療(中藥、針灸、推拿等)[12]。所以我們認為中醫的大量文獻和臨床數據具有大數據的特點,其中包涵了很多中醫文化的精髓。我們要把這種文化傳承和發揚下去就可以通過數據挖掘的方式提煉并發現其內在規律性。
打造信息化平臺是適應人民群眾不斷增長的健康需求的需要,是符合醫學模式與理念轉變的需要,是適應大數據時代到來的需要,是更好地傳承中醫文化的需要。中醫學具有整體觀特點,認為人是一個整體,人與自然也有密切聯系,天人合一。臨床又需辨證論證,因人因地制宜,開展個體化診療。中醫的這種整體而又辨證思維方式無處不在,這就對理論的總結、標準化數據的收集帶來了一定難度。中醫文獻和臨床中收集的數據具有整體性,不是樣本而是總體。它在把握個體信息時,強調的是天地人三者合一,得到的是所有與個體相關的信息中醫臨床對名老中醫經驗的傳承尤其需要中醫文獻和大數據技術的支持。然而中醫工作者收集信息手段相對落后,沒有要求過多的精確性。中醫辨證論治的基礎是發現個體的各種信息間的關系,通過這種關系能幫助判斷證候、治則和處方用藥。
有人已經在文獻研究中進行了數據挖掘的嘗試,通過對古代書籍中治療專病的方藥進行數據分析,發掘治療該疾病的中醫治療規律。例如張偉等[13]對《乳腺病奇效良方》中治療乳腺增生病的156首藥方進行單味中藥使用頻率和藥類、藥性、藥味、歸經的頻次分析,研究得出臨床辨證治療該專病的的用藥規律和依據。也可以利用大數據技術對文獻中某一具體方劑的用藥規律進行研究,發掘其中對臨床有用的中醫藥信息,例如李廷保[14]對清代以前古醫籍中“龍膽瀉肝湯”的研究,有助于認識龍膽瀉肝湯組方用藥的歷史源流,為臨床辨治濕熱疾病提供更好的用藥規律和用藥依據。
在大數據大潮的推動下,楊薇等[15]認為現代的中醫研究應該利用先進的大數據方法,將醫療實踐與科學計算相結合,以人為本,提出問題,然后以數據為依據,推動從臨床到臨床的真實世界的中醫臨床科研形式。也就是利用大規模的臨床診療實踐產生的海量數據進行真實的數據研究,推動臨床實踐下的科研工作,以推動中醫臨床的科研工作,并反饋到臨床實踐的循環進步模式。近年來計算機整理中醫臨床醫案工作已開展,并取得了一些成果。吳中平等[16]開發的醫案查詢統計分析系統,利用計算機統計技術,對古今醫案進行開放性的研究統計,按專用主題詞進行查詢,并可以按癥狀、病機、治法、藥物等方面進行統計分析,有利于開展大規模臨床研究。如果能在此基礎上,根據大數據的思想不斷擴大數據庫內容,乃至海量的級別,其使用價值將很大。鄭健等[17]利用大數據的計算機理論幫助,建立了名老中醫醫案研究應用系統,創造性地將現代名老中醫的臨床醫案和中醫經典文獻進行關聯性研究,為學者留下了探索空間。李健等[18]通過中醫傳承輔助系統軟件挖掘《中醫方劑大辭典》中治療肺癰的方劑組方規律,實現對藥物之間關聯性的定量描述、核心組合演化與提取、新處方發現等功能。采用大數據強調相關性分析的方法可以提取低頻次高相關的組合,更適合發現與挖掘中醫臨床和文獻中的隱形經驗。臨床研究是相對復雜的,但也有不少前輩做了很多嘗試,周雪忠等[19]利用復雜網絡中無尺度網絡特性對北京市地區20余位名老中醫門診病例進行核心處方配伍結構分析,發現了他們治療疾病的核心藥物、配伍結構及用藥思路。宋觀禮等[20]利用數據挖掘方法對臨床的1265例冠心病患者病因、癥狀、證候及方藥進行了分析,發現其中的規律。這都有助于我們提煉名老中醫經驗并研究專病治療診療方案。
為了醫案留存的客觀化和易操作性,我們打算以數據挖掘的方式對名老中醫的醫案進行保存和分析。根據現有文獻采集和數據挖掘的方法需要通過以下步驟開展。首先要做好數據準備。①數據的選擇:搜索名中醫有關的數據信息,并從中選出適用于數據挖掘應用的數據。例如:病名、癥狀、證型、病位、病因、病機、方名、藥名等。②數據的處理:為了提高研究數據的質量,為進一步的分析作準備可以去除醫案中的重復描述。③數據的轉換:數據表達方式或類型的變換。如對藥物劑量的統一量化、病名、病因、病機、病位、證型、等內容需一致化。第二步,要開展數據挖掘。可以和信息科合作對所整理得到的數據進行挖掘,主要是完善和選擇合適的挖掘算法。第三步,對結果統計分析。希望通過數據統計、分析解釋中醫臨證用藥規律,對不同數據采用與其相適應的統計分析方法。第四步,總結中醫用藥規律。將數據挖掘所得到的內容分析總結出規律性的內容形成中醫文獻,并再運用到中醫臨床中去,將老中醫的臨證經驗進行傳承,從而指導臨床。
中華文化是中華民族生生不息的不竭動力,海派中醫需要我們有包容的心去接納大數據時代的到來。中醫的傳承和創新更需要應用現代數據挖掘方式,把我們中醫臨床和中醫文獻中的內容進行去蕪存菁,使之與現代社會相協調,保持民族性,體現時代性。只有積極地挖掘傳統中醫文化中的有益成分,才能更好的開展中醫的傳承與創新,從而為改革開放和現代化建設提供精神動力和智力支持。
【參考文獻】
[1]Ackerman MJ.Computer briefs: Big data[J].J Med Pract Manage,2012,28(2):153-154.
[2]潘 文,程 濤,牛崇信,等.大數據時代中醫藥信息的應用[J].中國中醫藥圖書情報雜志,2014,38(1):2-4.
[3]吳瀟湘.中醫藥基礎學科名詞術語規范研究啟動[J].中醫藥管理雜志,2012,20(4):345.
[4]Manyika J, Michael C, Brown B, et al.Big Data: The next frontier for innovation,competition,and productivity[R].McKinsey Global Institute,2011.
[5]Gartner.Big Data[EB/OL].http://www.garmer.com/technology/topics/big-data.jsp,[2013-5-20].
[6]Wikipedia.Big Data[EB/OL].http://cn.wikipodia.org/wiki/Big_data,[2013-5-20].
[7]崔 蒙,李海燕,雷 蕾,等.“大數據”時代與中醫藥“知識密集型”數據[J].中國中醫藥圖書情報雜志,2013,37(3):1-3.
[8]韓翠峰.大數據帶給圖書館的影響與挑戰[J].圖書與情報,2012(5):37-40.
[9]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2012:18-42.
[10]崔 蒙,尹愛寧,李海燕,等.論建立中醫藥信息學[J].中醫雜志,2008,49(3):267-269,278.
[11]朱毓梅.大數據時代背景下中醫古籍面臨的機遇與挑戰[J].中國中醫藥圖書情報雜志,2014,38(3):12-14.
[12]蘇 暄.大數據,帶來中醫個體化診療新視域?——訪中國中醫科學院常務副院長劉保延[J].中國醫藥科學,2015,5(1):1-3.
[13]張 偉,楊世寧,李廷保.基于數據挖掘對中醫藥治療乳腺增生病配伍規律的研究[J].中國中醫藥科技,2012,19(6):572-573.
[14]李廷保.基于數據挖掘對古醫籍中龍膽瀉肝湯用藥規律的研究[J].中醫藥學報,2012,40(4):60-61.
[15]楊 薇,崔英子,楊海淼,等.醫療大數據在中醫藥研究領域的應用與思考[J].長春中醫藥大學學報,2016,32(3):625-627.
[16]吳中平,何新慧,柯雪帆,等.醫案查詢統計分析系統介紹[J].上海中醫藥雜志,2003,37(3):54-56.
[17]鄭 健,林丹紅,李其鏗.基于本體的名老中醫醫案研究應用系統[J].福建中醫學院學報,2008,18(6):48-50.
[18]李 健,盧 朋,唐仕歡,等.基于中醫傳承輔助系統的治療肺癰方劑組方規律分析[J].中國實驗方劑學雜志,2012,18(2):254-257.
[19]周雪忠,劉保延,王映輝,等.復方藥物配伍的復雜網絡方法研究[J].中國中醫藥信息雜志,2008,15(11):98-100.
[20]宋觀禮,劉保延,王映輝,等.基于中醫臨床科研信息一體化技術平臺的冠心病診治規律研究[J].中華中醫藥雜志,2013,28(5):1247-1252.