郭義王 江陳波



摘要 21世紀是信息科學時代,信息的載體就是數據。計算機等學科的迅猛發展,為針灸學領域儲備了大量的數據,但是這些數據背后蘊含哪些尚未發現的特征與規律,缺乏系統深入的挖掘研究,嚴重制約了針灸學的學科發展。作為傳統針灸學與現代科學相結合而形成的新興前沿交叉學科,計算針灸學應運而生,以針灸學中的現象和規律、理論作為研究對象,以解決針灸醫學的關鍵科學問題和提高針灸臨床療效為最終目標,為針灸科學研究鋪開一條多學科交叉融合的高速路。
關鍵詞 大數據;計算科學;計算針灸學;針灸學
Abstract The 21st century is the era of information science and the carrier of information is data. With the rapid development of computer science and other disciplines, a large amount of data has been reserved for the field of acupuncture. However, there are still undiscovered features and laws behind these data, and the lack of systematic and in-depth mining research, which seriously restricts the discipline development of acupuncture. As a new frontier interdisciplinary subject formed by the combination of traditional acupuncture and modern science, computational acupuncture has emerged as the times require. It takes the phenomena and laws in acupuncture as the research objectand aims to solve the key scientific problems of acupuncture medicine and improve the clinical efficacy of acupuncture. Computational acupuncturepaves a multi-disciplinary and cross fusion highway for the research of acupuncture.
Keywords Big data; Computational science; Computational acupuncture; Acupuncture
21世紀是信息科學時代,信息是數據的含義,數據是信息的載體。計算機等學科的迅猛發展,為各個領域儲備了大量的數據。但是這些數據背后蘊含的大量新信息、大量新知識,由于缺乏系統深入的分析挖掘發現,仍然沉睡在不被人們關注的角落。而大數據、人工智能等數據處理新技術的產生,使人們的世界觀、思維方式發生著巨變:第一,人們不再僅僅依靠隨機樣本的小數據,同時關注全樣本的大數據。第二,不再只追求數據的精確性,同時也容忍數據的混雜性。第三,不再只是渴求找到線性的因果關系,同時也讓數據自己“發聲”,展示其中復雜的相關關系。隨著新系統、新工具、新模型的大量涌現,計算科學就應運而生。計算科學(也稱科學計算Scientific Computation或SC)是使用強大的計算能力來理解和解決復雜問題的學科。計算生物學就是計算科學的重要分支[1]。
計算生物學(Computational Biology)是開發和應用數據分析及理論的方法、數學建模、計算機仿真技術等,用于生物學、行為學和社會群體系統研究的一門學科。運用計算生物學,科學家有望鑒定基因和生物通路在健康和疾病中的角色,挖掘它們與環境因素之間的關系;發展、評價以及應用以基因組為基礎的診斷方法來預測對疾病的易感性,預測藥物反應,發現疾病的早期診斷標記、疾病在分子水平上的發展機制;應用基因組和代謝通路的知識,通過分子模擬等方法進行計算機輔助藥物設計,縮短新藥開發周期,從而開發有效的、新的疾病治療方法;發展基于基因組的工具來改善大眾的健康狀況,從而促進人類基因組計劃,造福于人類。分子模擬和計算機輔助藥物設計是當前計算生物學研究的一個熱點,也是計算生物學與生物醫藥產業結合最緊密的方向之一。中國科學院上海藥物研究所率先在國內將高性能計算應用于分子模擬和開展藥物設計研究,發展了復雜生物大分子體系理論計算方法,進行了復雜生物大分子長時分子動力學和變構動力學模擬;并在分子模擬的基礎上對30余種重要靶標進行了藥物設計研究[3]。
針灸學作為中醫學的重要組成部分,從“天人合一”的高度,將自然界對人有益的干預與人運動狀態與運動方式結合,構建了“以外踹內”“整體調節”“個體診療”的理論體系和豐富的健康維護方法,形成了“真實世界臨床科研的范式”,在疾病醫學暢行的今天,中醫針灸獨具特色與優勢。但由于中醫針灸學是一個“天人合一”的開放復雜巨系統,從人的現象入手,研究人的狀態與自然界干預的關系,只有借助“計算科學”的手段和方法,才能使其個體化診療背后所蘊含的規律、新的信息、知識被重新發現和認識?;谝陨系拇罂茖W背景,一門新的學科——計算針灸學孕育而生了。計算針灸學的創立,是針灸學發展的客觀要求和必然。它豐富了針灸學內涵,促使幾千年來從臨床實踐發展起來的針灸醫學走上一條臨床實踐、科學實驗、數據計算三輪驅動的新階段,必將推動針灸學的快速發展。
1 計算針灸學是針灸學發展的客觀要求
幾千年發展起來的針灸學是以中醫理論為指導,通過觀察的方法,通過長期實踐經驗積累,研究經絡、腧穴以及刺灸方法,探討運用針灸防治疾病規律的一門學科[4],醫學實踐中積累的經驗與古代哲學思想融合所形成的理論體系是它歷久彌新的基石[5]。
20世紀現代科學技術迅猛發展,應用不同的實驗方法與技術對經絡現象、針灸作用原理進行探索,實驗針灸學在歷史潮流驅動下應勢而生,1983年,天津中醫學院(現天津中醫藥大學)創建了實驗針灸學新學科,標志著實驗針灸學學科體系的正式確立。實驗針灸學是在中醫理論指導下,應用現代科學技術與實驗方法,研究針灸理論、作用機制和作用原理,指導臨床實踐的一門學科[6]。它是針灸學吸納現代科學的方法和成果而形成的新興交叉學科,是針灸學科的重要分支。
21世紀基于數據驅動的計算生物學、計算藥學、計算神經精神病學、計算社會學等學科的創建和發展方興未艾。針灸學已經應用于臨床500多種疾病的治療,廣泛應用的電子病例記錄和蘊含了大量的針灸臨床診療經驗以及新方法、新技術和新的認識,基于8 000多冊古代醫籍和浩瀚現代文獻所建立的古今文獻數據庫,與大量的動物試驗、人體試驗所產生的針灸對基因組、蛋白組、代謝組影響的數據資源,以及生物醫學已經建立的各種組學數據庫,已經使針灸學擁有了大數據4V特點:
1)Volume:龐大的數據量——針灸研究已有一定的積累。
2)Velocity:數據的快速流轉、動態體系——針灸電子病歷、針灸研究的文獻、針刺信息傳遞復雜性、針灸動態調節、針灸網絡調節、針灸走向世界等,所獲數據都具有快速流轉、動態體系等特點。
3)Variety:數據多樣性——針灸不但具有大量的文本數據、圖像數據、音像數據;檢測數據、監測數據;人體試驗數據、動物試驗數據、古代文獻、現代文獻的數據等等,可以說針灸具有各種類型的數據。針灸大數據具有多樣性的特點。
4)Value:數據的巨大價值,再利用、再分析——針灸干預與操作者的經驗密不可分,使用方法與手法操作多樣,取穴靈活多變(辨經、辨位、辨證、辨因都有),針灸操作強調“治神”,醫患互動是關鍵,來自于各方面的針灸數據各方面的關系錯綜復雜,但蘊含著中醫針灸醫師對古代、前人智慧的理解、體驗,蘊含著繼承與創新的結合,其中許多新的發現、新的技術、新的思路淹沒其中。這正是計算針灸學要做的,通過數據再分析,發現新規律、新機制,預測新趨勢等等。
2 計算針灸學的創立,是針灸學發展的必然規律
人體是一個以五臟為中心,通過經絡的聯系而形成的有機整體。人體本身就是一個復雜系統,各個細胞、組織、器官以至各個生理系統之間都是相互關聯的。中醫的經絡也是一個復雜網絡調節系統。針灸一種非特異性物理刺激,會引起機體方方面面的整體變化,故針灸的實質就是一個物理刺激激發機體的整體綜合調節反應,激發機體最大的調節潛能,達到防治疾病的作用。具體來說,針灸本身具有復雜干預的屬性,從干預方式來說,就有針刺、艾灸、拔罐、放血、皮膚針等多種方式,單就針刺來說,又有各種針刺手法,如提插補瀉、捻轉補瀉、呼吸補瀉、迎隨補瀉等、手法不同,效應不同。影響針灸效應的因素很多,疾病的狀態、穴位的選擇、刺法灸法、時間因素等等,因此,針灸具有復雜多因素干預的本質屬性,決定了針灸研究必須應用新的方法,計算科學就是重要方法之一,計算針灸學的發展就成了針灸發展的必然。
針灸作用具有小刺激、大反應的特點,針灸的作用最本質的特點就是調節,具有整體調節、網絡調節、品質調節、雙向調節、自限調節等特點[4]。從復雜系統的角度研究針刺的治療規律和機理,這也是中醫整體觀念的精髓。因此,針刺效應的生物學基礎需要從宏觀、整體、系統和動態的角度來認識。以系統生物學理念為指導,發揮多學科交叉優勢,將穴位局部、外周、中樞、靶器官途徑與整體、系統、器官、組織、細胞、分子水平研究相結合,是穴位效應和穴位配伍研究的趨勢所在,也是計算科學的優勢特色領域。
計算針灸學基于大數據,通過知識發現建立假設和構建數學模型,進行計算機仿真并進行檢驗,與臨床和實驗觀察結果進行比較分析,一方面預測和指導進一步的臨床和體內體外實驗研究,另一方面從新的實驗數據中重新進行知識發現、修正假設、完善數學模型,最終闡明針灸理論和針灸干預生命活動的現象、規律和機制。計算針灸學可整合多層次海量數據,進而獲得針灸的可理解的規律性認識,可反映針灸作用蘊含的普遍生物學基礎,從而避免個體差異性??蓪嶒灛F象高度抽象化,源自實驗但又高于實驗??梢姡嬎汜樉膶W是以中醫針灸學理論為指導,基于數據驅動,研究針灸作用理論、針灸作用規律和針灸作用原理,指導臨床實踐的一門新興交叉學科。是針灸學發展的必然。
3 針灸學、實驗針灸學和計算針灸學的關系
以臨床實踐和觀察方法發展起來的針灸學,建立了針灸學基本的理論和技術體系,是實驗針灸學和計算針灸學創建的基礎,也是實驗針灸學和計算針灸學發展的源泉和指引;以現代科學技術和實驗方法發展起來的實驗針灸學,在傳統針灸學指導下,研究傳統針灸學“為何”治病的現代科學基礎,也是計算針灸學創建的基礎;計算針灸學以傳統針灸學為指導,以計算科學的方法,以數據驅動,開發和應用數據分析及理論的方法、數學建模和計算機仿真技術,用于針灸學研究(針灸理論、針灸技術、針灸作用規律和原理),是用計算方法來管理、分析針灸數據并從中挖掘發現知識的一門學科,最終指導臨床實踐,從而解決針灸“為何”“更好”治病等問題。計算針灸學是傳統針灸學和實驗針灸學的發展。
實驗針灸學利用現代科學技術和實驗方法對傳統針灸學的理論、作用規律與原理等內容進行實證研究,獲取的實驗數據可為計算針灸學提供信息來源。計算針灸學是將海量的針灸古籍信息、過往針灸研究數據以及最新實驗所獲得的信息作為數據源,以針灸學問題構建數學模型,通過計算的方法分析針灸的作用規律與原理,預測針灸最佳適應病癥及最優干預方案。計算針灸學提出實驗及可驗證的假說,用以指導實驗。計算針灸學側重于計算,通過模型構建和計算仿真,研究針灸基本理論、針灸作用原理、針灸作用規律等內容。計算針灸學與實驗針灸學兩者相輔相成,互為補充,計算針灸學需要實驗提供數據與驗證,實驗針灸學需要計算提供分析與挖掘,計算針灸學重在回答發生或可能發生什么,而實驗針灸學重在回答為什么發生。
5.2 研究針灸作用規律機器學習(Machine Learning)是一門專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能的學科[18]。1959年美國的塞繆爾(Samuel)設計了一個下棋程序,這個程序具有學習能力,它可以在不斷的對弈中改善自己的棋藝。4年后,這個程序戰勝了設計者本人。又過了3年,這個程序戰勝了美國一個保持8年之久的常勝不敗的冠軍。在過去,數據分析比事后分析更為重要,事后分析就是“已經發生的事情”。未來的預測本質上仍是歷史分析。人工智能和機器學習正在幫助開拓一個新領域:“將要發生的事情,或者至少是“可能發生的事情”。此外,還可以教會機器學習算法基于前瞻性的見解做出決策或采取行動。
機器學習已應用于中醫藥相關規律的研究。其中,傳統機器學習算法為中醫癥狀、癥候和證型辨別的客觀化以及中醫藥內在規律的挖掘與發現提供了技術支持。如馮冰等對脈診儀采集的脈診數據先進行雙樹復小波變換,再通過梅爾倒譜系數進行特征提取,最后使用Fuzzy c-means聚類算法進行聚類分析,對脈象的識別準確率可達78.2%,一定程度上可避免醫生主觀判斷對脈象識別的影響[19]。潘主強等在以亞健康數據為主要研究對象,探索不均衡數據的機器學習分類方法;以腎臟疾病為主要研究對象,構建綜合了3種輔助診斷工具的混合分類模型;以心血管病、血脂異常疾病和尿酸升高類疾病為主要研究對象,研究多標記數據分類方法等相關實驗中均取得良好的病癥分類效果,且分類結果符合醫學理論,具有臨床指導意義[20]。裴衛等通過關聯規則、K-means聚類分析等無監督的機器學習算法對589首中醫治療肝病的處方進行了分析,發現機器學習的結果與藥物復雜網絡中的結構完全一致,應用機器學習探究中醫治療肝硬化的中藥組方規律確實可行[21]。
浩如煙海的針灸古典文獻是先人留給我們的防病治病智慧,現代的針灸臨床研究和真實世界的臨床病歷采集所積累的文獻蘊含著寶貴的臨床經驗,凡此等等都構成了針灸的大數據。大數據的價值在于數據分析以及分析基礎上的數據挖掘和智能決策,通過對數據的分析,發現數據的變化以及各數據間的相關性,挖掘以往被忽視的規律,獲得具有洞察力和新價值的新知識,實現對行為的決策和預測。
如我們采用機器學習的方法,對針刺治療疾病的選穴配伍規律等進行了研究。首先進行了針灸數據挖掘基礎詞庫的構建,建立了基于機器學習的針刺文獻數據庫,發現了單穴與配穴、局部配穴與遠近配穴的等針灸腧穴配伍的普適性規律。給出了針灸優勢病種中腧穴配伍處方的核心腧穴,研發了針灸臨床決策支持系統[22]。見圖2~4。
5.3 探索針灸作用機制針灸刺激具有復雜性,其復雜性使得針灸機制的研究開展面臨困難,難以用單一的、特定的生物靶點概括針灸的作用效果。如何為針灸治療尋找生物學特征,是計算針灸學的一個重要的任務。20世紀80年代末,北京醫學院針麻原理觀察組為了研究針刺穴位時的鎮痛規律,對正常人及神經系統疾病患者進行針刺對皮膚痛閾影響的觀察,發現進針后痛閾升高和去針后痛閾恢復均符合指數曲線形式,并進行驗證發現實際測得值和理論值相符,這是基于實驗數據通過計算對針灸作用規律和機制進行探討的有益探索[22]。針灸組學特征研究更是要計算,這包括從一系列針灸組學如穴位組學、針灸效應的表型組(Phenome)、基因組(Genome)、轉錄組(Transcriptome)、蛋白質組(Proteome)、相互作用組(Interactome)、代謝組(Metabolome)等。計算針灸學運用大規模高效的理論模型和數值計算來識別針灸干預機體后基因組、蛋白組、代謝組的變化;研究針灸作用后生物大分子之間相互作用以及生物大分子與配體的相互作用,模擬針灸后生命體內的信息流過程,從而認識針灸作用的規律,應用基因組和代謝通路的知識,通過分子模擬等方法進行計算機輔助針灸設計,開發有效的、新的疾病治療方法。無論是針灸本身的實驗數據挖掘,還是對針灸結果的進一步挖掘,提取特征規律都需要計算?;趯嶒炨樉牡臄祿?,探尋針灸作用的規律與機制是計算針灸學重要研究內容之一。
廣泛深入的數學建模及應用是計算針灸學的重要研究內容,計算針灸學要將眾多知識發現有機地整合起來,把來自各方面的因素聯系在一起,以定量的形式刻畫、從不同角度展現針灸激發生命現象的本質和治療疾病的規律,必然需要建立數學模型通過數學語言的抽象描述來實現。計算針灸學可在前人大量針灸研究基礎上結合現代最新實驗數據記錄,通過收集、整理、學習、分析、挖掘針灸蘊藏的豐富的信息資源,進而揭示針灸作用的客觀規律。
針刺效應機制的研究已從穴位局部、外周、中樞、靶器官不同層面開展了一些研究,取得了很多重要成果,但這些研究多為單一因素的研究,對穴位效應產生的各個環節尚未建立起相互聯系、相互影響的復雜網絡模型,缺乏系統的歸納和規律的提煉。如針灸是如何調節機體達到中和狀態的呢?這也需要計算針灸學。我們首先提出“三網聯動”說。見圖5。針灸啟動經穴小網絡,調動機體大網絡,調整機體病網絡,達到陰陽協調、氣血平和的中和狀態。具體來說,就是針灸作為一種創傷性物理刺激,首先激活了針刺穴位微環境小網絡,使針刺信息在穴位局部啟動并級聯放大,進而調動人體自身調節大網絡——神經—內分泌—免疫網絡(NEI網絡),經NEI調控,針刺效應信息輸出到靶器官,調整疾病網絡(病網絡),產生針灸療效。即針效的產生是針刺啟動穴位局部“穴網絡”,調動機體神經-內分泌-免疫“大網絡”的調節,從而作用于靶器官“病網絡”。三網聯動,糾正疾病的失衡狀態,恢復機體的內穩態,達到“中和”狀態[12]。當機體處于病理狀態時,疾病網絡發生改變,通過機體的神經-內分泌-免疫網絡等途徑,也可以反映到穴位局部的穴網絡,從而使穴位產生某些陽性反應,如壓痛、條索、結節等,阿是穴的產生即如此。只有將以上個部分建立起相互聯系、相互影響的復雜網絡模型,才可能解決針灸作用的規律。
6 小結
我們正處在于一個大數據時代,各行各業均存在大數據,醫療中更是有著比較廣泛的應用,如基因工程、疾病的預測分析、患者的手術方案等,大數據可以幫助醫療機構建立患者的疾病風險跟蹤機制以及幫助醫藥企業提升藥品的臨床使用效果等。面對紛繁復雜的信息,我們需要搜索、處理、分析、歸納、總結其深層次的規律。計算針灸學是針灸學發展的新時代,是傳統針灸學、實驗針灸學與現代計算科學相結合的產物,涉及包括數學、統計學、中醫針灸學、生物學和計算機科學等在內的多個學科,以針灸學中的現象和規律作為研究對象,以解決針灸醫學的關鍵科學問題和提高針灸臨床療效為最終目標,它將“發現的科學”和“假設驅動的科學”有機地聯系起來,使得針灸生物信息、知識發現、數學模型和假設檢驗完美地結合在一起,為針灸科學研究鋪開一條多學科交叉融合的高速公路。
參考文獻
[1]周宏仁.信息化:從計算機科學到計算科學[J].中國科學院院刊,2016,31(6):591-598.
[2]程妍,劉仲林.計算生物學——一門充滿活力的新興交叉學科[J].科學學與科學技術管理,2006,27(3):11-15.
[3]譚小芹,熊嘉誠,朱亭霏,等.中國藥物分子設計40年發展成就[J].中國科學:生命科學,2019,49(11):1375-1394.
[4]梁繁榮,王華.針灸學[M].北京:中國中醫藥出版社,2016:1-2.
[5]張伯禮.中醫藥發展的機遇與任務[J].中國中西醫結合雜志,2017,37(2):145-146.
[6]郭義,方劍喬.實驗針灸學[M].中國中醫藥出版社,2015:1-2.
[7]李鵬祥.隨機抽樣中必要樣本容量的確定[J].赤峰學院學報:自然科學版,2009,25(9):18-19.
[8]梁吉業,馮晨嬌,宋鵬.大數據相關分析綜述[J].計算機學報,2016,39(1):1-18.
[9]Gluud C.循證醫學的臨床實踐[J].中國醫學科學院學報,2002,24(6):541-547.
[10]蔡榮林,胡玲,吳子建.循證醫學、真實世界研究在針灸臨床研究中的應用與思考[J].中國針灸,2015,35(9):949-952.
[11]劉佳,何麗云,趙玉鳳,等.基于真實世界國際針灸病例注冊登記研究的關鍵技術[J].世界科學技術-中醫藥現代化,2017,19(12):1920-1923.
[12]Li NC,Li MY,Chen B,et al.A New Perspective of Acupuncture:The Interaction among Three Networks Leads to Neutralization[J].Evid Based Complement Alternat Med,2019,2019:2326867.
[13]沈自尹.系統生物學和信息醫學在中西醫結合中的應用[J].中西醫結合學報,2006,4(2):111-113.
[14]Langevin HM,Wayne PM,Macpherson H,et al.Paradoxes in acupuncture research:strategies for moving forward[J].Evid Based Complement Alternat Med,2011,2011:180805.
[15]Xu Y,Hong S,Zhao X,et al.Acupuncture Alleviates Rheumatoid Arthritis by Immune-Network Modulation[J].Am J Chin Med,2018,46(5):997-1019.
[16]齊婧蕾,陳勇,公一囡,等.基于針刺效應靶標蛋白阿片肽的針刺優勢病種的預測研究[J].四川中醫,2020,38(1):176-180.
[17]陳波,李明月,丁沙沙,等.針刺調節神經-內分泌-免疫網絡研究進展[J].世界針灸雜志:英文版,2014,24(4):49-53,58.
[18]陳海虹,黃彪,劉峰,等.機器學習原理及應用[M].成都:電子科技大學出版社,2017:2-19.
[19]馮冰,李紹滋.中醫脈診信號的無監督聚類分析研究[J].智能系統學報,2018,13(4):564-570.
[20]潘主強,張林,張磊,等.中醫臨床不均衡數據疾病分類方法研究[J].智能系統學報,2017,12(6):848-856.
[21]裴衛,吳輝坤,李曉東,等.基于機器學習的中醫治療肝硬化組方規律研究[J].世界科學技術-中醫藥現代化,2017,19(6):950-956.
[22]李宛蓉,李博,郭義,等.數據挖掘技術應用于針灸重大問題研究的可行性分析[J].中醫藥學報,2018,46(6):6-9.
[23]韓濟生,湯健,任民峰,等.中樞神經遞質與針刺鎮痛[J].北京醫學院學報,1980,12(1):11-19.
(2020-03-10收稿 責任編輯:王明)