盧恩仕,韓明光,劉祖發
1.中國中醫科學院望京醫院,北京 100102;2.北京大學數學科學學院,北京 100871
中醫藥以其獨特的理論和實踐體系在疾病診療中發揮著重要作用,但中醫辨證多依靠主觀經驗,缺乏客觀標準,這在一定程度上阻礙了中醫藥現代化的發展。相較于傳統研究方法,數據挖掘技術能夠較好地處理模糊、非線性、不完整的數據[1],有利于促進中醫藥標準化、數字化及信息化發展[2-3]。利用數據挖掘技術進行中醫藥現代化研究,已成為推動中醫藥發展不可或缺的環節。
目前,基于貝葉斯網絡的概率圖模型已廣泛應用于人工智能、生物信息學和醫療大數據等眾多領域[4-5]。貝葉斯網絡能夠根據先驗知識及概率統計,對未知事件進行預測[6],其推理是在推導數理、計算概率、設定閾值等基礎上建立起來的,具有明確的推理過程及精確度較高的結論表達。
貝葉斯網絡作為一種信念網絡[7],具有有向無環性,能夠利用有向邊的連接表示各節點之間的因果關系。這種有向邊能夠直觀地表達變量之間的依存關系,即直接連接兩個節點的邊表示兩節點有直接依賴關系。貝葉斯網絡的理論基礎是條件獨立性假設和貝葉斯定理,是一種利用不確定性問題中各變量之間邏輯依賴關系建模的概率圖模型,在處理不確定問題時具有較強的穩定性能。
(1)
(2)
式(2)中:x1,x2,L,xn是節點集合,pa(xi)是節點xi的父節點集合,p(x1,x2,L,xn)是網絡所有節點的聯合分布。
如圖1所示,有向無環圖即典型的貝葉斯網絡[8]。它包含一個結構模型和與該結構相關的條件概率密度函數,節點為隨機變量,表示對事件、狀態等特征抽象表示;直接連接兩個節點的邊表示兩節點有直接依賴關系,該關系常常是一種因果關系。考慮隨機變量集合U={x1,x2,L,xn},每個變量xi的狀態有限,P是網絡節點處的條件概率分布,表征各隨機變量之間關系的強弱。根據條件獨立性應用于鏈式規則,圖1貝葉斯網絡的聯合概率分布為

圖1 典型的貝葉斯網絡
p(x9|x6)p(x8|x5,x6)p(x7|x5)p(x6|x3,x4)g
p(x5|x2,x3)p(x4|x1)p(x2|x1)p(x1)
(3)
2.1 基于貝葉斯網絡探究中醫證候規律中醫“辨證”是指通過分析癥狀、體征等證候規律,提取病位、病性等證候要素,并在此基礎上診斷中醫證型的思維過程。“辨證”的關鍵在于辨證候要素,但中醫辨證多取決于臨床醫師的個人經驗,受主觀因素影響,難以形成客觀統一的辨證標準。而貝葉斯網絡能夠模擬人腦思維過程,學習醫師在臨床中積累經驗的方式,在此基礎上挖掘數據中的隱藏變量[9-10],通過概率分析其可能性,提取證候要素,展現癥狀、證候要素及證型間的相互關系[11],從而使復雜且高度非線性的中醫辨證系統可量化。
孫文軍等[12]通過建立閾下焦慮抑郁患者的貝葉斯網絡模型,從中提取肝郁脾虛、心腎不交、心脾兩虛3種常見證型及其主次癥狀。Zhang等[13]運用貝葉斯網絡探究男性不育癥的中醫證候特征,通過建立隱樹模型,發現男性不育患者的基本中醫證候特征為腎陽虛、腎氣虛、脾陽虛、肝氣郁結、氣滯血瘀等,證型多為脾腎陽虛、肝氣郁滯證型,而非單一證型。薛亞靜[14]利用貝葉斯網絡探究523例焦慮抑郁共病患者的中醫證候規律,從中獲得17個證候要素及7個證候類型。楊洋等[15]建立了胃癌證型間的貝葉斯網絡,從中提取6種證型,并與專家的辨證結果進行比較,發現二者有著較高的吻合率,證實了貝葉斯網絡在中醫辨證中的有效性。
在中醫證候研究中,相較于其他數據挖掘方法,貝葉斯網絡技術準確率更高。吳宏進等[16]利用貝葉斯網絡算法、支持向量機算法、K最近鄰(k-nearest neighbor,KNN)分類算法3種數據挖掘方法探究圍絕經期綜合征中醫證型,經比較,發現貝葉斯網絡有著最高的正確率及最小的標準誤差,在證型分類方面效果優于另外2種算法。李仕進等[17]分別運用貝葉斯算法及KNN算法進行古方“癥-證”間的關聯性研究,實驗表明貝葉斯算法的正確率高于KNN算法,在中醫“癥-證”分析研究中更加具有優勢。
2.2 貝葉斯網絡在名老中醫經驗傳承的應用貝葉斯網絡技術可將名老中醫的辨證經驗轉化為客觀定量的數據表達[18],從中提取證候要素并運用條件概率分析相關癥狀的貢獻度,展現名老中醫的辨證思路,為名老中醫經驗傳承提供新方式。
吳榮等[18]利用貝葉斯網絡探究名老中醫治療冠狀動脈粥樣硬化性心臟病的中醫證候規律,從中提取8個證候要素,發現其中最主要的證型為血瘀證,最常見的證候為氣虛痰濁血瘀證。甘小金等[19]運用貝葉斯網絡探討王子瑜教授治療子宮內膜異位癥的辨證規律,其中最常見的單一證候要素為血瘀證,最常見的證素組合為氣滯血瘀及腎虛血瘀,這與王子瑜教授的學術思想相吻合。
2.3 貝葉斯網絡在中藥藥性研究中的應用中藥藥性理論是中醫藥理論的重要組成部分,但中藥具有成分復雜、功效多樣及靶點多的特點[20],傳統研究方法多為局部研究,缺乏整體性及系統性,貝葉斯網絡能夠直觀地展現中藥藥性與功效間、功效與藥理間的復雜網絡關系[21],探究其背后的因果規律,為中藥組分藥性及分子水平的研究奠定了基礎[22]。
邢雁輝等[23]建立中風中藥組方的貝葉斯模型,以探究中藥、證候與療效間的相互關系,對單味中藥藥效進行預測,并提取在疾病治療中具有良好功效的中藥,為新藥研發提供了相關的技術支持。沈忱等[24]運用貝葉斯網絡建立活血化瘀類中藥及其藥理作用間的數據模型,通過計算二者間的概率值,并利用所構建的數據模型對疑似有活血化瘀作用的中藥進行預測,驗證其功效。齊方等[25]運用貝葉斯網絡探究中藥的整體藥性與物質成分間的關系,發現由偏最小二乘判別模型選擇出的37個藥性特征標記作為節點所構建的中藥整體藥性貝葉斯模型具有較高的靈敏度、特異性以及較強的中藥藥性判別能力。張培等[26]建立中藥有效組分五味與藥理間關系的貝葉斯網絡模型,在此基礎上進行中藥五味的預測,有利于促進中藥組分藥性及組分配伍的進一步研究。
2.4 貝葉斯網絡在疾病干預措施療效評價中的應用近年來,貝葉斯網絡多與Meta分析相結合,用于對疾病多種干預措施的系統評價。相較于傳統Meta分析,網狀Meta分析準確性、穩定性及靈活性更高,且能對不同的療法進行療效及安全性排序[27-28],使評價更加客觀、全面。
貝葉斯網狀Meta分析常用于分析不同中藥注射劑在疾病中的療效,并從中進行最優選擇。黃培穎等[29]運用貝葉斯網絡Meta分析探究6種中藥注射劑與抗病毒類西藥聯合應用于流行性感冒的治療效果,發現在退熱、鎮咳、住院時間及不良反應方面,喜炎平、清開靈及熱毒清注射液分別發揮了最佳的療效。Tan等[30]利用貝葉斯網狀Meta分析探究銀杏注射液聯合常規治療冠狀動脈粥樣硬化性心臟病心絞痛的臨床療效及安全性,研究顯示銀杏注射液聯合常規治療冠狀動脈粥樣硬化性心臟病心絞痛優于單純常規治療。Liu等[31]運用貝葉斯網狀Meta分析探究雷公藤甲素治療特應性濕疹的療效及安全性,研究表明雷公藤甲素在與其他藥物聯合治療特應性濕疹時協同作用較強,具有一定的臨床療效,但不良反應較為明顯。
此外,貝葉斯網狀Meta分析也常用于針灸、推拿及傳統運動等中醫療法的綜合評價中。Pang等[32]利用貝葉斯網狀Meta分析探究8種針灸方法治療神經性耳鳴的臨床療效,發現這些干預措施對神經性耳鳴的治療均有效果,其中艾灸的療效呈上升趨勢。Li等[33]利用貝葉斯網狀Meta分析探究八段錦、六字訣、太極拳及氣功4種中國傳統運動對認知功能障礙患者的治療效果,發現4種中國傳統運動對患者整體認知功能均有改善作用,其中八段錦效果最為明顯。
傳統中醫四診的辨別多取決于主觀經驗,缺乏客觀標準,而以貝葉斯網絡等為主體的現代計算機技術為四診信息的采集提供了客觀依據,促進了舌診、脈診等中醫特色診斷的標準化發展以及中醫診斷方法的客觀化、規范化。
Wang等[34]提出了一種定量的人體脈搏信號自動識別方法。通過提取特征參數,構建基于貝葉斯網絡的識別模型,結果證實該方法可有效識別脈搏信號的深度、頻率、節律、強度和形狀,有利于推動脈搏診斷的現代化。Pang等[35]建立了一種新的計算機化舌診系統,利用貝葉斯網絡對色度量和紋理度量這兩種定量特征與疾病之間的關系進行建模,在455名患有13種常見疾病的患者和70名健康志愿者身上測試了該方法,并證實了其有效性。Yan等[36]基于貝葉斯網絡等計算機方法提出了基于像素及低對比度的彩色舌下圖像的舌下靜脈分割算法,實驗結果表明該算法對彩色舌下圖像的舌下靜脈分割具有較好的效果,且該框架量化的寬度和顏色特征與舌診總結的診斷標準基本一致。
中醫診療強調辨證論治,個體化診療一直是中醫學的優勢所在,貝葉斯網絡技術能夠模擬人腦的學習和思維的過程,探究癥狀、證候要素、證型及方藥間的關聯性,使復雜且高度非線性的中醫臨床數據可量化,因此已廣泛應用于中醫藥數據挖掘中[37]。除此之外,以四診技術為核心的現代診斷技術逐漸向數據化及標準化發展[38],舌診儀、脈診儀、色診儀[39]等診療儀器的研發促進了中醫診療客觀化發展,這些都為中醫輔助診療系統的建立奠定了良好的基礎。在此基礎上,利用貝葉斯網絡建立中醫輔助診療系統,有利于促進中醫智能化診療的發展。
基于貝葉斯網絡的中醫疾病輔助診斷系統的構建大致可分為四步:①確定網絡變量。根據專家經驗和收集到的數據,將與該疾病相關的病位和癥狀進行統計,作為疾病發生的依據,然后把這些依據作為網絡變量,對其數據進行量化處理。②建立模型。依據所選取的數據選擇相應的貝葉斯網絡結構學習算法,獲得貝葉斯網絡疾病診斷網絡。利用數據選擇相應的參數學習方法對網絡進行參數學習,獲得具有最佳參數設置的貝葉斯網絡。③網絡推理,后驗查詢。采集多組患者信息,運用貝葉斯網絡進行推理,對可能存在的各類疾病進行概率計算。④疾病診斷分析。比較各類疾病發生的后驗概率,概率最大的疾病即為診斷得出的疾病類型。
目前,已有部分學者對此進行了相關探索。賈小飛[40]利用貝葉斯網絡建立中西醫結合疼痛康復管理系統,對疾病進行中醫辨證、病理因素的診斷及最佳治療方案的推薦,以對康復過程進行智能化、精準化管理。孫亞男等[41]利用貝葉斯算法建立了冠狀動脈粥樣硬化性心臟病的中醫證型診斷模型,發現貝葉斯模型在中醫診斷中有著較好的分類性能,可提高臨床辨證的準確性。陳曦等[42]建立了基于貝葉斯網絡的中醫輔助診療模型,為患者進行自我早期疾病診斷提供了有效的技術支持。
貝葉斯網絡技術在中醫藥研究的諸多領域均已發揮了重要作用,但仍具有不足之處,首先,實現數據分析的客觀性需要大樣本數據的支持,擴大樣本量、提高樣本質量是進一步實現數據分析客觀性的必要選擇。其次,貝葉斯網絡算法利用頻率進行,一旦出現頻率較低的癥狀、證候要素及證型,算法會在變量篩選的過程中將其舍棄,導致信息獲取不夠全面,使結果的準確性受到影響[6],因此如何更多地獲取高質量樣本和精進算法仍然是今后需要不斷研究及探索的方向。
貝葉斯網絡技術的信息處理過程與中醫辨證思維相吻合,目前已廣泛應用于中醫藥數據挖掘及現代化中醫診斷技術中,將復雜多樣的中醫數據轉變成客觀、可量化的標準。在此基礎上,中醫輔助診療系統建立并不斷完善,促進了臨床輔助診療及遠程醫療的發展[43-44]。隨著貝葉斯網絡技術在中醫藥研究中的不斷深入,建立智能化的中醫藥診療系統將是下一步的發展目標。通過智能化的診療系統,進行疾病診斷并提供個體化的治療處方及調理建議,有助于充分發揮中醫藥“未病先防,既病防變”的診療優勢,實現精準化的個體診療,同時緩解醫療資源緊缺的狀況。今后需進一步加強貝葉斯網絡在中醫藥現代化健康管理中的應用,真正發揮中醫藥在新時代健康管理中的作用。