傅 爽,陳素玲,李運倫
(1.山東中醫藥大學理工學院,山東 濟南 250355;2.山東中醫藥大學附屬醫院 心臟內科,山東 濟南 250011
高血壓病又稱原發性高血壓,是一種常見的心血管疾病,而肝陽上亢證是高血壓病最常見的證候類型。中醫藥在辨證論治高血壓病方面有自身的特色和優勢,然而自古至今大部分處方均為各醫家經驗用藥,帶有一定的主觀性和片面性。如何集各家所長,又能摒除個人用藥的偏倚,找到能夠達到最佳療效的藥物組方,是現今亟待解決的研究課題。數據挖掘的許多方法既能借鑒專家意見,又能夠盡量消除主觀性等隨機誤差,所以可以利用其對用藥規律進行較為科學的探討。本研究擬利用數據挖掘方法,從古今醫案中探尋中醫藥治療高血壓病肝陽上亢證的用藥規律。
課題組從高血壓病(眩暈、頭痛)相關的古今醫案中搜集到治療高血壓病(眩暈、頭痛)肝陽上亢證的處方776篇。由于產地、炮制、用藥部位的不同,即便同一品種的藥物也有不同的藥名,對此均做了統一處理,“生白芍”、“炒白芍”均作“白芍”,“釣藤”、“吊藤”、“釣鉤藤”、“鉤丁”、“倒掛金鉤”、“鉤耳”、“雙鉤藤”、“鉤藤皮”、“鉤藤莖枝”、“鉤藤鉤子”、“嫩鉤”均作“鉤藤”。在這776篇處方中,共得到藥物252種,從中選取出現頻率較高的藥物53種將其數字化,出現為“1”,不出現為“0”,并利用SPSS17.0生成數據庫。
單味藥在方劑中出現的頻數實際上是中藥常用程度的數量化標準。先利用 SPSS17.0中的“frequency”命令計算各藥物出現的頻數及頻率,將出現頻率大于15%的藥物按頻率高低次序列出。
系統中的屬性并不同等重要,有些甚至是冗余的。屬性約簡就是在保持系統分類能力不變的條件下,刪除那些不相關或者不重要的屬性。若將這些屬性刪除,不僅不會改變決策表的分類或預測能力,反而會提高系統潛在知識的清晰度。而粗糙集理論〔1〕是處理模糊和不明確問題的一種較新的數學工具,主要應用于研究不完整數據、不確定知識的表達、學習及歸納。它無需提供問題所需處理的數據集合之外的任何先驗知識——避免了專家的主觀經驗。
由于數據庫中的數據來源于古今不同的醫案,而不同時期、不同的中醫都有自己的用藥習慣,不同的患者除了具有肝陽上亢證的癥狀以外還有其他自身所特有的癥狀,所以在第一步利用頻數分析得到的出現頻率較高的藥物并不一定是對肝陽上亢證的治療起關鍵作用的藥物,屬性約簡能在一定程度上摒棄這樣一些隨機因素,保留實質上重要的屬性,使我們能進一步了解到治療肝陽上亢證所常用的藥物。
對采用屬性約簡以后保留下來的高頻藥物采用關聯規則的Apriori算法進行分析,旨在找出已知和未知的藥對和藥組。
關聯規則〔2〕是一種簡單但很實用的數據挖掘方法。關聯規則算法本質上是一種對條件概率、聯合概率方法的簡化,并在這個簡化過程中增加了對數據庫掃描次數和效率的改進,從而使算法更加實用化。本文使用的是Apriori算法,算法利用了頻繁項集的子集必是頻繁項集,非頻繁項集的超集必是非頻繁項集的特點。算法的實現過程如下:
(1)通過單趟掃描事務數據庫D計算出所有1-項集的支持度,從而得到滿足最小支持度s%的頻繁1-項集構成的集合 L1;(2)為產生k-項集構成的集合Lk,先生成一個候選頻繁 k-項集的集合Ck。若 P,Q ∈ Lk-1,P ={p1,p2,…,pk-1},Q ={q1,q2,…qk-1},并且當 1 ≤ i≤ k - 1 時,pi=qi,當 i=k - 1 時,pk-1≠ qk-1,則 P ∪ Q={p1,p2,…,pk-2,pk-1,qk-1}是候選頻繁 k - 項集的集合 Ck中的元素;(3)由于Ck是Lk的超集,可能有些元素不是頻繁的。由于任何非頻繁的k-1項集必定形不成頻繁k-項集的子集,所以當候選k-項集的某個k-1子集不是Lk-1中的成員時,則該候選頻繁項集不可能是頻繁的,可以從Ck中移去。通過單趟掃描事務數據庫D,計算Ck中各個項集的支持度,將Ck中不滿足最小支持度s%的項集刪除,形成由頻繁k-項集構成的集合Lk;(4)通過迭代循環,重復上述步驟(1)~(2),直到不能產生新的頻繁項集的集合為止。
表1顯示,在所收集的776例處方中,按照藥物出現頻數的高低進行排序,出現頻率大于15%的前15味藥物如下:珍珠母、鉤藤、菊花、玄參、茯苓、白芍、黃芩、丹皮、甘草、牛膝、天麻、桑寄生、枸杞、牡蠣和酸棗仁。按照中藥學的功效分類標準對其功效進行歸類。

表1 藥物出現的頻率和頻率統計表
表2顯示,采用粗糙集理論Johnson算法對所收集的776例處方藥物進行屬性約簡,約簡結果保留了以下16味藥物,即鉤藤、菊花、玄參、珍珠母、黃芩、茯苓、白芍、丹皮、懷牛膝、首烏、當歸、龜板、石決明、桑寄生、桑葉和菖蒲,包括平肝潛陽藥(鉤藤、菊花、珍珠母、龜板、石決明)、滋補肝腎陰液藥(玄參、白芍、懷牛膝、首烏、桑寄生)、健脾藥(茯苓)、清熱藥(黃芩、丹皮)、養血藥(當歸)和祛風藥(桑葉)。同時屬性約簡結果還認為,在藥物頻次出現較高的前15味藥物中,甘草、天麻、牡蠣、枸杞、酸棗仁并不重要,是可以被約簡掉的。藥物分布的頻數分析和基于粗糙集理論的屬性約簡均認為,重要的藥物是珍珠母、鉤藤、菊花、玄參、茯苓、白芍、黃芩、懷牛膝、丹皮、桑寄生,2種數據挖掘方法所得出的結論基本上是吻合的。
3.3.1 藥對配伍結果 表2顯示,將以上保留的藥物通過頻繁項集挖掘出的藥對,按照藥對出現頻數的高低進行排序,出現頻數大于25%的藥對共10組,即:鉤藤 +珍珠母、鉤藤 +菊花、珍珠母 +白芍、珍珠母+菊花、珍珠母+玄參、鉤藤+黃芩、珍珠母+黃芩、珍珠母+茯苓、鉤藤+茯苓、鉤藤+白芍。
3.3.2 3味藥組配伍結果 表3顯示,將以上保留的藥物通過頻繁項集挖掘出的3味藥的藥組,按照藥組對出現頻數的高低進行排序,出現頻數較高的藥組共8組,即:鉤藤 +珍珠母 +菊花、鉤藤 +珍珠母+黃芩、鉤藤+珍珠母+白芍、珍珠母+白芍+玄參、鉤藤+珍珠母 +茯苓、鉤藤 +菊花 +黃芩、鉤藤+菊花+茯苓、鉤藤+菊花+白芍。

表2 藥對統計分析

表3 3味藥組統計分析
3.3.3 4味藥組配伍結果 表4顯示,將以上保留的藥物通過頻繁項集挖掘出的四味藥的藥組,按照藥組對出現頻數的高低進行排序,出現頻數較高的藥組共4組,即:鉤藤 +珍珠母 +菊花 +白芍、鉤藤+珍珠母+黃芩+菊花、鉤藤 +珍珠母 +菊花+茯苓、鉤藤+珍珠母+玄參+白芍、珍珠母+玄參+白芍+菊花。
3.3.4 5味藥組配伍結果 表5顯示,將以上保留的藥物通過頻繁項集挖掘出的5味藥的藥組,按照藥組對出現頻數的高低進行排序,出現頻數較高的藥組共3組,即鉤藤+珍珠母+菊花+白芍+玄參、鉤藤+珍珠母+菊花+白芍+茯苓、鉤藤+珍珠母+菊花+白芍+黃芩。

表4 4味藥組統計分析

表5 5味藥組統計分析
數據挖掘[2]就是一門致力于從大量數據中提取或“挖掘”知識的學科。數據挖掘具有分類、估計與預測、聚類、關聯和序列發現、描述等功能。從大量的數據中挖掘有價值的模式或規律,常應用決策樹理論、人工神經網絡以及關聯規則等,挖掘到的知識和規律是否有用,除去相關領域專家的指導和評價外,數據本身統計方面的特性也必不可少,特別是對挖掘到的模式和關系進行解釋和評價時,將更多地應用到統計學的方法和思想。在數據挖掘過程中多種方法交互、混合使用,比單一方法更能有效挖掘出所需要的知識。
從上面藥味分布的頻數和知識約簡結果統計中可以看出,治療高血壓病(眩暈、頭痛)肝陽上亢證的藥味達252味,常用中藥10余味,因此中醫治療高血壓病(眩暈、頭痛)肝陽上亢證組方用藥非常廣泛和靈活,不僅要考慮主癥,還要對很多兼癥加以辨證用藥。從各味常用藥味的功效來看,所用的藥類比例輕重有明顯不同,其中以平肝潛陽藥和滋陰藥出現的頻率較高,如平肝潛陽類藥物(珍珠母、鉤藤、菊花、天麻、牡蠣)共出現1539次/776方,平均1.98次/方,滋補肝腎陰液類藥物(玄參、白芍、枸杞、桑寄生、懷牛膝)共出現1123次/776方,平均1.44次/方,也從側面反映了高血壓病(頭痛、眩暈)肝陽上亢證的“陰虛陽亢”病機特征及證候歸屬。其他健脾藥、清熱藥和安神藥也是治療高血壓病肝陽上亢證的常用藥物,是平肝潛陽方劑的重要組成部分,如健脾藥(茯苓、甘草)共出現504次/776方,平均0.65次/方,清熱藥(黃芩、丹皮)共出現449次/776方,平均0.59次/方,安神藥(茯苓、棗仁)共出現453次/776方,平均0.58次/方。由此可見,潛陽藥、滋陰藥、健脾藥、清熱藥和安神藥的遣用是中醫治療高血壓病(頭痛、眩暈)肝陽上亢證的基本配伍規律。
藥對或藥組是由2味或2味以上藥物組成,分析藥對藥組,對于深入探討治療高血壓病的中藥復方的配伍規律有重要意義,特別是通過關聯分析可以找出在臨床上高頻使用而還未載入中醫書籍的藥對和藥組〔3〕。表2、表3顯示,出現頻率大于 25%的10組藥對中有6組屬于潛陽藥配伍潛陽藥或潛陽藥配伍滋陰藥,出現頻率大于14%的8組藥組中有4組屬于潛陽藥配伍潛陽藥或潛陽藥配伍滋陰藥??梢?,潛陽藥不論是使用次數還是與其他藥組成的藥對藥組都占有相當大的比率,而同其配伍最多的藥類是潛陽藥和滋陰藥。中醫學認為,高血壓病肝陽上亢證的病機特征陰虛陽亢、肝腎陰液虧虛為本,亢陽上擾為標,亢陽上擾在高血壓病肝陽上亢證的病機演變中占有特殊重要的地位,治療宜平潛亢陽為主兼以滋補陰液〔4〕。因此,潛陽藥配伍滋陰藥為主的藥對藥組是治療高血壓病(頭痛、眩暈)肝陽上亢證方劑的基本結構。
高血壓病肝陽上亢證的基本病機是陰虛陽亢,而亢陽升騰太過可以化火、生熱,肝陽、肝火可以影響脾導致脾氣虧虛,肝陽、肝火上擾于心而導致神志不安,因此火熱熾盛、脾氣虧虛和神志不安也是高血壓病肝陽上亢證病機演變的重要內容。本研究發現,清熱藥(黃芩、丹皮)、安神藥(棗仁)和健脾藥(茯苓)既是使用頻率比較高的藥物,也是藥對、藥組中常用的配伍藥物,在潛陽、滋陰的基礎上,清火熱、健脾氣、安神志。可見,健脾藥、清熱藥和安神藥的配伍既針對高血壓病肝陽上亢證的病機演變過程,其配伍與否對治療效果也有一定的影響,是中醫治療高血壓病肝陽上亢證不可忽視的配伍藥類。
本研究采用數據挖掘技術中的關聯規則和鏈接分析工具,對中醫治療高血壓病(頭痛、眩暈)肝陽上亢證的醫案進行了分析,找到了中醫治療高血壓病(頭痛、眩暈)肝陽上亢證的處方用藥規律,其結果與中醫理論一致,說明數據挖掘技術是適合分析中醫臨床數據的一種科學有效的方法。
[1]張文修,吳偉業,梁吉業.粗糙集理論及方法[M].北京:科學出版社.2001.78-89.
[2]梁循.數據挖掘算法與應用[M].北京:北京大學出版社.2006,56-63.
[3]周魯,周曉芳,李鵬志.中藥復方治療病毒性心肌炎用藥分析[J].遼寧中醫雜志.2005,32(8):827-828.
[4]李運倫.滋陰潛陽法在內科雜病中的應用[J].山東衛生.2004,(5):31-32.