李 靜,鄭 光,李 立,展俊平,呂愛平,馬超英,何小鵑△
(1.西南交通大學(xué),成都 610031;2.中國(guó)中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所,北京 100700;3.蘭州大學(xué)信息學(xué)院,蘭州 730000;4.上海中醫(yī)藥大學(xué),上海 201203;5.中國(guó)中醫(yī)科學(xué)院中醫(yī)基礎(chǔ)理論研究所,北京 100700)
雷公藤(Tripterygium wilfordii Hook.f.)系衛(wèi)矛科雷公藤屬植物,味苦、性寒,有大毒,歸肝、腎經(jīng),藥用部位為根,主要功能為祛風(fēng)除濕、消腫止痛、通經(jīng)活絡(luò)、扶正祛邪。其藥用最早收載于《神農(nóng)本草經(jīng)》,已有近2000年的應(yīng)用歷史。現(xiàn)代研究發(fā)現(xiàn),其有抗炎、免疫抑制、抗腫瘤和抗生育等多種藥理作用[1]。早在上世紀(jì)80年代末期就已正式應(yīng)用于臨床治療風(fēng)濕性疾病,抗風(fēng)濕療效顯著,隨后又用于治療自身免疫性疾病、器官移植、腎病、哮喘、腫瘤等。近年來,對(duì)雷公藤的報(bào)道文獻(xiàn)大量存在于現(xiàn)有數(shù)據(jù)庫中。本文借助文本挖掘技術(shù)[2,3],結(jié)合原文獻(xiàn)回溯、人工閱讀分析等方法,對(duì)現(xiàn)有雷公藤中文文獻(xiàn)進(jìn)行挖掘,以探討雷公藤用藥規(guī)律。
方法概述如下:在中國(guó)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(Chinese BioMedicalLiterature Database,CBM,http://sinomed.cintcm.ac.cn/index.jsp)中,“缺省(智能)”狀態(tài)下以“雷公藤”為檢索詞進(jìn)行檢索,共得到文獻(xiàn)5406篇(檢索日期:2012年7月14日),下載后作為文本數(shù)據(jù)挖掘的原始數(shù)據(jù)。
將收集來的數(shù)據(jù)按照下載的先后順序整合到一個(gè)平面文件(后綴 txt)里,以 ANSI編碼格式保存。然后,利用專有的文本提取工具(軟件著作權(quán),軟著登字第0261882號(hào),登記號(hào)2010SR073409),對(duì)下載非結(jié)構(gòu)化的txt文本數(shù)據(jù)進(jìn)行信息提取,保存成格式化的、便于大型關(guān)系型數(shù)據(jù)庫(Microsoft SQL Server,以下簡(jiǎn)稱SQL)處理的格式,然后導(dǎo)入 SQL中進(jìn)行下一步的挖掘分析。假設(shè)每一篇文獻(xiàn)的貢獻(xiàn)度是相同的,1篇文獻(xiàn)中重復(fù)出現(xiàn)的關(guān)鍵詞,只需要計(jì)算1次,據(jù)此構(gòu)建算法進(jìn)行數(shù)據(jù)清洗工作[2]。清洗完畢后的數(shù)據(jù),既可以提取挖掘?qū)ο蟮囊痪S頻次,也可以得到挖掘?qū)ο蟮亩S關(guān)系,進(jìn)行可視化呈現(xiàn)。抽出不同頻次的關(guān)鍵詞對(duì),用Cytoscape 2.8軟件進(jìn)行可視化處理,形成可視化的網(wǎng)絡(luò)圖,然后結(jié)合專業(yè)知識(shí)進(jìn)行解析,一旦發(fā)現(xiàn)不合理的結(jié)果,即回溯原文獻(xiàn)數(shù)據(jù)集,如果是噪音仍按算法進(jìn)行噪音清洗,直至噪音降到滿意為止。
圖1顯示,數(shù)據(jù)挖掘到的疾病有72種,依據(jù)頻數(shù)高低排序,并選取頻數(shù)最高的前10項(xiàng)列出。數(shù)據(jù)顯示,雷公藤對(duì)腫瘤、腎病、類風(fēng)濕關(guān)節(jié)炎等均有較廣泛應(yīng)用。圖1列出前10項(xiàng)疾病的頻次圖。從圖中可以看到,雷公藤用于治療腫瘤的應(yīng)用最為廣泛,文本挖掘到的頻數(shù)為444,其次是腎病綜合征(273)、類風(fēng)濕關(guān)節(jié)炎(246)、糖尿病(122),再次是紫癜性腎炎、過敏性紫癜、IgA腎病、糖尿病腎病、慢性腎炎、原發(fā)性腎病綜合征。

圖1 雷公藤治療疾病前10項(xiàng)頻次
圖2顯示,文本挖掘提取到的雷公藤常見配伍中藥有41種,取頻數(shù)大于15的列出:黃芪、丹參、天冬、白芍、川芎、生地黃、甘草、當(dāng)歸、大黃、茯苓。把雷公藤及其常見配伍中藥與腫瘤、腎病綜合征、類風(fēng)濕關(guān)節(jié)炎三類疾病關(guān)聯(lián)起來挖掘,提取到的結(jié)果構(gòu)建關(guān)系網(wǎng)絡(luò)圖。網(wǎng)絡(luò)中的中藥(圖中圓形除雷公藤外)為雷公藤配伍藥,配伍中藥、疾病(圖中方形)的顯示度和形狀大小正相關(guān);其他中藥與疾病之間的連線表示雷公藤與其配伍和疾病的相關(guān)性?;厮菰墨I(xiàn),昆明山海棠為噪音,應(yīng)予剔除。從圖中可以看出,在腫瘤疾病中雷公藤的相關(guān)配伍為黃芪、丹參、人參等。在腎病綜合征中,雷公藤的相關(guān)配伍為黃芪、丹參、人參、川芎、冬蟲夏草等,在類風(fēng)濕關(guān)節(jié)炎中,雷公藤的相關(guān)配伍為黃芪、白芍、川芎、當(dāng)歸、制附子等。圖中未與雷公藤連線的圓形為頻數(shù)小于15的中藥。

圖2 雷公藤配伍中藥治療疾病網(wǎng)絡(luò)圖
文本挖掘提取到的雷公藤常見聯(lián)用西藥有48種,取頻數(shù)大于10的列出:甲氨喋呤、糖皮質(zhì)激素、免疫抑制劑、環(huán)磷酰胺、地塞米松、免疫球蛋白。把雷公藤及其常見聯(lián)用西藥與腫瘤、腎病綜合征、類風(fēng)濕關(guān)節(jié)炎三類疾病關(guān)聯(lián)起來挖掘,提取到的結(jié)果構(gòu)建關(guān)系網(wǎng)絡(luò)圖(圖3)。網(wǎng)絡(luò)中的西藥(圖中三角形,除雷公藤外)為與雷公藤聯(lián)用的藥,聯(lián)用西藥、疾病(圖中方形)的顯示度和形狀大小正相關(guān);西藥與疾病之間的連線表示雷公藤與其聯(lián)用和疾病的相關(guān)性。回溯原文獻(xiàn),干擾素、免疫球蛋白為噪音,應(yīng)剔除。從圖中可以看出,雷公藤常聯(lián)用環(huán)磷酰胺、順鉑等治療腫瘤,聯(lián)用免疫抑制劑、糖皮質(zhì)激素、環(huán)磷酰胺等治療腎病綜合征,聯(lián)用甲氨喋呤、免疫抑制劑、糖皮質(zhì)激素及柳氮磺胺吡啶類解熱鎮(zhèn)痛藥治療風(fēng)濕關(guān)節(jié)炎。圖中未與雷公藤連線的三角形為頻數(shù)小于10的西藥。

圖3 雷公藤聯(lián)用西藥治療疾病網(wǎng)絡(luò)圖
文本挖掘是數(shù)據(jù)挖掘的一個(gè)方向,它所挖掘的對(duì)象是非結(jié)構(gòu)化或半結(jié)構(gòu)化,即從數(shù)以百萬計(jì)的文本數(shù)據(jù)中尋找潛在規(guī)律和趨勢(shì)[4]。文本挖掘應(yīng)用于中醫(yī)藥領(lǐng)域,能從海量的中醫(yī)藥文獻(xiàn)中發(fā)現(xiàn)知識(shí),以促進(jìn)中醫(yī)臨床研究和中藥復(fù)方研發(fā)等多個(gè)方面,為中西醫(yī)藥研究提供新的思路和途徑,其結(jié)果更加客觀,可重復(fù)性強(qiáng)[5]。
本研究發(fā)現(xiàn),雷公藤制劑在治療腫瘤、腎病綜合征及類風(fēng)濕關(guān)節(jié)炎疾病上有較多應(yīng)用,這與醫(yī)家對(duì)這3種疾病病因病機(jī)的認(rèn)識(shí)和現(xiàn)代研究結(jié)果相一致。中醫(yī)認(rèn)為,腫瘤的病因病機(jī)是痰、濕、氣、瘀、毒相互搏結(jié),郁而為患,用藥通常為開郁理氣、清熱解毒、化痰祛濕、活血散瘀等諸法,雷公藤苦寒清熱力強(qiáng),消腫止痛功效顯著,正有利于腫瘤治療;腎病綜合征屬正虛邪實(shí)之證,以脾腎虧虛為本,以風(fēng)邪、寒濕、濕熱、瘀血為標(biāo)[6]。雷公藤祛風(fēng)除濕、活血通絡(luò)功效正可用于該證。類風(fēng)濕關(guān)節(jié)炎屬痹證,《素問·痹論》指出:“風(fēng)寒濕三氣雜至,合而為痹也。其風(fēng)氣勝者為行痹,寒氣勝者為痛痹,濕氣勝者為著痹也?!崩钪需鳌夺t(yī)宗必讀痹》闡明“治風(fēng)先治血,血行風(fēng)自滅”的原則,葉天士對(duì)痹久不愈、邪入于絡(luò),建議用活血化瘀法治療。雷公藤較強(qiáng)的活血通絡(luò)之功,為治風(fēng)濕頑痹要藥,同時(shí)現(xiàn)代研究結(jié)果也為雷公藤的應(yīng)用提供了科學(xué)數(shù)據(jù)支持。基于較為成熟的文本挖掘技術(shù),我們轉(zhuǎn)變了從疾病角度探討用藥規(guī)律的思路,嘗試從中藥的角度更深入立體地研究中藥的用藥規(guī)律,并在本研究中成功展示了雷公藤治療的高頻次疾病,同時(shí)描繪了在多個(gè)疾病中與中藥和西藥聯(lián)合應(yīng)用的情況,是對(duì)雷公藤相關(guān)病證方藥規(guī)律的一次比較全面的總結(jié)。這一結(jié)果不僅得到了前期研究結(jié)果的佐證[7,8],且與臨床用藥實(shí)際基本相符,說明該方法應(yīng)用于中藥用藥規(guī)律研究具有穩(wěn)定性和準(zhǔn)確性,也為中藥新藥開發(fā)和應(yīng)用提供了有益的參考。
綜上,文本挖掘獲得的結(jié)果真實(shí)地反映了臨床用藥實(shí)際,而且系統(tǒng)總結(jié)了雷公藤在臨床實(shí)踐中的用藥規(guī)律,其新的發(fā)現(xiàn)拓展了臨床用藥的范疇和思路,為臨床醫(yī)生提供了參考。以藥物名稱作為關(guān)鍵詞檢索文獻(xiàn)進(jìn)行挖掘是文本挖掘的一種新方法,還有待進(jìn)一步的改善,這為深層次全方位的文本挖掘提供了可能。
[1]鄧翠娥,吳斯金.雷公藤醫(yī)藥作用研究進(jìn)展[J].時(shí)珍國(guó)醫(yī)國(guó)藥,2000,11:370-371.
[2]ZHENG G,JIANG M,HE XJ,et al.Discrete derivative:a data slicing algorithm for exploration of sharing biological networks between rheumatoid arthritis and coronary heart disease[J].BioData Min,2011,4:18.
[3]郭洪濤,鄭光,趙靜,等.基于文本挖掘分析甲型 H1N1流感的中醫(yī)藥治療特色[J].世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化,2011,13(5):772-776.
[4]呂婷,姜友好.文本挖掘在生物醫(yī)學(xué)領(lǐng)域中的應(yīng)用及其系統(tǒng)工具[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2010,19(4):56-64.
[5]LI S,ZHANG , WU LJ, et al. Understanding ZHENG in traditional Chinese medicine in the contex of neuro-endocrineimmune network[J].IET Syst Biol,2007,1(1):51-60.
[6]楊倩倩.楊霓芝教授治療難治性腎病綜合征的臨床經(jīng)驗(yàn)[J].中國(guó)中西醫(yī)結(jié)合腎病雜志,2003,9(4):500-502.
[7]徐衛(wèi)東,周奇,鄭光.利用文本挖掘技術(shù)分析治療類風(fēng)濕關(guān)節(jié)炎中成藥和西藥使用基本規(guī)律[J].遼寧中醫(yī)雜志,2012,39(3):425-426.
[8]蔡峰,鄭光,郭洪濤,等.基于文本挖掘技術(shù)的中成藥及西藥治療IgA腎病用藥規(guī)律研究[J].中國(guó)中醫(yī)急癥,2011,20(10):1628-1629.