章新友, 李秀云, 張春強, 張亞明
(1.江西中醫藥大學藥學院, 南昌 330004; 2.江西中醫藥大學計算機學院, 南昌 330004)
肺癌由一組分子和組織學異質亞型所組成,分為小細胞肺癌和非小細胞肺癌兩種[1]。在全球范圍內肺癌影響最深,在患癌的占比中常年居首位,且肺癌發病率逐年上升,患者致死率也居高不下,對于人民的生命安全、身體健康是極大隱患,早已成為現今臨床研究者的難點和熱點[2]。如今,除外科手術治療外,化療可降低患者疾病進展風險,但是化療也存在不可忽視的副作用(細胞毒性、神經/腎毒性、骨髓移植、胃腸道反應等),降低肺癌患者生存質量,影響治療療效[3]。
中醫藥立足辨證論治角度,整體調節機體,通過抑制正常細胞凋亡及炎癥損傷、改善機體氧化應激狀態、激活細胞自噬等途徑有效降低含鉑化療引起的毒性反應,與含鉑化療相結合,可起到增效減毒、提高患者生存質量的作用[4]。但是治療肺癌的復方存在用藥多樣、醫生開方個性化,長期以來難以對其用藥規律、配伍關系等進行系統性研究。因此,現通過數據挖掘的方法分析治療真實世界肺癌中藥復方的用藥規律及特點,從客觀的角度探究中藥復方治療特點以及用藥規律。
收集江西省南昌市3個區的3所省級三甲醫院中臨床診斷為肺癌的中藥處方,建立肺癌數據庫;根據篩除標準剔除無效處方(即相同處方;診斷與用藥不符處方;)得到有效處方407個,共涉及中藥324味。
所錄入中藥存在一味中藥有多種名稱、藥物錯別字、藥物全稱與簡稱等現象,因此,需根據2020版的《中華人民共和國藥典》規范中藥名稱,如“石打穿”規范為“石見穿”、“田七”規范為“三七”、“仙靈脾”規范為“淫羊藿”、“瓜蔞殼”規范為“瓜蔞皮”、“冬棱草”規范為“冬凌草”、“百花蛇舌草”規范為“白花蛇舌草”、“白芨”規范為“白及”等,再將規范后的中藥數據導入中醫傳承輔助平臺(V2.5)進行數據挖掘分析。
中藥數據錄入后由兩位相關專業研究人員對數據分別獨立進行審核,再通過比較分析、統一,確保數據準確完整。通過中醫傳承輔助平臺“數據分析”功能中的“方劑分析”板塊,依次分析錄入中藥的性味歸經、藥物頻次、組方規律、核心藥物組合等。
1.4.1 篩選中藥化合物并構建 “中藥-化合物-靶點-疾病”網絡
(1)通過中藥系統藥理學分析平臺(traditional Chinese medicine system platform,TCMSP),以口服利用度(oral availability,OB)和類藥性(drug-likeness,DL)值為主要篩選指標,篩選核心中藥(半夏、白術、茯苓、浙貝母)的活性化合物。
(2)通過TCMSP數據庫得到活性化合物作用靶點,并通過Uniprot數據庫規范靶點的人源靶點名稱;考慮到單一數據庫靶點信息不全以及信息陳舊問題,另將核心化合物導入Swiss TargetPrediction 進行靶點預測,最后將兩個數據庫所得靶點匯總后進行下一步分析。
(3)以關鍵詞“lung cancer”在GeneCards數據庫、CTD數據庫搜索疾病靶點,得到肺癌疾病靶點信息。
(4)取化合物靶點和肺癌疾病靶點的交集靶點為核心中藥治療肺癌的作用靶點,運用cytoscape3.9.0構建“中藥-化合物-靶點-疾病”網絡,根據網絡中連接度以及連接分數獲得核心中藥中發揮主要作用的化合物。
1.4.2 構建蛋白互作網絡并篩選核心靶點
將1.4.1節中得到的作用靶點導入String平臺進行蛋白互作分析,得到tsv文件導入cytoscape3.9.0分析。運用cytoscape中的CytNCA插件分析作用靶點的拓撲參數,采用度中心性(degree centrality,DC)、介度中心性(betweenness centrality,BC)、接近中心性(closeness centrality,CC)對作用靶點進一步評價篩選。據研究所需選取大于DC二倍中位數的靶點為核心靶點、核心靶點中大于BC、CC中位數靶點為主要作用靶點。
1.4.3 GO生物功能過程和KEGG代謝通路富集
基于可視化驅動的生物信息學分析網站(https://hiplot.com.cn/)分析作用靶點的基因本體論(gene ontology,GO) 生物功能過程和KEGG代謝通路,據研究所需,選取KEGG數據庫public/db/kegg/gga_kegg_20200924.rds,P、Q閾值設置為0.05,輸出富集網絡圖、富集柱狀圖以及基因概念網絡圖。

圖1 藥物功效、肺癌證型、治則治法百分比統計圖Fig.1 Statistical chart of drug efficacy, lung cancer syndrome type and treatment method percentage
分別在TCMSP、RCSB PDB(http://www.rcsb.org/)數據庫獲取主要化合物MOL文件、PDB文件,基于AutoDock軟件對主要作用化合物以及作用靶點進行前期去水、加氫處理后對接,對接能越低,化合物與靶點對接效果越好。
納入中藥復方407個,包含中藥324味,對所納入復方進行藥物頻次統計,得到藥物使用頻次≥45 的有27味,頻次≤10的有206味,處于二者之間的有91味。中藥使用頻次由高到低,依次為甘草、茯苓、白術、陳皮、半夏、黃芪、黨參、浙貝母、白花蛇舌草、薏苡仁。藥物頻次(≥45)統計結果見表1。
如圖1所示,整理所納入中藥的功效以及真實世界中的醫生診斷肺癌證型和治則治法進行統計分析,功效、證型、治則治法均以占總體百分比結果統計,其中A組為肺癌證型,B組為藥物功效,C組為治則治法;在肺癌的中醫證型診斷中,以痰瘀互結證為主,占45.99%;治則治法以化痰散結和解毒抗癌為主,分別占28.99%、29.25%;所用中藥以補虛藥為主,占比32.69%。
對324味中藥性味歸經頻次分析得出;四氣之中屬溫性藥物最多,高達2 420次(包含重復),占比41.39%,五味之中以味甘為主,占比45.5%,其次五味中苦味最多,占比36.63%;歸經之中以肺經占比最高,為25.82%,如圖2所示。
對用藥頻次前5位的中藥(甘草、半夏、白術、陳皮、黨參)進行藥物劑量統計分析,其結果如圖3所示。由圖3可知,甘草用量為6 g的最多,黨參為10 g,白術為10 g,茯苓為15 g,半夏為10 g,藥物使用劑量均在10~15 g。

表1 藥物頻次(≥45)統計結果Table 1 Statistical results of drug frequency (≥45)

圖2 性味歸經頻次統計Fig.2 Statistics of recurrent frequency of sexual taste

圖3 中藥用藥劑量分析(頻次前5)Fig.3 Dose analysis of traditional Chinese medicine (top 5 frequency)
首先,應用Excel2019中插入數據透視表、查找及替換等功能,對所有中藥復方數據格式進行規范化整理,用了該味藥記為“1”、未用記為“0”,將整理好的規范數據導入SPSS Modeler 18 軟件進行數據分析。其次,將規范數據設為源節點,類型中測量選為標記,角色為任意,圖形中選擇網絡,鏈接源節點、類型、網絡后在網絡中僅顯示True值標志,鏈接強度分別設置為弱鏈接的上限為15,強鏈接的下限為35。再次,進行關聯規則網絡的可視化繪圖。最后,運用cytoscape進行可視化升級。關聯規則可視化結果,如圖4所示。在圖4中連線粗細及深淺代表關聯強度的大小,藥物圓圈的大小及顏色深淺代表藥物頻次的高低。
在模式選項中根據Apriori算法對藥物之間關聯規則進行分析。其中最低支持度和最高支持度分別為10%、80%。按常規做法最大前項設置為2,最終所得規則235條。所得到的關聯規則分別見表2、表3、表4。

圖4 治療肺癌中藥復方藥物關聯規則可視化分析圖Fig.4 Visualization analysis of association rules of TCM compound drugs for lung cancer
通過聚類算法對藥物頻次≥35的中藥進行分析。將數據導入Origin2021中,選取所有的Y軸,再選擇統計模塊中多變量分析的系統聚類分析功能。觀測值為X軸,聚類為變量,依據本研究的特點設置聚類個數為6,生成圓形聚類圖,如圖5所示。聚類結果共分為6類,見表5。其中第1類為厚樸、黨參、半夏、陳皮、茯苓、瓜蔞、浙貝母、半枝蓮、白花蛇舌草、白術;第2類為黃芩、甘草;第3類為苦杏仁、石上柏、石見穿、桔梗、薏苡仁;第4類為黃芪、當歸、熟地黃、麻黃、白芥子、白芍、柴胡、百部;第5類為五味子、海浮石、牡蠣、麥冬、山慈姑;第6類為款冬花。

表2 常用2種藥物組合關聯規則

表3 常用3種藥物組合關聯規則

表4 常用4種藥物組合關聯規則

圖5 藥物聚類分析圖Fig.5 Drug cluster analysis diagram

表5 聚類分析結果
在中醫傳承輔助平臺數據分析的組方規律分析模塊中,設置支持度個數100,支持度0.9時結果符合真實世界臨床實踐,分析其用藥模式并通過網絡展示,基于真實世界的中藥復方治療肺癌核心藥物有7味,分別為黨參、茯苓、白術、陳皮、浙貝母、黃芪、甘草,網絡分析結果,如圖6所示。

圖6 中藥復方治療肺癌的核心藥物網絡Fig.6 Core drug network of TCM compound therapy for lung cancer
2.8.1 篩選中藥化合物并構建 “中藥-化合物-靶點-疾病”網絡
根據頻數、關聯規則以及聚類分析和復雜網絡綜合分析的結果,對核心中藥半夏、茯苓、白術、浙貝母的成分和靶點進行篩選,得到靶點共244個,主要化合物信息表見表6。檢索GeneCards、CTD數據庫,刪除重復項后得肺癌疾病靶點994個,運用cytoscape構建“中藥-化合物-靶點-疾病”網絡,其中化合物12-千里光酰基-8-反式白術三醇(12-senecioyl-2E,8E,10E-atractylentriol,BZ5)、14-乙酰基各里光酰基-8-反式白術三醇(14-acetyl-12-senecioyl-2E,8E,10E-atractylentriol,BZ6)、β-谷甾醇(beta-sitosterol,BX5)值排名靠前,為治療肺癌的重要化合物,網絡圖如圖7所示,其中節點的顏色深淺和大小代表該節點在網絡中連接度高低。
2.8.2 構建蛋白互作網絡并篩選核心靶點
作用靶點導入String平臺獲取tsv結果文件后運用cytoscape3.9.0進行蛋白互作拓撲分析并通過cytoNCA 插件篩選核心靶點結果如圖8所示。圖8中左矩陣網絡中,節點顏色深淺表示靶點DC值,根據DC、CC、BC篩選出核心靶點為腫瘤抗原p53(tumor antigenp53,TP53)、表皮生長因子受體(epidermal growth factor receptor,EGFR)、蛋白激酶Bα(protein kinase Bα,AKT1)。表明這3個靶點在治療肺癌中發揮重要作用。

表6 中藥化合物信息表

圖7 “中藥-化合物-靶點-疾病”網絡圖Fig.7 “TCM-compound-target-disease” network diagram

圖8 蛋白互作網絡、核心靶點篩選圖Fig.8 Protein interaction network and core target screening

圖9 GO、KEGG富集分析結果Fig.9 Enrichment analysis results of GO and KEGG
2.8.3 基因本體(gene ontology,GO)和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路富集
將作用靶點導入后可得,GO 生物過程主要包括細胞對化學壓力的反應、金屬離子的反應、細胞對外界刺激的反應、氧化應激反應、細胞對鎘離子的反應等;GO 分子功能則包括泛素樣蛋白連接酶結合、磷酸酶結合等;而GO 細胞成分包含RNA聚合酶Ⅱ轉錄調節復合物、膜筏、膜區域、內吞作用的泡、囊腔等;KEGG通路富集分析結果顯示,關鍵通路富集為腫瘤壞死因子信號通路、鉑耐藥通路、內分泌障礙、IL-17信號通路,通路富集結果還涉及前列腺癌、胰腺癌、乳腺癌、人類巨細胞病毒感染等,表明該核心中藥可能有治療這些疾病的潛在優勢,結果如圖9所示。
由以上分析結果選取中藥化合物為BZ5、BZ6、BX5以及靶點AKT1(PDB編號為4GAH)、EGFR(PDB編號為5GNK)、TP53(PDB編號為6IU7)進行分子對接,對接能量與對接結果對應分圖見表7,由表7可知,對接能量均小于0 kJ/mol,表明小分子配體與蛋白結合的構象穩定,對接圖如圖10所示。

表7 分子對接能量

圖10 分子對接結果Fig.10 Molecular docking results
肺癌是全球癌癥死亡的主要原因,現代醫學治療肺癌的主要手段為手術治療、放療、化療、靶向治療、免疫療法等[5],雖然肺癌治療技術日新月異,已取得突破性進步,但仍存在治療后嚴重不良反應、患者生存質量差、耐藥性等問題[6-7]。中醫藥治療肺癌的相關研究逐步成熟且深入,據中醫藥治療肺癌的知識圖譜數據統計分析可知,中醫藥治療肺癌的研究逐年增多,中醫藥療法治療的主要領域為緩解患者的不良反應以及提高患者的生存質量方面[8]。
隨著數據挖掘技術的革新,中醫藥研究邁入新的領域[9],中醫藥發展至今積累的大量復方信息的用藥規律研究逐步深入[10]。采用數據挖掘方法,初步探討了已納入的407個中藥復方治療肺癌的用藥規律、核心藥物等,得出以下結論。
(1)藥物頻次分析結果表明,補虛藥(甘草、白術、黨參)、化痰止咳平喘藥(浙貝母、半夏)、清熱解毒藥(白花蛇舌草)、理氣藥(陳皮)、利水消腫藥(茯苓)使用頻次較高。甘草使用頻次最多,其主要藥效為清熱解毒、鎮咳祛痰、補脾益氣,也有調和百藥的作用[11-12],而肺癌主要癥狀為咳嗽(刺激性干咳、咳嗽痰中帶血、無痰、少痰等)[13],甘草在對癥的同時也起到調和百藥的作用。茯苓、白術為常見配伍使用的藥對,主要功效為治療脾胃氣虛、水濕內停證[14],二者配伍始見于張仲景《傷寒論》和《金匱要略》。半夏中富含生物堿類、有機酸類、揮發油類、黃酮類等化合物,主要功效有鎮痰止咳、止嘔、抗癌等[15];浙貝母主要藥理作用為鎮痰止咳、抗潰瘍、抗炎、抗腫瘤等[16],說明中藥復方治療肺癌以補中益氣、抗癌扶正、鎮痰止咳為主。
(2)對藥物功效、治則治法以及肺癌證型的研究結果表明,肺癌治療的中藥以補虛為主,《難經·論五臟積病》中肺癌的病機歸納為正氣不足,《內經》寫道,“正氣存內,邪不可干”“邪之所湊,其氣必虛”,均認為肺癌的主要致病因素為正氣不足、氣血虛。因此所用藥物功效以補虛為主,這與研究結果一致。而肺癌證型中痰瘀互結證為主要診斷病證,此為肺癌實證的主要表現。著名中醫學家周岱翰指出,肺癌發病機制是虛證、血瘀、痰、邪毒進入,導致肺功能無法正常運行[17]。中醫藥治療肺癌的主要原則為清熱解毒、化痰祛瘀、益氣扶正等[18],這與研究中主要的治則治法解毒抗癌不謀而合。
(3)肺癌初期以肺氣虛為主要特征,并行特征為氣虛,病情日久發展為痰熱壅肺證、痰濕阻肺證及痰、濕、熱證等[19]。溫平可補氣、和中、助陽,寒性中藥有清熱、解毒、瀉火之功效[20]。對藥物性味歸經的研究發現中藥復方治療肺癌的藥性以溫、平、寒為主,藥味以甘、苦、辛為主,歸經以肺經、脾經、胃經為主。肺癌病位涉及肺、脾、胃等,這與歸經統計結果一致,且治療主要注重肺經[21]。
(4)通過關聯規則分析表明,茯苓-半夏、茯苓,半夏-白術、茯苓,浙貝母-半夏-白術分別為同一組中支持度最高的組合,其置信度均大于80%。研究表明,白術中白術多糖具有抗腫瘤、免疫調節、抑菌、降血糖、抗氧化等藥理作用[22]。茯苓多糖具有抗菌、抗腫瘤、免疫抑制等諸多藥理活性[23]。半夏植物中主要活性成分β-谷甾醇,對人體中癌細胞,如胃癌、結腸癌、肺癌、乳腺癌等具有顯著的抑制活性[24];浙貝母中主要成分為生物堿,其藥理作用為鎮咳祛痰、鎮痛抗炎、抗潰瘍、止瀉、抗菌抗腫瘤等[16]。
(5)由聚類分析結果可知,第1類為加味六君子湯,六君子湯可以抑制癌細胞增殖、促進癌細胞凋亡、抑制腫瘤細胞遷移和血管生成[25];第2類為黃芪-甘草藥對,具有補氣生津、補氣升陽、利水退腫的功效[26];第3類為苦杏仁、石上柏、石見穿、桔梗、薏苡仁,其中苦杏仁、石上柏清肺止咳平喘,桔梗是臨床上常用的一種清化熱痰藥物, 薏苡仁有利水滲濕、健脾止瀉、除痹、排膿、解毒散結的功效;第4類為黃芪、當歸、熟地黃、麻黃、白芥子、白芍、柴胡、百部,其中麻黃、白芥子、百部可潤肺止咳、宣肺平喘、溫肺化痰,當歸、熟地黃、白芍為補血養血功效,柴胡主要功效為疏散退熱;第5類為五味子、海浮石、牡蠣、麥冬、山慈菇,五味子、麥冬歸肺經,山慈姑可清熱解毒、化痰散結;第6類為款冬花,具有潤肺化痰止咳功效。
(6)通過復雜網絡對中藥復方配伍規律分析,結果表明在治療肺癌的中藥復方中,白術、茯苓、半夏、浙貝母尤為重要,君、臣、佐、藥的復方配伍規律,在關聯規則分析以及聚類結果中均有體現,充分表明這四味藥為中藥復方治療肺癌的核心藥物,也有可能作為治療肺癌潛在的中藥復方。
(7)網絡藥理學及分子對接研究核心中藥治療肺癌作用機制表明,核心中藥治療肺癌涉及多個有效成分,充分體現其治療的多藥物、多成分的作用機制,其中BX5ZBM6成分體現了四味核心中藥中的共性,該成分來源于浙貝母和半夏兩味中藥,在動物實驗中被驗證可通過調節參與信號轉導的癌癥生物標記蛋白發揮抗癌作用,同時可有效抑制參與癌細胞轉移、增殖的基質金屬蛋白酶蛋白[27],另有研究表明該成分體外可誘導淋巴瘤細胞凋亡以此緩解腫瘤的繼續惡化[28];化合物BZ5、BZ6為白術植物中化合物,經細胞實驗驗證可抑制 PG 細胞的侵襲方面作用顯著、還對肺癌細胞克隆的形成能力有明顯的抑制作用[29],有實驗驗證其可能通過細胞毒性機制、調控細胞凋亡和阻滯細胞周期等方面對癌細胞生長有顯著抑制作用[30]。蛋白互作、GO、KEGG分析中可知,TP53、PTGS2、MAPK8、EGFR、AKT1等基因均涉及細胞化學應激適應性反應、金屬離子反應等,通過這些反應,可調控癌細胞對化學信號的響應機制以此抑制癌細胞突變的發生或者突變后患癌過程[31]。核心中藥治療肺癌涉及的信號通路主要為IL-17信號通路、鉑耐藥信號通路、腫瘤壞死因子信號通路、細胞凋亡等,TP53、EGFR、AKT1在這些通路均有富集,有臨床研究表明EGFR和TP53的突變狀態與NSCLC靶向治療的反應密切相關,EGFR是NSCLC患者許多靶向治療的主要作用靶點,TP53突變是接受治療的非小細胞肺癌患者的潛在負面預后因素[32]。肺腺癌細胞中的基因表達模式研究中,AKT1對體外肺腺癌細胞活力、凋亡和糖酵解以及體內腫瘤生長均有抑制,表明其具有明顯抑腫瘤作用[33]。由以上分析可知,核心中藥治療肺癌是多分子通過調控多個信號通路、涉及多種生物過程的復雜過程,且是生物過程、細胞組分、分子功能以及作用通路等之間互相影響、相互作用組成治療的復雜整體,這與中醫診療的整體理念相契合。
綜上所述,中藥復方治療肺癌的用藥思路兼顧虛實兩證,以補虛溫陽、扶正益氣為主,以清熱解毒、化痰祛瘀、鎮咳平喘等為輔;據其用藥規律研究可知,治療肺癌的核心組方為黨參、茯苓、白術、陳皮、浙貝母、黃芪、甘草。通過數據挖掘方法對肺癌治療的中藥復方進行統計分析,總結了蘊藏在大量復方中的診療、配伍規律、核心用藥等,為肺癌的中醫臨床提供了新的處方依據,也開拓了新方開發的思路,通過網絡藥理學和分子對接明確核心中藥治療肺癌的作用機制和物質基礎,對肺癌臨床研究有一定的指導作用。但是本研究僅對于江西省內肺癌患者的中藥復方的真實世界治療情況進行數據挖掘研究,研究結果僅代表江西省,將研究樣本擴大至全國范圍仍需要后期進一步推進,網絡藥理學、分子對接結果有待進一步實驗驗證。