張澤鑫,余佳蓓,林思其,劉紫鳳,陳林靜,陳栩靜,陳祎琦
1 廣州中醫藥大學第一臨床醫學院,廣州5100062;2 廣州中醫藥大學第二臨床醫學院
肺腺癌(LUAD)是非小細胞肺癌(NSCLC)中最常見的病理類型,五年生存率僅為4%~17%,預后不佳[1]。LUAD的發生發展是一個多基因共同參與、多因素共同作用、多階段進展的復雜生物學過程,深入研究LUAD的分子機制是提高NSCLC診療效果的基礎。中藥抗腫瘤藥復方紅豆杉膠囊可用于治療LUAD,研究顯示,其有抗炎、增強免疫力的作用,對LUAD細胞具有較強的細胞毒性,但具體作用機制尚不明確[2]。加權基因共表達網絡(WGCNA)分析是一種系統生物學方法,用來描述基因間的相關模式,其可利用系統生物學的思想尋找基因之間表達的相似性,并將表達高度相關的基因確定為一個基因模塊。2021年3月—4月,本研究將WGCNA用于LUAD表達譜數據的分析,篩選出復方紅豆杉膠囊治療LUAD的有效成分及核心靶點,并通過GO功能富集和KEGG通路富集分析其作用機制,以期為LUAD的診斷和治療提供新的策略。
1.1 復方紅豆杉膠囊活性成分及作用靶點篩選 通過中藥系統藥理學數據庫與分析平臺(TCMSP,http://tcmspw.com/tcmsp.php)檢索復方紅豆杉膠囊關鍵成分紅豆杉、紅參、甘草的活性成分及相關作用靶點,根據口服利用度(OB)≥30%、化合物類藥性(DL)≥0.18進行篩選。由于TCMSP中沒有收錄紅豆杉的相關活性成分,因此使用中藥分子機制的生物信息學分析數據庫(BATMAN-TCM,http://bionet.ncpsb.org.cn/batman-tcm/)對紅豆杉的藥物活性成分進行補充。使用R語言(3.6.1)對活性成分和作用靶點進行配對。
1.2 LUAD差異表達基因共表達模塊篩選 從TCGA數據庫(https://portal.gdc.cancer.gov/)下載TCGA-LUAD的轉錄組數據和臨床數據,從GEO數據庫(https://www.ncbi.nlm.nih.gov/gds)下載LUAD表達譜(GSE83227)的基因芯片數據。從TCGA數據庫中獲得59個正常樣本和535個LUAD樣本;GEO數據庫中獲得33個正常樣本和32個LUAD樣本。通過R語言的RPKM函數和WGCNA包,篩選出具有RPKM值的基因,對基因表達量進行規范。使用函數pickSoftThreshold選擇軟閾值β=5和18以建立無標度網絡,通過公式AIJ=|SIJ|β(AIJ:基因I與基因J之間的鄰接矩陣,SIJ:通過所有基因對的皮爾遜相關性獲得的相似性矩陣)并轉換為拓撲重疊矩陣(TOM)及其相關的相似度(1-tom)。為了將相似的表達基因分為不同的共表達模塊,構建了1-tom矩陣的層次聚類樹,聚類樹中表達具有高度相關性的基因確定為一個基因模塊,分別用不同的顏色表示。為了篩選正常樣本和腫瘤樣本之間差異最大的基因模塊,我們將其與數據的臨床特征進行了整合分析,通過繪制基因模塊和臨床特征之間的相關熱圖來評估每個模塊與正常樣本和腫瘤樣本的臨床特征之間的相關性,選擇相關性差異最大的基因模塊進行后續研究。
1.3 復方紅豆杉膠囊治療LUAD的加權共表達基因篩選 通過R語言的VennDiagram包對復方紅豆杉膠囊活性成分治療靶點、TCGA數據庫及GEO數據庫中相關性差異最大的基因模塊進行相互映射,取交集獲得復方紅豆杉膠囊治療LUAD的加權共表達基因,并使用Cytoscape3.7.2繪制加權共表達基因的藥物—化合物—靶點圖。
1.4 加權共表達基因的功能與作用通路分析 使用R語言中的ClusterProfiler軟件包對復方紅豆杉膠囊治療LUAD的加權共表達基因進行GO功能和KEGG通路富集分析,以篩選出復方紅豆杉膠囊治療LUAD相關的生物信息學過程。以上篩選過程設定過濾條件為pvalue Filter=0.05,qvalue Filter=1。
1.5 復方紅豆杉膠囊治療LUAD核心靶基因的篩選與驗證 使用R語言的survival包對TCGA數據庫的臨床數據進行生存分析并通過Kaplan-Meier單變量生存分析圖進行展示,其中,藍色曲線代表基因低表達患者,紅色曲線代表基因高表達患者,以P值代表該基因在高、低表達患者中是否存在顯著性差異,秩數檢驗P<0.05的加權共表達基因被認為是與生存時間顯著相關的加權共表達基因,即復方紅豆杉膠囊治療LUAD的核心靶基因。將篩選出的復方紅豆杉膠囊治療LUAD的核心靶基因直接導入到HPA數據庫(https://www.proteinatlas.org/)中,驗證其在正常肺組織和LUAD組織中的表達是否具有差異。
2.1 復方紅豆杉膠囊活性成分及作用靶點篩選結果 共得到復方紅豆杉膠囊活性成分141個(甘草92個、紅參4個、紅豆杉45個),去重后作用靶點356個(甘草335個、紅參20個、紅豆杉271個)。
2.2 LUAD差異表達基因共表達模塊篩選結果 排除未分配給任何功能組的灰色模塊后,TCGA數據庫中共得到15個基因共表達模塊,GEO數據庫中共得到5個基因共表達模塊(OSID碼圖1、2)。繪制基因模塊和臨床特征之間的相關熱圖可見,TCGA數據庫中的綠松石色模塊(正常樣本r=0.77,LUAD樣本r=-0.77,P=9E-119)及GEO數據庫中的綠松石色模塊(正常樣本r=0.88,LUAD樣本r=-0.88,P=5E-22)相關性差異最明顯,分別包含了6 587、649個基因(OSID碼圖3、4)。
2.3 復方紅豆杉膠囊治療LUAD的加權共表達基因篩選結果 將復方紅豆杉膠囊活性成分治療靶點、GEO數據庫綠松石色基因、TCGA數據庫綠松石色基因取交集,共得到復方紅豆杉膠囊治療LUAD的加權共表達基因14個,分別為LDLR、FOS、IL6、CAV1、TUBB3、TUBB6、MCL1、CA2、JUN、SLC6A4、CD36、ALDH1A1、MAOB、TFAP2C。通過繪制加權共表達基因的藥物—化合物—靶點圖可見,紅豆素A(Taxumain A)和紫杉堿(Taxinine)為復方紅豆杉膠囊治療LUAD的主要活性成分。見OSID碼圖5。
2.4 加權共表達基因的功能與作用通路分析結果 對14個加權共表達基因進行GO功能和KEGG通路富集分析,GO功能分析顯示,復方紅豆杉膠囊治療LUAD的主要生物過程為有機羥基化合物轉運、細胞對氧化應激的反應、對脂多糖的反應等,主要細胞成分為內吞囊泡膜、內吞囊泡、膜筏等,主要分子功能為低密度脂蛋白顆粒受體活性、一氧化氮合酶結合、脂蛋白顆粒受體活性等;KEGG通路分析顯示,復方紅豆杉膠囊治療LUAD可能通過致病性大腸桿菌感染、朊病毒病、苯丙胺成癮等通路發揮作用。見OSID碼圖6、7。
2.5 復方紅豆杉膠囊治療LUAD核心靶基因的篩選與驗證 Kaplan-Meier單變量生存分析圖顯示,
CAV1基因為復方紅豆杉膠囊治療LUAD的核心靶基因(P<0.009)。見OSID碼圖8。HPA數據庫中免疫組織化學染色顯示,CAV1在肺正常組織中染色中等(quantity:75%~25%),在LUAD組織中無染色(quantity:None)。見OSID碼圖8。
LUAD是最致命的惡性腫瘤之一,可分為原位癌、微浸潤性腺癌和浸潤性腺癌,其起源細胞和進展階段尚不明確。LUAD的全球發病率為31.5%,病死率為27.1%,且發病率逐年增加[3]。目前LUAD的治療方法主要包括手術、放化療、微波消融等,盡管治療方法很多,但其治療效果仍然有限,預后不佳。因此,深入研究治療LUAD的關鍵基因、關鍵信號通路,了解基因之間的調控機制對于LUAD的治療具有重要意義。
本研究結果顯示,復方紅豆杉膠囊中共有141個候選化合物,其中治療LUAD最主要的活性成分是Taxumain A和Taxinine。Taxumain A是一種有毒的蛋白質,也是一種Ⅱ型核糖體失活蛋白[4]。其可以通過修飾真核延伸因子2(eEF-2)或破壞28 S rRNA來不可逆地直接失活核糖體,并可間接通過修飾參與蛋白質合成翻譯的因子來抑制蛋白質合成,進而誘導細胞壞死或細胞調亡,導致LUAD細胞死亡[5]。Taxinine是紫杉醇的中間體,對LUAD細胞具有細胞毒性[6]。此外,Taxinine也是紅豆杉的抗血小板成分,具有抗血小板聚集的作用。其一方面可以抑制血小板調節腫瘤細胞和腫瘤的微環境,促進自然殺傷細胞識別腫瘤細胞[7];另一方面也可以抑制血小板促進腫瘤血管生成,減少腫瘤細胞增殖,增加腫瘤壞死,從而影響腫瘤的生長[8]。
本研究發現,復方紅豆杉膠囊在治療LUAD中具有14個加權共表達基因,其中最主要的核心基因為CAV1。CAV1是一種多功能膜蛋白,在癌癥中起著雙重作用。其在癌癥的早期階段表現為抑癌基因,對腫瘤的抑制功能是由其最主要的功能結構域腳手架區域(CSD)介導的[9]。CAV1的CSD可與各種信號蛋白分子相互作用,抑制其蛋白活性,從而抑制該信號途徑[10]。CAV1的表達水平受生長因子刺激負調控,重組過表達CAV1可以通過介導細胞周期阻滯在G0/G1期來抑制細胞增殖[11]。但是,CAV1在晚期癌癥和癌癥轉移中起到腫瘤啟動子的作用[12]。通過生長因子誘導CAV1的絡氨酸(Tyr14)和絲氨酸(Ser80)磷酸化以及膽固醇結合到CAV1基因啟動子上,引起的CAV1的上調表達,可促進腫瘤細胞的遷移和侵襲并參與各種細胞代謝以維持癌細胞生存[13]。此外,有研究顯示,CAV1的高表達可導致治療耐藥性,這也是導致LUAD臨床預后不良的原因之一[14]。
GO功能分析可以提供涉及相關基因的生物學過程、細胞組成和分子功能,并幫助研究人員了解疾病的發病機制或藥物機理。通過GO分析,我們發現復方紅豆杉膠囊可調節有機羥基化合物的轉運,有利于抗癌增殖。研究顯示,有機羥基化合物可通過調節細胞周期和誘導細胞凋亡來實現抗增殖活性,對LUAD上皮細胞具有抗增殖作用,這與我們的研究結果一致[15]。我們還發現,復方紅豆杉膠囊在治療LUAD時主要在內吞囊泡膜發揮作用并可調節低密度脂蛋白顆粒受體的活性。研究顯示,載脂蛋白顆粒可以通過低密度脂蛋白顆粒受體進入細胞,從而抑制炎癥,增強人體的免疫防御能力[16]。KEGG通路分析顯示,共有30條KEGG富集通路,其中致病性大腸桿菌感染信號傳導途徑富集的基因最多。相關報道顯示,致病性大腸桿菌感染可引起炎癥和產生活性氧[17]。炎癥能夠增強大腸桿菌在腸道微生物群中的彈性,從而增強大腸桿菌的促癌活性[18]。大腸桿菌誘導了氧化應激,而氧化應激參與了癌變過程。細胞正常氧化還原狀態的紊亂會產生過氧化物和自由基,破壞包括蛋白質、脂質和DNA在內的細胞成分,從而引起毒性作用。此外,致病性大腸桿菌產生的毒素可干擾真核細胞的細胞周期或誘導DNA損傷,并影響正常細胞的分化、凋亡和增殖,進而導致LUAD的發生發展[19]。
綜上所述,本研究通過TCMSP數據庫和BATMAN-TCM數據庫篩選出復方紅豆杉膠囊的活性成分及作用靶點,并將WGCNA用于LUAD表達譜數據的分析,篩選出14個復方紅豆杉膠囊治療LUAD的加權共表達基因,這些加權共表達基因的主要功能為有機羥基化合物的轉運、調節低密度脂蛋白顆粒受體的活性等,主要作用通路為致病性大腸桿菌感染信號傳導途徑。進一步分析發現,復方紅豆杉膠囊治療LUAD的主要的活性成分為Taxumain A、Taxinine,核心靶基因為CAV1,其可以作為治療LUAD的關鍵活性成分及關鍵靶點,為LUAD的診療提供新的策略。