智 鵬,張皓旻,王毅興,遲小華,陳浩然,陳熙勐,張鈞棟,李卓陽,劉格良,楊 波,葉 芳,盧學春
新型冠狀病毒肺炎(coronavirus disease 2019,COVID-19)疫情仍未結束,全球多個國家均出現了確診和疑似病例[1]。COVID-19患者病情進展快,預后差,病死率高,給患者臨床診療帶來巨大挑戰[2]。研究表明,嚴重急性呼吸綜合征冠狀病毒(severe acute respiratory syndrome coronavirus,SARS-CoV)與嚴重急性呼吸綜合征冠狀病毒-2(severe acute respiratory syndrome coronavirus-2,SARS-CoV-2)序列高度同源且體內結合位點一致[3]。生物信息學分析與藥物預測發現,西多福韋對嚴重急性呼吸綜合征(severe acute respiratory syndrome,SARS)具有潛在治療作用,且治療靶點與mTOR、IL-17等信號通路有關[4-5]。據此推測西多福韋對SARS-CoV-2可能具有類似作用。為探明西多福韋治療COVID-19的潛在分子機制,本研究采用生物信息學方法,篩選關鍵治療信號分子及通路進行研究,以期為COVID-19臨床治療藥物選擇提供指導。
1.1 數據篩選與提取 本研究以“cidofovir”為關鍵詞,在基因表達數據庫(gene expression omnibus,GEO)中檢索,篩選至少包含3個生物學重復且物種為人或小鼠的數據,將西多福韋治療組設為實驗組,未治療組設為對照組。
1.2 差異表達基因識別 在bioconductor網站(http//:www.bioconductor.org)下載R語言程序,利用 Impute 程序包對已獲取的基因表達譜進行歸一化處理。利用注釋包對數據注釋,將探針對應到基因上進行匹配(若多個探針對應一個基因,則取多個探針表達量的平均值作為該基因的表達量)。利用Impute 程序包將基因注釋結果與表達量整合,得到2組數據集的基因表達譜,用于后續分析;利用 Limma 程序包,以|logFC|>1,FDR<0.05作為閾值,篩選實驗組與對照組的差異表達基因。
1.3 富集分析 采用基因本體論 (gene ontology,GO)和京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)對差異表達基因進行富集分析。采用Fisher確切概率法,以FDR<0.05,P<0.05作為篩選條件,獲得差異表達基因GO富集的生物學進程(biological processes,BP)、細胞組分(cellular component,CC)、分子功能(molecular function,MF)和KEGG富集的通路。
1.4 構建蛋白互作網絡 使用STRING開源數據庫對前述差異表達基因構建蛋白互作(proteinprotein interaction,PPI)網絡,以可靠性閾值>0.4作為截斷值下載數據,隨后將數據導入Cytoscape可視化分析軟件,使用CytoHubba 插件對PPI網絡中基因節點進行得分計算,以Degree≥6 作為閾值,選取Degree 值前10位基因作為核心基因。
1.5 EpiMed關聯分析 利用課題組前期自主研發的臨床生物信息學表觀精準治療預測平臺(epigenomic precision medicine prediction platform,EpiMed)篩選與西多福韋關聯的疾病和藥物,關聯強度為正值即為正相關,負值即為負相關[6-7]。
2.1 數據選擇 共檢索到4篇“cidofovir”相關文章[8-11],涉及4組數據,120個樣本,最終選擇GSE39293數據集中西多福韋作用于原發性人角質化細胞的數據,見表1。

表1 數據基本情況Table 1 Basic information of data
2.2 差異表達基因識別 歸一化后數據差異表達基因篩選中,共發現585 個差異表達基因,其中上調差異表達基因494個,下調差異表達基因91個,見圖1。

圖1 差異表達基因分析紅色為上調差異表達基因,綠色為下調差異表達基因,黑色為未達到篩選閾值的基因Figure 1 Analysis of differentially expressed genes
2.3 富集分析
2.3.1 GO 富集分析 GO 富集分析結果顯示,富集BP 42條,CC 11條,MF 0條。相關基因有IFIT3、OAS1、ISG15、IFIT1、IFIT2、Mx2 等。BP方面主要富集條目為干擾病毒復制、I型干擾素作用、免疫調節等;CC方面主要富集條目為核小體組裝、DNA復合物、有絲分裂紡錘體中央區等,見圖2。

圖2 GO富集分析選擇富集基因數量排名前10的進行展示;橙色代表BP,藍色代表CC,橫坐標為富集的基因數量,縱坐標為GO富集條目Figure 2 GO enrichment analysis
2.3.2 KEGG富集分析 富集KEGG通路共244條,主要富集條目為抗病毒、抗凋亡、免疫調節,凝血系統相關信號通路等。相關基因有CXCL8、CCL20、MMP1、SLC7A5、EIF4EBP1 、SESN2、CFHR1、CFH、PLAT等。抗病毒相關信號通路包括HIV-1感染信號通路、堿基切除修復、DNA復制等,其中HIV-1感染信號通路見圖3;抗凋亡相關信號通路包括p53、鐵死亡、JAK-STAT等,其中JAK-STAT通路見圖4;免疫調節相關信號通路包括類風濕性關節炎、IL-17、mTOR等,其中IL-17信號通路見圖5;凝血系統相關信號通路包括葉酸生物合成、補體與凝血系統等,其中補體與凝血系統信號通路見圖6。

圖3 抗病毒相關信號通路紅色表示差異表達基因上調,綠色表示差異表達基因下調Figure 3 Anti virus related signaling pathway

圖4 抗凋亡相關信號通路紅色表示差異表達基因上調,綠色表示差異表達基因下調Figure 4 Anti-apoptosis related signaling pathway

圖5 免疫調節相關信號通路紅色表示差異表達基因上調,綠色表示差異表達基因下調Figure 5 Immunomodulatory signaling pathway

圖6 凝血系統相關信號通路紅色表示差異表達基因上調,綠色表示差異表達基因下調Figure 6 Coagulation system related signaling pathway
2.4 PPI網絡分析及核心基因篩選 PPI網絡分析結果顯示,共得到514個蛋白,715條相互關系,平均點度2.78。對核心基因進行篩選,排名前10位核心基因分別為CDK1、CCNA2、CDC6、KIF11、MAD2L1、NDC80、RRM2、ASPM、NCAPG、CENPU,見圖7。

圖7 關鍵基因PPI 網絡及核心基因統計圖A.PPI網絡;B.排名前10位的核心基因Figure 7 Key gene in PPI network and statistical chart of hub genes
2.5 EpiMed關聯分析 EpiMed預測結果顯示,西多福韋與SARS、肺炎等疾病呈負相關,與利巴韋林、α-干擾素等藥物呈正相關,與諾氟沙星、衣霉素等抗生素呈負相關,見表2。

表2 EpiMed關聯分析結果Table 2.Results of EpiMed correlation analysis
本研究以西多福韋相關全基因組表達譜數據為研究對象,經臨床生物信息學分析,發現西多福韋可對大量基因表達模式產生影響,尤其以CDK1等細胞周期相關分子最為顯著,與以往研究結果一致[12-14]。此外,富集分析結果顯示,上述分子表達水平變化可能與抗病毒、抗凋亡、免疫調節和凝血系統相關信號通路有關,針對以上信號通路開展研究有望揭示西多福韋治療COVID-19的組學機制。
既往研究表明,包括SARS-CoV、SARSCoV-2等在內的RNA病毒可通過干擾宿主組蛋白修飾、染色質重塑機制或編碼與宿主組蛋白直接相互作用的病毒蛋白,進而干擾和拮抗宿主先天免疫反應[15]。本研究GO富集分析發現,西多福韋調控基因中有大量與干擾病毒復制、I型干擾素作用、免疫調節等作用相關的分子,例如IFIT3、OAS1、ISG15等。Carey等[16]發現,OAS1結合入侵病毒雙鏈RNA,可產生2'-5'連接的寡聚腺苷酸,以激活核糖核酸酶,裂解RNA,抑制病毒復制。同時 OAS1還可以通過宿主RNA進行自動激活,從而發揮抗病毒作用;除此之外,本研究發現大量西多福韋調控基因富集于I型干擾素作用的BP中,例如 IFIT1、IFIT2、Mx2等。Zhao等[17]發現IFIT1、IFIT2等產生后,可通過干擾病毒包膜與宿主膜融合,直接發揮抑制病毒作用;Haller與Fuchs等[18-19]發現,Mx2等Mx家族蛋白可作為干擾素誘導產生ISG家族的激動劑,對多數RNA和DNA病毒初期復制具有廣泛抑制作用。因此,本研究推測西多福韋可以通過上述分子調控的BP發揮抗SARS-CoV-2的作用。
此外,西多福韋影響的信號通路主要與抗病毒、抗凋亡、免疫調節及凝血系統相關。以往研究發現,西多福韋可通過誘導病毒感染相關腫瘤細胞的凋亡發揮治療作用[20-21]。本研究發現大量基因富集于p53、鐵死亡、JAK-STAT等抗凋亡相關信號通路,推測西多福韋可通過上述信號通路誘導感染SARS-CoV-2的細胞凋亡,進而發揮抗病毒作用。現已證實,冠狀病毒感染人體后可通過IL-17、mTOR等免疫調節相關信號通路誘導促炎因子釋放,同時影響CD8+T細胞、CD4+T細胞功能進而發生異常凋亡、分化及遷移[22-24]。本研究發現,西多福韋可通過mTOR、IL-17信號通路發揮免疫調節作用。在IL-17信號通路中,CXCL8、CCL20、MMP1是西多福韋的主要作用對象,推測西多福韋可通過這些分子影響IL-17信號通路進而抑制促炎因子的釋放,改善SARS-CoV-2感染導致的相關免疫失調問題。同時,西多福韋可通過SLC7A5、EIF4EBP1 、SESN2等分子對mTOR信號通路產生影響,推測與COVID-19患者體內的免疫細胞遷移密切相關。臨床研究發現,COVID-19重癥患者常出現膿毒癥休克及凝血功能異常,其潛在機制除與體內病毒大量復制及免疫反應有關外,可能還與凝血系統相關信號通路的功能異常密切相關[25]。本研究發現,西多福韋可對葉酸生物合成、補體與凝血系統等凝血系統相關信號通路產生影響,CFHR1、CFH、PLAT等分子可作為西多福韋調控凝血功能的主要分子,與既往研究結果一致[26]。基于上述結果,推測西多福韋對重型COVID-19患者的免疫失調、凝血功能異常等癥狀具有潛在治療作用。
再者,基于EpiMed開展的疾病和藥物關聯分析發現,與疾病呈負相關表示該藥物可能對某疾病發揮治療作用;與藥物呈正相關表示該藥物具有與西多福韋類似的作用,且聯合用藥可發揮協同作用。與抗生素呈負相關表示該藥物與西多福韋聯合使用可能會加重病情[6-7]。在疾病關聯分析方面,西多福韋與肺炎、SARS等疾病呈負相關,提示西多福韋可能對上述疾病具有治療作用,因SARS-CoV與SARS-CoV-2序列高度同源,推測西多福韋對COVID-19具有類似治療作用。在藥物關聯分析方面,西多福韋與氟伐他汀、利巴韋林、α-干擾素、柴胡、黃芪等藥物呈正相關,推測可能與西多福韋作用類似且可與西多福韋聯合用藥。國家衛生健康委員會發布的《新型冠狀病毒肺炎診療方案(試行第八版)》[27]中亦包含上述藥物。同時,Reiner等[28]發現包括氟伐他汀在內的他汀類藥物可能是SARS-CoV-2高效的抑制劑,與本研究結果一致。此外本研究發現,西多福韋與衣霉素、諾氟沙星等抗生素呈負相關。Becattini等[29]發現,抗生素會破壞共生種群之間的平衡,導致人類腸道菌群和下層黏膜物質之間的交換減少;也可能會產生過敏、代謝綜合征、藥物療效降低等多種后果。以上都說明衣霉素、諾氟沙星等抗生素不僅不能與西多福韋聯合應用,而且不建議用于COVID-19的治療。
本研究不足之處在于未能開展臨床試驗和直接獲取SARS-CoV-2感染的開源數據,未來如能開展基礎及臨床試驗,有望為COVID-19治療藥物與臨床方案的選擇及優化提供指導。
綜上所述,西多福韋能夠對機體全基因組產生影響,可能通過誘導感染細胞凋亡降低體內SARS-CoV-2數量;通過免疫調節、凝血系統相關信號通路等對機體免疫失調及重型患者出現的凝血功能異常進行調節,達到治療COVID-19的作用。