趙子雨,劉 暢, 沈紀辰, 李文碩, 李 欣
(1.南開大學 醫學院,天津 300350;2.南開大學 生命科學學院,生物國家級實驗教學示范中心,天津 300071)
新型冠狀病毒肺炎(COVID-19)自2019年底爆發以來相繼在世界各國蔓延,先后被世界衛生組織宣布為國際關注的突發公共衛生事件(PHEIC)和全球性大流行病(Pandemic),對全球的公共安全構成了嚴重威脅[1-2]。據WHO新冠疫情數據顯示,截至2020年10月1日,全球新冠確診病例累計33 842 281例,其中死亡1 010 634例[3]。另據美國約翰斯·霍普金斯大學統計數據,截至同年10月2日,全球累計確診超3 420萬例,其中死亡超102萬例[4]。
導致新型冠狀病毒肺炎的病原是一種冠狀病毒。冠狀病毒在系統分類上屬套式病毒目(Nidovirales)冠狀病毒科(Coronaviridae)冠狀病毒屬(Coronavirus),是具有囊膜的ssRNA正鏈病毒,在自然界中廣泛存在[5]。2020年2月11日,世界衛生組織將引起此次新冠肺炎的病毒正式命名為SARS-CoV-2[6]。它是目前已知的第七種能夠感染人類的冠狀病毒,具有高傳染性和高隱蔽性[7],且臨床上針對病毒感染性疾病的治療較為困難。在我國第七版《新型冠狀病毒肺炎診療方案》中,采用的抗病毒藥物治療推薦了三種方案:第一種是干擾素、洛匹那韋/利托那韋和利巴韋林的聯合使用;第二種是抗瘧疾藥物磷酸氯喹的應用;第三種是阿比多爾的運用[8]。由于這三種都不是針對新冠肺炎的特效藥,因此在診療方案中明確要求要注意上述藥物的禁忌癥、副作用以及藥物間相互作用等[9]。當前對于新型冠狀病毒的蛋白靶點的研究主要集中在特定蛋白靶點與已有藥物的分子對接、分子動力學模擬等,探索相應蛋白靶點的結合藥物及其作用機制;另外新冠肺炎的藥物研究也有臨床試驗在進行中,據中國臨床試驗注冊中心 ( Chinese Clinical Trial Registry,ChiCTR) 網站數據顯示,截至 2020 年 7月 1 日,我國共有 666 項( 因各種原因撤銷的 45項未計算在內) 相關臨床試驗( 包括藥物、診斷試劑、心理干預等) 正在實施過程中[10]。但目前來看,老藥新用的臨床效果并不理想,且尚沒有出現治療新型冠狀病毒肺炎的特效藥,從長遠角度考慮,進行疫苗和創新藥物研發仍是當前重要研究任務[11]。
美國化學文摘社(Chemical Abstracts Service, CAS,美國化學會的分支機構,是全球化學信息最權威的機構,提供世界上最大的公開披露的化學信息的數據庫)發布了SARS-CoV-2的蛋白靶點詞庫[12]。本研究對其發布的蛋白靶點進行生信分析,了解病毒的結構、侵襲過程以及基因組和蛋白質信息,借助分析工具和數據庫資料分析與病毒復制等過程相關的蛋白通路和蛋白-蛋白相互作用關系,以獲得新冠病毒和宿主細胞蛋白靶點組成的蛋白通路和互作網絡,探索對于預防和治療新冠肺炎有效的關鍵蛋白靶點和生物過程,希望為新冠肺炎的藥物和疫苗研究提供可能的思路。
依據美國CAS提供的新型冠狀病毒蛋白靶標詞庫《COVID-19 Protein Target Thesaurus》,一共可以得到63種與新冠病毒相關的蛋白靶點作為本次研究的基本材料。在這63種蛋白靶點中,可根據蛋白來源不同,分為宿主蛋白和病毒蛋白兩大類。對于宿主蛋白,若一種蛋白具有發揮作用的不同亞型,則將其作為一類,對亞型進行細分,查找每個亞型靶點的Ensembl Gene ID。對于宿主蛋白靶點,白介素-1受體包括白介素-1受體1(IL-1R1)、白介素-1受體2(IL-1R2);血管緊張素II受體包括血管緊張素II-1型受體(AGTR1)、血管緊張素II-2型受體(AGTR2);免疫球蛋白受體包括IgG受體IIa的Fc片段(FCGR2A)、IgG受體IIb的Fc片段(FCGR2B)、IgG受體IIIa的Fc片段(FCGR3A);核周蛋白α類包括核周蛋白α亞基1(KPNA1)、核周蛋白α亞基2(KPNA2)、核周蛋白α亞基3(KPNA3)、核周蛋白α亞基4(KPNA4)、核周蛋白α亞基5(KPNA5)、核周蛋白α亞基6(KPNA6)、核周蛋白α亞基7(KPNA7);核周蛋白β類包括皮質素傳遞蛋白1(TNPO1)、皮質素傳遞蛋白2(TNPO2)、入核轉運受體5(IPO5);吞蛋白類包括吞蛋白A1(SH3GL2)、吞蛋白A2(SH3GL2)、吞蛋白A3(SH3GL3)、吞蛋白B1(SH3GLB1)、吞蛋白B2(SH3GLB2)。對于病毒蛋白靶點,可將具有相同功能的蛋白劃分為一類。將3種同為病毒RNA依賴型RNA聚合酶的蛋白靶點歸為一類,將2種核衣殼蛋白歸為一類,并且將具有相同結構但有不同別名的蛋白合并為一類。由此分類后,可得到34種來自宿主細胞的蛋白靶點和19種來自病毒自身的蛋白靶點。宿主蛋白靶點種類多且復雜,病毒蛋白靶點則可分為參與病毒體構成的結構蛋白和不參與病毒體構成但在病毒增殖過程中發揮作用的非結構蛋白。本研究將分別對宿主蛋白靶位和病毒蛋白靶位的生物學特征及相互作用關系進行生信分析。
病毒和宿主的蛋白靶點序列數據來源于數據庫NCBI(https://www.ncbi.nlm.nih.gov/)、Ensembl(http://asia.ensembl.org/index.html);數據分析工具為蛋白富集分析工具Matescape[13](https://metascape.org/gp/index.html)、蛋白網絡分析工具STRING[14](https://string-db.org/);病毒蛋白靶點的圖文描述來源于ViralZone網站[15-16](https://viralzone.expasy.org/;https://viralzone.expasy.org/9056);蛋白相互作用資源來源于ViralZone網站SARS-CoV-2蛋白組信息網站(https://viralzone.expasy.org/8996),ViralZone網站SARS-CoV-2互作組信息網站(https://viralzone.expasy.org/9077),UniProt數據庫 (https://covid-19.uniprot.org/uniprotkb?query=*)。
將CAS提供的新型冠狀病毒的細胞蛋白靶點利用NCBI數據庫工具轉換成基因序列信息,并在Ensembl數據庫檢索基因的詳細信息得到基因名稱和ID,整理成表格信息,表中共有32種、48個蛋白靶點,同種類的蛋白靶點歸納在表格的最后部分,表中蛋白AL079342.2由于尚沒有明確詳細的研究記錄,不列入分析網絡內,故表中實有47個有效的Ensembl Gene ID。
1.3.1 蛋白質富集分析
將47個不同的蛋白靶點以列表的形式輸入到工具Metascape中,利用KEGG Pathway, GO Biological Processes, Reactome Gene Sets, Canonical Pathways, CORUM, TRRUST, DisGeNET和PaGenBase等資源進行路徑和過程的富集分析,基因組中的所有基因都被用作富集背景,其中篩選條件p值<0.01、最小計數為3、富集因子>1.5的富集項,根據相似性進行層次聚類,生成條形圖;為了進一步探索富集項之間的關系,我們將其呈現為網絡圖,并用Cytoscape生成可視化網絡[17];最后利用BioGrid6、InWeb_IM7、OmniPath8等數據庫和MCODE算法進行蛋白質相互作用的富集分析,得到所有基因相關蛋白質的全連接互作網絡。
1.3.2 蛋白網絡
運用STRING數據庫對基因的序列信息進行分析,做出包含已知相互作用、預測相互作用和根據蛋白質同源性得到的相互作用等的蛋白質互相作用網絡,以及對各蛋白節點的描述、蛋白名稱、注釋等信息,并對結果進行整理分析。
分析蛋白質互作網絡,得到相互作用強的蛋白網絡,根據相互作用的強弱和子網絡的分布查詢對應的蛋白通路信息,并利用DAVID工具對相關作用強的基因做GO和KEGG分析[18],建立蛋白通路和新冠肺炎治療的聯系。
1.3.3 病毒
運用NCBI數據庫公布的SARS-CoV-2病毒組學信息[19],對CAS提供的已知的19種病毒蛋白靶位進行資料搜集,將靶點蛋白分類為結構蛋白和非結構蛋白兩大類,整合組學信息后列出表格。然后,利用ViralZone網站中提供的圖文資料得到有關病毒的結構、病毒的基因組蛋白組、病毒的復制周期、蛋白互作的描述及圖表[15-16]。最后,整合CAS提供的靶點描述信息、NCBI提供的靶點所在開放閱讀框的組學信息,并將其對應至ViralZone圖片中結構蛋白靶點在病毒體上的具體位置,非結構蛋白靶點在病毒基因組中的相應位置,整理在UniProt數據庫中通過相似性對比或已經由文獻報道的蛋白質相互信息,梳理互作關系,分析靶點功能,得出結果。
細胞蛋白靶位情況(見表1);病毒蛋白靶位情況(見表2)。

表1 細胞蛋白靶位Table 1 Cellular protein targets

表2 病毒蛋白靶位Table 2 Viral protein targets
通過GO和KEGG獲得富集分層聚類樹(見圖1)。圖中展示了前18個具有統計意義的通路,分別為與宿主的相互作用、NLS介導蛋白入核、病毒基因組復制、網格蛋白介導型內吞、肺結核病、腎素-血管緊張素系統、白細胞介素-1介導的信號通路的調控、吞噬體、病毒附著于宿主細胞、甲型流感、破骨細胞分化、髓系白細胞介導免疫、脂質定位、負向調節內吞作用、細胞對激素刺激的反應、肽類激素代謝、嗜中性粒細胞遷移等,這些人體內的生物過程均與新冠病毒的作用有關,因此,我們可以考慮調控這些關鍵的通路,以控制新冠病毒在人體內的復制與繁殖。其中,“與宿主的相互作用”和“NLS介導蛋白入核”的p值最小,具有最顯著的統計學意義,這是由新冠病毒的致病機制決定的。新冠病毒通過呼吸道飛沫、接觸等傳播途徑入侵人體,在人體內大量復制、繁殖,人體免疫系統調動防御機制殺死病毒,與大部分病毒相似,新冠病毒以相互作用的形式在宿主體內生存。核定位信號(NLS)是一段存在于核蛋白中,引導核蛋白入核的氨基酸序列,病毒在侵染過程中存在病毒蛋白的核質穿梭,盡管大部分RNA病毒能在細胞質中完成復制,但一些關鍵蛋白仍需進入核內進行復制,不僅如此,許多研究表明,部分病毒蛋白的核定位可以抑制核進口從而抑制宿主基因的轉錄[20-21],因此NLS介導蛋白入核是影響病毒致病力和宿主細胞重要的一環。

圖 1 基因列表中富集項的條形圖,用p值表示Fig.1 Bar chart of enriched items from the gene list, coloured with p-values
在層次聚類的基礎上,相似度大于0.3的子樹相連為一個簇,生成網絡圖(見圖2),p值最小的兩個簇分別代表“與宿主的相互作用”和“NLS介導蛋白入核”,與上一結果對應一致。

圖 2 富集項的網絡Fig.2 Network of enriched items
此外,對該基因列表還進行了蛋白質相互作用的富集分析(見圖3)。蛋白質互作網絡包含與列表中至少一個其他成員形成物理相互作用的蛋白質子集,其中收集了兩個為單個基因列表識別的MCODE網絡。第一個網絡由基因SH3GL1、SH3GL2、SH3GL3、AAK1、DNM2、GAK組成,其中發揮主要作用的生物過程為網格蛋白介導型內吞、網格蛋白依賴型內吞作用及其調節,網格蛋白介導型內吞是受體介導內吞的主要方式之一,在質膜蛋白內吞及胞內外信號傳導過程中起著重要的調控作用,網格蛋白介導型內吞和依賴型內吞是許多病毒進入宿主細胞的重要途徑,在研究抗病毒藥物時,可通過抑制此途徑阻斷病毒感染[22];第二個網絡由基因KPNA2、KPNA4、KPNA6、IPO5組成,其中發揮主要作用的生物過程為核定位信號(NLS)介導蛋白入核,此結果與上述聚類結果相對應,同時啟發我們,對于新冠病毒入核機制的研究有利于發現潛在的抗病毒點,為靶向藥物的研發提供新方向,例如,我們可以考慮通過改變病毒蛋白的細胞核定位信號來影響病毒的毒力。

圖3 基因列表中確定的蛋白質-蛋白質相互作用網絡及MCODE成分Fig.3 Protein-protein interaction network and MCODE components identified in the gene list
利用STRING數據庫得到用基因表示的47種蛋白靶點相互作用網絡(見圖4),其中有四種蛋白基因DHODH、DDX5、CH25H、DDX19B與其他蛋白在STRING數據庫中沒有得到任何已知或預測的相互作用,其與新冠肺炎治療的關系仍需要探索。主要的數據來源為精選數據庫KEGG、GO、Biocarta等得到的相互作用,MINT、HPRD等實驗確定的相互作用和預測的基因鄰接、基因融合、基因共現相互作用,以及參考文本挖掘、共表達、蛋白質同源性得到的相互作用。此蛋白網絡分析是繼上述富集分析的延伸,圖3中的蛋白網絡只涵蓋了全部研究基因中的一部分,而此蛋白網絡是全部基因的整體蛋白互作網絡,分析的蛋白質相互作用更加全面,并且對于子網絡的分析更具體。其中有一個相互作用強的的子網絡和兩個相互作用較弱的、較大的子網絡,每個子網絡中的蛋白以及整個網絡的蛋白存在較大聯系或處于一個蛋白通路,包括肺結核、腎素-血管緊張素系統、細胞內吞作用、病毒在宿主細胞內的定向運動等蛋白通路和生物過程。

圖 4 蛋白靶點相互作用網絡Fig.4 Interaction network of protein targets
相互作用最強的子網絡由基因SH3GL1、SH3GL2、SH3GL3、GAK、AAK1、DNM2、AGTR1組成,包括通過精選數據庫、實驗測定、文本挖掘得到的相互作用和基因共表達、蛋白質同源性的聯系。在轉換成基因ID后運用DAVID的Functional Annotation Tool做通路分析,基因占比在50%左右的生物過程有細胞內吞作用、中樞神經系統發育和信號傳導,根據Viral Zone網站查詢得知SARS-CoV-2病毒蛋白是通過細胞的內吞作用進入宿主細胞的,并且病毒的ORF8蛋白可能與“攔截”負載的I類MHC分子,并將其保留在內質網中或將其靶向降解以避免肽在細胞表面出現這一過程有關[23],由此推斷其中涉及兩個基因DNM2和SH3GL2的通路抗原呈遞細胞在其細胞表面與MHC Ⅱ類蛋白復合物聯合表達外源性肽抗原過程,以及涉及四個基因SH3GL1、SH3GL2、SH3GL3、DNM2的通路細胞內吞作用,都與SARS-CoV-2病毒在人體內的侵襲過程有關,對這些基因所表達蛋白的研究和相應的藥物研究對新型冠狀病毒的防御和新冠肺炎的治療有很大幫助。
另外兩個相互作用較弱的子網絡內部不同基因也存在聯系,相互作用強的基因有IFITM1、IFITM2與IFITM3,FCGR2A與FCGR3A,CTSB與CTSL,IL6、IL6R與JAK1等。利用STRING的Analysis分析工具發現與這些基因相關聯的GO生物過程,IFITM1、IFITM2和IFIFM3主要參與了病毒進入宿主細胞的負調節,對干擾素-α的反應,以及對干擾素-β的反應;FCGR2A和FCGR3A主要參與了內吞作用和涉及吞噬作用的Fc-γ受體信號通路;CTSB和CTSL主要參與了細胞對甲狀腺激素的反應和膠原分解代謝過程;IL6、IL6R和JAK1主要參與了肝免疫反應,膠原蛋白合成過程的負調節,以及白介素6介導的信號通路[24],這些生物過程與免疫反應有很大關聯。運用DAVID的Functional Annotation Tool對47個基因做整體的通路分析和功能解釋,發現同樣存在與新冠肺炎有關的蛋白通路。涉及基因最多的蛋白通路為含NLS的蛋白導入細胞核的過程,包括基因IPO5、TNPO1、TNPO2、KPNA1、KPNA2、KPNA3、KPNA4、KPNA5 、KPNA6和KPNA7,即為一個單獨的子網絡,在Viral Zone網站查詢得知SARS1在病毒復制或釋放過程中病毒的ORF6蛋白和KPNA2存在交互過程,通過阻止蛋白質的核輸入來破壞干擾素信號傳導[25],與這一通路有關聯,以其中蛋白為藥物靶點對SARS-CoV-2的防御有研究意義。其次同樣是細胞內吞作用,涉及SH3GL1、SH3GL2、SH3GL3、SH3GLB1、SH3GLB2、CAV1、CXCR1和DNM2共八個基因。發現與病毒相關度很高的通路有甲型流感,涉及JAK1、IL6、KPNA1、KPNA2和TMPRSS2共五個基因,但在蛋白網絡中并沒有顯示出明顯的相互作用;以及病毒或病毒的一部分在宿主細胞內的定向運動這一過程,與病毒在細胞內的活動有很強的關聯,包括CLEC4M、CD209、KPNA1、KPNA2、KPNA3、KPNA4、KPNA5和KPNA7共8個基因;網絡中與病毒有直接關系的蛋白通路還包括病毒附著后病毒或其核酸突破細胞膜進入宿主細胞的過程,免疫應答,病毒對宿主細胞過程的影響或調控,I型干擾素信號通路,涉及基因都比較多,為四到八個之間,這些通路都與病毒的侵襲、復制等活動過程有關,通過藥物對通路中某一蛋白的調控可以影響疾病的發展。病毒附著后病毒或其核酸突破細胞膜進入宿主細胞的過程,涉及CLEC4M、CD209、NPC1、ANPEP、ACE2、CTSB、DPP4和KPNA3共八個基因,除基因KPNA3外,其他基因都在蛋白網絡中有關聯,且相互作用較強,這一過程涉及病毒對細胞的侵入,對相應蛋白以藥物控制可以一定程度地阻止SARS-CoV-2病毒的侵入;免疫應答的過程涉及基因為FCGR3A、FCGR2B、IFITM2、IFITM3、IL1R1、IL1R2和IL6,這七個基因的相互作用在蛋白網絡中相對較弱,IL1R1對于輔助性T細胞1因子的合成是正調節作用,IL6對于輔助性T細胞2因子的合成同樣是正調節,兩者積極調節T細胞因子的產生,且兩者與IL1R2共同參與了白介素1介導的信號通路的調控,IFITM2和IFITM3對于病毒進入宿主細胞有負調控作用,FCGR3A和FCGR2B都是低親和力免疫球蛋白γFc區受體,參與了吞噬作用的Fc-γ受體信號通路,這七個基因都涉及了免疫過程。由此,針對這一過程的蛋白設計藥物對免疫系統對病毒的防御過程做出調節,加強保護機制,可以作為治療新冠肺炎的一個可行途徑;另外兩個通路病毒對宿主細胞的影響和I型干擾素信號通路同樣和病毒在體內的過程有關,以及蛋白網絡中涉及的其他通路肺結核、腎素-血管緊張素系統、破骨細胞分化、造血細胞通路、金黃色葡萄球菌感染、蛋白質從細胞質到細胞核的定向運動、癌癥中的轉錄失調蛋白質水解等,與病毒在體內的活動過程都有關聯,其中在Viral Zone網站查詢得知SARS1在病毒復制或釋放過程中病毒的ORF6蛋白和KPNA2存在交互過程,通過阻止蛋白質的核輸入來破壞干擾素信號傳導[25],并且在病毒釋放的過程中病毒的核蛋白(N)和宿主蛋白SMAd3存在交互作用,可能引起骨髓抑制[26],前者與I型干擾素信號通路和蛋白質從細胞質到細胞核的定向運動有很大的關聯,后者與破骨細胞分化和造血細胞等通路有密切關系。
總之,利用STRING做出的含47種基因或蛋白的蛋白互作網絡,除四個基因外都有相互作用或處在同一蛋白通路,并且關系錯綜復雜,形成一些子網絡和相連的網絡,其中相對主要的并且與新冠肺炎相關度較高的通路包括細胞內吞作用、I型干擾素信號通路、蛋白質從細胞質到細胞核的定向運動、病毒附著后病毒或其核酸突破細胞膜進入宿主細胞的過程、免疫應答和病毒對宿主細胞過程的影響或調控,這些通路涉及的蛋白可以作為藥物的靶點,研究其結構和功能設計藥物,以緩解或治療新冠肺炎,所以研究這些蛋白靶點設計藥物對新冠肺炎的治療有重要意義。
由NCBI公布的SARS-CoV-2基因組、蛋白組數據可知,美國CAS提供的19種SARS-CoV-2蛋白靶位中,有15種為病毒的非結構蛋白(Non-structural proteins),有4種為結構蛋白(Structural proteins)(見表2)。其中,前15種為非結構蛋白,后4種為結構蛋白。
ViralZone網站公布了SARS-CoV-2基因組及表達信息(見圖5)。由圖可知,SARS-CoV-2基因組編碼13個開放閱讀框(Open Reading Frame)。其中ORF1a/b由大約三分之二的全基因組長度組成,可通過初級翻譯產生多肽pp1a和pp1ab,編碼16種蛋白。 其他ORFs占基因組的其余三分之一,通過基因組亞基因化表達過程,主要編碼了4種蛋白——糖基化刺突蛋白(S)、包膜蛋白(E)、膜蛋白(M)、核衣殼蛋白(N),和其他輔助蛋白。

圖5 新型冠狀病毒基因組及表達Fig.5 SARS-CoV-2 genome and expression
將病毒蛋白靶位(見表2)對應至ViralZone圖片(見圖5)蛋白靶點在病毒基因組中的相應位置可知,CAS提供的15種非結構蛋白靶點均由冠狀病毒基因組編碼的開放閱讀框ORF1a/b翻譯得到的兩個多肽pp1a和pp1ab經過切割后形成。它們不僅可以參與構成病毒的復制-轉錄酶復合體(Replicase-transcriptase complex ,RTC),對病毒的復制周期起關鍵作用,還可能具有抑制宿主基因表達、誘導細胞凋亡、抑制先天性免疫反應的作用,是病毒能夠大量繁殖的優勢所在。
CAS提供的4種結構蛋白靶點則是病毒基因組亞基因化表達的產物。在這4種相關的結構蛋白靶位中,有2種糖基化刺突蛋白(S),1種核衣殼蛋白(N)和1種膜蛋白(M)。刺突蛋白(S)位于病毒表面,可與宿主細胞的ACE受體結合介導病毒通過內吞作用進入細胞,還可與宿主蛋白TMPRESS2、Furin發生切割作用來獲得融合能力,從而誘導病毒進入細胞。可見冠狀病毒S蛋白與其宿主細胞表面受體的相互作用是決定宿主取向的關鍵因素,對其結構及功能的進一步研究可以指導疫苗的設計和研發[27-28]。核衣殼蛋白(N)參與病毒基因組的構成,使其保持“串珠狀”結構,它也是一種高度免疫原性的磷蛋白,與病毒基因組復制和調節細胞信號通路有關。膜蛋白(M)主要位于病毒囊膜內表面,它在構成病毒內膜與核衣殼蛋白間連接支架的同時,也與子代病毒粒子的裝配和釋放有關。
SARS-CoV-2的結構蛋白和非結構蛋白靶位都在其感染細胞、大量增殖的過程中起關鍵作用,并同宿主細胞也具有一定的相互作用關系。因此,增加對這些蛋白靶點的生物學功能及互作機制的研究將對新冠肺炎的預防和治療具有重要意義。
梳理ViralZone中給出的蛋白組描述、互作組描述信息,UniProt數據庫中對病毒蛋白靶點功能注釋和相互作用注釋(見表3)。

表3 病毒蛋白靶點互作蛋白及功能Table 3 Interacting proteins and functions of viral protein targets
新冠肺炎已爆發許久,感染人群眾多,但目前尚未研發出針對新冠病毒的特效藥。上述分析啟發我們,通過干擾宿主細胞的生物通路和病毒自身結構有可能為目前的新冠肺炎患者提供有效的治療方案,為藥物研發提供思路和方向。
在臨床治療上,可以通過干擾宿主細胞的生物通路抑制病毒感染。在蛋白富集分析的結果中我們發現網格蛋白介導型內吞是病毒進入細胞的主要途徑,因此我們可以考慮在網格蛋白介導內吞過程中,靶向抑制發動蛋白或網格蛋白從而阻止病毒侵入細胞,在此領域較為常見的抑制劑有氯丙嗪等。在蛋白網絡分析部分,我們得到了很多和宿主細胞免疫應答過程相關的生物過程,干擾與之相關的病毒蛋白或調節宿主細胞的關鍵通路,或可降低病毒毒力、恢復人體免疫力,例如干擾病毒ORF6蛋白或調控KPNA2使得干擾素信號傳導過程不受影響,或補充所需干擾素以抑制細胞增殖、調節免疫;病毒的ORF8蛋白與避免肽在細胞表面表達有關,針對ORF8的抑制劑或使用IFN可能增強人體的免疫反應從而對抗新冠病毒[30]。
另外,經過我們的分析,在病毒入侵宿主細胞的過程中,NLS介導蛋白入核發揮了重要的作用,調控病毒蛋白NLS不僅可以減弱病毒的毒力,還可以恢復宿主細胞轉錄基因的表達,如研制靶向藥物使NLS突變或缺失,從而起到有效的抗病毒作用。
病毒侵染宿主細胞時對其他蛋白通路的影響可能使人體感染相應疾病或出現相應疾病的類似臨床表現,因此,舊藥新用不失為一種治療方案。例如治療肺結核病常用的莫西沙星、左氧氟沙星和鏈霉素等、降壓藥氫氯噻嗪和氯沙坦等、減少免疫抑制的白細胞介素-1β抑制劑、用于治療甲型流感的連花清瘟膠囊等,但這些用藥方案只是根據蛋白通路的推斷,同時這些藥物不是針對新冠病毒的特效藥,使用前應進行臨床試驗。
針對新冠病毒本身而言,與新冠肺炎有關的15種非結構蛋白對病毒的復制、調控、免疫起到了重要的作用,其中有些非結構蛋白可能影響病毒毒力,若能驗證敲掉某非結構蛋白后病毒毒力大幅下降,則可為病毒疫苗的研發提供新思路。作為新冠肺炎靶位的結構蛋白有4種,2種S蛋白介導病毒附著并侵入宿主細胞,N蛋白與病毒基因組和宿主蛋白都存在相互作用并影響宿主造血細胞通路,M蛋白影響病毒的組裝與免疫原性,針對上述結構蛋白可研發相應的病毒檢測試劑和疫苗。
新冠肺炎的流行給醫療行業帶來了重大壓力,疫情當前,如何進行有效的預防和治療成為了亟待解決的問題。根據蛋白靶位進行藥物研發,使疾病的治療有了更多的針對性;同時,舊藥新用可以在原有的經驗上節省時間。總之,對新冠病毒的蛋白靶位進行生信分析,讓我們對病毒自身結構和侵染過程有了更多的了解,也為抗病毒藥物和疫苗的研發提供了更多的參考。
上述分析獲得了新冠病毒和宿主細胞蛋白靶點組成的蛋白通路和互作網絡,由此我們進一步了解了新冠病毒的結構和侵染人體的過程:新冠病毒附著并通過內吞作用進入細胞,病毒基因組復制翻譯,合成自身所需結構蛋白和非結構蛋白,抑制免疫反應,并胞吐出細胞。在此過程中,各種生物通路和組成病毒自身的蛋白質都起到了非常重要的作用。其中包括(但不限于):
1)病毒附著后,通過網格蛋白介導的內吞作用和自身的S蛋白作用進入宿主細胞;
2)病毒入侵細胞后,需要借助NLS進入細胞核完成復制。
3)病毒進入細胞后,病毒的ORF8蛋白下調細胞表面MHC-Ⅰ的表達從而逃避免疫細胞的殺傷;
4)在病毒侵染宿主細胞的過程中,還會影響其他蛋白通路,比如肺結核病、腎素-血管緊張素系統、白細胞介素-1介導的信號通路的調控、甲型流感、破骨細胞分化、造血細胞通路等。