高珂星,魯 非,高競溪,胡志剛,紀 鋒,郭志剛
(南京師范大學 生命科學學院,南京 210046)
基于系統學、分類學等的研究,SARS-CoV-2被歸為冠狀病毒中的Beta屬,遺傳物質為單股正鏈RNA,顆粒多為球狀,直徑一般在60 ~140 nm,通常具有多形性[1],病毒衣殼外由刺突樣結構包裹,顯微結構呈皇冠樣。2020年1月7日,該病毒被初次檢出且已被證明是截至目前第7種可以侵染人的冠狀病毒,該病毒入侵機體可引發COVID-19。2019年12月,SARS-CoV-2的首例感染患者出現在湖北省武漢市,之后疫情迅速傳播到中國眾多省份及其他169個國家和地區[2]。COVID-19的初期臨床病征通常與普通感冒相似,以渾身發熱、乏力為主,部分嚴重個體可發展為膿毒癥、凝血功能障礙等[3],有時甚至會危及神經系統。
與其他侵染人的冠狀病毒相比,SARS-CoV-2的基因特征存在顯著差別。據研究顯示,生活于云南省的一種蝙蝠(Rhinolophusaffinis)可能為SARS-CoV-2的自然宿主,其體內檢測到的冠狀病毒(BatCovRaTG13)在基因水平上與SARS-CoV-2極其相似,兩者相似率高達96.2 %[4]。
棘突蛋白(Spike protein,S)、核衣殼蛋白(Nucleocapsid phosphoprotein,Np)、小包膜蛋白(Envelope protein,E)、囊膜蛋白(Membrane protein,M)為SARS-CoV-2編碼的四種結構蛋白[5]。其中,Np相較其它三種蛋白(S、E、M)表達量更高,其為多功能堿性磷酸化蛋白,具有RNA伴侶活性,于細胞質中與RNA結合組成核糖核蛋白顆粒,從而保護病毒自身的遺傳物質[6]。同時,它在病毒自身的復制、轉錄、組裝等方面也占據了重要地位[7-8]。因具有免疫原性強和保守性高的特征,Np不僅能夠診斷冠狀病毒,而且可以作為抗病毒治療的理想靶標[9-10]。
本研究通過對Wuhan-Hu-1株Np的堿基序列進行進化分析,并通過對Np氨基酸序列的空間結構及其B細胞優勢抗原表位的分析預測,結合多種因素綜合剖析以篩選合適的B細胞優勢抗原表位,為研制SARS-CoV-2表位疫苗、快速診斷試劑和制備其單克隆抗體奠定基礎,從而進一步解決COVID-19迫切的防控及治療問題。
從NCBI數據庫(https://www.ncbi.nlm.nih.gov/)中獲取Wuhan-Hu-1株Np氨基酸序列(Protein ID:YP_009724397.2)。
1.2.1 不同地區SARS-CoV-2 N蛋白基因進化分析
以NCBI數據庫中不同國家地區多株SARS-CoV-2 N蛋白基因為研究對象,采用MEGA5.05軟件中的Neighbor-joining法進行分析,構建SARS-CoV-2 N蛋白堿基序列的系統發生樹,并應用MegAlign軟件分析不同毒株間的遺傳距離。
1.2.2 Wuhan-Hu-1株Np三維結構的預測
以Wuhan-Hu-1株Np氨基酸序列為研究對象,應用Phyre2在線工具(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)預測其三維空間結構,并應用Chimera軟件模擬其立體結構。
1.2.3 Wuhan-Hu-1株Np的二級結構和抗原表位分析
以DNAStar軟件中的Protean模塊下的方法剖析Wuhan-Hu-1株Np,步驟如下:首先對Np的二級結構(Garnier-Robson 法和Chou-Fasman 法)、柔性區段(Karplus-Schulz法)、表面可能性(Emini法)進行預測;然后分析Np的親水性(Kyte-Doolittle法),再預測其抗原指數和抗原表位指數(分別用Jameson-Wolf法和Kolaskar-Tongaonkar法(http://tools.immuneepitope.org/tools/bcell/iedb_input));最后,參考Np的三維結構,對Wuhan-Hu-1株Np的B細胞優勢抗原表位進行綜合預測。
以Wuhan-Hu-1株(WHU01)N蛋白和其他不同國家地區的SARS-CoV-2毒株N蛋白的堿基序列為分析對象,采用Neighbor-joining法(步長1 000,boot-strap值>20 %)構建系統發生樹(見圖1)。MegAlign軟件分析結果顯示:不同國家地區分離的SARS-CoV-2毒株N蛋白堿基序列存在極高相似性(99.6 %~100 %)。結果表明,不同國家地區間的SARS-CoV-2毒株N蛋白堿基序列差異性很小,指示SARS-CoV-2毒株N蛋白基因高度保守。

圖1 不同國家地區SARS-CoV-2 N蛋白堿基序列系統發生樹Fig.1 Phylogenetic tree of SARS-CoV-2 N protein base sequence isolated from different countries and regions
應用Chimera軟件模擬得到的Wuhan-Hu-1株Np的3D結構如圖所示:蛋白中央存在一定數量的β-折疊,指示其內部可能含有大量疏水性殘基;蛋白外圍分布有一定數量的β-轉角和無規則卷曲結構,且含少量的α-螺旋(見圖2)。

注: (a)中亮綠色區域代表β-折疊結構,白色區域代表α-螺旋、β-轉角及無規則卷曲結構.
以兩種不同的方法分別剖析Np的二級結構,最終結果可相互佐證。Garnier-Robson法預測的α-螺旋主要分布在氨基酸序列的中后段,且366~385區段跨區最大(20 aa),存在單個氨基酸組成的α-螺旋;有較多數量的β-折疊,其分布較均勻,最大的一個區段為262~274(13 aa);β-轉角分布也較均勻,其中189~196區段最大(8 aa),存在單個氨基酸。Chou-Fasman法與Garnier-Robson法預測結果有部分區域重疊:α-螺旋呈分散分布,其中368~382區段存在跨最大區域的α-螺旋(15 aa),β-折疊呈分散分布,其預測數量相對較少;β-轉角區域分布均勻,最大的一個區段為182~209(28 aa)(見圖3、表1、表2)。以Karplus-Schulz法預測出的Wuhan-Hu-1株Np柔性區段分布在5~15,17~50,57~83,89~106,114~119,125~128,136~153,161~169,174~208,211~216,225~250,254~266,275~299,309~310,325~329,339~348,361~392,401~416,可見Np存在多個柔性區段,有可能形成多個優勢表位(見圖4)。

圖3 不同方法預測Wuhan-Hu-1株Np的二級結構Fig.3 Secondary structure of Np in Wuhan-Hu-1 strain predicted by different methods

圖4 Karplus-Schulz法預測Wuhan-Hu-1株Np的柔性區段Fig.4 Flexible regions of Np in Wuhan-Hu-1 strain predicted by Karplus-Schulz method

表1 Garnier-Robson法預測的Wuhan-Hu-1株Np的二級結構Table 1 Secondary structure of Np in Wuhan-Hu-1 strain predicted by Garnier-Robson method

表2 Chou-Fasman 法預測的Wuhan-Hu-1株Np的二級結構Table 2 Secondary structure of Np in Wuhan-Hu-1 strain predicted by Chou-Fasman method
親水性(Kyte-Doolittle法)分析顯示(見圖5),Np親水區段占比較高,幾乎覆蓋大多數區域,進一步證明該蛋白親水性較強。表面可能性(Emini法)分析顯示(見圖6),1~13,20~49,58~68,75~97,182~207,226~270,276~283,294~301,339~347,356~390,401~410,414~419區域的表面可能性較大。分析結果指示,兩種方法預測的重復部分,極有可能位于Np表面,具備作為病毒抗原表位的特性。

圖5 Wuhan-Hu-1株Np的親水性Fig.5 Hydrophilicity of Np in Wuhan-Hu-1 strain

圖6 Wuhan-Hu-1株Np的表面可能性Fig. 6 Surface probability of Np in Wuhan-Hu-1 strain
Jameson-Wolf法預測結果顯示(見圖7),有多個抗原指數較高的區域分布于Wuhan-Hu-1株Np中,如2~12,17~48,58~71,75~85,88~108,113~130,137~153,171~216,226~267,274~300,337~349,355~390區域,其中171~216為抗原指數最高的區段,最有可能作為優勢表位。

圖7 Wuhan-Hu-1株Np的抗原指數Fig. 7 Antigenic index of Np in Wuhan-Hu-1 strain
Kolaskar-Tongaonkar法預測結果顯示(見圖8),Wuhan-Hu-1株Np的抗原指數在0.874~1.197之間波動,均值為0.988。

圖8 Wuhan-Hu-1 株Np的抗原表位指數Fig. 8 Antigenic epitope index of Np in Wuhan-Hu-1 strain
先對Wuhan-Hu-1株Np序列的柔性區段、親水性指數、抗原指數、蛋白質表面可能性等抗原表位參數進行分析,再參考抗原表位指數結果,預測:如果某一區段滿足抗原指數≥ 0.988(均值)、表面可能性≥ 1、親水性≥ 0,至少包含6個氨基酸殘基,且內部或鄰近區存在柔性區段,則推測該區段很大概率可以作為Np的B細胞抗原表位。結合空間預測結果,共篩選出符合上述條件的16個優勢表位(見表3)。

表3 Wuhan-Hu-1株Np B細胞抗原表位的氨基酸序列Table 3 Amino acid sequence of B-cell antigenic epitope of Np in Wuhan-Hu-1 strain
抗原表位(Epitope)是指決定抗原特異性且位于分子表面的氨基酸序列及其組成的空間結構[11]。抗體或淋巴細胞表面與抗原相結合部位的形狀、大小需與抗原表位相適合才能發揮其免疫學效應[12]。表位的分子量一般很小(5~7 aa),所在區段結構多數比較松散、具有可移動性。作為病毒抗原性的物質基礎,表位預測可為疾病的診斷、藥物的篩選與合成及表位疫苗的制備等奠定理論基礎[13]。本研究從NCBI獲取了Wuhan-Hu-1株Np氨基酸序列(419 aa),空間結構預測結果指示,Wuhan-Hu-1株Np空間構象形似錘狀,中央的疏水核心聚集了一定數量的β-折疊且有較多的β-轉角和無規則卷曲分布于蛋白表面,同時存在少量的α-螺旋。近期有報道稱歐洲SARS-CoV-2基因發生突變并傳入中國[14-16],鑒于該病毒中Np較強的抗原性和保守性,準確預測Wuhan-Hu-1株Np抗原表位可以為未來進一步的工作提供方向。
SARS-CoV-2粒子多呈皇冠狀[17],Np是其主要編碼的四種結構蛋白(Np、M、E、S)之一,在復制初期產生并與病毒遺傳物質組成核殼體結構[6, 18]。Np通常大量表達于病毒侵染的初期[19-20],具有很強的抗原性。因此,常作為其他Beta冠狀病毒如SARS-CoV、MERS-CoV等的快速診斷抗原和相關疫苗設計的靶標[21-24],具有特異、敏感、重復性好的優勢。值得一提的是,廣譜抗病毒藥物和疫苗可對后續由病毒變異引起的新型傳染病起到關鍵性作用,而Np在種屬間的高度保守性[25],正使其占領了獨特的優勢。目前京天成生物、Bioss等科研機構已研制出針對Wuhan-Hu-1株Np的抗體,雖然還未進入臨床使用,但為靶向Np抗體的設計開創了先例,而可識別Np的表位疫苗研制卻存在較大空白。對于疫苗的制備,小分子蛋白更易做到快速、大量地表達,表位疫苗相對于減毒活疫苗和死疫苗又能達到更高的安全性[26]。所以,準確推斷B細胞抗原表位的特定氨基酸序列,并通過表達相應基因以實現工廠化生產具有免疫原性的低毒多肽,可以成為制備診斷試劑、表位疫苗、單抗的新手段。為提高準確度,本研究采用新興的多參數綜合預測法。分析結果指示,Np抗原指數均值為0.988,抗原表位指數較高的區域分布均勻,最大值為1.197,其中52~59、69~75、83~89、106~115、119~124、130~136、154~166、217~227、243~249、267~273、299~315、333~339、347~363、379~385、389~401、403~411氨基酸區段覆蓋了大部分抗原指數較高的區域,指示這些區段可能具有作為表位的潛能。本研究基于同源建模(TBM)參數預測結果,通過與同一毒株的小角X射線散射(SAXS)獲得的低分辨率三維結構(pdb id: 6yun)[27]進行比較,發現二者內部均由若干近乎平行的β-折疊形成的領結形狀偏離了中心的菱形瓦片結構組成,這與已報道的基于saxs的兩個浮動NTD模型是相容的[28-29],但二者結果仍然存在一定的結構差異。這也許是由不同預測方法造成的,同時也體現了多參數預測以及后期驗證的重要性。
Hopp-Woods開創的親水性參數預測法[30-31]為抗原表位的預測奠定了基礎,但與單一參數分析法相比,多參數預測的準確率明顯更高[26, 32]。可見,由于抗原表位的多態性,表位抗原性取決于多種因素的互作而非任意單一條件決定。B細胞抗原表位應位于蛋白質表面且具有一定程度的靈活性,為更準確地與抗體或淋巴細胞表面配體相結合,抗原構象通常需要產生一定程度的改變,即其多具有柔韌性;此外,抗原表位生物學特性與其二級結構和三級結構也有較高相關性。準確剖析Np的抗原表位不但有助于進一步認識其表現出抗原性的結構基礎,而且能夠為指導藥物的合成篩選、快速診斷試劑的研發制備和表位疫苗的設計生產等提供理論基礎[33]。
通過對Wuhan-Hu-1株Np的堿基序列進行進化分析,并通過單獨分析Np的二級結構、柔韌性、親水性、表面可能性、抗原指數等多種參數,再利用三級結構預測結果篩選表位,最終綜合以上所有參數多維篩選確定Np的B細胞優勢抗原表位。研究結果為進一步闡明Np的結構特征及深入探究SARS-CoV-2入侵和致病機制提供了參考,以期助力解決SARS-CoV-2感染引發的肺炎疫情及迫切的防控問題。