任青燕,陸子鑫,涂盈穎,韋 力,喬 芬
(麗水學院生態學院,浙江 麗水 323000)
冠狀病毒(Coronavirus)是一種單鏈RNA 病毒,具有球形顆粒和包膜結構,其基因組大小為27~32 kb[1-2],在物種分類中,冠狀病毒屬于套式病毒目(Nidovirales)冠狀病毒亞目(Cornidovirineae)冠狀病毒科(Coronaviridae)[3]。2018 年國際病毒學分類委員會將冠狀病毒科分成勒托病毒亞科(Letovirinae)和正冠狀病毒亞科(Orthocoronavirinae)兩個亞科[4]。勒托病毒亞科僅包含一個屬,即甲勒托病毒屬(Alphaletovirus)。正冠狀病毒亞科基于基因型和血清學則可分為4個屬,即α、β、γ和δ冠狀病毒屬[5-6],其中α、β冠狀病毒屬病毒主要感染哺乳動物和人,γ和δ冠狀病毒屬病毒主要感染禽類和豬[1,7]。冠狀病毒的宿主范圍很廣,可以通過動物跨物種感染人類,甚至導致人際傳播[8-9]。冠狀病毒具有較強的傳染性,且致死率高[10]。經過科學家在電子顯微鏡下的觀察以及結合基因組測序結果,確認新型冠狀病毒感染(corona virus disease 2019,2019-nCoV,簡稱 “新冠感染” )為由新型冠狀病毒感染引起的急性呼吸道傳染病[11]。由于該病毒與SARS-CoV 具有較高的相似性,都屬于β冠狀病毒屬,與SARS-CoV 是姊妹病毒,對人類的健康造成重大威脅,國際病毒命名委員會將其改命名為SARS-CoV-2[12],因序列信息注釋中使用的為2019-nCoV,所以本文使用2019-nCoV。除2019-nCoV 外,目前已發現能感染人的冠狀病毒有6 種,分別是屬于α-CoV 的HCoV-229E 和HCoV-NL63,屬于β-CoV 的HCoV-OC43、HCoV-HKU1、SARS-CoV、MERS-CoV[13]。近10多年來,由冠狀病毒引起的烈性傳染病已經嚴重危害到人類健康,針對冠狀病毒的預防及研究已然成為全世界必須重視的工作。新型冠狀病毒具有傳播速率快、范圍廣、傳染性強、易感性強等特點[14]。新型冠狀病毒感染的臨床表現以發熱、乏力、干咳為主,少數伴有鼻塞、流鼻涕、咽痛、惡心、腹瀉等癥狀。重癥患者發病一周后常有呼吸困難的癥狀,并迅速發展為急性呼吸窘迫綜合征、敗血癥、感染性休克、代謝性酸中毒和凝血功能障礙,部分患者甚至死于多器官功能衰竭[3,15]。由于新冠感染患者眾多,對于患者的康復治療儼然成為當今社會棘手的問題。對于新冠感染的治療,臨床上可以考慮借鑒非典型肺炎和中東呼吸綜合征的治療方案。中草藥治療體現出一定優勢:早期干預、阻斷病程、減輕癥狀、縮短治療時間、減少并發癥、減少大劑量激素引起的毒副作用[16]。
冠狀病毒含有30 kb大小的基因組和4種編碼結構蛋白,分別為刺突蛋白(S)、包膜蛋白(E)、膜蛋白(M)及核衣殼蛋白(N)[10]。通常有一些小的開放讀碼框(ORFs)存在于結構蛋白之間。通過體外實驗證明,雖然某些ORFs對病毒復制不是必需的,但與病毒的致病性存在聯系,同時還可以決定病毒的種群特異性[2]。因此,選擇冠狀病毒中合適的蛋白序列進行進化樹構建和分析是非常有必要的。
冠狀病毒的S蛋白由1 160~1 400個氨基酸組成,包括21~35 個N-糖基化位點。S 蛋白以三聚體的形態在病毒表面形成特殊的皇冠結構,冠狀病毒因此而得名[7]。S 蛋白的作用是負責結合病毒受體、介導宿主細胞的融合以及誘導機體產生中和抗體,是一種重要的毒力蛋白[17]。S 蛋白由S基因編碼,S基因突變能力較強,是毒株毒力的指征性基因,其突變和重組可能會影響冠狀病毒的毒力,進而產生新的毒株。同時S蛋白也是新型冠狀病毒與人類細胞受體ACE2結合的關鍵,在病毒侵襲和感染人體的過程中起到關鍵作用[18]。冠狀病毒N 蛋白是指核衣殼蛋白,與病毒基因組RNA互相纏繞形成病毒核衣殼[19]。N 蛋白被N基因編碼,在病毒粒子組裝過程中起到決定性作用,是一種重要的結構蛋白[20]。N 蛋白具有增強病毒基因組轉錄、在病毒組裝過程中與其他蛋白質結合、通過破壞各種細胞活動而對宿主細胞產生毒性等不同特征[21],并且可刺激宿主產生具有高親和力但沒有中和活性的抗體。在CoV的結構蛋白中,N蛋白是最保守和最穩定的蛋白[22]。對于冠狀病毒而言,S 蛋白影響其毒力且易突變,而N 蛋白決定其結構相對穩定。故選擇冠狀病毒S、N蛋白序列作為構建進化樹的主要數據。
目前,大部分冠狀病毒的蛋白序列信息已被收錄在世界主要的蛋白數據庫GenBank 中。本研究通過對冠狀病毒蛋白序列進行篩選和整理,運用MEGA7.0 軟件構建進化樹并分析其進化關系,同時比較S、N 蛋白構建進化樹的區別,為認識和研究冠狀病毒打下基礎。
本文所有冠狀病毒蛋白序列信息均來自于GenBank 數據庫(http://www.ncbi.nlm.nih.gov/Genbank/)。從GenBank數據庫中篩選冠狀病毒S、N蛋白序列各30條,序列包括來自寄主為人、豬、牛、羊、犬、貓、鼠、禽、蝙蝠、駱駝的冠狀病毒S蛋白和N蛋白,包括2株2019-nCoV序列和28株具有代表性的α、β、γ和δ冠狀病毒屬的冠狀病毒,同時對其序列進行進化分析。其中有云南省的中菊頭蝠冠狀病毒RaTG13,以及SARS-CoV、MERS-CoV 和其他蝙蝠冠狀病毒,還包括α冠狀病毒屬的宿主為貓、狗、豬和人的冠狀病毒,β冠狀病毒屬的宿主為駱駝、牛、兔、馬和人的冠狀病毒,γ冠狀病毒屬的不同宿主(火雞、鴿)的冠狀病毒,δ冠狀病毒屬的夜鶯冠狀病毒HKU11和畫眉冠狀病毒HKU12(表1、表2)。

表1 冠狀病毒S蛋白序列信息
運用MEGA 7.0 軟件進行多序列比對,采用距離依靠法中的鄰接法(neighbor-joining,N-J)構建N-J 進化樹。將在GenBank 上下載到的冠狀病毒蛋白序列以FASTA 格式導入MEGA 7.0 進行多序列與模型篩選。進化樹構建使用p-distance模型,選擇Bootstrap值5 000,其他為默認值。
冠病毒代表性N 蛋白和S 蛋白序列保守基序motif 預測通過MEME在線網站進行(https://memesuite.org/meme/tools/meme)[23],基序最大數量設置為3,數據結果使用TBtools 進行可視化[24]。
S 蛋白進化分析結果顯示:β屬新型冠狀病毒聚到一個大的分支,其中2019-nCoV 與分離自云南省的中菊頭蝠冠狀病毒RaTG13關系最近,其次與SARS 相關毒株的進化關系較近。多種哺乳類動物感染的α冠狀病毒屬、家養禽類感染的γ冠狀病毒屬、野生禽類感染的δ冠狀病毒屬的冠狀病毒與2019-nCoV 關系較遠。然而α、γ、δ冠狀病毒屬之間沒有很好地區分成獨立的分支,尤其是豬急性腹瀉綜合征冠狀病毒(SADS-CoV)未與其他株系聚類到一起,表明其可能與其他毒株進化關系較遠(圖1)。

圖1 冠狀病毒S蛋白構建進化樹結果圖
N蛋白進化分析結果顯示:α、β屬冠狀病毒分別聚到2個大的分支中,γ冠狀病毒屬與δ冠狀病毒屬聚到了1 個分支中。新型冠狀病毒2019-nCoV 同樣與分離自云南省的中菊頭蝠冠狀病毒RaTG13 關系最近;其次與人和蝙蝠感染的SARS冠狀病毒具有較近的關系,尤其是蝙蝠感染的SARS冠狀病毒HKU3-2。其他哺乳類動物和禽類感染的α冠狀病毒屬、γ冠狀病毒屬、δ冠狀病毒屬病毒與新型冠狀病毒2019-nCoV 的關系較遠。該結果與S蛋白進化關系分析結果相似(圖2)。

圖2 冠狀病毒N蛋白構建進化樹結果圖
利用MEME 軟件對該N、S蛋白的保守元件進行分析,如圖3 所示:N 蛋白中,選擇的30 個蛋白中有9 個只含有motif 1 和motif 2 保守元件,其他成員含有3 個保守元件,保守元件在蛋白中的分布相對均勻。S 蛋白中,選擇的30 個蛋白均含有motif 1、motif 2 和motif 3 保守元件,且集中在C端,整體看來保守元件所在位置和保守元件種類高度相似,表明冠狀病毒的N、S 蛋白具有一定的保守性。

圖3 冠狀病毒的N、S蛋白保守元件分析
冠狀病毒可感染人和多種動物,例如豬、牛、羊、犬、貓、鼠等。一些宿主可以被多種冠狀病毒感染,而一種冠狀病毒也可以感染多個宿主[25]。冠狀病毒還可以感染雞、鴨、鵝、鴿子、麻雀等禽類動物,其中:雞傳染性支氣管炎病毒(IBV)和火雞冠狀病毒屬于γ 屬冠狀病毒;夜鶯冠狀病毒HKU11、鵝口瘡冠狀病毒HKU12 等屬于δ屬冠狀病毒[26]。最早的冠狀病毒是由雞身上分離出來的,即雞傳染性支氣管炎病毒(IBV),因此禽類是冠狀病毒的早期宿主。故選擇禽類、豬、牛、羊、犬、貓、鼠的冠狀病毒蛋白或基因序列作為構建進化樹的數據,有助于對冠狀病毒進化關系及其對人類潛在的危害性的分析。蝙蝠是馬爾堡病毒、狂犬病病毒、尼帕病毒、亨德拉病毒等多種侵染人類的病毒的天然宿主,也被認為是SARS-CoV、MERS-CoV和2019-nCoV 的天然宿主[26]。另有研究表明:單峰駱駝是中東呼吸綜合征冠狀病毒的主要宿主(MERS-CoV),并且是人群中出現中東呼吸綜合征感染的動物來源[27-28]。
本研究運用S、N兩種蛋白序列構建冠狀病毒進化樹所得的進化關系總體上相似,β冠狀病毒屬的新型冠狀病毒2019-nCoV與分離自云南省的中菊頭蝠冠狀病毒RaTG13關系最近,其次與人和蝙蝠感染的SARS冠狀病毒具有較近的關系,然而基于S 蛋白的進化分析沒有很好地將α、γ、δ冠狀病毒屬區分成獨立的分支,尤其是豬急性腹瀉綜合征冠狀病毒(SADS-CoV)未與其他株系聚類到一起,說明運用S 蛋白建樹所得結果存在一定偏差。一些研究運用二代測序結合三代測序獲得2019-nCoV 全基因組序列,測序長度為29 688~29 899 bp,并涵蓋了全部病毒的編碼區[25]。通過對39株2019-nCoV的全長基因組核苷酸序列進行比對,證明其與SARS 冠狀病毒(SARS-CoV)的基因相似性平均為78.7%[26],說明2019-nCoV與人和蝙蝠感染的SARS冠狀病毒的確具有較近的關系,與N蛋白構建的進化樹結果一致。筆者推測:與S蛋白相比,運用N 蛋白構建冠狀病毒進化樹更合適,所得到的進化關系也更加準確。
新型冠狀病毒于2019 年12 月初在中國被報道,對人類健康的危害程度已遠超2003 年暴發的SARS病毒[27]。本研究通過S、N蛋白序列構建進化樹,表明新型冠狀病毒2019-nCoV與分離自云南省的中菊頭蝠冠狀病毒RaTG13 關系最近,并且與SARS-CoV也存在較近的關系,與全長基因組核苷酸序列進化關系分析結果一致[26]。因此,可借鑒SARS的預防與治療思路。由于新冠病毒的突變率較高,病毒群體在較短時間內便可積累相當數量的突變,進化方向不可預測,從進化生物學和群體遺傳學的角度分析,其結果有助于新冠病毒的監測與防控[29]。公眾、各地疾病預防控制中心和社區醫生需要認識冠狀病毒及其遺傳進化關系,以促進對新冠病毒的預防與治療[30]。