摘 要:柯薩奇病毒A組16型(Coxsackie virus A16,CoxA16)病毒是引起手足口病(Hand,foot and mouth disease,HFMD)的主要病原體。為了解不同地區CoxA16病毒株的系統進化關系,收集了NCBI數據庫中注釋有具體地區分布的23條CoxA16全基因組序列,分別采用Kimura 2-parameter法和E距離法對病毒株進行親緣關系分析。結果表明,基于E距離的系統進化樹最大程度地吻合了Kimura 2-parameter遺傳距離法構建的系統進化樹,且E距離法普適性較強,頗具應用潛力,為更精確地判斷病毒株之間的進化關系提供了一條新途徑。
關鍵詞:CoxA16病毒;全基因組;Kimura 2-parameter遺傳距離;E距離;進化樹
中圖分類號:Q939.4 文獻標識碼:A 文章編號:1006-060X(2014)17-0013-03
Phylogenetic Relationship of Coxsakie Virus A16 Based on Genomes Sequence and E Distance
XIANG Yan1,3,XU Xi-lin1,3,ZHANG Yong-sheng1,3,TAN Si-qiao1,3,LI Ke1,3,HU Xiao-tian1,3,ZHOU Wei1,2,3
(1.Hunan Key Laboratory for Biology and Control of Plant Diseases and Insect Pests, College of Plant Protection, Hunan Agricultural University, Changsha 410128, PRC; 2.Chenzhou Company , Hunan Tobacco Corporation, Chenzhou 423000, PRC; 3.Hunan Engineering Technology Research Center for Biopesticide and Pharmaceutic Processing, Hunan Agricultural University, Changsha 410128, PRC)
Abstract:Coxsackie virus A16(CoxA16)is a major etiological agent of the hand, foot and mouth disease(HFMD). To learn the phylogenetic relationship of CoxA16 genomes from different regions, all genomes of CoxA16 strains in NCBI were collected to construct genome phylogenetic trees based on Kimura 2-parameter and E distance. The results showed that the phylogenetic tree with E distance was the best fit to the one with Kimura 2-parameter distance;and E distance with wide adaption had the potential to analyze phylogenetic relationship in CoxA16. This study will provide a new method for CoxA16 evolution research.
Key words:coxsackie virus A16 (CoxA16);genome; Kimura 2-parameter distance; E distance; phylogenetic tree
收稿日期:2014-07-16
基金項目:國家自然科學基金青年項目(31301388);湖南省自然科學基金(14JJ3092);湖南省科學技術廳科技計劃項目(2014GK3046);湖南農業大學大學生創新性實驗計劃項目(71);中國博士后面上項目(2014M562109)
作者簡介:向 妍(1988-),女,湖南祁東縣人,碩士研究生,主要從事生物信息學研究。
通訊作者:周 瑋
手足口病(Hand foot and mouth disease,HFMD)是一種常見的高發傳染病,全年均可發病,好發于夏秋季,以嬰幼兒發病為主。2008年以來,我國手足口病呈高流行態勢[1]。柯薩奇病毒A組16型(Coxsackie virus A16,CoxA16)病毒和腸道病毒71型(Entero virus 71,EV71)是引起HFMD的主要病原體。與EV71相比,CoxA16導致的HFMD癥狀較輕,極少引起嚴重的神經系統癥狀。因此,針對CoxA16的基礎研究也較薄弱。
CoxA16病毒基因組為長約7 410 bp的單股正鏈RNA,病毒顆粒呈球形,為二十面體立體對稱,無包膜。它包括5’端和3’端的非編碼區和中間一個單一、較長的開放讀碼框架(Open Reading Frame,ORF),依次由VP4、VP2、VP3、VP1、2A、2B、2C、3A、3B、3C、3D共11個基因組成,主要編碼含2 193個氨基酸的多聚蛋白,可分為P1、P2、P3三個區。病毒外殼由結構蛋白VP1、VP2、VP3和VP4構成,其中VP1、VP2、VP3裸露于病毒外殼表面,VP4隱藏于病毒外殼內[2]。2A到3D分別編碼P2、P3非結構蛋白。
系統進化分析是生物信息學中的重要研究領域,它的主要研究手段是從一組同源的DNA或蛋白質序列出發,計算各個序列之間的進化距離,進而構建反映物種進化關系的進化樹。構建進化樹的方法主要分為三類,即距離法,簡約法和似然法。距離法通過各個物種之間的比較,根據一定的假設(進化距離模型)推導出類群之間的進化距離,構建一個進化距離矩陣。該研究在鄰接法(Neighbor-Joining,NJ)的基礎上,以兩種不同距離矩陣構造進化樹。Kimura 2-parameter遺傳距離是目前常用的進化樹構建方法,E距離法則是以不同堿基電子共振能為基礎,類比于群落相似性發展而來的新的距離方法[3]。該研究選取目前為止所有的CoxA16病毒株全基因序列進行分析和研究,通過兩種不同距離方法構建進化樹,為CoxA16遺傳學背景和進化關系研究提供更加適宜的距離矩陣模型。
1 材料與方法
1.1 試驗數據來源
從美國國立生物技術信息中心(NCBI)下載全部CoxA16病毒株基因組序列(數據更新截至2013年11 月19 日)。為了數據的后續分析及準確性,進一步從獲得的病毒株序列中篩選出注釋有具體地區分布和多聚蛋白的病毒株CDS序列,作為分析對象。
1.2 距離法構建進化樹
1.2.1 基于Kimura 2-parameter模型的進化樹構造 采用NJ建樹時,蛋白質序列常使用Poisson Correction模型,核酸序列常使用Kimura 2-parameter模型。該研究以基因組序列為對象,故選擇Kimura 2-parameter模型構造進化樹。普遍認為,當Bootstrap值>70時,認為構建的進化樹較為可靠。如果Bootstrap值太低,則進化樹拓撲結構可能有誤,進化樹不可靠。因此,該研究將Bootstrap值設置為1 000。在MEGA 5.1中打開序列文件,輸入數據類型選擇“Nucleotide Sequences”,從Substitution Model中選擇“Kimura 2-parameter model”,再點擊“Compute”,構建進化樹。
1.2.2 基于E距離參數模型的進化樹構造 E距離矩陣是類比于群落間相似性而產生的。在群落生態學中,為了準確地對群落分類,除研究種間關連度以外,還可比較兩個群落之間的相似程度。根據群落中的物種數來估計相似性指數,公式為s=2c/(a+b),其中s為相似性指數,a為樣本(或群落)A中物種數,b為樣本(或群落)B中的物種數,c為兩樣本(或兩群落)中共有的物種數[4]。與相似性指數相對應的相異性指數,計算公式為D=1-S。若將待比較的兩個序列看作兩個群落并按位比較,可用群落相異性指數公式來計算兩個群落序列間的分子進化距離。按能量計算群落相異性指數,已知各堿基電子共振能比值為A‥G‥C‥T=0.32‥0.27‥0.23‥0.17,
類似地,E距離可定義為:E=1-2c /(a+b)。其中a為序列A的分子能量,b為序列B的分子能量,c為序列A和序列B相同的分子能量。E距離最大程度地吻合了形態學分類結果。實驗室在前期研發了計算序列兩兩比對與E距離計算批處理程序,成功地應用于以堿基分子質量和二電子共振為基礎的研究中。因此,該研究也采用此程序,先得到序列之間的E距離矩陣,而后利用MEGA5.1構建基于NJ法和E距離參數模型的系統進化樹。
2 結果與分析
2.1 CoxA16參考病毒株信息
截止至2013年11 月19 日,GanBank共收錄48條CoxA16病毒株基因組序列,去掉地區注釋不明的序列后共保留23條(覆蓋至我國8個省市和4個外國國家),長度介于7 278~7 439 bp之間;它們的CDS長度相同,均為6 582 bp。所選病毒株分離時間介于1994~2011年間,其中廣東省分離的毒株最多(表1)。
2.2 兩種類型進化樹的比較
Kimura 2-parameter距離矩陣,E距離矩陣見表2,由此構建的CoxA16 23條病毒株的系統發育樹見圖1。從表2中可以看出,目前流行病毒株之間的親緣關系較近,且與最早出現的南非原型株(G10)之間已有一定差異;只有安徽阜陽病毒株(FY18)和原型毒株(G10)距離最近,這與其他相關研究的結論一致[5]。
由圖1可知,兩種不同距離進化樹基本一致,23條CoxA16病毒株基本分為3個大的分支。這說明基于E距離構建進化樹的方法是可行的。Kimura 2-Parameter distance法和E距離法構建的系統進化樹唯一的差別在于馬來西亞的PM07病毒株和PM99病毒株的進化距離。在Kimura 2-Parameter distance法構建的系統進化樹中,PM00和KO08聚為一類,再與PM07、PM99并列聚為一類;而在E距離法構建的系統進化樹中,PM00和KO08聚為一類,再與PM99聚為一類,然后再與PM07聚為一類。
3 小結與討論
多序列比對計算距離矩陣是一種傳統的系統進化樹構建方法,但是當序列數目較多時,其結果難免會出現偏差[6]。而MEGA提供了包括Kimura 2-parameter距離在內的十余種不同的距離指標,雖然這些距離都不同程度地存在一定的局限性,例如常用的Kimura
2-parameter距離雖然考慮了轉換和顛換的替換率差異并做了校正,但其對不同位點替換速率相等和核苷酸頻率相等的假定在多數情況下并不成立。因此,研究針對病毒株的全基因組序列構建了基于E距離的系統進化樹構建新方法。結果表明,E距離法構建的系統進化樹與Kimura 2-parameter距離法構建的系統進化樹實現了最大程度地吻合,且E距離法普適性較強,頗具應用潛力,為更精確地判斷病毒株之間的進化關系提供了一條新途徑,但其應用效果還需更多實例來驗證。
參考文獻:
[1] 郭瑞玲,李燕霞,馬艷霞,等. 腸道病毒CoxA16 IgG血清流行病學研究[J]. 中華疾病控制雜志,2011,15(9):819-821.
[2] 衛燦東,李琳琳,何雅晴,等. 中國柯薩奇病毒A組16型部分VP1區序列測定及系統進化分析[J]. 病毒學報,2005,21(3):223-227.
[3] 袁哲明,歐陽芳,吉洪湖,等. 基于堿基分子質量和π電子共振能的幾種新距離在系統發育重建中的應用[J]. 生命科學研究,2005,9(1):77-83.
[4] 張孝曦,李運甓,陳常銘. 昆蟲生態及預測預報[M]. 第三版. 北京:中國農業出版社,2002. 158-160.
[5] 高風華,郭中敏,陸家海. 148 株柯薩奇病毒A組16型的多序列比對及遺傳進化分析[J]. 中華疾病控制雜志,2012,16(5):400-403.
[6] 王方圓. 基于序列兩兩比較的進化樹構造方法研究[D]. 北京:北京工業大學碩士學位論文,2008.
(責任編輯:成 平)