王章群,解增言,蔡應(yīng)繁,舒坤賢,黃飛飛
1. 重慶郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,重慶 400065;
2. 重慶郵電大學(xué)生物信息學(xué)院,重慶 400065;
3. 河南大學(xué)生命科學(xué)學(xué)院,開封 475001
在過去的幾十年中,基于單個(gè)或少數(shù)幾個(gè)基因序列構(gòu)建系統(tǒng)發(fā)育樹的方法被研究得較為透徹,并得到了廣泛應(yīng)用[1~4]。但由于存在橫向基因轉(zhuǎn)移(Horizontal gene transfer,HGT)、并系同源基因(Paralog)及類群間基因進(jìn)化速率差異等因素,基于單基因構(gòu)建的基因樹有時(shí)并不能代表真實(shí)的物種樹[5~8]。利用不同基因構(gòu)建的系統(tǒng)發(fā)育樹在很多情況下并不一致[9]。另外,這些方法都需要先對(duì)基因進(jìn)行多序列比對(duì),隨著序列的增加,計(jì)算時(shí)間呈指數(shù)增長(zhǎng),因此在物種較多時(shí),利用經(jīng)典方法構(gòu)建系統(tǒng)發(fā)育樹需耗費(fèi)大量的時(shí)間。
基于單基因構(gòu)建系統(tǒng)發(fā)育樹存在上述缺點(diǎn),新的系統(tǒng)發(fā)育方法的提出顯得十分必要。隨著一些模式生物基因組測(cè)序完成,人們陸續(xù)提出了幾種基于全基因組數(shù)據(jù)構(gòu)建系統(tǒng)發(fā)育樹的方法[10~13],形成了一個(gè)新的研究領(lǐng)域——系統(tǒng)發(fā)育基因組學(xué)(Phylogenomics)。這些方法盡管原理不一樣,但由于都同時(shí)利用基因組中多個(gè)基因或多數(shù)序列信息構(gòu)建系統(tǒng)發(fā)育樹,因此或多或少地解決了上述基于單基因構(gòu)建系統(tǒng)發(fā)育樹存在的問題。系統(tǒng)發(fā)育基因組學(xué)在確定一些重要類群的系統(tǒng)發(fā)育地位方面發(fā)揮著越來越重要的作用,另外該方法也可以用來闡述由基因重復(fù)導(dǎo)致的基因組進(jìn)化問題,重建各種生物化學(xué)路徑的進(jìn)化歷史及預(yù)測(cè)基因功能等[14]。……