匡衛民,于黎
基因組時代線粒體基因組拼裝策略及軟件應用現狀
匡衛民,于黎
云南大學生命科學學院,省部共建生物資源保護與利用國家重點實驗室,昆明 650091
隨著測序技術的不斷發展,越來越多物種的全基因組數據被測定和廣泛應用。在二代基因組數據爆發式增長的同時,除了核基因組數據,線粒體基因組數據也非常重要。高通量測序的全基因組序列中除了核基因組序列也包括線粒體基因組序列,如何從海量的全基因組數據中提取和拼裝線粒體基因組序列并加以應用成為線粒體基因組在分子生物學、遺傳學和醫學等方面的研究方向之一。基于此,從全基因組數據中提取線粒體基因組序列的策略及相關的軟件不斷發展。根據從全基因組數據中錨定線粒體reads的方式和后續拼裝策略的不同,可以分為有參考序列拼裝方法和從頭拼裝方法,不同拼裝策略及軟件也表現出各自的優勢和局限性。本文總結并比較了當前從全基因組數據中獲得線粒體基因組數據的策略和軟件應用,并對使用者在使用不同策略和相關軟件方面給予建議,以期為線粒體基因組在生命科學的相關研究中提供方法上的參考。
全基因組;線粒體基因組;有參考序列拼裝方法;從頭拼裝方法;拼裝軟件
線粒體基因組(mitochondrial genome)作為一種特殊且容易獲取的遺傳標記,因具有高突變速率、無基因重組、高拷貝數和母系遺傳等特點[1],被廣泛應用在系統發育和生物地理研究[2~5]、群體遺傳[6~13]、醫學[14~17]和生態學研究[18~20]等領域。……