劉永鑫,秦媛,3,郭曉璇,白洋,3
微生物組數據分析方法與應用
劉永鑫1,2,秦媛1,2,3,郭曉璇1,2,白洋1,2,3
1. 中國科學院遺傳與發育生物學研究所,植物基因組學國家重點實驗室,北京 100101 2. 中國科學院遺傳與發育生物學研究所,中國科學院–英國約翰英納斯中心植物和微生物科學聯合研究中心,北京 100101 3. 中國科學院大學現代農學院,北京 100049
高通量測序技術的發展衍生出一系列微生物組(microbiome)研究技術,如擴增子、宏基因組、宏轉錄組等,快速推動了微生物組領域的發展。微生物組數據分析涉及的基礎知識、軟件和數據庫較多,對于同領域研究者開展學習和選擇合適的分析方法具有一定困難。本文系統概述了微生物組數據分析的基本思想和基礎知識,詳細總結比較了擴增子和宏基因組分析中的常用軟件和數據庫,并對高通量數據下游分析中常用的幾種方法,包括統計和可視化、網絡分析、進化分析、機器學習和關聯分析等,從可用性、軟件選擇以及應用等幾個方面進行了概述。本文擬通過對當前微生物組主流分析方法的整理和總結,為同領域研究者更方便、靈活的開展數據分析,快速選擇研究分析工具,高效挖掘數據背后的生物學意義提供參考,進一步推動微生物組研究在生物學領域的發展。
微生物組;數據分析;擴增子;宏基因組;分析流程
微生物組(microbiome)是指包括細菌、古菌、低(高)等真核生物、病毒等微生物的基因和基因組,及其周圍環境在內的全部[1]。研究表明微生物組在人類和動植物的營養吸收[2]、疾病抵抗[3]和環境適應中起重要作用[4,5]?!?br>