周家蓬,裴智勇,2,陳禹保,陳潤生
1. 北京市計算中心,北京 100094;
2. 中國科學院北京基因組研究所,北京 100101;
3. 中國科學院生物物理研究所,北京 100101
全基因組關聯研究(Genome-wide association study,GWAS)是對多個個體在全基因組范圍的遺傳變異多態性進行檢測,獲得基因型,進而將基因型與可觀測的性狀,即表型,進行群體水平的統計學分析,根據統計量或P值篩選出最有可能影響該性狀的遺傳變異。GWAS的主要方法學依據是歸納法中的共變法,是探究復雜因果關系的最主要的思想和方法。因此,GWAS特別適用于遺傳機理不明的復雜疾病或性狀。得到高密度、高可信的遺傳變異是GWAS的基礎,這些遺傳變異包括單核苷酸多態性(Single nucleotide polymorphisms,SNP)、插入缺失(Insertion and deletion,InDel)及拷貝數變異(Copy number variation,CNV)等,其中最主要的是SNP,占標記總量的90%以上。目前獲得高密度SNP的方法主要是SNP芯片(Array),因其高效、易用、廉價等特點在近些年被廣泛使用。而第二代測序技術(Next-generation sequencing,NGS)的快速發展,為GWAS的相關研究工作提供了新的技術和思路。NGS可以獲得大量低頻甚至稀有的遺傳變異,一些無法由芯片的高頻或常規變異(即 MAF ≥ 5%的變異)檢測到的表型關聯,有望通過基于NGS的GWAS方法得到有意義的結果。本文對基于高通量測序的GWAS的原理、策略及相關研究進展進行了闡述,并對其如何應用于個體化醫療(Personalized medicine,PM)進行了展望。
GWAS的研究思路最早于1996 年由Risch等[1]提出,目的是將人類復雜疾病的研究從候選基因轉向全基因組水平,以期用更大規模的檢測得到與疾病相關的每一個基因。近年來,已有多篇報道對GWAS研究進展進行了綜述[2~4]?!?br>