999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

不同人群的SNPs基因型數(shù)據(jù)中r2值對TagSNP數(shù)量的影響*

2012-03-11 14:02:12張鎦琢鄭娟娟孫遠(yuǎn)潔袁重勝
中國衛(wèi)生統(tǒng)計(jì) 2012年3期
關(guān)鍵詞:研究

張鎦琢 秦 平 李 昂 鄭娟娟 孫遠(yuǎn)潔 袁重勝 劉 艷△

研究人員通過對比病例組和對照組的基因型頻率的不同來發(fā)現(xiàn)基因?qū)膊〉挠绊懀捎趩误w型(haplotype)整合了各個多態(tài)位點(diǎn)之間的連鎖不平衡(linkage disequilibrium,LD)信息,因此基于單體型的關(guān)聯(lián)研究比基于單個單核苷酸多態(tài)性(single nucleotide polymorphisms,SNPs)的分析能夠提供更高的檢出功效〔1-2〕。與疾病相關(guān)的基因型很有可能就存在于病例組和對照組之間基因型頻率不同的染色體區(qū)域內(nèi),理論上對全部的SNPs位點(diǎn)都進(jìn)行基因分型,就能夠?qū)ふ业竭@樣的區(qū)域〔3〕,但應(yīng)用這種方法進(jìn)行鑒定的成本卻過于昂貴。已有研究表明〔4〕,用少部分的遺傳標(biāo)記仍可保留單體型的大部分信息,例如單體型圖計(jì)劃已鑒定出約50萬個標(biāo)簽SNP(TagSNP)位點(diǎn),提供了與一千萬個SNPs位點(diǎn)大致相同的圖譜信息,從而大幅度地減少了成本使得研究易于進(jìn)行。目前,已有幾種根據(jù)基因分型或單體型數(shù)據(jù)篩選tagSNP的方法〔5〕,研究者利用SNPs及其他遺傳變異在染色體上的組成特點(diǎn),從HapMap中獲得tagSNP的信息,通過軟件分析用來定位與重要醫(yī)學(xué)特征相關(guān)的基因〔6〕。TagSNP的篩選大大簡化了基因與疾病的關(guān)聯(lián)分析,使遺傳疾病的基因定位能夠更為有效的進(jìn)行。

材料與方法

1.數(shù)據(jù)來源

利用國際人類基因組單體型圖計(jì)劃(The International HapMap Project,http://www.hapmap.org) 的通用基因組瀏覽器(HapMap Genome Btowser)下載2009年2月公布的Ⅲ期22號染色體的SNPs基因型數(shù)據(jù)。其中,北京漢族人群(Han Chinese in Beijing,China,CHB)包括84個樣本的18 588個SNPs信息;東京日本人群(Japanese in Tokyo,Japan,JPT)包括86個樣本的18 103個SNPs信息;而來自歐洲北部和西部的猶他州人群(Utah residents with Northern and Western European ancestry from the CEPH collection,CEU)則包括165個樣本的19 660個SNPs信息。

2.軟件介紹

在SNPs基因型數(shù)據(jù)分析中,常用的軟件有BEST、GeneDigger、HaploBlock 以及 Haploview,其中 Haploview是由劍橋大學(xué)編寫的利用已有的基因型數(shù)據(jù)來計(jì)算連鎖不平衡統(tǒng)計(jì)量并推斷人群單體型模型的公用軟件包,目前的最新版本為Haploview4.2(可從http://www.broadinstitute.org/haploview/haploview-downloads免費(fèi)下載),可在1.4版及以上的Java運(yùn)行環(huán)境(JRE)中使用。

Haploview中的Tagger計(jì)算機(jī)程序提供了篩選tagSNP的方法〔7〕,主要參數(shù)是次等位基因頻率(Minor Allele Frequency,MAF)閾值以及 tagSNP和未檢測SNP之間的最小連鎖不平衡相關(guān)程度(用r2值來表示),即侯選基因上所有常見 SNPs(即次等位基因頻率大于閾值者),要么作為tag-SNP進(jìn)行直接檢測,要么與一個待檢SNP相關(guān)聯(lián)(r2值超過設(shè)定值)。此外,研究者也可以結(jié)合現(xiàn)有文獻(xiàn)選取感興趣的可能的功能位點(diǎn)(如基因編碼區(qū)和調(diào)控區(qū)的多態(tài)位點(diǎn))作為tagSNP。

3.篩選tagSNP

運(yùn)行Haploview4.2分別讀取HapMap中的CHB、JPT和CEU的22號染色體SNPs基因型數(shù)據(jù),之后首先要對數(shù)據(jù)的信息進(jìn)行整理,設(shè)定Hardy-Weinberg平衡切斷值(HW p-value cutoff)為0.0010,次等位基因頻率(minimum minor allele freq)的最小值為0.0010,未缺失的基因型頻率最小值為75%,最大孟德爾遺傳規(guī)律錯誤的個數(shù)(max mendel errors)為1,Haploview將最終選取滿足這些條件的SNPs進(jìn)行有效的分析;隨后在tagSNP的篩選過程中設(shè)定不同的r2值(0.5~1.0),并記錄tagSNP的數(shù)量。

4.TagSNP數(shù)量的比例關(guān)系

HapMap所提供的不同人群的相同染色體的SNPs數(shù)量并不完全相同,為了排除所篩選的tagSNP數(shù)量會受到人群總SNPs數(shù)量的影響,需要計(jì)算不同人群中不同r2值所對應(yīng)的tagNP數(shù)量占總SNPs數(shù)量的百分比例。

結(jié) 果

運(yùn)行Haploview4.2分別處理三個人群的SNPs基因型數(shù)據(jù),不同r2值所對應(yīng)的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例的具體情況見表1。當(dāng)r2值為0.8(軟件默認(rèn)值)時,在CHB中篩選出7 752個tag-SNP,這表示由占總SNPs數(shù)量41.70%的這7 752個tagSNP所構(gòu)建的單體型即可反映北京漢族人群整個22號染色體上的18 588個SNPs的大部分信息;與此相比,依然是在 r2值為0.8時,分別需要7 460個(41.21%)和9086個(46.22%)tagSNP才能反映東京日本人群和來自歐洲北部和西部的猶他州人群22號染色體上的單體型信息。即使在相鄰的SNPs位點(diǎn)存在著完全連鎖的情況下(r2值為1)所篩選的tagSNP的數(shù)量還是明顯的低于總SNPs數(shù)量,此時CHB、JPT和CEU的tagSNP數(shù)量分別占總SNPs數(shù)量的65.56%、63.35%和70.05%。

表1 三個人群中不同r2值所對應(yīng)的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例

若以設(shè)定的r2值為橫坐標(biāo),以所篩選的tagSNP數(shù)量或其占總SNPs數(shù)量百分比例為縱坐標(biāo)做圖,則可以更為直觀地看到三個人群中北京漢族人群和東京日本人群比較接近,且三個人群均表現(xiàn)出隨著所設(shè)定的r2值的增大tagSNP數(shù)量及其百分比例呈現(xiàn)出逐漸增多的趨勢;但在r2值相同時三個人群的tagSNP數(shù)量卻存在著一定的差異,表現(xiàn)為日本人群的數(shù)量最少,北京漢族人群其次,歐洲北部和西部的猶他州人群的數(shù)量最多。在三個人群中tagSNP數(shù)量的增加速度都表現(xiàn)為在r2值小于0.9時較為平穩(wěn),r2值大于0.9時增加速度都有所提高,其中以北京漢族人群的增加更為明顯。

討 論

運(yùn)用Haploview軟件進(jìn)行tagSNP的篩選,可直接分析從HapMap上下載到的階段性SNPs基因型數(shù)據(jù),通過計(jì)算連鎖不平衡統(tǒng)計(jì)量來推斷人群單體型模型。有研究顯示利用HapMap基因型數(shù)據(jù)所篩選的tagSNP進(jìn)行關(guān)聯(lián)研究比單位點(diǎn)研究的統(tǒng)計(jì)效力更高,且可不受數(shù)據(jù)庫完整性的影響〔7〕。本研究即是運(yùn)用Haploview4.2軟件計(jì)算出三個人群(北京漢族人群、東京日本人群和來自歐洲北部和西部的猶他州人群)22號染色體在不同r2值(最小連鎖不平衡相關(guān)程度)時所對應(yīng)的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例,結(jié)果顯現(xiàn)出tagSNP的數(shù)量受r2值的影響較大,雖然三個人群在SNPs連鎖不平衡關(guān)系上存在著一定的差異(相對說來,北京漢族人群和東京日本人群的結(jié)果較為接近),但均表現(xiàn)出隨著所設(shè)定的r2值的增大tagSNP數(shù)量及其百分比例呈現(xiàn)出逐漸增多的趨勢,不過tagSNP數(shù)量的增加速度在三個人群中略有不同。究其增加速度不同的原因,一方面在于HapMap計(jì)劃所檢測的三個人群總SNPs位點(diǎn)個數(shù)以及樣本例數(shù)的差異(北京漢族人群和東京日本人群樣本例數(shù)幾乎相等,而歐洲北部和西部的猶他州人群的樣本例數(shù)則幾乎是北京漢族人群和東京日本人群樣本例數(shù)的總和),理論上較大的樣本量意味著位點(diǎn)間有更多的重組機(jī)會(重組機(jī)會的增多可降低原位點(diǎn)間的r2值),故當(dāng)固定r2值以篩選tagSNP時,較大的樣本量就可導(dǎo)致有更多的tagSNP被篩選出來;另一方面,影響r2值的因素還包括群體有效大小(Ne)以及位點(diǎn)間重組率(c),三個人群不同的遺傳背景使得位點(diǎn)間重組率和重組率圖(相鄰的SNPs位點(diǎn)間的重組率即組成了重組率圖) 產(chǎn)生差異,因 E(r2)=1/(1+4Nec)〔8〕,從而也導(dǎo)致了三個人群的tagSNP在數(shù)量及增加速度上的差異。所以,在實(shí)際研究中要依據(jù)目標(biāo)人群、研究經(jīng)費(fèi)等方面的具體情況設(shè)置合理的r2值,若因研究經(jīng)費(fèi)有限需要檢測的SNPs位點(diǎn)數(shù)量較少時,可通過降低r2值來減少tagSNP的數(shù)量,尤其是當(dāng)研究人群不同時,不應(yīng)盲目地遵從由參考樣本數(shù)據(jù)所計(jì)算出的r2值,應(yīng)更相信從實(shí)際研究數(shù)據(jù)中所計(jì)算得到的r2值。此外,當(dāng)估算出位點(diǎn)間的r2值后,還可進(jìn)一步推斷群體有效大小,因?yàn)槿后w有效大小是一個重要參數(shù),有助于解釋人群是如何進(jìn)行演變和擴(kuò)大的,并可提高對復(fù)雜性狀遺傳模式的理解和建模〔9〕。

目前,在疾病的病因?qū)W研究中,盡管已在發(fā)現(xiàn)疾病的危險(xiǎn)等位基因方面取得了很大的進(jìn)步,但大多數(shù)的遺傳風(fēng)險(xiǎn)仍然無法解釋。在廣泛的人群中全面的檢測所有常見和稀有的等位基因可對疾病的遺傳風(fēng)險(xiǎn)有一個更為完整的認(rèn)識〔8〕。但對全部SNPs位點(diǎn)進(jìn)行關(guān)聯(lián)研究確實(shí)存在著諸多困難(工作量大、成本較高等),而利用少量的tagSNP就能提供與全基因組SNPs位點(diǎn)大致相同的圖譜信息的方式,則可以良好的解決這些問題。相信,隨著生命科學(xué)的不斷發(fā)展和進(jìn)步,提取tagSNP的算法將會得到逐步完善,從而在分子流行病學(xué)和生命科學(xué)的研究中發(fā)揮積極的作用。

1.Akey J,Jin L,Xiong M.Haplotypes vs single marker linkage disequilibrium tests:what do we gain?Eur J Hum Genet,2001,9(4):291-300.

2.鄒莉玲,趙耐青,秦國友,等.應(yīng)用關(guān)聯(lián)規(guī)則篩選疾病相關(guān)的SNP位點(diǎn)及其組合的分析方法.中國衛(wèi)生統(tǒng)計(jì),2009,26(3):226-233.

3.Johnson GC,Esposito L,Barratt BJ,et al.Haplotype tagging for the identification of common disease genes.Nat Genet,2001,29(2):233-237.

4.Patil N,Berno AJ,Hinds DA,et al.Blocks of limited haplotype diversity revealed by high-resolution scanning of human chromosome 21.Science,2001,294(5547):1669-1670.

5.Gopalakrishnan S,Qin ZS.TagSNPselection based on pairwise LD criteria and power analysis in association studies.Pac Symp Biocomput,2006,511-522.

6.Xu Z,Kaplan NL,Taylor JA.Tag SNPselection for candidate gene association studies using HapMap and gene resequencing data.Eur J Hum Genet,2007,15(10):1063-1070.

7.Bakker PI,Yelensky R,Pe'er I,et al.Efficiency and power in genetic association studies.Nat Genet,2005,37(11):1217-1223.

8.Sved JA.Correlation measures for linkage disequilibrium within and between populations.Genet Res(Camb),2009,91(3):183-192.

9.Tenesa A,Navarro P,Hayes BJ,et al.Recent human effective population size estimated from linkage disequilibrium.Genome Res,2007,17(4):520-526.

猜你喜歡
研究
FMS與YBT相關(guān)性的實(shí)證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
關(guān)于遼朝“一國兩制”研究的回顧與思考
EMA伺服控制系統(tǒng)研究
基于聲、光、磁、觸摸多功能控制的研究
電子制作(2018年11期)2018-08-04 03:26:04
新版C-NCAP側(cè)面碰撞假人損傷研究
關(guān)于反傾銷會計(jì)研究的思考
焊接膜層脫落的攻關(guān)研究
電子制作(2017年23期)2017-02-02 07:17:19
主站蜘蛛池模板: 在线观看亚洲人成网站| 欧美性色综合网| 天天操天天噜| 中文字幕在线观| 在线网站18禁| 亚洲人成人无码www| 亚洲成aⅴ人片在线影院八| 色首页AV在线| 中文字幕伦视频| 97国产精品视频人人做人人爱| 日韩福利在线观看| 91精品国产综合久久香蕉922| 国产精品极品美女自在线网站| 国产高清不卡| 欧亚日韩Av| 亚洲精品大秀视频| 欧洲高清无码在线| 亚洲精品大秀视频| 999精品色在线观看| 在线观看国产黄色| 2021国产精品自产拍在线观看 | 久久亚洲高清国产| 综合亚洲网| 亚洲精品国产精品乱码不卞| 蜜臀AVWWW国产天堂| 中文字幕色在线| 中文一级毛片| 国产无套粉嫩白浆| 精品国产网站| 亚洲午夜福利在线| 国产福利观看| 国产在线97| 国产特级毛片aaaaaa| 无码日韩精品91超碰| 波多野结衣国产精品| 人妻少妇乱子伦精品无码专区毛片| 欧美一级高清视频在线播放| 影音先锋丝袜制服| 国产高潮流白浆视频| 久久亚洲国产视频| 91探花国产综合在线精品| 色视频国产| 日韩专区欧美| 成人国产免费| 色婷婷在线影院| 综合五月天网| 99热亚洲精品6码| 中国毛片网| 亚洲香蕉伊综合在人在线| 香蕉蕉亚亚洲aav综合| 国产欧美日韩在线一区| 国产一区二区三区视频| 午夜毛片免费看| 亚洲美女高潮久久久久久久| 国产精品第一区在线观看| 亚洲国产天堂久久综合| 国产性猛交XXXX免费看| 在线欧美一区| www.亚洲一区| 啊嗯不日本网站| 亚洲伦理一区二区| 毛片免费观看视频| 国产三级成人| 免费看美女毛片| 久久77777| 99视频在线看| 伊人色天堂| 欧美www在线观看| 国产黄色片在线看| 成人夜夜嗨| 青青青视频91在线 | 日韩福利视频导航| 欧美亚洲综合免费精品高清在线观看 | 91年精品国产福利线观看久久 | 在线综合亚洲欧美网站| 免费A∨中文乱码专区| 综合色亚洲| 国内99精品激情视频精品| 日本高清在线看免费观看| 台湾AV国片精品女同性| 亚洲国产成人麻豆精品| 国外欧美一区另类中文字幕|