999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基因-疾病關聯研究meta分析中存在合并基因型的貝葉斯分析策略*

2018-07-16 10:08:06第二軍醫大學衛生統計學教研室200433
中國衛生統計 2018年3期
關鍵詞:關聯模型研究

第二軍醫大學衛生統計學教研室 (200433) 

宋嘉麒 金志超△ 賀 佳△

基因-疾病關聯研究常利用單核苷酸多態性(single nucleotide polymorphisms,SNPs)篩查與疾病相關的基因突變位點,然而由于樣本量和統計效能的問題,常常導致假陰性,利用meta分析對原始研究進行定量合并,能夠有效地提高統計效能。

在進行基因-疾病關聯研究meta分析時,常常遇到遺傳模型的假定問題。遺傳模型的假定問題既存在于原始文獻中,也存在于meta分析定量合并時。如果原始文獻中研究者主觀地進行了遺傳模型的假定,如假定為顯性或者隱形遺傳模型,在其結果中有可能只給出特定遺傳模型下的效應量(OR值),從而使meta分析作者無法同時獲得三種基因型的頻數,最終導致其在定量合并時也不得不采用原始文獻中的遺傳模型,或者將該研究剔除。Minelli,Salanti等人對遺傳模型的假定問題進行了較為深入的研究[1-2]。Salanti等人的研究已經能夠較好的處理上述兩種遺傳模型假定的情況[2],利用貝葉斯方法分析遺傳模型假定而存在的基因型合并問題。但是在實際研究當中,由于Salanti等人提出的貝葉斯方法較為復雜,且對于常用的回顧性似然未提供代碼(回顧性似然更適合采用病例對照研究的基因-疾病關聯研究[3]),使得此方法在實際應用中使用的并不廣泛。同時,Salanti等人在其研究中并未對遺傳模型的選擇提供結論。

本研究將在Minelli和Salanti等人研究的基礎上,利用回顧性似然和貝葉斯方法處理基因-疾病關聯研究meta分析中存在的原始文獻基因型合并的問題,構建一個遺傳模型選擇指示概率,以數據驅動估計各種典型遺傳模型存在的相應概率,最后提供相應的JAGS代碼和R代碼用以實現上述過程,為其他類似研究提供方法學支持。

方  法

1.基本原理

常見的進行基因關聯研究的原始文獻會提供如表1所示的病例組和對照組的三種基因型的頻率,假定三種基因型分別時AA、Aa和aa。

表1 常見基因關聯研究的數據表現形式

表1中cni(n=1,2,3)表示納入的某原始研究病例組三種基因型頻率,病例組樣本量為ci,tni(n=1,2,3)為對照組三種基因型頻率,對照組樣本量為ti。病例組和對照組基因型頻率服從多項分布,可用(1)式和(2)式表示:

(1)

(2)

(3)

式中系數λ表示遺傳模型,λ=0表示隱性遺傳模型,λ=0.5表示共顯性遺傳模型,λ=1表示顯性遺傳模型。式(3)是在病例組和對照組所有基因型都可以從納入文獻中獲取的情況下使用,但在納入的原始文獻中,作者在分析時有可能對遺傳模型進行假定,得到的是一個對基因型頻數進行合并了的四格表,如表2所示。

表2 假定遺傳模型下合并基因型的基因關聯研究數據表現形式

(4)

在估計φi時,假設感興趣的等位基因A的頻率為κi,根據哈代-溫伯格平衡(Hardy-Weinberg equilibrium),φi=2(1-κi)/(2-κi)。相比利用極大似然估計等方法,貝葉斯方法在估計合并效應量θ時更方便,能夠方便地借助外部信息,如哈代-溫伯格平衡。

2.實例

實例數據來自Huang等發表的關于ACE I/D基因多態性與腎移植預后關系的系統綜述[4],本實例選取了腎移植所致的急慢性排斥反應,共納入11項研究,其中9項提供了完全的基因型頻數,2個研究存在合并的基因型頻數(II和ID基因型存在合并)[5-6],其基本信息如表3所示。

表3  ACE I/D基因多態性對腎移植所致的急慢性排斥反應納入文獻基本信息

3.軟件實現

本研究采用貝葉斯常用軟件JAGS,并利用R軟件中的R2jags包調用執行。由于文章篇幅所限,本例中只提供關鍵的JAGS代碼,R代碼可通過郵件向通訊作者索取。JAGS完整代碼如下:

model{

#Complete studies

for(i in 1:9){

#Multinomial Likelihoods.matrix ′ca′ and ′co′ is 9*3

ca[i,1:3]~dmulti(p.case[i,1:3],tcase[i])

co[i,1:3]~dmulti(p.cont[i,1:3],tcont[i])

# 公式(3)

sum1[i]<-p.cont[i,1]+exp(lambda*theta[i])*p.cont[i,2]+exp(theta[i])*p.cont[i,3]

p.case[i,1]<-p.cont[i,1]/sum1[i]

p.case[i,2]<-exp(lambda*theta[i])*p.cont[i,2]/sum1[i]

p.case[i,3]<-exp(theta[i])*p.cont[i,3]/sum1[i]

for(k in 1:3){

p.cont[i,k]~dunif(0,1)

}

}

#Merged studies

for (i in 1:2){

#Multinomial Likelihoods.matrix ′ca.merg′ and ′co.merg′ is 9*2

ca.merg[i,1:2]~dmulti(p.casemerg[i,1:2],ca.n.merge[i])

co.merg[i,1:2]~dmulti(p.contmerg[i,1:2],co.n.merge[i])

#公式(4)

p.contr[i,1]<-p.contmerg[i,1]

p.contr[i,2]<-p.contmerg[i,2]*f[i]

p.contr[i,3]<-p.contmerg[i,2]*(1-f[i])

sum2[i]<-p.contmerg[i,1]+exp(lambda*theta[i+9])*f[i]*p.contmerg[i,2]+exp(theta[i+9])*(1-f[i])*p.contmerg[i,2]

p.case1[i,1]<-p.contr[i,1]/sum2[i]

p.case1[i,2]<-exp(lambda*theta[i+9])*p.contr[i,2]/sum2[i]

p.case1[i,3]<-exp(theta[i+9])*p.contr[i,3]/sum2[i]

for(k in 1:2){

p.contmerg[i,k]~dunif(0,1)

p.casemerg[i,k]~dunif(0,1)

}

#H-W平衡

f[i]<-2*(1-pa[i])/(2-pa[i])

pAA[i]<-(1-pa[i])*(1-pa[i])

n1[i]~dbin(pAA[i],co.n.merge[i])

pa[i]~dbeta(1,1)

}

for(i in 1:11){

theta[i]~dnorm(mean,prec)

}

# Priors information for effects and heterogeneity

mean~dnorm(0,0.0001)

tau ~ dnorm(0,1)I(0,) #半正態分布

prec=1/(tau*tau)

#Probability of genetic model,0:recessive model,0.5 co-dominant,1:dominant

d<-c(0,0.5,1)

p<-c(1/3,1/3,1/3)

K~dcat(p[])

lambda<-d[K]

#Results of interest

OR2<-exp(mean*lambda)

OR3<-exp(mean)

#probmodel[1]:recessive,probmodel[2]:co-dominant,probmodel[3]:dominant

for(g in 1:3){

probmodel[g]<-equals(K,g)

}

}

上述代碼的關鍵部分為涉及合并基因型的回顧性似然構建和編碼,對于τ還可以有其先驗分布,如dgamma(0.001,0.001)和dunif(0,10)等。

結  果

上述實例中,相對于基因型ACE D/D,攜帶有基因型I/I和基因型I/D的腎移植患者發生排斥反應風險無統計學意義,其OR值和95%置信區間分別為0.68 (0.41,1.02)和0.50(0.19,1.04),用以表示遺傳模型的系數λ及其95%置信區間為0.53 (0.50,1.00),其后驗概率密度分布如圖1所示。三種遺傳模型的概率分別為隱性遺傳模型為0%,顯性遺傳模型6.2%,共顯性遺傳模型為93.8%。研究間變異τ2=0.98。

圖1 表示遺傳模型的系數λ的后驗概率密度

另外,我們又選取了Ragland等發表的關于UCHL1 S/Y基因多態性與帕金森氏病發病風險關系的系統綜述[7],共納入18項研究,全部提供了完全的基因型頻數。首先用無遺傳模型約束的貝葉斯Meta分析方法[8-9]估計OR值,然后無放回地隨機抽取2個研究,合并S/Y和Y/Y基因型頻數,并用本研究方法估計OR值,并重復9次。結果如表4所示,相對于基因型S/S,基因型Y/Y的OR值為0.876~0.912,均值為0.895,與納入全部研究的估計結果0.894相近,基因型S/Y的OR值為0.649~0.734,均值為0.704,與納入全部研究的估計結果0.704相近。

表4 隨機合并S/Y和Y/Y基因頻數及全部研究OR值估計結果

討  論

本研究采用了貝葉斯方法處理了基因-疾病關聯研究meta分析中原始文獻中存在遺傳模型假定而帶來基因型合并問題。在meta分析過程中不假定基因

型,利用完整的研究和哈代-溫伯格平衡估計合并基因型中每個基因型的頻率,由于納入了所有原始文獻,未剔除存在合并基因型的研究,能夠提高統計檢驗效能。利用Ragland等人實例提供的完全數據表明本文方法估計OR值的穩定性、準確性以及精確性均較高。

同時,利用本研究的方法,在無充分生物學機制的基礎上,能夠利用數據驅動估計幾種經典遺傳模型的概率。利用meta分析的方法估計遺傳模型對于構建慢性傳染性疾病的發病或預后模型具有重要意義[2]。在宏觀環境危險因素的基礎上,利用合理的遺傳模型加入基因層面的影響因素,能夠使預測模型更為精確,能夠促進精準醫學的開展。

本研究存在的主要缺陷是哈代-溫伯格平衡在少量的研究中并不一定成立,因此需要考慮在哈代-溫伯格平衡不成立條件下的似然函數形式[10]。另外,本研究未對影響合并結果的其他因素如種族、檢測方法、性別等考慮在內,可以進一步考慮在貝葉斯框架下使用meta回歸,使得結果更為合理。

猜你喜歡
關聯模型研究
一半模型
FMS與YBT相關性的實證研究
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
主站蜘蛛池模板: 2021国产精品自拍| 久久熟女AV| 日韩一级二级三级| 欧美国产日韩在线播放| 91无码人妻精品一区二区蜜桃| 在线精品自拍| 男女性午夜福利网站| 久久永久精品免费视频| 中文无码精品A∨在线观看不卡 | 久久成人免费| 国产一区亚洲一区| 97久久精品人人做人人爽| 国产成人精品午夜视频'| 精品免费在线视频| 91在线国内在线播放老师| 国产91无毒不卡在线观看| 五月天久久综合国产一区二区| 久久综合色视频| 久久久四虎成人永久免费网站| 国产成人福利在线| 99热在线只有精品| a级毛片视频免费观看| 久久久亚洲色| 欧美中文字幕一区二区三区| 午夜毛片免费观看视频 | 亚洲欧洲一区二区三区| 国产欧美日韩资源在线观看| 99久久无色码中文字幕| 国产在线观看91精品亚瑟| 天堂岛国av无码免费无禁网站| 国产新AV天堂| 2021国产乱人伦在线播放| 怡红院美国分院一区二区| 亚洲精品第五页| 国产亚洲精品在天天在线麻豆 | 国产精品亚洲精品爽爽| 国产亚洲精品va在线| 福利一区在线| yy6080理论大片一级久久| 18禁影院亚洲专区| 国产aaaaa一级毛片| 色婷婷电影网| 一级做a爰片久久毛片毛片| 综合人妻久久一区二区精品| 999福利激情视频| 国产va欧美va在线观看| 91偷拍一区| 成人在线观看不卡| 欧美啪啪网| 亚洲欧美极品| 呦女精品网站| 国产打屁股免费区网站| 国产精品不卡片视频免费观看| 中文字幕亚洲第一| 日韩在线成年视频人网站观看| 亚洲人精品亚洲人成在线| 国产日本视频91| 亚洲日本韩在线观看| 亚洲中文字幕日产无码2021| 国产免费怡红院视频| 亚洲一区网站| 国产中文在线亚洲精品官网| 亚洲婷婷六月| 国产欧美日韩va| 亚洲娇小与黑人巨大交| 久久www视频| 一级毛片免费播放视频| 久久综合九色综合97网| 丁香亚洲综合五月天婷婷| 国产综合欧美| 伊人久热这里只有精品视频99| 欧美福利在线| 中文天堂在线视频| 91免费国产在线观看尤物| 亚洲无限乱码| 成人在线综合| 黄色网站不卡无码| 丁香婷婷激情网| 98精品全国免费观看视频| 国产成人精品亚洲日本对白优播| 92午夜福利影院一区二区三区| 在线观看国产小视频|