黃 煜 孫翔飛
【提 要】 目的 識(shí)別介導(dǎo)兒童期經(jīng)歷中等至極端虐待與抑郁障礙相關(guān)的DNA甲基化位點(diǎn),有助于在分子水平闡明抑郁障礙的發(fā)病機(jī)制,同時(shí)也可為改善臨床治療手段提供參考依據(jù)。方法 采用基于貝葉斯壓縮估計(jì)的高維中介效應(yīng)模型識(shí)別具有中介效應(yīng)的DNA甲基化位點(diǎn),數(shù)據(jù)來(lái)源于gene expression omnibus(GEO)數(shù)據(jù)庫(kù),分析采用基于R4.0的hdbm包進(jìn)行分析。結(jié)果 采用貝葉斯高維中介效應(yīng)模型進(jìn)行分析,研究識(shí)別出具有潛在中介效應(yīng)的2個(gè)DNA甲基化位點(diǎn),分別為cg08522473與cg13224723,且分別位于基因TAGLN3與PAOX。結(jié)論 采用該模型識(shí)別出的甲基化位點(diǎn)分別位于基因TAGLN3與PAOX,且該基因都在人腦中有表達(dá),且都與人類精神疾病相關(guān),故這些DNA甲基化位點(diǎn)很可能介導(dǎo)了兒童期經(jīng)歷中等至極端虐待后導(dǎo)致成年抑郁障礙的發(fā)生。
抑郁障礙是最常見(jiàn)的精神障礙之一,是指各種原因引起的以顯著而持久的心境低落為主要臨床特征的一類心境障礙。據(jù)WHO報(bào)告的數(shù)據(jù)顯示,全球有超過(guò)3.5億人受到抑郁癥的困擾,且在近十年來(lái)罹患該疾病的人數(shù)增長(zhǎng)了約18%,故闡明抑郁障礙的發(fā)病機(jī)制具有重要的意義。目前普遍認(rèn)為抑郁障礙發(fā)病是遺傳、心理、社會(huì)環(huán)境等多種因素共同作用的結(jié)果。近年來(lái)越來(lái)越多的研究者在表觀遺傳學(xué)領(lǐng)域?qū)υ摷膊〉陌l(fā)病機(jī)制進(jìn)行了研究,且有研究表明DNA甲基化與抑郁障礙的發(fā)病存在關(guān)聯(lián)[1]。DNA甲基化是基因表觀遺傳修飾機(jī)制的一種,它雖不會(huì)改變DNA序列,但卻能影響DNA序列的活性,從而產(chǎn)生一些未知的生物學(xué)效應(yīng)。
目前有研究支持兒童期遭受虐待會(huì)增加成年后罹患抑郁障礙的風(fēng)險(xiǎn)[2-3]。但是在分子水平上對(duì)該疾病的發(fā)病機(jī)制卻未完全闡明,有研究表明DNA甲基化可能參與了該疾病發(fā)病。目前的研究可知,兒童期經(jīng)歷過(guò)虐待可導(dǎo)致DNA甲基化[4],此外,也有研究支持DNA甲基化與成年罹患抑郁障礙有關(guān)[1,5],識(shí)別DNA甲基化位點(diǎn)對(duì)于在分子水平層面闡明抑郁障礙征具有重要的意義。
DNA甲基化在抑郁障礙的發(fā)病過(guò)程中起的作用相當(dāng)于“黑盒”效應(yīng),即兒童期經(jīng)歷虐待導(dǎo)致DNA甲基化的改變,DNA甲基化的改變又導(dǎo)致罹患抑郁障礙。DNA甲基化發(fā)揮著介導(dǎo)的作用,且可以建立起抑郁障礙的發(fā)病過(guò)程。
中介效應(yīng)分析是研究中介變量如何解釋暴露變量影響結(jié)局的機(jī)制。中介效應(yīng)分析可將暴露變量對(duì)結(jié)局的作用分為兩部分:通過(guò)中介變量發(fā)揮的作用稱為中介效應(yīng);中介變量無(wú)法解釋的效應(yīng)則稱為直接效應(yīng)。在我國(guó)醫(yī)學(xué)研究領(lǐng)域涉及中介效應(yīng)的研究中多為中介模型的應(yīng)用[6-8]。較少涉及中介模型的方法學(xué)研究。目前的中介分析方法由單中介模型,進(jìn)階為多中介模型,以及高維中介模型[9-10],此外,這些模型適用于連續(xù)和二分類結(jié)局,同時(shí)也有研究考慮暴露與中介變量間的相互作用的研究[11]。但是,這些研究基本都忽略了中介變量間的關(guān)系,由于DNA甲基化數(shù)據(jù)存在高維的特性,以及測(cè)序技術(shù)的原因,不可避免地在位點(diǎn)間存在一定的相關(guān)性。
基于以上的考慮,本研究采用高維情況下的貝葉斯中介分析方法[12]。貝葉斯中介模型是在分層框架中提出的,在該理論框架中,暴露因素對(duì)結(jié)局的影響是基于單個(gè)中介變量定義的。為了估計(jì)模型中的直接和中介效應(yīng),我們做了中介效應(yīng)稀疏性的假設(shè),即認(rèn)為在只存在少部分的中介變量具有中介效應(yīng)。在該先驗(yàn)下,認(rèn)為一小部分的DNA甲基化位點(diǎn)介導(dǎo)了兒童期經(jīng)歷中等至極端虐待對(duì)成年后罹患抑郁障礙的效應(yīng)。該方法將DNA甲基化位點(diǎn)識(shí)別的問(wèn)題轉(zhuǎn)變?yōu)镈NA甲基化位點(diǎn)的選擇問(wèn)題,并應(yīng)用貝葉斯方法對(duì)連續(xù)收縮率的影響進(jìn)行預(yù)測(cè)。該方法不僅可以同時(shí)分析多個(gè)中介變量,而且也無(wú)需對(duì)中介變量做出任何路徑特定或因果順序的假設(shè)。
1.數(shù)據(jù)來(lái)源
研究數(shù)據(jù)來(lái)自于美國(guó)格雷迪創(chuàng)傷項(xiàng)目研究,該研究在獲得埃默里大學(xué)醫(yī)學(xué)院和格雷迪紀(jì)念醫(yī)院機(jī)構(gòu)審查委員會(huì)批準(zhǔn)后,將亞特蘭大市中心居民中招募的非裔美國(guó)人作為研究對(duì)象。該數(shù)據(jù)集包含基線信息、細(xì)胞組成資料和DNA甲基化數(shù)據(jù)(DNAm)。研究采用改良的貝克抑郁量表(BDI)對(duì)研究對(duì)象進(jìn)行測(cè)量[13],且篩選出BDI評(píng)分≥10的觀察單位。在觀察結(jié)果中,排除了接受過(guò)抑郁障礙治療的研究對(duì)象,因?yàn)榻邮艿闹委熆赡軙?huì)影響DNAm的改變,從而使中介效應(yīng)分析的結(jié)果變得更為復(fù)雜與不確定。同時(shí),研究也剔除了兒童期經(jīng)歷中度至極端虐待缺失的觀察單位,最后納入中介效應(yīng)分析的研究對(duì)象有128例。關(guān)于該研究項(xiàng)目的詳細(xì)信息,讀者可以在網(wǎng)站http://gradytraumaproject.com/進(jìn)行參閱。研究采用的原始數(shù)據(jù)(DNAm數(shù)據(jù)、臨床數(shù)據(jù)和細(xì)胞數(shù)據(jù))可以在以下網(wǎng)址進(jìn)行下載獲取 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE72680。
2.方法
本研究采用R4.0軟件的hdbm包進(jìn)行分析,利用實(shí)際數(shù)據(jù)構(gòu)建兩個(gè)條件回歸模型,在利用Yi|Ai,Mi,Ci模型時(shí),要確保暴露因素Ai與Yi之間有關(guān)聯(lián)。首先構(gòu)建Yi|Ai,Ci模型:
(1)
繼而再構(gòu)建Yi|Ai,Mi,Ci模型:
(2)


其次,構(gòu)建Mi|Ai,Ci模型,即
Mi=Aiαa+αcCi+εMi
(3)

DE=E[Yi(a,Mi(a*))-Yi(a*,Mi(a*))|Ci]=βa(a-a*)
中介效應(yīng)可表示為:
ME=E[Yi(a,Mi(a))-Yi(a,Mi(a*))|Ci]=
(1)貝葉斯方法先驗(yàn)的指定
本研究對(duì)于第j個(gè)中介因素,假定了兩個(gè)正態(tài)分布的先驗(yàn),即


(2)后驗(yàn)抽樣算法



圖1 具有最大效應(yīng)的106個(gè)DNA甲基化位點(diǎn)介導(dǎo)的兒童期經(jīng)歷虐待導(dǎo)致成年罹患抑郁障礙
(4)


表1 貝葉斯高維中介模型識(shí)別出具有中介效應(yīng)的甲基化位點(diǎn)
本研究采用貝葉斯高維中介模型識(shí)別出了介導(dǎo)抑郁障礙發(fā)病的潛在中介效應(yīng)基因TAGLN3與PAOX。圖2反映出基因TAGLN3在人腦中高表達(dá),在人體的其他組織中則為呈低表達(dá)狀態(tài),且Aguzzi等在2008研究發(fā)現(xiàn)該基因編碼蛋白hNP25,且該蛋白能夠上調(diào)與增強(qiáng)調(diào)節(jié)克羅伊茨費(fèi)爾特-雅各布病與維持細(xì)胞骨架功能間的關(guān)系,該疾病是由朊病毒引起的中樞神經(jīng)系統(tǒng)變性疾病[19]。則說(shuō)明該基因參與了某些神經(jīng)系統(tǒng)疾病的發(fā)病。雖然未發(fā)現(xiàn)直接的研究支持該基因與抑郁障礙有關(guān),但是認(rèn)為該基因很可能與抑郁障礙的發(fā)病過(guò)程有關(guān)。對(duì)于基因PAOX,圖3反映出該基因在人腦中并非呈高表達(dá)狀態(tài),但是目前的研究發(fā)現(xiàn),基因PAOX與某些精神疾病相關(guān),比如,Moore K等研究發(fā)現(xiàn)基因PAOX對(duì)于焦慮的發(fā)病能起到保護(hù)作用;Cabrera-Mendoza B等對(duì)人腦基因甲基化與自殺身亡進(jìn)行了研究,提出基因PAOX是在以后的自殺研究中值得研究的基因[20],同樣未找到直接的研究支持基因PAOX與抑郁障礙的發(fā)病有關(guān),但是抑郁障礙與自殺存在很高的相關(guān)性,故該基因有很大可能性介導(dǎo)了兒童期經(jīng)歷中等至極端虐待導(dǎo)致成年后抑郁障礙的發(fā)病。研究結(jié)果可為分子水平上闡明抑郁障礙的發(fā)病機(jī)制提供參考,但要得出確定性的結(jié)論,則需要進(jìn)行生物學(xué)實(shí)驗(yàn)才能驗(yàn)證。

圖2 基因TAGLN3在不同人體組織中的表達(dá)量,該圖來(lái)自于(https://www.ncbi.nlm.nih.gov/gene/29114)

圖3 基因PAOX在不同人體組織中的表達(dá)量,該圖來(lái)自于(https://www.ncbi.nlm.nih.gov/gene/196743)
本研究雖采用了Song等研究提出的模型,同時(shí)也進(jìn)行了數(shù)值模擬研究佐證了該方法的優(yōu)越性。但是,利用該模型進(jìn)行分析時(shí),未對(duì)甲基化位點(diǎn)的性質(zhì)進(jìn)行考量,位于不同基因的DNAm位點(diǎn),由于基因間可能存在著上位效應(yīng),即DNAm位點(diǎn)在發(fā)揮效應(yīng)時(shí),可能處于不同的水平。而該模型將所有的DNAm位點(diǎn)都視為在同一水平發(fā)揮效應(yīng);該研究基于DNAm位點(diǎn)進(jìn)行研究,但基因才是遺傳的基本功能單位,對(duì)甲基化位點(diǎn)的生物學(xué)解釋具有一定的局限性;其次,研究識(shí)別出與抑郁障礙相關(guān)的DNAm位點(diǎn)在不同人群或地區(qū)中可能具有一定的差異性,因?yàn)榧谆稽c(diǎn)較基因的穩(wěn)定性差,故結(jié)果的外推性小;同時(shí),模型在計(jì)算中介效應(yīng)時(shí)采用了平方的形式來(lái)避免不同方向中介效應(yīng)的相互抵消,但是位點(diǎn)在模型擬合的過(guò)程中,無(wú)法控制方向不同的中介效應(yīng)的相互抵消,致使可能無(wú)法識(shí)別出具有潛在中介效應(yīng)但存在相互抵消的位點(diǎn)。同時(shí),識(shí)別出具有潛在中介效應(yīng)的位點(diǎn)的意義要遠(yuǎn)大于計(jì)算出中介效應(yīng)大小的意義,計(jì)算中介效應(yīng)的大小的目的是要了解在抑郁障礙發(fā)病過(guò)程中中介效應(yīng)所占的比例,但是,在模型估計(jì)過(guò)程中尚無(wú)法兼顧正負(fù)中介效應(yīng)抵消的問(wèn)題,所能識(shí)別出的都是中介效應(yīng)非常顯著的位點(diǎn),而且本模型采用了平方的形式來(lái)避免結(jié)果中中介效應(yīng)的相互抵消,但是采用這樣的方法將導(dǎo)致無(wú)法直觀地計(jì)算出中介效應(yīng)在致病過(guò)程中所占的比例,故本研究的結(jié)果部分沒(méi)有呈現(xiàn)中介效應(yīng)大小的結(jié)果。
最后,從生物學(xué)的角度,可知基因分為主效應(yīng)基因與微效基因,對(duì)于主效應(yīng)基因,可能單個(gè)位點(diǎn)即具有顯著的生物學(xué)效應(yīng),但是對(duì)于微效基因,則單個(gè)位點(diǎn)的生物學(xué)效應(yīng)較小,只有將這些微效效應(yīng)累加起來(lái)才能發(fā)揮顯著的生物學(xué)效應(yīng),該模型對(duì)于微效基因甲基化位點(diǎn)的識(shí)別可能不顯著。故以后將構(gòu)建更加吻合生物學(xué)意義的中介效應(yīng)模型。