牟紅婷
(中國(guó)石油大學(xué)(華東)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 青島 266580)
癌癥、心血管疾病等復(fù)雜疾病是影響人們身體健康的一個(gè)重要因素。其發(fā)病率高,遺傳方式不確定,致病機(jī)理異常復(fù)雜[1~2]。疾病性狀是復(fù)雜疾病的表現(xiàn)特征,是疾病的特征標(biāo)簽,而且復(fù)雜疾病多表現(xiàn)為連續(xù)的數(shù)量性狀變異,疾病性狀很容易被量化。因此為了了解復(fù)雜疾病的發(fā)病機(jī)制,發(fā)現(xiàn)和疾病性狀相關(guān)的基因非常重要,這對(duì)復(fù)雜疾病的診斷、治療以及預(yù)防都起到至關(guān)重要的作用[3~4]。
復(fù)雜疾病并不只是由單個(gè)基因引起的,而是由多個(gè)基因共同決定,受多個(gè)基因共同影響。其中每個(gè)基因的作用相對(duì)較弱,但是它們的綜合作用卻可以產(chǎn)生顯著作用。在分離分析每一個(gè)基因時(shí),都有產(chǎn)生巨大假陽(yáng)性的結(jié)果的可能性,因此我們很難發(fā)現(xiàn)相互作用的基因[5]。除此之外,人體中有數(shù)以萬計(jì)的基因,如果對(duì)全部基因進(jìn)行研究分析,無論是基因與基因之間的相互作用關(guān)系還是基因與疾病性狀之間的相互作用關(guān)系都是龐大且復(fù)雜的,這對(duì)數(shù)據(jù)的選擇工作也提出了新的挑戰(zhàn)。
所以本文提出利用結(jié)構(gòu)方程模型對(duì)基因和疾病相關(guān)性狀建模,量化了多個(gè)基因的綜合作用,以及多組基因和疾病相關(guān)性狀的關(guān)聯(lián)關(guān)系,發(fā)現(xiàn)與疾病性狀相關(guān)的基因。結(jié)構(gòu)方程模型可以用來解決多個(gè)變量之間的相互作用,明確量化單個(gè)變量對(duì)整體的作用和單個(gè)變量之間的作用[6~7]。與其他方法相比,結(jié)構(gòu)方程模型所估計(jì)的參數(shù)更加準(zhǔn)確,而且無需考慮控制變量;……