999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

灰色關(guān)聯(lián)決策在NSNP曲線擬合中的應(yīng)用

2012-07-24 09:35:38郭曉龍
統(tǒng)計(jì)與決策 2012年20期
關(guān)鍵詞:關(guān)聯(lián)

邱 路,蔣 艷,郭曉龍

(上海理工大學(xué) 管理學(xué)院,上海 200093)

0 引言

近些年來,隨著人類全基因技術(shù)發(fā)生了迅猛的發(fā)展,分析研究基因變異以及基因讀取的軟件和算法也越來越先進(jìn)[1][2]。其中以生物統(tǒng)計(jì)學(xué)的發(fā)展最為明顯,對(duì)于龐雜的生物數(shù)據(jù)進(jìn)行匯總,并且對(duì)其進(jìn)行計(jì)算研究,最后得出一些有利于科學(xué)家進(jìn)行進(jìn)一步研究的素材,這極大地推動(dòng)了基因技術(shù)的發(fā)展。可是由于統(tǒng)計(jì)學(xué)的方法畢竟是有限的,在處理一些數(shù)據(jù)時(shí),并不能真實(shí)有效地反映出這些數(shù)據(jù)的確切含義,而且有時(shí)精確度也有待于提高。

單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP)為DNA序列變異的基本形式。SNP不僅可以作為遺傳學(xué)標(biāo)記,通過連鎖或關(guān)聯(lián)分析定位疾病易感基因,而且有些SNP本身就可以導(dǎo)致疾病,SNP對(duì)疾病的早期風(fēng)險(xiǎn)評(píng)估、早期診斷、預(yù)防和治療等各方面均有巨大的應(yīng)用價(jià)值[7]。為了探求人類的基因庫中NSNPS(Novel SNPs)的變化規(guī)律,文獻(xiàn)[1]中用了隨機(jī)排序算法,將每一次排序所得的NSNP數(shù)量進(jìn)行平均化,最后用STATA軟件擬合出來一條曲線,擬合的確定系數(shù)98.3%。本文為了進(jìn)一步提高曲線的擬合可信度,分別采用matlab和spss對(duì)于NSNP進(jìn)行了4種模型的預(yù)測,4種模型中有3個(gè)確定系數(shù)都在99.8%左右。本文進(jìn)一步引入灰色關(guān)聯(lián)評(píng)價(jià)方法,在3個(gè)確定系數(shù)都是99.8%的曲線中再擬合出一個(gè)最優(yōu)的曲線。結(jié)果表明該方法對(duì)提高擬合曲線精確度有明顯的效果。

1 模型建立與問題描述

本文采取了排序算法[1]對(duì)于44個(gè)人全基因組外顯子上的SNP進(jìn)行了研究。本文采用R軟件中隨機(jī)排序算法對(duì)44個(gè)隨機(jī)數(shù)進(jìn)行1000次全排列,如表1。

表1 44個(gè)全基因組外顯子SNP序列一次隨機(jī)排列表

在此基礎(chǔ)上,將這44個(gè)全基因組上的NSNP和合并后的NSNP進(jìn)行對(duì)比,每次對(duì)比都刪除重復(fù)的NSNP,最后對(duì)1000次結(jié)果求平均數(shù)。對(duì)比后的數(shù)據(jù)序列如表2所示。該表中數(shù)據(jù)包括44個(gè)基因組每次的NSNPs數(shù),每個(gè)基因組中NSNPs的1000對(duì)比后的平均數(shù)。

表2 NSNP匯總表

表2中的平均值和基因組數(shù)作成曲線如圖1:

圖1 44個(gè)基因組中NSNP變化趨勢圖

為了對(duì)NSNP的數(shù)量進(jìn)行預(yù)測,在這里我們采取了擬合曲線的方法,圖2是分別用matlab和spss軟件擬合的幾條曲線。

圖24 種模型的擬合圖

從圖2可以看出,幾條擬合曲線都比較理想。他們的確定系數(shù)如下:雖然這四條曲線和原曲線的差別相當(dāng)小,但其與原曲線的區(qū)分度依然值得提高。本文采用灰色關(guān)聯(lián)評(píng)價(jià)方法以得到一條最能精確表達(dá)原曲線的函數(shù)。

2 方法提出與數(shù)據(jù)處理

灰色關(guān)聯(lián)分析的基本思想是根據(jù)序列曲線的集合形狀的相似程度來判斷其聯(lián)系是否緊密。曲線越接近,相應(yīng)序列之間的關(guān)聯(lián)度也就越大[8]。進(jìn)行灰色關(guān)聯(lián)評(píng)價(jià)的步驟如下:

首先,選取一條序列為參考序列,在這里我們采取NSNPS數(shù)這條原序列為參考序列。

X0=(X0(1),X0(2),X0(3)…X0(43),X0(44))=(3272.98,2768.01,2586.54…1489.43,1482.77)將其余四條曲線也分別變換成數(shù)字序列形式:令matlab擬合的冪曲線1:

X1=(X1(1),X1(2),X1(3)…X1(43),X1(44))=(3257.00,2824.79,2599.06,…,1504.19,1497.10)

令matlab擬合的冪曲線2:

X2=(X2(1),X2(2),X2(3)…X2(43),X2(44))=(3230.3,2819.79,2601.64,…,1495.08,1487.58)

令spss擬合的冪曲線:

X3=(X3(1),X3(2),X3(3)…X3(43),X3(44))=(3273.36,2835.83,2607353,…,1502.67,1495.54)

令spss擬合的對(duì)數(shù)曲線:

X4=X4(1),X4(2),X4(3)…X4(43),X4(44)=(3068.63,2771.09,2597.05,…,1454.13,1444.27)

其次,對(duì)于X0,X1,X2,X3,X4這5個(gè)數(shù)列進(jìn)行無量綱化。在這里采取均值像法:

xi(k)d=無量綱化的5個(gè)序列如表3。

表3 無量綱化的五個(gè)序列

幾種灰色關(guān)聯(lián)度的公式如下:[9]

(1)灰色絕對(duì)關(guān)聯(lián)公式為:

(2)灰色相對(duì)關(guān)聯(lián)度公式為:

其中(n)是xi(n)初值像的始點(diǎn)零化像。

(3)灰綜合關(guān)聯(lián)度公式為:

(4)灰色相似關(guān)聯(lián)度公式為:

灰色系統(tǒng)理論建模系統(tǒng)3.0是一套用Visual Basic6.0開發(fā)的第一套基于Windows視窗界面的灰色系統(tǒng)建模軟件。[9]這套軟件極大地簡化了數(shù)據(jù)輸入中的繁瑣過程,便利了灰色關(guān)聯(lián)度的計(jì)算。

最后,將表3中的經(jīng)過無量綱化的數(shù)據(jù)導(dǎo)入到灰色系統(tǒng)建模軟件中,分別得出了4條曲線和原NSNP曲線的灰色關(guān)聯(lián)度,如表4所示:

表4 4種灰色關(guān)聯(lián)度對(duì)比表

由表4可見,四種灰色關(guān)聯(lián)度中X3與X0都是最大的,也就是說用SPSS軟件擬合的冪曲線是最優(yōu)曲線,方程為:Y=3273.356X-0.207。在這四種灰色關(guān)聯(lián)度中,灰色相似關(guān)聯(lián)度區(qū)分度最高,這也符合了灰色相似關(guān)聯(lián)度的基本思想:根據(jù)曲線幾何形狀來判斷不同序列之間的聯(lián)系是否緊密。

3 結(jié)論

為了探求44個(gè)全基因組上NSNP出現(xiàn)的規(guī)律,我們采取了擬合的方法,有利于對(duì)于更多數(shù)量的基因出現(xiàn)時(shí)對(duì)NSNP進(jìn)行預(yù)測。文獻(xiàn)[1]中采取的是STATA軟件,最后的確定系數(shù)是98.3%,并沒有達(dá)到最優(yōu)的擬合效果。本文用matlab和SPSS擬合,并用灰色關(guān)聯(lián)決策進(jìn)行最后擬合比選,確定系數(shù)大于99.8%。可見采取多種軟件進(jìn)行擬合,并用灰色關(guān)聯(lián)決策理論進(jìn)行最后的擬合比選的這種決策思想,為基因變異數(shù)量的預(yù)測提供了一個(gè)很有開創(chuàng)性的方法。

[1]Kimberly Pelak,Kevin V,Shianna,et al.The Characterization of Twen?ty Sequenced Human Genomes[Z].PLoS Genet 6(9):e1001111.doi:10.1371/journal.pgen.1001111.

[2]Li H,Durbin R.Fast and Accurate Short Read Alignment with Bur?rows-Wheeler Transform[J].Bioinformatics,2009,25.

[3]Li-Juan,Zhang,Zhou-Jun,Li,Huo-Wang,Chenand,Jian Wen.Mini?mum Redundancy Gene Selection Based on Grey Relational Analysis[J].Computer Science2006,4265.

[4]崔立志,劉思峰,李致平,崔杰.一種新的灰色相似關(guān)聯(lián)度模型及其應(yīng)用[M].統(tǒng)計(jì)與決策,2010,(7).

[5]黨耀國,劉思峰.灰色斜率關(guān)聯(lián)度的改進(jìn)[J].中國工程科學(xué),2004,6(3).

[6]謝乃明,劉思峰.幾類關(guān)聯(lián)度的平行性和一致性[J].系統(tǒng)工程,2007,25(8).

[7]張小燕,胡木林,周才秀,王忠,陳沁.中風(fēng)易感性與候選基因SNP位點(diǎn)關(guān)聯(lián)研究[J].生物技術(shù)通報(bào),2008,(增刊).

[8]鄧聚龍.灰理論基礎(chǔ)[M].武漢:華中科技大學(xué)出版社,2002.

[9]劉思峰,黨耀國,方志耕,謝乃明.灰色系統(tǒng)理論及應(yīng)用[M].北京:科學(xué)出版社,2010.

[10]寧宣熙,劉思峰.管理預(yù)測與決策方法[M].北京:科學(xué)出版社,2008.

猜你喜歡
關(guān)聯(lián)
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
船山與宋學(xué)關(guān)聯(lián)的再探討
原道(2020年2期)2020-12-21 05:47:06
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
新制度關(guān)聯(lián)、組織控制與社會(huì)組織的倡導(dǎo)行為
奇趣搭配
基于廣義關(guān)聯(lián)聚類圖的分層關(guān)聯(lián)多目標(biāo)跟蹤
智趣
讀者(2017年5期)2017-02-15 18:04:18
探討藏醫(yī)學(xué)與因明學(xué)之間的關(guān)聯(lián)
西藏科技(2016年5期)2016-09-26 12:16:39
GPS異常監(jiān)測數(shù)據(jù)的關(guān)聯(lián)負(fù)選擇分步識(shí)別算法
主站蜘蛛池模板: 日韩中文无码av超清| 亚洲国产成人精品一二区| 日韩性网站| 伦精品一区二区三区视频| 亚洲天堂网2014| 午夜精品久久久久久久99热下载| 欧美色综合网站| 婷婷色狠狠干| 亚洲清纯自偷自拍另类专区| 欧美一区精品| 久久久久久久97| 免费jizz在线播放| 亚洲AⅤ无码日韩AV无码网站| 国产日韩AV高潮在线| 青青国产视频| 欧美专区日韩专区| 亚洲欧美另类视频| 成人免费网站在线观看| 最新国产成人剧情在线播放| 免费一级毛片在线观看| 亚洲伊人久久精品影院| 91精品日韩人妻无码久久| 波多野结衣一二三| 99这里只有精品免费视频| 国产成人精品综合| 亚洲精品欧美日本中文字幕| 成年片色大黄全免费网站久久| 亚洲浓毛av| 91丝袜乱伦| 精品无码一区二区三区在线视频| 天天色天天操综合网| 手机在线国产精品| 九九线精品视频在线观看| 91精品国产自产在线观看| 美女扒开下面流白浆在线试听| 久久人人妻人人爽人人卡片av| 秘书高跟黑色丝袜国产91在线| 秋霞国产在线| 久久精品国产亚洲麻豆| 天天干天天色综合网| 亚洲精品国产综合99| 黄色网页在线播放| 中文字幕乱码二三区免费| av大片在线无码免费| 91精品国产自产91精品资源| 亚洲欧美另类久久久精品播放的| 亚洲欧美在线综合一区二区三区| 国产精品一区在线麻豆| 伊人91在线| 999国产精品| 中文字幕久久波多野结衣| 美美女高清毛片视频免费观看| 成人另类稀缺在线观看| 91亚瑟视频| 欧美中文字幕在线播放| 四虎影视无码永久免费观看| 热这里只有精品国产热门精品| 经典三级久久| 日韩黄色在线| 思思99热精品在线| 国产麻豆精品手机在线观看| 国产二级毛片| 黄片在线永久| 五月天天天色| 人妻一本久道久久综合久久鬼色| 亚洲男人天堂2020| 日韩不卡免费视频| 亚洲成人在线免费观看| …亚洲 欧洲 另类 春色| 亚洲三级视频在线观看| 国产91色在线| 日本a级免费| 国产精品亚洲欧美日韩久久| 欧美午夜在线观看| 一本久道热中字伊人| 四虎影视8848永久精品| 制服丝袜一区| 一本久道热中字伊人| 国产精品美女自慰喷水| 国产成人免费| 2022精品国偷自产免费观看| 99热亚洲精品6码|