999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

從熵原理角度描述基因序列多樣性的方法

2015-07-02 21:28:09劉旻昊
科技資訊 2015年7期
關鍵詞:基因突變

劉旻昊

摘 要:Shannon熵理論可用于描述“無序狀態”,而以Shannon熵為基礎的AMI圖形的算法則包含了生物序列的獨特信息。DNA序列蘊含了生命的所有信息,基于Shannon熵為基礎的AMI則描述了這種“無序狀態”的變化趨勢。這種計算方法簡單易行,在遺傳學、醫學和生物學等領域都有廣泛的應用。

關鍵詞:Shannon熵 基因突變 多樣性

中圖分類號:TP39 文獻標識碼:A 文章編號:1672-3791(2015)03(a)-0242-01

隨著計算機技術和信息技術的發展,對復雜冗長的DNA序列的分析研究變為現實。如何分析這些數據,提取相應的特征量來描述生命體之間的聯系,是近年研究的熱門問題。通過近幾年的發展,也開發出一系列對比軟件,常用的有CLUSTRALW等軟件。

該文擬提取出不同DNA序列的平均互信息AMI作為特征參數,通過多元統計的方法對DNA序列進行描述,進而可以進行分類,在遺傳學、醫學等領域廣泛應用。此種方法的優點是計算簡單且速度較快,對大量數據的處理非常方便且準確率較高。

1 平均互信息AMI

對隨機變量M,事件m的自信息定義為:

其中p(m)是事件m發生的概率,自信息I(m)是事件m發生的可能性的一種度量,表示事件M=m發生時,事件m所含有的所能提供的信息量。

對隨機變量M和N,M的事件m與N的事件n之間的互信息定義為:

其中表示在事件n發生的概率下m發生的條件概率。

根據上述公式,可以定義基因序列的平均互信息(AMI):

其中為4種核苷酸A、C、G、T的集合,如果固定X在基因序列上的某一位置,則Y為X下游方向間隔k個位置的核苷酸。和是核苷酸為X和Y的概率。其中表示前一個核苷酸為X,下游方向間隔k個位置為Y的組合的個數,這樣就表示X和Y間隔為k的聯合分布概率。當k=0時,就表示了緊鄰二聯體核苷酸的概率,k=1時表示次緊鄰二聯體核苷酸的分布率[1]。

[2]就是基因序列的AMI,不同的k值對應不同的,對于每一個基因組,我們都能夠得到一組向量,不同的基因序列,則可以得到不同的向量。

2 相關系數

在該文中我們選擇的是pearson相關系數,又稱為線性相關系數,它能反映兩個數據集之間的線性相關程度。

令為兩個向量和的Pearson相關系數,和代表的AMI各有k個分量(,,…,)和(,,…, )。

這是一個范圍在[-1,+1]之間的數值,若相關系數為+1,表示兩個數據集合之間呈現完美的正線性相關;若相關系數為-1,則表示量數據集之間是負線性相關;若相關系數為0,則表示兩組數據之間沒有線性相關性。

3 距離計算

根據相關系數,我們定義兩種基因的AMI之間的距離為:

通過計算的距離可以看出各個物種與自己的距離為0,與其他物種的距離則根據進化關系的遠近而不同。

4 聚類分析

通過計算不同物種兩兩之間的AMI距離,可以得到一個距離矩陣。對于這個距離,該文選用“ward”法即離差平方和方法進行聚類[3]。

5 K值選擇

對于不同的基因組,首先提取各自序列的AMI的值,對于k值大小的選取,通過反復計算,認為取0到500是比較合適的。這樣每種基因組就得到一個向量,共有501個分量。對于不同基因組的AMI向量,計算相關系數得到距離,兩兩相比較距離得到一個距離矩陣,對距離矩陣通過ward法聚類,最后得到結果。

6 具體應用

通過此種方法,可以很方便地對各類DNA序列進行分類和研究。該課題研究者對64種脊椎動物線粒體DNA繪制了生物進化樹,進行分類進而構建它們之間的進化關系的應用。

參考文獻

[1] Yuan Zhi fa,Zhou Jing yu,Guo Man cai,et al.Gene Diversity and Shannon Information Entropy.Animal[A]Biotechnology Bulletin,8(1):353-358.

[2] 羅遼復.生命進化的物理觀[M].上海:上海科學技術出版社,2000,168-183.

[3] Mark Bauer,Sheldon M Schuster, Khalid Sayood.The Average Mutual Information Profile as a Genomic Signature[J].BMC Bioinformatics,2008 Jan 25,9:48.

猜你喜歡
基因突變
大狗,小狗——基因突變解釋體型大小
英語世界(2023年6期)2023-06-30 06:29:10
18F-FDG PET/CT代謝參數對結直腸癌KRAS基因突變的預測
管家基因突變導致面部特異性出生缺陷的原因
基因突變的“新物種”
管家基因突變導致面部特異性出生缺陷的原因
乙型肝炎病毒逆轉錄酶基因突變的臨床意義
JAK2V617F基因突變在骨髓增殖性腫瘤診斷中的應用
兩個雄激素不敏感綜合征家系中AR基因突變檢測
類脂蛋白沉積癥一家系調查及基因突變檢測
一例腦腱黃瘤病患者的CYP27A1基因突變
主站蜘蛛池模板: 国产av一码二码三码无码| 久久国产高潮流白浆免费观看 | 精品久久综合1区2区3区激情| 亚洲精品国产综合99| 国模粉嫩小泬视频在线观看| 国产丝袜一区二区三区视频免下载| 久久综合伊人77777| 免费激情网站| 四虎永久免费地址| 亚洲天堂网在线观看视频| 久久亚洲天堂| 99中文字幕亚洲一区二区| 露脸国产精品自产在线播| 播五月综合| 五月婷婷综合网| 伊人色在线视频| 精品视频福利| 欧美午夜视频在线| 欧美亚洲欧美| 日韩免费中文字幕| 草逼视频国产| 在线观看视频一区二区| 99在线观看视频免费| 国产成人综合日韩精品无码首页| 国产区91| 国产无码性爱一区二区三区| 欧美亚洲欧美区| 中文字幕精品一区二区三区视频| 亚洲69视频| 精品综合久久久久久97| 日韩一二三区视频精品| 国产人成网线在线播放va| 一级福利视频| 亚洲欧美在线看片AI| 欧美成人精品高清在线下载| 91欧洲国产日韩在线人成| 欧美国产日韩在线| 日韩久久精品无码aV| 欧美黄网站免费观看| 国产主播一区二区三区| 日韩欧美综合在线制服| 国产凹凸视频在线观看| 久久国产乱子伦视频无卡顿| 欧美一级专区免费大片| 亚洲视频免费在线| 亚洲三级色| 四虎在线观看视频高清无码| 亚洲一区二区成人| 日本手机在线视频| 97人人模人人爽人人喊小说| 国产精品深爱在线| 无码AV高清毛片中国一级毛片| 国产日韩久久久久无码精品| 成人a免费α片在线视频网站| 欧美第二区| 婷婷成人综合| 无码一区二区三区视频在线播放| 中文一级毛片| 国产乱人伦精品一区二区| 99久久精品国产精品亚洲| 亚洲成人精品在线| 国产成人精品免费视频大全五级| 国产极品粉嫩小泬免费看| 亚洲男人天堂久久| 99这里只有精品免费视频| 91精品国产一区自在线拍| 欧美黑人欧美精品刺激| 丰满少妇αⅴ无码区| 亚洲色图欧美在线| 2019年国产精品自拍不卡| 日本一区高清| 色有码无码视频| 亚洲中文字幕97久久精品少妇| 国产精品久久久久久久伊一| 色精品视频| 91探花国产综合在线精品| 国产丝袜啪啪| 欧美va亚洲va香蕉在线| 在线日韩日本国产亚洲| 青青久久91| 92精品国产自产在线观看| 亚洲国产日韩一区|