999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機的供體剪接位點識別

2018-10-20 17:43:17曾瑩
數碼設計 2018年12期

曾瑩

摘要:剪接位點識別是基因識別中的關鍵環節。本文對待測樣本采用0/1編碼,以表征各位置上的堿基,并結合堿基二聯體出現的頻次,最后采用支持向量機( SVM)進行分類決策。HS3D數據集上的仿真結果顯示,本方法獲得的預測精度為92.84%。

關鍵詞:剪接位點;基因識別;支持向量機( SVM);0/1編碼

中圖分類號:Q271

文獻標識碼:A

文章編號:1672 - 9129(2018)12 - 0082 - 01

引言:隨著人類基因組計劃的實施,基因組序列數據呈指數增長。如何解讀人類基因組,挖掘其背后隱藏的信息,是一個迫切需要解決的問題?;蜃R別基因組注釋的核心任務之一,旨在采用生物學實驗或計算機手段識別DNA序列中的基因。絕大多數真核基因是不連續結構,由外顯子和內含子交替組成,其中,外顯子是編碼蛋白質的序列片段,內含子是非編碼蛋白質的序列片段。外顯子和內含子的邊界即為剪接位點,內含子的5端起始堿基為CT,稱作供體剪接位點,3端起始堿基為AC,稱作受體剪接位點。因此,準確識別剪接位點,能夠精準定位基因外顯子的邊界,對于真核生物基因識別起著至關重要的作用。盡管99%的剪接位點遵循“CT - AC”規則,但這種強保守性并不能有效檢測剪接位點,因為在DNA序列的非剪接位點上還存在著大量GT/AG,因此,剪接位點識別可以看成一個二分類問題。本文主要研究基于機器學習方法的供體剪接位點識別。

1 數據及其預處理

實驗數據源自HS3D( home sapiens splice sites dataset)數據集。我們從該數據集中選取2796個真實供體位點作為正樣本,并隨機抽取2796個虛假供體位點作為負樣本。所有樣本均為140個堿基長度(即140bp)的序列,其中第1~70個堿基為外顯子序列,第70~140個堿基屬于內含子,而保守位點CT則位于第71、72位。

本文將序列中保守GT的位置設為00,上游區域位置分別標記為-l,-2,…,- 70,下游區域位置則記為l,2,…,68。對樣本序列中的每個位置,分別構建一張24的列聯表,以統計該位置上的四種堿基在正負樣本中出現頻次,然后計算各個位置對應的卡平方值,由于序列-3~+5、+7、+8、+10位的卡平方值高于其他位點卡平方值的平均值,考慮到窗口的連續性,我們最終確定序列長度為8bp(-3~ +5,不含00位),后續實驗均基于8bp供體位點序列。

2 特征提取

對序列長度為8bp的各個樣本,首先將其每個位置上的A,C,G,T四種堿基分別按:A - 0001,C- 0010,G- 0100,T- 1000進行編碼;然后,分別提取16個堿基二聯體(即二聯體AA,AT,AC--)在序列中出現的頻次。這樣,對任一個序列樣本,可得到一個48維(8 x4+16)特征向量。

3 基于SVM的分類決策

SVM能夠解決小樣本、高維數、非線性、過擬合及局部最小等問題,在生物信息、圖像識別等問題中得到了廣泛應用。本文采用LIBSVM作為分類器,其核函數固定為徑向基核,參數c、g自動搜索獲取。

4 實驗結果

在HS3D數據集(2796/2796個正/負樣本)上,采用10折交叉測試進行驗證,即將數據集均分為10份,每次使用其中的9份進行訓練,余下的l份進行測試,重復10次,最后將10次測試的精度均值作為最終結果,即敏感性( Sensitivity,SN)為0.9233、特異性(Specificity,sP)為0.9335、準確度( Accuracy,ACC)為0.9284。

參考文獻:

[1]馬猛,汪洋.應用序列特征分析基因剪接信號[J].計算機工程與應用,2012,48( 27):180 - 185.

[2] Li J L,Wang L F,Wang H Y, et al.High - accuracy splice siteprediction hased on sequence, component and position features[J]. Cenetics&Molecular Research 2012. 11(3):3432 - 51.

[3]李琴,張瑾,駢聰等.基于位置關聯權重矩陣及序列組分的多樣性增量識別剪接位點[J].生物物理學報2014,30(5):391 -400.

[4] Meher P.Sahu T,Rao A, et al.A statistical approach for 5'splicesite prediction using short sequence motifs and without encoding sequence data[J].BMC Bioinformatics 2014, 15(1):1- 14.

主站蜘蛛池模板: 亚洲IV视频免费在线光看| av大片在线无码免费| 欧美中文字幕无线码视频| 国产成人精品2021欧美日韩 | 亚洲Av综合日韩精品久久久| 欧美色图久久| 亚洲国产日韩欧美在线| 精品国产福利在线| 亚洲视频a| 国产欧美性爱网| 国产激情第一页| 精品伊人久久久香线蕉| 国产成人精彩在线视频50| 久热精品免费| 久久不卡精品| 欧美在线精品怡红院| 国产网友愉拍精品| 欧美啪啪视频免码| 亚欧美国产综合| 亚洲va在线∨a天堂va欧美va| 亚洲日韩国产精品无码专区| 五月天综合网亚洲综合天堂网| 国产熟睡乱子伦视频网站| 成人在线综合| 91精品国产91久久久久久三级| 欧美另类图片视频无弹跳第一页| 最新午夜男女福利片视频| 99国产在线视频| 伊大人香蕉久久网欧美| 中国一级特黄视频| 国产精品自在自线免费观看| 亚洲欧洲自拍拍偷午夜色| 国产在线精彩视频论坛| 欧美精品在线免费| 国产一级无码不卡视频| 国产精品99一区不卡| 亚洲第一成人在线| 成人毛片免费观看| 国产精品久久国产精麻豆99网站| 欧美中文字幕在线二区| 亚洲无码电影| 国产精品尤物在线| 亚洲日韩久久综合中文字幕| 久久福利网| 欧美日韩中文国产va另类| 日韩精品一区二区深田咏美| 真人高潮娇喘嗯啊在线观看| 国产精品刺激对白在线| 青草娱乐极品免费视频| 97在线视频免费观看| 第九色区aⅴ天堂久久香| 18禁影院亚洲专区| 中文字幕久久亚洲一区| 亚洲国产系列| 国产成+人+综合+亚洲欧美| 成人在线观看不卡| 日本亚洲国产一区二区三区| 午夜日韩久久影院| 国产成人91精品| 一区二区三区精品视频在线观看| 国产永久在线观看| 国产精品制服| 欧美成a人片在线观看| 国产成人午夜福利免费无码r| 99偷拍视频精品一区二区| 伊人激情综合网| 国产91在线|日本| 青青青视频91在线 | 在线观看视频99| 视频一本大道香蕉久在线播放 | 精品偷拍一区二区| 无码免费视频| 久久99热这里只有精品免费看| 欧美精品xx| 免费在线观看av| 欧美日韩亚洲国产主播第一区| 曰韩人妻一区二区三区| 国内精品自在自线视频香蕉| 在线看免费无码av天堂的| 国产日韩精品一区在线不卡| 91青青草视频在线观看的| 久久这里只有精品国产99|