999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

計算機算法在生物信息學中的應用綜述

2017-09-29 14:21:34劉奇付李靜靜
軟件導刊 2017年9期
關鍵詞:數據分析

劉奇付 李靜靜

摘 要:在人類基因組計劃的推動下,生物信息學得到了人們的廣泛關注,并呈現出數量多、計算量大等鮮明特征,因此要求在生物信息學中采用計算機算法,以提高生物信息學處理問題的效率。以生物信息學中常用的計算機算法為切入點,進一步從基因表達數據分析、基因組序列信息分析、生物序列差異和相似性分析、遺傳數據分析以及蛋白質結構與功能預測5個方面,論述了計算機算法在生物信息學中的典型應用。

關鍵詞:生物信息學;基因;計算機算法;數據分析

DOI:10.11907/rjdk.171382

中圖分類號:TP301 文獻標識碼:A 文章編號:1672-7800(2017)009-0209-03

Abstract:In the human genome project, the bioinformatics has been widely concerned by the broad masses of bioinformatics scholars, and has the characteristics of large quantity and large computational complexity. This requires that the computer science algorithm should be used in bioinformatics , In order to improve the efficiency of bioinformatics processing problems. In this paper, the computer algorithm used in bioinformatics as the starting point, and further from the analysis of gene expression data, genome sequence information, biological sequence differences and similarity, genetic data and predict the structure and function of protein five aspects, discusses the computer algorithm A typical application in bioinformatics for discussion.

Key Words:bioinformatics; gene; computer algorithm; data analysis

0 引言

生物信息學(Bioinformatics)作為一門新興的交叉學科,是隨著生命科學和計算機科學的高速發展而出現的。它通過充分利用生物學、信息學、數學、物理學、統計學以及計算機網絡等工具或手段,對大量生物數據信息進行有效的闡明和分析,使之成為具有相應生物意義的生物數據信息。其涵蓋了基因組信息的獲取、處理、分配、存儲等多個方面,通過對生物信息的比較和分析,從而獲取基因編碼以及核酸和蛋白質結構功能等信息,是最具活力和發展前景的學科之一。然而,生物信息學在我國由于起步較晚,加之其自身呈現出的數量多、計算量大等特征,使生物信息學面臨著計算瓶頸?;诖?,筆者結合自己的工作實踐,對計算機算法在生物信息學中的應用進行探討,以期為在生物信息學中進行有效的數據挖掘提供理論支持。

1 生物信息學中常用的計算機算法

算法作為計算機科學的一個重要分支,在計算機科學中居于核心地位。在信息時代,算法作為解決問題的重要工具之一,其通過輸入符合規范的信息,從而在短時間內快速獲取所需要的輸出,現已在各個領域得到了廣泛應用。在生物信息學中,計算機算法的應用也對生物信息學的發展起著積極推動作用。生物信息學中常用的計算機算法主要包括以下幾種:

(1)分治法。分治法即在解決大的問題實例時,通過將該問題實例分解為具有相同問題的幾個小的問題實例,再采用遞歸方法依次對這些小的問題實例求解,然后將所得的解合并,從而得出大的問題實例的解。分治法主要應用于合并排序、最近對和凸包問題等領域。而在生物信息學中,可以通過分治法來分析處理序列比對以及序列聯配等問題。其中,序列比對在生物學中是最為常見的問題之一,通過PSW-DC算法、生物序列比對算法,在分而治之方法理念的指導下,將Query序列劃分成幾個片段,再分配給對應的處理器,然后并行地按照Smith-Waterman算法和目標序列進行對比,最終根據相應規則的擴展過程得到最優化的序列匹配[1]。

(2)圖算法。圖算法指通過特制的線條算圖求得問題實例解的一種便捷算法。圖作為一種非線性結構,極具復雜性。因此,圖算法無論是在工程、人工智能、數學領域,還是在生物信息學、計算機科學領域均得到了廣泛應用。其中,在生物信息學中,運用圖算法能夠解決很多生物信息學問題,例如:DNA測序、蛋白質測序等。

(3)貪婪算法。貪婪算法指在一定標準下,通過制定一系列步驟構造問題實例的解,并從眾多解中選取局部最優的一個。選取不具有撤銷性,因而依此選取直至全局達到最優。在生物信息學中,貪婪算法主要應用于解決基因組重排、反序排列等問題[2]。該算法在生物信息學中的應用不僅能夠使問題得到最優解,而且具有較高的運算速度,是一種有效且可行的計算機算法。

(4)動態規劃算法。動態規劃算法是指將大的問題實例分解為若干小的、類似的、交錯的子問題實例,通過從下到上的遞推方式求得最優值,并將子問題實例的解進行有效存儲,防止重復計算子問題,從而得到問題最優解決方案的一種算法策略。將動態規劃算法運用到生物信息學中,能夠有效地分析并處理數據之間的重疊性以及相關性等特點,因此主要應用于DNA序列比較、局部及全局序列聯配、多重聯配、基因預測及填充表達缺失數據等問題中[3]。endprint

2 計算機算法在生物信息學中的典型應用

2.1 基因表達數據分析

基因表達數據分析一直是生物信息學研究的熱點和難點。在當今的工作實踐中,往往采用計算機算法中的聚類分析對基因表達數據進行分析處理,通過把表達規律相近的基因聚成一類,從而找出相互之間有關聯的基因,并分析基因功能。計算機算法可以通過基因的轉錄調節網絡,觀察基因的表達模式隨環境變化或在藥物作用下作出的相應改變,闡明基因相互間的調節作用,并對基因的啟動子加以研究,分析具有相同表達模式的同類啟動子的組成特性。計算機算法中的聚類分析作為分析基因表達數據的重要方法之一,不僅能夠發現基因間的線性關系,而且能夠找出基因間的非線性關系,因而逐步得到廣大研究者的認可[4]。

2.2 基因組序列信息分析

生物信息學中的基因組序列并不是基因的簡單排列,而是具有特定的組織和信息結構,并經過長期演化形成的結果,是基因充分發揮其應有功能所必需的基礎條件之一。利用計算機算法對基因組序列信息進行分析,并預測相關功能位點是近年來的主要研究方向之一。分析基因組序列信息通常采用從頭算法和比較同源列法兩大類。其中,從頭算法是基于統計學的方法,它是指通過識別蛋白質編碼基因的性質及特征,對外顯子、內含子和基因間的區域進行有效區分;而比較同源列法則是通過將基因信息與數據庫中的基因信息進行同源比較,從而找出新基因。在新的DNA序列中,一般除基因外,還包含許多與核酸結構特征有關聯的其它信息,這些信息對DNA與蛋白質或RNA之間的相互作用具有決定性影響,而運用計算機算法搜索與已知蛋白質、表達序列標簽相似的區域,并對其進行編碼,是生物信息學中分析基因組序列信息最為理想的算法之一。

2.3 生物序列差異與相似性分析

在生物信息學中,分析生物序列的差異和相似性是最基本且重要的操作之一,通過對生物序列差異和相似性的分析比較,能夠及時得到生物序列中的結構、功能以及進化等方面信息。一般而言,結構、功能和生物序列間呈現出相互制約的關系,結構由生物序列決定,而功能又由結構決定。在分析生物序列差異和相似性中采用計算機算法,能夠快速達到研究目的。其中,目的之一即通過生物序列之間的相似性,發現相似的結構及功能。當然也有特殊情況,例如:幾乎沒有任何相似之處的生物序列,不僅分子構成的空間形狀相同,而且功能也相同;目的之二即通過對比生物序列之間的相似性,對生物序列間的同源性進行判斷,并依此推斷生物序列間的進化關系。在分析生物序列的差異和相似性的過程中,常用的計算機算法主要為Needleman-Wunsch動態規劃算法、Smith-Waterman算法以及支持向量機算法等。

2.4 遺傳數據分析

在生物信息學研究中,由于基因結構、組序列信息以及生物序列的復雜性,要求在對遺傳數據信息的分析過程中運用計算機算法。具體而言,可以借用一些可視化工具,將基因以圖、樹、鏈和方體等形式表現出來,從而提高相關工作人員對基因信息以及基因模式的理解。而知識發現作為發現遺傳數據最有力的可視化工具之一,能夠對遺傳數據進行充分挖掘,對轉錄調控基因組水平也能起到積極影響。

2.5 蛋白質結構與功能預測

蛋白質的生物功能是由蛋白質結構決定的,因此在生物信息學中對蛋白質進行研究時,應當首先了解蛋白質結構。隨著現代科技的進步,預測蛋白質結構與功能的方法和手段均有了很大進步,但在具體操作過程中依然遠遠滿足不了實際需要,這從一定程度上為計算機算法的推廣應用提供了契機。將計算機算法運用于蛋白質結構與功能預測中,不僅對研究蛋白質結構與功能間的相互關系起著至關重要的作用,而且對蛋白質工程以及蛋白質設計的進展能起到積極促進作用。通常而言,預測蛋白質結構主要包括對蛋白質二級結構以及空間結構進行預測。其中,二級結構預測屬于模式識別問題,通過運用計算機算法能夠有效判斷氨基酸殘基形狀,而在空間結構預測時采用計算機算法,能夠以蛋白質序列為出發點,判斷亞細胞定位、糖基化位點、信號肽剪切位點等與蛋白質功能有關的特征。

3 研究展望

隨著生物信息學的發展,我國專家學者對生物信息學的重視程度不斷提高,而計算機算法的推廣應用也在一定程度上為生物信息學的發展提供了新的契機。但從生物信息學的總體發展情況來看,仍和國際水平有很大差距,需要在未來研究中特別注意如下兩方面問題:

(1)專業人才培養。生物信息學作為一門新興學科,要求相關從業人員既要具備扎實的生物學知識,又要具有較高水平的計算機學科技能,但縱觀我國生物信息學的從業人員現狀,存在著嚴重的人才斷層及人才匱乏現象,從而對計算機算法在生物信息學中的應用產生了一定制約。因此,要求在后期的研究過程中,注重專業人才的培養,有效解決人才匱乏的現狀,為計算機算法在生物信息學中的應用提供強大的人才支持。

(2)計算機算法應用范圍拓展。隨著人類基因組計劃的啟動以及計算機科學水平的提高,計算機算法在生物信息學中的應用已取得了初步進展,在分析基因表達數據、基因組序列信息、生物序列差異和相似性、遺傳數據,以及預測蛋白質結構與功能等方面發揮了重大作用。但生物信息學包含的內容極其豐富,因此要求在后期的研究過程中,應當有計劃地擴大計算機算法在生物信息學中的應用范圍,使計算機算法的價值得到最大限度的發揮,為生物信息學研究的有效開展提供強有力的技術支持。

4 結語

生物信息學作為一門生物學與計算機科學交叉融合的新興學科,其核心是生物學,基本工具則是計算機科學。因此,要求生物信息學相關研究人員在工作實踐中,加強各學科之間的溝通、合作,充分把握計算機算法在生物信息學中的應用,從而解決生物信息學中信息數量多、計算量大等問題,推動生物信息學的進一步發展。

參考文獻:

[1] 于嘯,孟繁疆.數據挖掘技術在生物信息學中的應用[J].農機化研究,2009(3):186-188.

[2] 趙磊,劉利軍,黃青松.計算機算法在生物信息學中的應用[J].化學與生物工程,2009,26(9):79-81.

[3] 黃元南,王建新,陳建二.數據挖掘技術在生物信息學中的應用探索[J].電腦知識與技術,2006(9):1-11.

[4] 莊麗艷,董紅斌.進化計算在生物信息學中的應用[J].哈爾濱師范大學自然科學學報,2007,23(1):60-63.

(責任編輯:黃 ?。〆ndprint

猜你喜歡
數據分析
電子物證檢驗的數據分析與信息應用研究
基于matlab曲線擬合的數據預測分析
商情(2016年40期)2016-11-28 11:28:07
分眾媒體趨勢下場景營銷的商業前景
商(2016年32期)2016-11-24 17:39:41
佛山某給水管線控制測量探討
科技資訊(2016年18期)2016-11-15 18:05:53
SPSS在環境地球化學中的應用
考試周刊(2016年84期)2016-11-11 23:57:34
大數據時代高校數據管理的思考
科技視界(2016年18期)2016-11-03 22:51:40
我校如何利用體育大課間活動解決男生引體向上這個薄弱環節
體育時空(2016年8期)2016-10-25 18:02:39
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
主站蜘蛛池模板: 国产精品30p| 国产大片黄在线观看| 波多野结衣视频网站| 高清无码一本到东京热| 爱爱影院18禁免费| 国产精品不卡片视频免费观看| 婷婷亚洲视频| 亚洲精品无码久久毛片波多野吉| 欧美激情第一区| 日韩在线永久免费播放| 日韩资源站| 园内精品自拍视频在线播放| 久久99国产乱子伦精品免| 亚洲色图在线观看| 另类重口100页在线播放| 亚洲国产欧美国产综合久久 | 亚洲精品无码专区在线观看| 国内嫩模私拍精品视频| 中文无码精品A∨在线观看不卡| 日韩国产无码一区| 国产成人1024精品下载| 广东一级毛片| 欧美区在线播放| 欧美一区二区福利视频| 不卡国产视频第一页| 四虎综合网| 一区二区影院| 超碰免费91| 午夜不卡福利| 欧美日本在线一区二区三区| 欧美在线三级| 精品国产亚洲人成在线| 国产鲁鲁视频在线观看| 啊嗯不日本网站| 亚洲人成网站观看在线观看| 日韩a级片视频| 欧美亚洲一二三区 | 狠狠五月天中文字幕| 91久久偷偷做嫩草影院| 制服丝袜亚洲| 天堂网亚洲系列亚洲系列| 国产一级毛片yw| 日本尹人综合香蕉在线观看| 免费一级成人毛片| 日韩成人在线一区二区| 亚洲无码视频喷水| 波多野一区| 日韩在线欧美在线| 色综合久久88色综合天天提莫| 国产午夜人做人免费视频中文| 热久久国产| 色视频国产| 国产v精品成人免费视频71pao| 国产美女精品在线| 试看120秒男女啪啪免费| 人妻一区二区三区无码精品一区| 国产麻豆精品久久一二三| 高清久久精品亚洲日韩Av| 永久在线精品免费视频观看| 曰韩人妻一区二区三区| 欧美一道本| 全午夜免费一级毛片| 精品国产中文一级毛片在线看| 午夜天堂视频| 一边摸一边做爽的视频17国产| 国产在线日本| 在线视频一区二区三区不卡| 久久久久国色AV免费观看性色| 久久99国产精品成人欧美| 亚洲欧美日韩视频一区| 亚洲一级毛片在线观播放| 亚洲视频a| 国产又黄又硬又粗| 亚洲成人网在线观看| 亚洲va欧美va国产综合下载| 欧洲欧美人成免费全部视频| 亚洲综合天堂网| 久久久久久久97| 免费精品一区二区h| 亚洲av片在线免费观看| 色综合网址| 老司国产精品视频91|