999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CyClus3D聚類算法的PPI網絡模體研究

2015-04-18 03:00:30浦恩祿張孟嬌張俊鵬
大理大學學報 2015年12期
關鍵詞:數據庫生物信號

浦恩祿,張孟嬌,張俊鵬

(大理大學工程學院,云南大理 671003)

隨著生物信息學技術的發展,人們已經獲得了大量生物分子之間的相互作用數據,并由此構成了龐大的生物網絡,其中蛋白質相互作用網絡是這些生物網絡數據中很重要的一類數據。蛋白質相互作用(Protein-Protein Interaction,PPI)在生物體的生命活動中起核心作用,對PPI的研究將有利于更好地了解生命體中的生物過程〔1〕。

PPI網絡的基本構造單元是網絡模體。網絡模體是一些在真實網絡中重復出現的具有特定拓撲結構特征的小規模模式單元,它在真實網絡中出現的頻率要遠高于隨機網絡〔2〕。網絡模體挖掘有利于揭示復雜網絡的更多細節和內容,將有助于深入理解生物體的內在作用機制。

1 PPI網絡模體挖掘

網絡模體是一些具有特定性質的小規模子圖,是構建整個生物網絡的基本單元,網絡模體的識別對PPI組成的生物基礎大網絡的研究和探究具有非常重要的作用。

1.1 PPI數據源 大量的PPI數據構建了很多內容豐富并且日益更新的PPI數據庫,這些數據庫為進一步深入研究PPI網絡提供了數據支持。對PPI關系的認識和研究可以更好地認識細胞生命活動的過程,揭示生物體的生理和病理現象。

目前,每個PPI數據庫都有自己獨有的特性,并且數據庫之間的PPI重合率較低。由于PPI數據庫的選擇沒有統一的標準,本文根據PPI數據庫在其他文獻中使用的頻繁程度,選擇 HPRD〔3〕,HIR〔4〕和BioGRID〔5〕3個數據庫作為PPI數據源。3個數據庫之間的PPI重合數只有7 631,整合個數為222 556,見圖1。為了更加全面地分析PPI網絡,本文整合3種PPI數據庫作為PPI數據源,其PPI數據源大小為222 556。

圖1 HPRD、HIR和BioGRID 3種PPI數據庫之間的維恩圖

1.2 CyClus3D聚類算法 CyClus3D〔6〕是一種3-點網絡模體挖掘算法。對于給定的3-點網絡模體,其邊可能是任何一種類型。假設所有模體的列表用一個3維數組T表示,如果節點(i,j,k)之間存在一個模體,那么Ti,j,k=1,否則Ti,j,k=0。由 3 個節點集(X1,X2,X3)組成的一個模體聚類可以用聚集分數來定義:

其中,|Xi|是Xi中的節點個數,如果p>1,它將扮演反精度參數的角色。為了最大化S,首先要確定T的最優秩-1逼近,即找到實數向量(x1,x2,x3)使下式最大化:

其中約束條件為||x1||p=1。

為了找到一個高分模體聚類,CyClus3D從模體集T中反復刪除不存在的模體直至沒有冗余的模體存在。由于模體數組的最優秩-1逼近等同于一個網絡鄰接矩陣的特征向量,因此CyClus3D聚類算法可以理解為二維頻譜聚類算法〔7〕的泛化。

1.3 基于3-點網絡模體的子網絡 精度參數r=1/p,其值越小,高分模體聚類將大而稀疏。相反,其值越大,高分模體聚類將小而密集。為了折中處理,r設定為0.5。由于蛋白質相互作用關系為無向邊,所使用的3-點模體邊都為無向邊。

CyClus3D聚類算法的3-點網絡模體,見圖2(a)。使用該模體挖掘的PPI子網絡圖,見圖2(b),其節點數為374,邊數為14 076。子網絡的聚類效果較好(聚類系數=0.510),蛋白質與蛋白質之間的路徑長度比較短(特征路徑長度=1.835),并且子網絡密度小而集中(網絡密度=0.165,網絡集中度=0.837),網絡緊密程度高(網絡直徑=3),見表1。另外,同一家族的蛋白質往往有更多的相互作用,例如蛋白質組(RPL10,RPL11,…,RPL19),(PSMA1,PSMA2,…,PSMA8),(HDAC1,HDAC2,…,HDAC7)。

圖2 CyClus3D聚類算法的3-點網絡模體及其子網絡圖

表1 基于3-點網絡模體挖掘的子網絡參數

2 網絡富集分析

為了研究網絡中的蛋白質與哪些生物過程和信號通道顯著性相關,功能分析軟件DAVID(http://david.abcc.ncifcrf.gov/)〔8〕用來對模體網絡進行富集分析。DAVID是一個能為大規模的基因或蛋白質列表提供系統綜合的生物功能注釋信息的在線數據庫。本文將從 GO(Gene Ontology)〔9〕生物過程和KEGG(Kyoto Encyclopedia of Genes and Genomes)〔10〕信號通道兩個方面對模體網絡進行富集分析。

2.1 GO生物過程富集分析 GO有3個結構化的網絡,分別從生物過程、分子功能、細胞組成這3個方面對基因進行分類、定義和注釋,本文重點挖掘蛋白質顯著性相關的GO生物過程。

GO生物過程富集分析針對提交蛋白質列表采用超幾何分布檢測每一個GO生物過程條目的富集顯著性。前5個GO生物過程如表2所示,其中3-點網絡模體組成的子網絡中有65個蛋白質(RPL18,RPL17,RPL19等)與生物過程:翻譯延伸(GO:0006414~翻譯延伸)顯著性相關(p=3.65E-73)。

2.2 KEGG信號通道富集分析 KEGG信號通道富集分析針對提交的蛋白質列表采用超幾何分布檢測每一個KEGG信號通道的富集顯著性,并進行KEGG信號通道圖分析。前5個KEGG信號通道如表2所示,其中有53個蛋白質(E2F1,HSP90AB1,PPARG等)與癌癥信號通道(KEGG:hsa05200~Pathways in cancer)顯著性相關(p=7.88E-13)。

表2 前5個顯著性GO生物過程和KEGG信號通道

3 結語

CyClus3D聚類算法對PPI網絡進行模體挖掘,可以將222 556個PPI縮小到14 076個PPI來進行研究。這將大大簡化PPI網絡的分析,便于進一步研究蛋白質的相互關系。在線軟件DAVID對網絡模體組成的子網絡進行GO生物過程和KEGG信號通道富集分析,能夠挖掘出與蛋白質顯著性相關的GO生物過程和KEGG信號通道??傊?,PPI網絡屬于大型的復雜網絡,從大量的PPI數據中挖掘出更多具有生物學意義的信息,有利于更好地了解生物體的生命活動中蛋白質之間的相互作用關系,從整體水平上理解某些疾病的細胞機制,預測一些蛋白質可能的生物功能。

〔1〕WAUGH D F.Protein-protein interactions〔J〕.Advances in Protein Chemistry,1954,9:325-437.

〔2〕SHEN-ORR S S,MILO R,MANGAN S,et al.Network motifs in the transcriptional regulation network of Escherichia coli〔J〕.Nature Genetics,2002,31(1):64-68.

〔3〕PRASAD T S K,GOEL R,KANDASAMY K,et al.Human protein reference database-2009 update〔J〕.Nucleic Acids Research,2009,37(S1):D767-D772.

〔4〕ZHOU X,CHEN P,WEI Q,et al.Human interactome resource and gene set linkage analysis for the functional interpretation of biologically meaningful gene sets〔J〕.Bioinformatics,2013,29(16):2024-2031.

〔5〕STARK C,BREITKREUTZ B J,REGULY T,et al.BioGRID:a general repository for interaction datasets〔J〕.Nucleic Acids Research,2006,34(S1):D535-D539.

〔6〕AUDENAERT P,VAN P T,BRONDEL F,et al.CyClus3D:a Cytoscape plugin for clustering network motifs in integrated networks〔J〕.Bioinformatics,2011,27(11):1587-1588.

〔7〕INOUE K,URAHAMA K.Sequential fuzzy cluster extraction by a graph spectral method〔J〕.Pattern Recognition Letters,1999,20(7):699-705.

〔8〕HUANG D W,SHERMAN B T,LEMPICKI R A.Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources〔J〕.Nature Protocols,2009,4(1):44-57.

〔9〕ASHBURNER M,BALL C A,BLAKE J A,et al.Gene Ontology:tool for the unification of biology〔J〕.Nature Genetics,2000,25(1):25-29.

〔10〕KANEHISA M,GOTO S.KEGG:kyoto encyclopedia of genes and genomes〔J〕.Nucleic Acids Rresearch,2000,28(1):27-30.

猜你喜歡
數據庫生物信號
生物多樣性
天天愛科學(2022年9期)2022-09-15 01:12:54
生物多樣性
天天愛科學(2022年4期)2022-05-23 12:41:48
上上生物
當代水產(2022年3期)2022-04-26 14:26:56
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
第12話 完美生物
航空世界(2020年10期)2020-01-19 14:36:20
基于FPGA的多功能信號發生器的設計
電子制作(2018年11期)2018-08-04 03:25:42
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 多人乱p欧美在线观看| 2021国产精品自产拍在线| 综合社区亚洲熟妇p| 亚洲国产精品一区二区高清无码久久 | 亚洲成年网站在线观看| 亚洲欧洲自拍拍偷午夜色无码| 国产精品网址在线观看你懂的| 亚洲精品视频网| 国产麻豆另类AV| 久久久久国产精品熟女影院| 久久黄色影院| 91久久青青草原精品国产| 91久久夜色精品| 国产乱子伦无码精品小说| 97国产精品视频自在拍| 最新日本中文字幕| 99热国产这里只有精品无卡顿"| 国产午夜不卡| 在线观看国产黄色| 曰AV在线无码| 高清欧美性猛交XXXX黑人猛交 | 青青国产在线| 精品久久人人爽人人玩人人妻| 天天干伊人| 日韩美女福利视频| 欧美一级在线| 亚洲av片在线免费观看| 国产特级毛片aaaaaa| 久久久久久久久18禁秘| 国产精品55夜色66夜色| 久久久久久久久18禁秘| 欧洲精品视频在线观看| 欧洲日本亚洲中文字幕| 99re在线免费视频| 免费一级α片在线观看| 日日碰狠狠添天天爽| 国产在线小视频| 四虎影视永久在线精品| 国产精品黑色丝袜的老师| 午夜福利视频一区| 啪啪国产视频| 日韩AV手机在线观看蜜芽| www成人国产在线观看网站| 亚洲AV无码久久天堂| 色噜噜中文网| 全部免费毛片免费播放| 动漫精品中文字幕无码| 手机精品福利在线观看| 国产农村1级毛片| 国产在线一区视频| 成人福利免费在线观看| 67194成是人免费无码| 干中文字幕| 国产成人精彩在线视频50| 亚洲精品国产精品乱码不卞 | 亚洲一区色| 99在线视频精品| 亚洲欧美一区二区三区蜜芽| 色网站在线视频| 久久一日本道色综合久久| 亚洲人在线| 久久精品日日躁夜夜躁欧美| 久久综合成人| 无码精品福利一区二区三区| 亚洲日本www| 国产流白浆视频| 久久久精品久久久久三级| 99精品视频播放| 亚洲精品卡2卡3卡4卡5卡区| 性视频一区| 波多野吉衣一区二区三区av| 婷婷午夜天| 国产亚洲精品自在线| 亚洲精品无码av中文字幕| 99热国产这里只有精品无卡顿"| 午夜福利在线观看成人| 67194亚洲无码| 成人在线观看不卡| 2021国产v亚洲v天堂无码| 人人爱天天做夜夜爽| 伊人查蕉在线观看国产精品| 成人午夜网址|