許睿++胡萍++李綱
摘要:針對目前蛋白質節點刪除方法存在破壞蛋白質相互作用網絡拓撲結構的問題,在定義蛋白質節點可達性的基礎上,提出了一種基于蛋白質網絡資本評價和節點失效法的關鍵蛋白質節點識別算法。在保持網絡整體拓撲結構完整的前提下,通過分析蛋白質節點失效前后網絡資本值的下降程度評估該節點在蛋白質網絡中的重要程度,從而識別關鍵蛋白質。實驗結果表明本算法對最為重要的前1%和前5%數據的關鍵蛋白質預測結果優于四種典型的中心性測度方法,而且對于關鍵蛋白質的識別具有較高的準確性。
關鍵詞: [蛋白質網絡; 可達性; 網絡資本評估; 關鍵蛋白質
中圖分類號: TP301.6
文獻標志碼: A
文章編號: 2095-2163(2016)06-0025-04
0引言
在包括人類在內的動物體內,有一種生物大分子參與了大部分的機體活動過程,眾所周知該類主體就是蛋白質。在蛋白質大家族中,有一類可統稱為關鍵蛋白質,雖然其在數量上并不為多,但對于動物的生存生長卻發揮著至關重要的決定性作用,而且對于維持動物正常的生命活動和繁衍生息也有著顯著特殊的現實意義。當下研究表明,關鍵蛋白質所擔負實現的生物學功能是其他蛋白質無法替代的。如何有效識別這一類關鍵蛋白質對于生物體的致病原理研究、從基因層面治療的開展、以及動植物藥用價值的開發等領域方面的升級完善均將產生廣泛而深遠的影響。
經過研究發現,蛋白質之間存在著相互作用,這些相互作用將蛋白質組合成為蛋白質網絡。通過進一步分析展開蛋白質網絡的研究設計過程,即會發現蛋白質在網絡中所處的拓撲位置對于衡量蛋白質作用在生物體中的影響力則能呈現清晰明確助益效果,而關鍵蛋白質在蛋白質網絡中通常將會處于更加重要的位置。因此,本文擬先通過計算蛋白質節點的可達性來進行蛋白質重要性排序,然后采用節點失效的方法,將重要的蛋白質節點不斷地“失效”,再不斷地計算新的蛋白質的重要性,從而在蛋白質網絡中動態地識別關鍵蛋白質。
5結束語
本文在定義蛋白質網絡的節點可達性和網絡資本值的基礎上,融合節點失效法,提出了一種識別關鍵蛋白質的混合識別算法。在保持蛋白質網絡拓撲結構完整性的前提下,通過評價節點失效前后蛋白質網絡的網絡資本值的下降程度來識別網絡中的關鍵蛋白質。實驗結果表明本算法在關鍵蛋白質的識別效率上,要優于4種中心性測度方法(DC、CC、BC、EC),尤其對于最為重要的前 1%和前 5%蛋白質則具有更好的識別效果。
[HS1*2][HT5H]參考文獻:[HT]
[WTBZ][ST6BZ][HT6SS][1] [ZK(#〗
[HJ*2]
JEONG H, MASON S P, BARABSI A L, et al. Lethality and centrality in protein networks[J]. Nature, 2001, 411(6833): 41-42.
[2] WUCHTY S, STADLER P F. Centers of complex networks[J]. Journal of Theoretical Biology, 2003, 223(1): 45-53.
[3] WUCHTY S. Interaction and domain networks of yeast[J]. Proteomics, 2002, 2(12): 1715-1723.
[4] BONACICH P. Power and centrality: A family of measures[J]. The American Journal of Sociology, 1987, 92(5): 1170-1182.
[5] 許睿,李琳芳. 基于網絡資本評估的蛋白質節點重要性排序[J]. 微型機與應用, 2016,35( 8):6-8.
[6] ZACHARY W W. An information flow model for conflict and fission in small groups[J]. Journal of Anthropological Research,1977,33:452-473.
[7] LUSSEAU D, SCHNEIDER K, BOISSEAU O J, et al. The bottlenose dolphin community of Doubtful Sound features a large proportion of longlasting associations[J]. Behavioral Ecology and Sociobiology, 2003, 54: 396-405.
[8] GIRVAN M, NEWMAN M E J. Community structure in social and biological networks[J]. Proceedings of the National Academy of Sciences, 2002, 99(6): 7821- 7826.
[9] Database of Interacting Proteins. Arabidopsis thaliana network[EB/OL]. [2004-01-15]. http://dip.doe-mbi.ucla.edu/dip/Main.cgi.
[10]Pajek datasets. Proteinprotein interaction network in budding yeast[EB/OL]. [2003-07-25]. http://vlado.fmf.uni-lj.si/pub/networks/data/bio/Yeast/Yeast.htm.
[11]MEWES H W, FRISHMAN D, MAYER K F X, et al. MIPS: analysis and annotation of Proteins from whole genomes in 2005[J]. Nucleic Acids Research, 2006, 34(Database issue): D169-D172.
[12]CHERRY J M, ADLER C, BALL C, et al. SGD: Saccharomyces genome database[J]. Nucleic Acids Research, 1998, 26(1): 73-79.
[13]ZHANG R, LIN Y. DEG5.0, a data base of essential genes in both prokaryotes and eukaryotes[J]. Nucleic Acids Research, 2009, 37(Database issue): D455-D458.
[14]Saccharomyces Genome Deletion Project. Yeast deletion project[EB/OL]. [2008-06-25]. http://www-sequence.stanford.edu/group/yeast_deletion_project[ZK)]
[FL)]