趙琳琳 趙亞莉 張牧歌 李文龍


摘 要: 近年來,復(fù)雜網(wǎng)絡(luò)理論受到廣泛的關(guān)注和研究。本文將復(fù)雜網(wǎng)絡(luò)的理論應(yīng)用到生物數(shù)據(jù)分析領(lǐng)域,設(shè)計(jì)并實(shí)現(xiàn)一款智能化和可視化的生物網(wǎng)絡(luò)特征分析軟件。該軟件可以實(shí)現(xiàn)數(shù)據(jù)輸入或者批量數(shù)據(jù)導(dǎo)入功能,通過對(duì)數(shù)據(jù)的讀取和結(jié)合相應(yīng)的生物學(xué)背景知識(shí),建立數(shù)據(jù)的網(wǎng)絡(luò)視圖,以及提供對(duì)該生物網(wǎng)絡(luò)的特征系數(shù)的參考值及分析結(jié)果,能有效幫助用戶發(fā)現(xiàn)節(jié)點(diǎn)之間存在的隱藏聯(lián)系及功能模塊之間的特征,是一款交互性較好的輕量級(jí)應(yīng)用軟件。
關(guān)鍵詞: 復(fù)雜生物網(wǎng)絡(luò);可視化;生物信息節(jié)點(diǎn);復(fù)雜網(wǎng)絡(luò)
Abstract:In recent years complex network theory has received extensive attention and research. This paper applies the theory of complex network to the field of biological data analysis and designs and implements a kind of intelligent and visualized biological network feature analysis software.This software can achieve the data input or batch data import function through the data read and combined with the corresponding biological background knowledge it can establish a data network view and provide reference value of the coefficient of the characteristics of biological networks and the results of the analysis which could help users to find the hidden relationship between the nodes and characteristics between functional modules. Thus it can be taken as a good lightweight interactive application software.
Key words: complex biological network;visualization;biological information node;complex networks
引言
近年來,各個(gè)領(lǐng)域中對(duì)復(fù)雜網(wǎng)絡(luò)的研究正日趨進(jìn)步與深入,人們開始廣泛關(guān)注網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜性及其與網(wǎng)絡(luò)行為之間的關(guān)系。復(fù)雜網(wǎng)絡(luò)的研究最早可以追溯到1736年Euler的七橋問題,長期發(fā)展演變至今,復(fù)雜網(wǎng)絡(luò)的探究也已從早期的數(shù)學(xué)領(lǐng)域逐漸擴(kuò)展到實(shí)際生活的其它多個(gè)方面,諸如從社交網(wǎng)絡(luò)、到物理學(xué)網(wǎng)絡(luò)、再到生物學(xué)網(wǎng)絡(luò)。而且,復(fù)雜網(wǎng)絡(luò)借助數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)等現(xiàn)代分析工具[1],已經(jīng)形成相對(duì)成熟的系統(tǒng)理論。例如,在復(fù)雜網(wǎng)絡(luò)的理論研究方面主要集中在對(duì)實(shí)際復(fù)雜網(wǎng)絡(luò)進(jìn)行統(tǒng)計(jì)分析,建立復(fù)雜網(wǎng)絡(luò)的模型進(jìn)行特征性分析[2],以及復(fù)雜網(wǎng)絡(luò)的混沌同步及控制研究上。就目前來看,未來復(fù)雜網(wǎng)絡(luò)將推動(dòng)研究學(xué)界著重設(shè)計(jì)采用一個(gè)簡(jiǎn)單方便的方法來應(yīng)對(duì)處理,即這些將復(fù)雜的系統(tǒng)視作一個(gè)個(gè)網(wǎng)絡(luò)圖來展開理論闡釋與研究,同時(shí)還要進(jìn)一步去延伸探索復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu)以及結(jié)構(gòu)與系統(tǒng)功能之間的聯(lián)系。
不僅如此,復(fù)雜網(wǎng)絡(luò)的現(xiàn)有理論結(jié)果同時(shí)也吸引了為數(shù)可觀生物學(xué)者的興趣與關(guān)注。對(duì)于節(jié)點(diǎn)眾多、連接結(jié)構(gòu)復(fù)雜的網(wǎng)絡(luò)所設(shè)定的整體結(jié)構(gòu)的研究過程中發(fā)現(xiàn),可以將復(fù)雜網(wǎng)絡(luò)與生物網(wǎng)絡(luò)密切聯(lián)系起來,通過借助復(fù)雜網(wǎng)絡(luò)日趨完備的理論對(duì)復(fù)雜生物網(wǎng)絡(luò)有針對(duì)性的探討分析[3],即可更加便利地掌握各個(gè)生物信息之間的微小聯(lián)系,比如復(fù)雜網(wǎng)絡(luò)中的冪律分布,小世界效應(yīng)運(yùn)用在生物蛋白質(zhì)領(lǐng)域,調(diào)用復(fù)雜網(wǎng)絡(luò)特征提取展示的不同蛋白質(zhì)之間的內(nèi)在相關(guān)性。分析復(fù)雜生物網(wǎng)絡(luò)圖的內(nèi)在理論特點(diǎn),根據(jù)理論特征分析得到的直觀結(jié)果,則能成功分析出相對(duì)應(yīng)節(jié)點(diǎn)之間蛋白質(zhì)是如何相互作用的,基因之間有什么相似之處與關(guān)聯(lián),生物細(xì)胞變異有什么原因等等這些問題的機(jī)理與內(nèi)在奧秘。除此之外,還可將復(fù)雜網(wǎng)絡(luò)應(yīng)用在生物神經(jīng)網(wǎng)絡(luò)中來模擬探測(cè)人類大腦神經(jīng)的結(jié)構(gòu)同樣具有現(xiàn)實(shí)重大的研究意義。
目前,對(duì)復(fù)雜網(wǎng)絡(luò)應(yīng)用在生物學(xué)的領(lǐng)域研究已成為業(yè)界熱點(diǎn),而且也已經(jīng)成為一個(gè)系統(tǒng)綜合的用來解釋基因數(shù)據(jù)水平及其內(nèi)在聯(lián)系的有利工具。已有不少軟件率先做出了功能范例,諸如Cytoscape、Vanted、Vis Ant等一系列用于分析復(fù)雜生物網(wǎng)絡(luò)的軟件已經(jīng)可以實(shí)現(xiàn)預(yù)計(jì)功能,然而卻也仍然存在著不足之處。正因?yàn)槠淦趯I(yè)化,使得研發(fā)面對(duì)的可行域是有限的,對(duì)于生物領(lǐng)域方面分析的可視化結(jié)構(gòu)可堪稱完美,能夠完善地展示和處理已構(gòu)建的復(fù)雜網(wǎng)絡(luò)圖,但是對(duì)于其它領(lǐng)域則呈現(xiàn)出設(shè)計(jì)欠缺。其中的關(guān)鍵點(diǎn)就是并未設(shè)定高端的數(shù)據(jù)處理分析,不能立足在復(fù)雜網(wǎng)絡(luò)本質(zhì)特征的角度去釋疑與分析,并通過對(duì)復(fù)雜網(wǎng)絡(luò)的特征分析做出相應(yīng)的結(jié)果輸出,使用戶能夠擁有更多功能選擇以及收獲數(shù)據(jù)的精確分析。本文擬將提出的研究?jī)?nèi)容就是建立在Cytoscape軟件基礎(chǔ)之上的,不同之處在于,本文將對(duì)于所有輸入的節(jié)點(diǎn)信息,不僅具備其可視化的展示部分如圖1所示,還包括對(duì)可視化展示后的復(fù)雜網(wǎng)絡(luò)的特征分析及數(shù)據(jù)處理結(jié)果顯示,并將最終結(jié)果提供給用戶,幫助用戶理解和分析研究?jī)?nèi)容。
1 復(fù)雜網(wǎng)絡(luò)基本理論
1.1 復(fù)雜網(wǎng)絡(luò)
復(fù)雜網(wǎng)絡(luò)(Complex Network)是指具有自組織、自相似、吸引子、小世界、無標(biāo)度中部分或全部性質(zhì)的網(wǎng)絡(luò),換言之,即呈現(xiàn)高度復(fù)雜性的網(wǎng)絡(luò)。復(fù)雜網(wǎng)絡(luò)的基本特征包括小世界、集群即集聚程度的概念、冪律的度分布概念。其復(fù)雜性主要表現(xiàn)在如下方面,其內(nèi)容可表述為[4]:
(1)結(jié)構(gòu)復(fù)雜。表現(xiàn)在節(jié)點(diǎn)數(shù)目巨大。
(2)網(wǎng)絡(luò)結(jié)構(gòu)呈現(xiàn)多種不同特征。表現(xiàn)在節(jié)點(diǎn)或連接的產(chǎn)生與消失,例如World-Wide Network,網(wǎng)頁或鏈接隨時(shí)可能出現(xiàn)或斷開,導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)不斷發(fā)生變化。
(3)連接多樣性。體現(xiàn)在節(jié)點(diǎn)之間的連接權(quán)重存在差異,且可能存在方向性。
(4)動(dòng)力學(xué)復(fù)雜性。體現(xiàn)在節(jié)點(diǎn)集可能屬于非線性動(dòng)力學(xué)系統(tǒng),例如節(jié)點(diǎn)狀態(tài)隨時(shí)間發(fā)生復(fù)雜變化。
(5)節(jié)點(diǎn)多樣性。體現(xiàn)在復(fù)雜網(wǎng)絡(luò)中的節(jié)點(diǎn)可以代表任何事物。例如,人際關(guān)系構(gòu)成的復(fù)雜網(wǎng)絡(luò)中,節(jié)點(diǎn)代表單獨(dú)個(gè)體;萬維網(wǎng)組成的復(fù)雜網(wǎng)絡(luò)中,節(jié)點(diǎn)可以表示不同網(wǎng)頁。
(6)多重復(fù)雜性融合。即以上多重復(fù)雜性相互影響,導(dǎo)致更加難以預(yù)料的結(jié)果。例如,設(shè)計(jì)一個(gè)電力供應(yīng)網(wǎng)絡(luò)需要考慮此網(wǎng)絡(luò)的進(jìn)化過程,其進(jìn)化過程將決定網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。當(dāng)2個(gè)節(jié)點(diǎn)之間頻繁進(jìn)行能量傳輸時(shí),節(jié)點(diǎn)之間的連接權(quán)重會(huì)隨即增加,通過不斷地學(xué)習(xí)與記憶逐步改善網(wǎng)絡(luò)性能。
復(fù)雜網(wǎng)絡(luò)已經(jīng)應(yīng)用在很多領(lǐng)域,也在實(shí)際領(lǐng)域中得到了工程統(tǒng)計(jì)數(shù)據(jù)來實(shí)現(xiàn)后續(xù)的數(shù)據(jù)分析,部分示例數(shù)據(jù)可見表1。
1.2 復(fù)雜網(wǎng)絡(luò)的基本概念
這里,關(guān)于圖的基本概念術(shù)語以及相關(guān)特征系數(shù)將給出如下分析概述。
在本次研究中,將蛋白質(zhì)作為簡(jiǎn)單的節(jié)點(diǎn),即相互作用網(wǎng)絡(luò)將表示成無向圖,故而僅需聚焦在無向圖的相關(guān)定義上。設(shè)無向圖G=(V,E),其中,V是圖中點(diǎn)的集合,E是圖中邊的結(jié)合,可得定義形式如下:
(1)對(duì)于邊e∈E,若e=(u v),則稱邊e與頂點(diǎn)u v關(guān)聯(lián)。
(2)對(duì)于頂點(diǎn)u,v∈V,如果存在邊e=(u v),使得e=(u v),則稱u與v鄰接,或說u和v是相鄰的頂點(diǎn)。
(3)對(duì)于邊e1,e2∈E,若e1和e2關(guān)聯(lián)共同的頂點(diǎn),則稱e1和e2鄰接,或說e1和e2是相鄰的邊。
1.3 復(fù)雜網(wǎng)絡(luò)的基本屬性介紹
在對(duì)基本圖的研究中,一般要探討5個(gè)方面的網(wǎng)絡(luò)屬性,具體表述如下:
(1) 度分布: 一個(gè)節(jié)點(diǎn)有k條邊的概率P(k)。
(2) 小世界效應(yīng)(最短路徑) :任意2個(gè)節(jié)點(diǎn)能通過最少幾條邊的路徑建立連接。小世界效應(yīng)的網(wǎng)絡(luò)更有利于在網(wǎng)絡(luò)節(jié)點(diǎn)之間的信息傳播。
(3) 聚類系數(shù):節(jié)點(diǎn)近鄰之間聯(lián)系的緊密程度,通常可以用網(wǎng)絡(luò)中包含的三角形個(gè)數(shù)予以表征說明。
(4)平均路徑長度:任意兩節(jié)點(diǎn)之間距離的平均值,主要是為了分析復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)[6]。
(5) 魯棒性(彈性):網(wǎng)絡(luò)的容錯(cuò)與抗攻擊能力。
在生物復(fù)雜網(wǎng)絡(luò)的研究中,也是從上述5個(gè)方面來考慮生物網(wǎng)絡(luò)圖的各種性質(zhì),通過探析各個(gè)節(jié)點(diǎn)之間相互作用網(wǎng)絡(luò)的結(jié)構(gòu)和機(jī)制,分析其在整張復(fù)雜網(wǎng)絡(luò)里面所具備的特征。
1.3.1 復(fù)雜網(wǎng)絡(luò)的聚類系數(shù)
在時(shí)下的社交網(wǎng)絡(luò)中,經(jīng)常會(huì)出現(xiàn)這樣一種情況,某人的2個(gè)朋友之間也可能是朋友,關(guān)于這種特性就可稱之為聚類特性[4]。一般條件下,假設(shè)網(wǎng)絡(luò)中節(jié)點(diǎn)i有Ki個(gè)邊,這個(gè)邊將該節(jié)點(diǎn)與其它節(jié)點(diǎn)連在一起,那么這Ki個(gè)節(jié)點(diǎn)就是i的鄰居。在這個(gè)Ki個(gè)節(jié)點(diǎn)之間最多有Ki(Ki+1)/2條邊。用Ei表示這Ki個(gè)節(jié)點(diǎn)之間實(shí)際存在的邊的個(gè)數(shù)。則節(jié)點(diǎn)i的聚類系數(shù)、也稱局部聚類系數(shù)Ci的數(shù)學(xué)公式可表述如下[4]:
全局聚類系數(shù)就是整個(gè)網(wǎng)絡(luò)的聚類系數(shù)C,表示了所有節(jié)點(diǎn)i的聚類系數(shù)Ci的平均值。聚類系數(shù)的值是在0和1之間。對(duì)于全局聚類系數(shù)C,當(dāng)C=0時(shí),當(dāng)且僅當(dāng)復(fù)雜網(wǎng)絡(luò)中所有的節(jié)點(diǎn)均為孤立節(jié)點(diǎn),所有節(jié)點(diǎn)之間沒有任何相連的邊。對(duì)于一個(gè)含有N個(gè)節(jié)點(diǎn)的完全隨機(jī)網(wǎng)絡(luò),當(dāng)N很大時(shí),C=O(1/N)。在實(shí)際生活中,已有的許多大規(guī)模網(wǎng)絡(luò)都具有明顯的聚類效應(yīng),在某種程度上和社交關(guān)系網(wǎng)絡(luò)中的“物以類聚,人以群分”之間表現(xiàn)出頗高的相似性,這些網(wǎng)絡(luò)的聚類系數(shù)遠(yuǎn)小于1但是又比O(1/N)大得多。在人們的社交網(wǎng)絡(luò)中,某人朋友的朋友與此同時(shí)也是其本人朋友的概率會(huì)隨著網(wǎng)絡(luò)規(guī)模的增加趨向于一個(gè)非零的常數(shù)。另外,還需指出,在日常接觸的復(fù)雜網(wǎng)絡(luò)中,大多數(shù)往往都不是完全隨機(jī)的網(wǎng)絡(luò)。
1.3.2 平均路徑長度
設(shè)連接網(wǎng)絡(luò)中節(jié)點(diǎn)i和j之間最短路徑上的邊數(shù)為i和j之間的距離dij。在復(fù)雜網(wǎng)絡(luò)中任意兩點(diǎn)之間距離的最大值為復(fù)雜網(wǎng)絡(luò)的直徑,即:
復(fù)雜網(wǎng)絡(luò)的平均路徑長度也稱為復(fù)雜網(wǎng)絡(luò)的特征路徑長度(Characteristic path length),當(dāng)不包含節(jié)點(diǎn)到自身的距離時(shí),研究推得L的運(yùn)算公式可見如下:
在社交網(wǎng)絡(luò)中,L的含義是連接2個(gè)人之間最短關(guān)系鏈中朋友的平均個(gè)數(shù)。在復(fù)雜生物網(wǎng)絡(luò)中,L的含義是2個(gè)蛋白質(zhì)之間最短關(guān)系鏈中蛋白質(zhì)的個(gè)數(shù)。
在很多復(fù)雜網(wǎng)絡(luò)中,盡管節(jié)點(diǎn)個(gè)數(shù)巨大,但是平均路徑卻很小。如果對(duì)于固定的網(wǎng)絡(luò)節(jié)點(diǎn)平均度
1.3.3 度與度的分布
在復(fù)雜網(wǎng)絡(luò)中,用ki表示節(jié)點(diǎn)i連接的其它節(jié)點(diǎn)的個(gè)數(shù)。對(duì)于有向網(wǎng)絡(luò),一個(gè)節(jié)點(diǎn)的度可劃分為出度(out-degree)和入度(in-degree)兩部分。
其中,節(jié)點(diǎn)的出度代表從該節(jié)點(diǎn)指向其它節(jié)點(diǎn)的邊的數(shù)目,節(jié)點(diǎn)的入度是指從其它節(jié)點(diǎn)指向該節(jié)點(diǎn)的邊的數(shù)目。網(wǎng)絡(luò)中所有節(jié)點(diǎn)度的平均值用
1.4 小世界網(wǎng)絡(luò)模型的統(tǒng)計(jì)特征
類似于ER隨機(jī)圖模型,WS小世界模型也是所有節(jié)點(diǎn)的度都近似相等的均勻網(wǎng)絡(luò)。自從Watts等人提出WS模型后[7],就陸續(xù)推出了對(duì)WS模型的各類研究改進(jìn)。前期出現(xiàn)的度不變的SD模型,保持相對(duì)度總數(shù)不變的機(jī)制生成小世界網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)同時(shí)具有小世界特征。
1.4.1 聚類系數(shù)
1.4.2 平均路徑長度
目前,還未見到關(guān)于WS小世界模型的平均路徑長度L的精確表達(dá)式[4] ,相對(duì)比較可靠的計(jì)算平均路徑長度的數(shù)學(xué)公式則具體可見如下[10]:
1.4.3 度分布
2 復(fù)雜生物網(wǎng)絡(luò)節(jié)點(diǎn)信息的可視化實(shí)現(xiàn)
2.1 復(fù)雜生物網(wǎng)絡(luò)數(shù)據(jù)的可視化實(shí)現(xiàn)對(duì)比分析
在算法解析復(fù)雜網(wǎng)絡(luò)的基礎(chǔ)上,將復(fù)雜網(wǎng)絡(luò)實(shí)現(xiàn)可視化也是系統(tǒng)的重點(diǎn)之一。通過與目前比較流行的幾種可視化系統(tǒng)網(wǎng)絡(luò)建模與模擬可視化系統(tǒng)進(jìn)行對(duì)比分析,找準(zhǔn)自身軟件的定位,并將基于復(fù)雜網(wǎng)絡(luò)的可視化以及網(wǎng)絡(luò)特征的算法分析相結(jié)合,就是為用戶提供一個(gè)方便實(shí)用的技術(shù)工具。
本軟件主要功能是:首先將生物信息視作一個(gè)普通的節(jié)點(diǎn),將這些節(jié)點(diǎn)的聯(lián)系當(dāng)做邊,存至文檔中作為整個(gè)系統(tǒng)的輸入信息,由本文論述的系統(tǒng)后臺(tái)實(shí)現(xiàn)可視化的設(shè)定,而后在界面上顯示出相應(yīng)節(jié)點(diǎn)的信息。這些信息就是文檔輸入的節(jié)點(diǎn)自身含有的信息,包括整個(gè)復(fù)雜網(wǎng)絡(luò)上平均路徑、聚類系數(shù)、連通子圖、各個(gè)節(jié)點(diǎn)的入度/出度、以及度的分布。當(dāng)然,這些輸入可以是生物領(lǐng)域的蛋白質(zhì)內(nèi)在聯(lián)系分析,也可以是基因組與人類疾病聯(lián)系的相關(guān)輸入,甚至可以是人的社交網(wǎng)絡(luò),節(jié)點(diǎn)代表人等等。最后,可利用聚類系數(shù)對(duì)整個(gè)復(fù)雜網(wǎng)絡(luò)進(jìn)行區(qū)域劃分,將關(guān)系相近的節(jié)點(diǎn)劃分在一個(gè)區(qū)域,用戶可以利用軟件分析的結(jié)果并依據(jù)需要展開相應(yīng)的研究。同時(shí),本文定制提出的軟件還可以實(shí)現(xiàn)界面節(jié)點(diǎn)注釋信息的展示。
2.1.1 Cytoscape
Cytoscape就是一個(gè)開源的網(wǎng)絡(luò)可視化和分析軟件系統(tǒng)。目前可以說在復(fù)雜網(wǎng)絡(luò)的可視化方面已呈現(xiàn)出高端技術(shù)優(yōu)勢(shì)[11]。該軟件可以通過生物分子相互作用網(wǎng)絡(luò)可視化的形式將高通量基因表達(dá)數(shù)據(jù)、分子狀態(tài)信息有機(jī)整合在一起。而且,其最重要的設(shè)計(jì)應(yīng)用就在于可視化大規(guī)模蛋白質(zhì)-蛋白質(zhì)相互作用、蛋白質(zhì)-DNA和遺傳相互作用等復(fù)雜生物網(wǎng)絡(luò)的分析,并能將這些網(wǎng)絡(luò)與功能注釋等數(shù)據(jù)庫進(jìn)行有效鏈接。另外,由于軟件內(nèi)嵌有良好與成熟的插件開發(fā),用戶還可以方便地將自身的數(shù)據(jù)轉(zhuǎn)換為復(fù)雜網(wǎng)絡(luò)的可視化。
2.1.2 VisAnt
VisAnt是一個(gè)在線可視化建模系統(tǒng),用戶在線即可連接數(shù)據(jù)庫,并且將數(shù)據(jù)信息借助這一工具,以圖形模式繪制并顯示出來。該軟件能夠在線可視化GO(geneontology)以及諸如提供與KEGG和Swiss rot等數(shù)據(jù)庫的在線連接及可視化。目前,VisAnt主要生成的布局算法是Spring-embedded算法。
2.1.3 VANTED
VANTED是一個(gè)在綜合分析實(shí)驗(yàn)數(shù)據(jù)基礎(chǔ)上能夠輸出生物網(wǎng)絡(luò)可視化的功能軟件,適用于網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)(如蛋白質(zhì)、酶、代謝物)均集結(jié)有大量的實(shí)驗(yàn)數(shù)據(jù)(Excel表格方式提供)的可視化分析。其中,主要包括了力導(dǎo)向算法、環(huán)布局等算法。
2.2 信息節(jié)點(diǎn)可視化顯示
通過參考cytoscape.Js庫中的常用函數(shù),在可視化界面將節(jié)點(diǎn)以及節(jié)點(diǎn)之間的聯(lián)系終端頁面顯示出來,不同節(jié)點(diǎn)之間將采用不同的色彩加以區(qū)分,節(jié)點(diǎn)自身包含著共享的細(xì)節(jié)信息,點(diǎn)擊相應(yīng)的節(jié)點(diǎn)即可智能顯示節(jié)點(diǎn)內(nèi)部信息。在復(fù)雜生物網(wǎng)絡(luò)的可視化頁面,用戶可以隨時(shí)獲知當(dāng)前的節(jié)點(diǎn)是何種蛋白質(zhì)、代表什么基因等等。并且還可以根據(jù)用戶需要引入一定的位置調(diào)整,與此同時(shí)當(dāng)前頁面的節(jié)點(diǎn)坐標(biāo)也將隨即發(fā)生變動(dòng),同時(shí)還將結(jié)合用戶可操作控制的頁面按鈕,用戶就可以選擇全部輸出,或者只輸出局部的統(tǒng)計(jì)特征。通過點(diǎn)擊按鈕,借助Javascripe函數(shù)的運(yùn)行,調(diào)用深層機(jī)制,靈活選擇指定函數(shù)以及從數(shù)據(jù)庫中讀取目標(biāo)數(shù)據(jù)。在得到相應(yīng)的輸出結(jié)果之后,再基于可實(shí)時(shí)交互的開放頁面,用戶可以在終端頁面根據(jù)相應(yīng)的結(jié)果信息,進(jìn)行一定的增、刪調(diào)整,還可以根據(jù)需要重新設(shè)計(jì)結(jié)果的輸出,數(shù)據(jù)庫的相應(yīng)信息也會(huì)隨著交互頁面的變動(dòng)發(fā)生聯(lián)動(dòng)調(diào)整,從而輸出最終更新的數(shù)據(jù),并提供給客戶用于后續(xù)數(shù)據(jù)分析和相關(guān)研究。
2.3 后臺(tái)數(shù)據(jù)庫處理及運(yùn)行機(jī)制的分析
數(shù)據(jù)庫的數(shù)據(jù)錄入部分,主要是借助DIP數(shù)據(jù)庫目錄通過實(shí)驗(yàn)確定蛋白質(zhì)之間的相互作用。過程中結(jié)合了各種來源的信息,并創(chuàng)建了一整套一致的蛋白質(zhì) - 蛋白質(zhì)相互作用。在DIP網(wǎng)站中尋找到完整的DIP數(shù)據(jù)集再以“PSI-MI TAB”格式下載了最新數(shù)據(jù)。此后可以將以TAB為分隔符的txt文件導(dǎo)入到Excel文件中。對(duì)完整的DIP數(shù)據(jù)集進(jìn)行符合本次項(xiàng)目數(shù)據(jù)要求的修改,得到兩兩蛋白質(zhì)之間的對(duì)應(yīng)關(guān)系,以及對(duì)應(yīng)關(guān)系出現(xiàn)的方法或文獻(xiàn)信息。后臺(tái)數(shù)據(jù)庫用于支持維護(hù)數(shù)據(jù)的錄入和讀取,并且作為整個(gè)軟件機(jī)制的數(shù)據(jù)源,可為軟件前端界面的可視化顯示派做信息依據(jù),將用戶信息以表格形式存儲(chǔ)在相應(yīng)的系統(tǒng)之中,供中央處理器調(diào)用和計(jì)算處理,以及前端可視化展示。
2.4 將節(jié)點(diǎn)信息進(jìn)行公式理論化處理
將復(fù)雜網(wǎng)絡(luò)的算法以Java的形式存儲(chǔ)起來,將每個(gè)算法作為獨(dú)立的函數(shù),前端頁面設(shè)置對(duì)應(yīng)函數(shù)的標(biāo)志性按鈕,若觸發(fā)該按鈕,系統(tǒng)會(huì)讀取當(dāng)前的可視化信息,并在系統(tǒng)數(shù)據(jù)庫后臺(tái)調(diào)用節(jié)點(diǎn)信息,作為輸入傳送至函數(shù)中,再啟用函數(shù)執(zhí)行相關(guān)的數(shù)據(jù)計(jì)算,得到優(yōu)化處理輸出,進(jìn)而反饋給Jsp頁面顯示相應(yīng)的結(jié)果。在最終可視化頁面,設(shè)置各類主題按鈕供用戶根據(jù)自身需要選擇相應(yīng)的輸出。作用機(jī)制就是利用框架原理,將函數(shù)計(jì)算部分作為javabean,與可視化部分聯(lián)系在一起,同時(shí)與數(shù)據(jù)庫創(chuàng)建關(guān)聯(lián),從數(shù)據(jù)庫中讀取要計(jì)算的輸入數(shù)據(jù)。
3 結(jié)束語
在本次研究過程中,初步實(shí)現(xiàn)的可視化軟件是將用戶輸入的文檔信息轉(zhuǎn)化為可視化的復(fù)雜網(wǎng)絡(luò),為用戶實(shí)現(xiàn)了預(yù)計(jì)的特征分析功能。在可視化頁面,節(jié)點(diǎn)按鈕存儲(chǔ)基本的節(jié)點(diǎn)信息,幫助用戶進(jìn)一步了解研究指定分析的節(jié)點(diǎn)與節(jié)點(diǎn)之間的內(nèi)在特征及在網(wǎng)絡(luò)中的價(jià)值,滿足用戶分析數(shù)據(jù)的需要,并在可[CM(22]視化界面研究嵌入了良好人機(jī)交互,用戶可以根據(jù)已有的結(jié)果信息將原初數(shù)據(jù)進(jìn)行可控性的調(diào)整和更改,重新啟動(dòng)頁面按鈕得到新的可視化顯示和數(shù)據(jù)分析的關(guān)聯(lián)結(jié)果。同時(shí),本文設(shè)計(jì)論述的軟件還可以實(shí)現(xiàn)界面節(jié)點(diǎn)注釋信息的展示,方便用戶及時(shí)探查和使用信息。但是,目前本軟件涉及分析的特征數(shù)據(jù)信息仍然較為有限,并未達(dá)到完善和全面,復(fù)雜網(wǎng)絡(luò)的其它重要的特征數(shù)據(jù),并沒有完全配備各類規(guī)范運(yùn)算,且對(duì)于部分用戶數(shù)據(jù)分析結(jié)果也僅限于提供輔助參考作用。
參考文獻(xiàn)
[1] 陸鎖軍. 生物復(fù)雜網(wǎng)絡(luò)抉擇行為與混沌同步研究[D]. 上海:東華大學(xué),2008.
[2] 江珊,蔣勃,徐桂珍,等. 使用Cytoscape對(duì)生物網(wǎng)絡(luò)數(shù)據(jù)的建模和分析[J]. 農(nóng)業(yè)網(wǎng)絡(luò)信息,2017(6):32-37.
[3] 周洪偉. 復(fù)雜網(wǎng)絡(luò)理論及其在生物網(wǎng)中的應(yīng)用[D]. 南京:南京航空航天大學(xué),2007.
[4] 汪小帆,李翔,陳關(guān)榮. 復(fù)雜網(wǎng)絡(luò)理論及其應(yīng)用[M]. 北京:清華大學(xué)出版社 2006.
[5] ALBERT R BARABASI A L. Statistical mechanics of complex network[J]. arXiv preprint arXiv: cond-mat/0106096 2001.
[6] 周云龍. 復(fù)雜網(wǎng)絡(luò)平均路徑長度的研究[D]. 合肥:合肥工業(yè)大學(xué),2013.
[7] NEWMAN M E J.The structure and function of complex networks[J]. SIAM Review 2003,45(2):167-256.
[8] ERDS P RNYI A.On the evolution of random graphs[J]. Transactions of the American Mathematical Society,1960(5):17-61.
[9] NEWMAN M E J. The structure and function of networks[J]. Computer Physics Communications,2002,147(1):40-45.
[10]NEWMAN M E J WATTS D J. Renormalization group analysis of the small-world network model[J]. Physics Letters A,1999,263(4-6):341-346.
[11]孫璽箐,司守奎. 復(fù)雜網(wǎng)絡(luò)算法與應(yīng)用[M]. 北京:國防工業(yè)出版社,2015.
[12]王林,戴冠中. 復(fù)雜網(wǎng)絡(luò)的度分布研究[J]. 西北工業(yè)大學(xué)學(xué)報(bào),2006,24(4):405-409.
[13]劉濤,陳忠,陳曉榮. 復(fù)雜網(wǎng)絡(luò)理論及其應(yīng)用研究概述[J]. 系統(tǒng)工程,2005,23(6):1-7.
[14]劉強(qiáng),方錦清,畢橋,等. 不同機(jī)制的小世界模型的同步能力比較[J]. 中國原子能科學(xué)研究院年報(bào),2006:183-185.