趙小蕾,左曉宇,覃繼恒,梁巖,張乃尊,欒奕昭,饒紹奇.
1. 廣東醫(yī)學(xué)院醫(yī)學(xué)系統(tǒng)生物學(xué)研究所與公共衛(wèi)生學(xué)院,東莞 523808;
2. 中山大學(xué)公共衛(wèi)生學(xué)院,廣州 510080;
3. 茂名市人民醫(yī)院,茂名 525000
京都基因與基因組百科全書(shū)(Kyoto Encyclopedia of Genes and Genomes,KEGG)中的通路數(shù)據(jù)庫(kù)(KEGG PATHWAY database)是系統(tǒng)性分析和闡釋基因功能的重要知識(shí)庫(kù),涵蓋了從基本細(xì)胞過(guò)程到人類(lèi)復(fù)雜疾病等重要生命過(guò)程中分子間的相互作用和網(wǎng)絡(luò)關(guān)系[1,2],已成為研究細(xì)胞生化過(guò)程如代謝、膜轉(zhuǎn)運(yùn)、信號(hào)傳遞和細(xì)胞周期以及人類(lèi)復(fù)雜疾病致病分子機(jī)制的重要參考工具[3~5]。KEGG通路通過(guò)描述分子間的相互互作和反應(yīng)的信息以闡釋基因及其產(chǎn)物的功能。KEGG通路數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)對(duì)象也被稱(chēng)為是廣義的蛋白質(zhì)-蛋白質(zhì)互作網(wǎng)絡(luò),包括基因產(chǎn)物(節(jié)點(diǎn))和3種類(lèi)型的相互作用和關(guān)系(邊):酶-酶關(guān)系、直接的蛋白質(zhì)-蛋白質(zhì)互作、基因表達(dá)關(guān)系[6,7]。隨著分子生物學(xué)研究的不斷深入,KEGG通路數(shù)據(jù)庫(kù)得到快速地積累和擴(kuò)充,已從 2001年的201個(gè)通路約6000個(gè)基因產(chǎn)物節(jié)點(diǎn)[6]增加到2010年的300多個(gè)通路約17000多個(gè)蛋白質(zhì)節(jié)點(diǎn)[8]。盡管如此,對(duì)于復(fù)雜的生命過(guò)程而言,該數(shù)據(jù)庫(kù)掌握的知識(shí)仍只是冰山一角,亟需進(jìn)一步進(jìn)行知識(shí)擴(kuò)充和完善。但是,受限于實(shí)驗(yàn)成果發(fā)表周期以及數(shù)據(jù)庫(kù)管理人員手工擴(kuò)充通路信息造成的滯后,傳統(tǒng)的基于實(shí)驗(yàn)室技術(shù)的通路擴(kuò)充方法已然不能滿足當(dāng)前分子生物學(xué)研究的需求。生物信息學(xué)預(yù)測(cè)方法為通路擴(kuò)充提供了一種有效和便利的途徑。
既往的通路(網(wǎng)絡(luò))擴(kuò)充、重構(gòu)和預(yù)測(cè)方法多基于基因表達(dá)數(shù)據(jù)提取基因間相互作用的關(guān)系[9,10]。……