李 雷, 蔣林華
(上海理工大學 現代光學系統重點實驗室,上海 200093)
過去的20年里,斑馬魚逐漸成為研究人類基因功能的重要模式動物。因為它們的壽命相對較短,但與人類一樣,它們仍然會逐漸老化。并且,由于它的生命周期短,適合做生物學實驗。此外,它的保守分子的廣泛表征細胞生理學使斑馬魚成為揭示老化,疾病和修復的潛在機制的極好模型。了解斑馬魚衰老基因的分子機制,例如氧化蛋白質在肌肉中的積累都至關重要[1-2]。盡管沒有現成的斑馬魚衰老基因組,但大多數的性狀都需要涉及到一個復雜的分子之間相互作用,因此,衰老也不例外。
最近,有了更多關于斑馬魚神經系統老化的消息,使得對于它的衰老分子機制的研究更加明朗。斑馬魚尤其有可能在老年學研究中具有很大的價值,因為發展 - 精神和基因研究的豐富性已經推動了基本斑馬魚生物學和相關實驗技術的廣泛特征化。這種小型脊椎動物具有幾個獨特的特征,為該領域提供許多優勢。此外,大多數斑馬魚因組已被測序,并被證明與人類具有高度相似性,具有許多人類基因的直系同源物。一個復雜的哺乳動物樣發育基因程序生成了一個整合的神經系統,為此所有的主要腦區都被映射,并賦予這些斑馬魚高級認知功能和社會行為[3]。此外,斑馬魚專用實驗程序(獲得和喪失功能方法,體內成像技術)和資源(克隆,抗體)的廣泛可用性將進一步支持老化。在之前的斑馬魚研究中,衰老一直被認為是微不足道的,因為它們經歷了不確定的生長并具有非常強大的再生能力。過去二十年的不斷努力,已經開始研究出斑馬魚內潛伏老齡化途徑,說明了與其他脊椎動物物種的許多相似之處。它們表現出相同的典型標記和降低的β-半乳糖苷酶表達,并顯示出通常類似于人類中已知的年齡相關病理學的衰老表型和骨關節炎[13]。
研究表明,由于斑馬魚復雜和多效的性質,其衰老狀態難以用少數特征來表征。越來越明顯的是,許多老齡驅動因素相互關聯并產生相互影響。不幸的是,到目前為止,對于斑馬魚衰老分子機制的分子相互作用很少,所以高度需要斑馬魚衰老蛋白質分子相互作用交互圖。在這種情況下,使用不同的動物模型系統進行精確的遺傳或藥理學操作確實可以在不同的生理系統和/或功能中鑒別衰老劑。因此,似乎只有將不同模型中的數據組合起來才有助于破譯造成老齡化的主要因素。
數據來源National Center of Biotechnology Information(NCBI)基因表達綜合數據庫(GEO)數據庫(http://www.ncbi.nlm.nih.gov/geo/),GPL1319平臺([Zebrafish] Affymetrix Zebrafish Genome Array)應用于表達式陣列。本平臺的斑馬魚數據集包含12個樣本,下載這些數據(CEL表單)和注釋文件以進行進一步分析。由于智人與斑馬魚具有很高的同源性,最后從47 036個斑馬魚基因中,選擇了67個與智人具有同源性、具有代表性的斑馬魚衰老相關基因[4-7]。使用SPSS對數據進行標準化處理,然后將獲得的67個基因放入NCBI的GEO數據集中。已經發現85.38%的基因被用于功能基因組學研究,因此我們有理由相信這些數據可以作為斑馬魚衰老機制的基因。獲得原始數據后,對數據進行歸一化,使得GEO數據集中斑馬魚基因與人類基因之間的同源性系數在0到1之間,然后進行單樣本T檢驗方法鑒定Hgs(同源性基因),得出GEO中與人類同源性高的斑馬魚基因。選擇置信區間為99%作為截止標準(見表1)。

表1 來自GEO數據庫的同源化基因的分析結果Table 1 Analysis of homologous genes from the GEO database
KEGG(京都基因與基因組百科全書)是基因組破譯方面的數據庫。它是一個公認的綜合性數據庫,同時它是一個系統的分析基因功能、基因組信息數據庫,它有助于研究者把基因及表達信息作為一個整體網絡進行研究,包括各種生物化學途徑[5-8]。因此,在這項工作中,我們對Hgs應用了KEGG數據庫研究Hgs的富集分析,尋找可能影響斑馬魚衰老發生的生物化學途徑。DAVID用于進行KEGG通路富集分析,p值<0.05,基因計數>2。為了進一步了解Hgs的功能,DAVID應用于識別顯著失調的KEGG途徑。來自所有衰老相關基因的p值<0.05和基因計數> 2獲得的途徑分別顯示在表2中。根據富集結果,顯著富集FoxO singaling pathway、ErbB singaling pathway、p53 singaling pathway、Focal adhesion等。其中也不乏一些之前預測像細胞新陳代謝之類的通路,我們有理由相信通過這些蛋白質相互作用,可以得出或者預測之前不曾考慮到的斑馬魚致衰老因素[6]。
由于蛋白質很少獨立發揮其功能,因此通過研究蛋白質的較大功能群來了解這些蛋白質的相互作用是重要的[9-10]。所以在這項研究中,STRING在線工具被用來分析Hgs的PPIs,其綜合得分> 0.15的截止標準。從以前的研究中,大多數獲得的PPI網絡服從無標度歸因[16-18]。同時,網絡的節點度被分析并用于獲得PPI網絡中的中樞蛋白質,選擇連接度>35作為中樞節點,并預測可能在斑馬魚的衰老研究進展中占重要比重。STRING工具被用來獲得Hgs的PPI關系[11-12]。綜合得分> 0.4時,共獲得767個PPI關系。在濾除了度數≤5的節點后,我們最終構建了包含78個節點和478個邊的網絡(見圖1)。計算PPI網絡各節點的連通度,輸出見圖2。高連接度>35的這些基因(kita、mapk3、mapk1、ptneb、kras、mtor、jak2b、hrasb、sirt1、myca、pickc3、arf1)被選為影響斑馬魚衰老的重要因素。

表2 同源性基因的KEGG通路分析Table 2 Analysis of the KEGG pathway of homologous genes

圖1 通過STRING在線工具獲取網絡圖,并對選定的一些中心基因進行標記Fig.1 Network map obtained through the STRING online tool with some selected central genes marked

圖2 PPI網絡中各節點的連通度Fig.2 Connectivity of each node in PPI network
由于PPI網絡的節點和邊緣非常復雜,我們需要使用ClusterONE Cytoscape插件進行富集分析。在運行ClusterONE Cytoscape以披露PPI網絡的豐富功能模塊之前,設置參數最小尺寸> 5且最小密度<0.05。我們還對模塊基因進行了GO(基因本體論)功能富集分析,以分析分子水平上的基因功能。此外,我們還使用DAVID進行最佳富集模塊KEGG通路富集分析,同時進行了Kmeans聚類。PPI網絡富集是研究和鑒定功能蛋白質的主要方法之一[23]。在這項研究中,有8個重要模塊(p值<1×10-3)通過ClusterONE Cytoscape插件進行富集,參數最小> =5,最小密度<0.05。最重要的富集模塊A(p=1.0×10-3),模塊B(p=9.083×10-5)和模塊C(p=1.2×10-3)如圖3所示。根據圖3,顯然模塊A可能是最好的模塊,因為它有42個節點和487條邊,而模塊B有10個節點和44條邊,模塊C有7個節點和21條邊[15]。為了進一步研究腫瘤進展過程中的功能變化,我們在模塊A中進行了GO功能注釋[19-20]。模塊A的 GO富集分數分別為18.28。因此,模塊A可能是進一步功能分析最合適的模塊。模塊A中有42個基因(見圖3),它們和之前我們所假設的中樞基因不謀而合,所假設的中樞基因也在圖一中標注出來。因此模塊A可能是進一步功能分析最合適的模塊。模塊A有42個基因,它們在細胞老化、細胞周期、代謝過程的調節等生物過程功能富集,然后通過KEGG富集分析研究結果。
本項目介紹了斑馬魚這種模式生物衰老機制,涵蓋了衰老相關的87個蛋白質之間的767個相互作用。這不僅包含準確預測的PPI,還包含從文獻收集以及實驗所得的那些分子相互作用。然后進行網絡化,找到中樞基因(mapk1、mtor、tp35、kita、pik3cs、myca、sirt1、kras、mapk3、arf1、jak2b),與后面的模塊富集得出的重要基因不謀而合。在對斑馬魚衰老過程進行模塊A分析的過程中,得出生物調節、生物過程、分子代謝過程等功能富集,說明端粒磨損、細胞老化對斑馬魚衰老過程中起到重要的作用[21-22]。同時,參考López-Otín等人(2013年)描述衰老與生物體的基本功能相關的九個主要參數,并且通常與衰老過程相關,進一步佐證我們的預測。

圖3 Hgs的PPI模塊化分析中的模塊AFig.3 Module A in PPI modular analysis of Hgs
斑馬魚已成為脊椎動物基因功能研究的熱門生物。該物種幾乎透明的胚胎以及通過基因敲低或過表達加速基因研究的能力已經導致斑馬魚在脊椎動物基因功能的詳細研究中的廣泛使用,并且越來越多地研究人類遺傳疾病[27-29]。但是,為了有效模擬人類遺傳疾病,了解斑馬魚基因和基因結構與直系同源人類基因的相關程度很重要。在這項研究中,根據斑馬魚與人類的同源性,從NCBI(https://www.ncbi.nlm.nih.gov/)47 036個斑馬魚基因中,選擇了67個具有代表性的斑馬魚衰老相關基因。這些基因大多富含生物過程和生物調節,部分基因富含細胞代謝過程等。
通過分析網絡中的功能富集,發現細胞有很多重要的生物過程[24-26]。P53是許多的腫瘤類型起著腫瘤抑制劑的作用,根據生理情況和細胞類型誘導生長停滯或細胞凋亡。作為反式激活因子參與細胞周期調控,通過控制該過程所需的一組基因來負向調節細胞分裂。其中一個激活的基因是細胞周期蛋白依賴性激酶抑制劑。細胞凋亡誘導似乎是通過刺激bax和fas抗原表達或通過抑制Bcl-2表達來介導的。
此外,使用STRING工具獲得Hgs的PPI關系,并獲得了具有87個節點和767個邊緣的網絡。在網絡中,選擇kita、mapk3、mapk1、ptneb、kras、mtor、jak2b、hrasb、sirt1、myca、pickc3、arf1作為集線器節點,因為它們的連通度> 35。最后,我們進行了PPI網絡的模塊分析。含有42個基因的模塊A被證明與斑馬魚衰老密切相關[14-15]。通過GO分析,模塊A中的基因在生物調節、生物過程,分子代謝過程等功能富集,說明端粒磨損、細胞老化對斑馬魚衰老過程中起到重要的作用。
作為研究的結果,我們證實斑馬魚衰老機制與FoxO singaling pathway、ErbB singaling pathway、p53 singaling pathway、Focal adhesion、分子代謝過程有關。此外,我們還發現mapk1、mtor、tp35、kita、pik3cs、myca、sirt1、kras、mapk3、arf1,jak2b等基因可能在衰老機制中發揮重要作用,并且它們是預測的源基因。