王 凡,徐世明,鄢 雯,古同男,王宏娟
首都醫科大學燕京醫學院生物化學與分子生物學教研室,北京 101300
在蛋白質代謝過程中,泛素化修飾是蛋白質翻譯后修飾的重要方式之一,底物與泛素可通過E1泛素活化酶、E2泛素結合酶和E3泛素連接酶催化的酶促級聯反應建立共價連接,進而影響底物蛋白的活性[1]。E3泛素連接酶是泛素化反應中的關鍵酶,介導泛素-蛋白酶體系統中底物的識別,確定泛素化反應的特異性,并通過調控調節蛋白的泛素化過程參與細胞內的多種生理過程[2]。有研究表明,E3泛素連接酶可利用泛素-蛋白酶體系統,調節腫瘤相應基因啟動子或抑制子,影響腫瘤細胞生長[3-4]。目前已發現600余種E3泛素連接酶,其中E3泛素蛋白連接酶1(MIB1)可通過泛素化NOTCH蛋白受體正向調節信號通路,進而促進內吞作用[5]。在人胚胎干細胞中,MIB1蛋白能催化八聚體結合轉錄因子4(OCT4)的泛素化,調控OCT4蛋白處于適宜的表達水平,并介導OCT4經26S蛋白酶體途徑的降解,從而維持胚胎干細胞的自我更新[6]。此外,鈣黏著蛋白關聯蛋白可被MIB1蛋白泛素化進而調控細胞遷移[7],MIB1蛋白還可以調控胰腺向腺泡細胞或導管分化[8]。
斑馬魚是模式脊椎動物之一,其基因組與人類基因相似度達到87%,數據庫中有其相關信息供查詢下載,可作為人類疾病模型,其已成為生命科學研究的新寵[9]。本研究通過對斑馬魚MIB1基因的生物信息學研究,包括非編碼RNA(ncRNA)預測、轉錄因子結合位點(TFBS)分析、互作基因與互作蛋白預測,以及基因功能富集分析等,探究斑馬魚MIB1基因的相關功能。
1.1材料來源 斑馬魚MIB1基因序列的獲取:美國國家生物技術信息中心(NCBI)(http://www.ncbi.nlm.nih.gov/)。ncRNA預測:國家基因組科學數據中心(NGDC)(http://ngdc.cncb.ac.cn/lgc/calculator)。TATA盒預測網址:SoftBerry(http://linux1.softberry.com/berry.phtml)。TFBS預測網址:Alggen(http://alggen.lsi.upc.es),AnimalTFDB(http://bioinfo.life.hust.edu.cn/AnimalTFDB4/#/)。互作基因預測網址:GeneMANIA(http://genemania.org)。基因本體(GO)與京都基因與基因組百科全書(KEGG)分析數據來源:DAVID(https://david.ncifcrf.gov)。互作蛋白預測網址:STRING(http://cn.string-db.org)。
1.2方法
1.2.1斑馬魚MIB1基因及其啟動子序列的獲取 在NCBI數據庫中搜索斑馬魚MIB1基因,讀取相關基因信息,在“工具”下拉按鈕中選擇“序列文本視圖”,從中選取轉錄起始位點上游1 500 bp內的DNA序列,獲取MIB1基因的啟動子序列。將MIB1基因啟動子及5′非翻譯區的序列上傳至SoftBerry中,預測TATA盒。
1.2.2ncRNA的預測 登錄NGDC網站,在ncRNA模塊中將斑馬魚MIB1基因啟動子及5′非翻譯區的序列一同輸入文本框進行預測。
1.2.3斑馬魚MIB1基因TFBS預測 登錄Alggen網站,點擊“啟動子”按鈕,在“設置因子”與“設置位點”中均選擇“真核生物”。點擊“查詢位點”按鈕,上傳斑馬魚MIB1基因的啟動子序列,設置“最大矩陣差異率”為0,點擊“提交”進行預測,該數據庫使用的是TRANSFAC 8.3版本。登錄AnimalTFDB網站,點擊“預測TFBS”,在對話框中輸入啟動子序列進行預測,下載預測結果。該網站使用的是動物轉錄因子數據庫4.0版本。綜合結果中的“得分”與“P值”,篩選“得分”≥16且“P值”≤10-6數量級的TFBS,將篩選結果與Alggen網站的預測結果進行合并整理。
1.2.4預測斑馬魚MIB1蛋白與其轉錄因子的作用關系 登錄STRING網站,選擇“多種蛋白質”,將預測得到的TFBS與MIB1蛋白的名稱共同輸至對話框中,物種選擇“斑馬魚”,點擊“搜索”進行預測。
1.2.5GeneMANIA預測斑馬魚MIB1的互作基因 登錄GeneMANIA網站,在主頁物種下拉菜單中選擇“斑馬魚”,并在右側對話框中輸入MIB1基因的名稱進行預測,篩選具有相互作用關系或調節作用的基因信息,需要說明的是該網站預測的信息更偏向GO功能。
1.2.6STRING預測斑馬魚MIB1的互作蛋白 登錄STRING網站,選擇“按蛋白序列”搜索,在對話框中輸入MIB1蛋白序列,同時在“生物”選項中選擇“斑馬魚”,點擊“搜索”。在彈出的網頁中選擇目的蛋白后,點擊“繼續”進行預測,再次通過輸入MIB1蛋白名稱的方式進行預測,將兩次預測結果匯總。
1.2.7斑馬魚MIB1基因的GO與KEGG可視化分析 登錄DAVID網站,在“開始分析”中,將預測得到的互作基因名稱粘貼至“基因列表”中進行富集,下載有關生物過程(BP)、細胞組分(CC)、分子功能(MF)及KEGG中的圖表數據,利用 Fisher檢驗得到P值后進行GO與KEGG可視化分析,繪制直方圖與氣泡圖,并在KEGG富集的圖表數據中,點擊相應鏈接,分析信號通路圖。
2.1斑馬魚MIB1基因及啟動子序列特點 斑馬魚MIB1基因ID為352910,位于2號染色體,全長87 102 bp,包含22個外顯子,其編碼序列共編碼1 040個氨基酸。預測結果顯示,在轉錄起始點上游53 bp處(即啟動子序列第1 448 bp處)存在TATA盒。斑馬魚MIB1基因的5′非翻譯區長度為1 001 nt。
2.2ncRNA預測結果 由于斑馬魚MIB1基因的5′非翻譯區較長,推測有編輯ncRNA的可能性,對此進行了預測驗證,見圖1。結果顯示,“Coding Potential Score”得分為-0.28,“Coding Label”結果為ncRNA。綜合預測結果提示,MIB1基因的啟動子區及5′非翻譯區可轉錄出ncRNA。

注:ORF Length為最長開放閱讀框長度;GC Content為最長開放閱讀框的GC堿基水平;Coding Potential Score中得分大于0為mRNA,小于0為ncRNA,等于0表示轉錄出mRNA或ncRNA的概率相等;Coding Label中“Coding”代表mRNA,“Noncoding”代表ncRNA,Pc為開放閱讀框存在于編碼序列中的可能性,Pnc為開放閱讀框存在于非編碼序列中的可能性。
2.3Alggen網站預測結果 經Alggen網站預測,在斑馬魚MIB1基因啟動子序列中得到86種TFBS,見圖2,圖中已標出各種TFBS及對應的位置,但有重復。通過手動去重后得到76種TFBS,其中AML1、ATF-2、CRE-BP2、DFD、DOF2、EVE、FOXP3、GAGA FACTOR、GT-1、HOXD家族、Oct-B1、MNB1a、P53、POU家族、SXR:RXR-ALPHA等在啟動子區出現的頻率較高。

圖2 TFBS預測結果
2.4AnimalTFDB預測結果 在斑馬魚MIB1基因啟動子區TFBS預測結果中,包含每個TFBS的位置、得分、P值、Q值及相應位點的序列信息,經過篩選并去重后,得到50種TFBS。將該結果與Alggen預測結果合并去重后,得到ABF1、ATF、C/EBP、CREB、CUTL1、DBP、DFD、DMRT3、EVE、FOSL、GA-BF、GAGA factor、GATA、GR、HNF、HOX、HSF1、IRF、JUN、MYB2、NFATC1、NFATC2、NIT2、OCT-B1、P53、PBF、POU、RC2、SQUA、STAT2、TFIID、TGGCA-binding protein、TLL、TRP53、UNC-86、WT1 I、XBP-1、ZFP28、ZNF等共計121種TFBS。
2.5MIB1與轉錄因子的作用關系 P53是抑癌基因TP53的轉錄編碼蛋白,具有轉錄因子活性。通過STRING預測發現,斑馬魚MIB1蛋白只與其轉錄因子P53有互作關系,與其余轉錄因子間無互作關系。有趣的是,作為反式作用因子,P53不僅能與MIB1基因啟動子結合,還可與MIB1蛋白相互作用。見圖3。

圖3 P53因子與MIB1的作用關系
2.6GeneMANIA預測結果 經GenaMANIA預測,共得到20種斑馬魚MIB1的互作基因:ABAT、ACTN2b、ACTN3a、ACTN4、ATP2b4、CSNK2b、CYT1L、DLA、DLC、DLD、EXOC1、EXOC3、FAM76b、HSPA8、LRPAP1、MIB2、TOMM20b、USO1、YAF2、YWHAQA。結果顯示,MIB1基因與ACTN2b、CSNK2b、HSPA8、DLA和DLD基因有共表達的關系,見圖4。經GenaMANIA進一步查詢還發現,MIB1與DLG1基因有共表達的關系,DLG1又可與DLG4b共享蛋白結構域。

圖4 MIB1互作基因的作用關系
2.7STRING預測結果 通過輸入斑馬魚MIB1蛋白序列的方式預測得到11種MIB1互作蛋白,結果見圖5A;再輸入MIB1蛋白名稱,進行預測,結果見圖5B。將兩次預測結果匯總,得到以下20種互作蛋白:DLD、DLA、DLC、ENSDARP00000050857、NOTCH1a、JAG2b、NEURL1b、NEURL1ab、NEURL1aa、LOC566455、MIB、LOC556551、SHROOM4、ABHD3、SHROOM2a、STK3、GREB1Ⅰ、ATOH1b、FTR82、SHROOM1。經分析發現,SHROOM1蛋白分別可與SHROOM2a、SHROOM4、STK3共表達,NOTCH1a與DLA可共表達,見圖6。 但STRING與GeneMANIA的預測結果并不完全是一一對應的關系,前者主要描述蛋白質之間的互作關系,后者更偏向于基因間的互作關系,如共表達、遺傳相互作用和物理相互作用等。

注:圖A為MIB1蛋白序列預測結果;圖B為MIB1蛋白名稱預測結果。

圖6 MIB1互作蛋白共表達關系
2.8斑馬魚MIB1互作基因GO與KEGG分析 通過對MIB1互作基因的GO分析,見圖7A,發現MIB1基因及其互作基因在BP方面具有調控細胞、組織、器官生長分化、NOTCH信號通路及神經元的發生發展等功能。在CC方面,MIB1基因主要在細胞質核周區、細胞膜、頂端連接復合體、細胞骨架和突觸后致密區等部位富集。在MF方面,具有結合NOTCH蛋白和PDZ結構域蛋白等功能。KEGG分析得到4條代謝途徑,見圖7B。

注:A為GO分析;B為KEGG分析。
2.9信號通路分析 除NOTCH蛋白本身,有兩種斑馬魚MIB1互作蛋白(DELTA和SETTATE)直接參與到NOTCH 信號通路中,見圖8,但是在前面的預測中并未發現MIB1與SERRATE有直接的互作關系。為此,通過GeneMANIA分析MIB1與SERRATE的作用關系發現,SERRATE與剪切多聚腺苷酸化特異性因子(CPSF3)、DEAD盒解旋酶(DDX5)、非ATP 酶蛋白酶體26S亞基1(PSMD1)、復制蛋白A2(RPA2)、剪接因子3a(SF3a)具有共表達的關系,且MIB1與上述5種基因都具有物理相互作用關系,MIB1與SERRATE存在間接作用關系。

圖8 MIB1互作蛋白在NOTCH信號通路中的位置關系
ncRNA廣泛涉及不同水平的基因調控,與基因沉默和轉錄后調控密切相關,ncRNA的異常表達常與某些侵襲性病變有關[10]。經預測發現,斑馬魚MIB1啟動子區及5′非翻譯區可轉錄出ncRNA,而這些ncRNA的具體功能尚需進一步探索。
斑馬魚MIB1基因的TFBS的預測結果中得到了121種TFBS,其中包含轉錄因子P53。P53發揮著監控細胞分裂和影響細胞周期啟動的作用。細胞出現損傷后,P53蛋白會阻止DNA復制,并對損傷DNA進行修復。如果P53基因發生突變,會導致機體失去對細胞增殖的控制,引起細胞癌變[11]。分析預測結果發現,P53不僅是斑馬魚MIB1基因的轉錄因子之一,還可與MIB1蛋白相互作用,推測P53可通過這種雙重調控方式抑制MIB1在癌細胞中的過表達[12]。這種方式在P53參與的基因表達調控中并不常見,值得進一步深入研究。通過預測還發現,斑馬魚MIB1基因啟動子區存在IRF 1~3的結合位點。而IRF家族成員是一類重要的轉錄因子,可結合到干擾素基因(IFN)啟動子上,在機體受到病毒感染時IRF可調控IFN基因的表達[13]。據此推測斑馬魚MIB1基因在免疫調節方面發揮一定的作用。
GeneMANIA預測結果顯示,斑馬魚MIB1與MIB2存在互作關系,推測斑馬魚MIB1與MIB2應是相互結合后,介導通路中信息的傳遞。此外,MIB1與HSPA8也存在互作關系。有研究稱,在細胞應激反應中,MIB1可被迅速滅活,導致AZI1、PCM1、CEP290非泛素化[14]。通過進一步查詢發現,MIB1還與HSPA5和HSPA9相互作用。在此過程中,推測MIB1的滅活應該是由熱應激蛋白介導的。此外,經預測發現MIB1還與DLG4b有間接作用關系。DLG4b基因的表達產物為突觸后致密區蛋白 95(PSD95),其對興奮性神經元的突觸強度和可塑性至關重要,與突觸信號傳導、發育和生存密切相關[15]。筆者推測MIB1可能是通過PSD95的介導,進而影響神經系統發育的。
STRING預測結果顯示,MIB1有6種互作蛋白未在實驗中證實,包括ABHD3、GREB1l、LOC556551、SHROOM1、SHROOM2a與SHROOM4。在胚胎發育后期,SHROOM家族蛋白在上皮器官中廣泛表達,可使上皮細胞被拉長,且SHROOM2的異位表達能夠增加細胞長度,而SHROOM2功能缺陷則導致神經上皮細胞伸長失敗,SHROOM家族蛋白對于上皮組織的形態發生起著重要作用[16]。所以,筆者推測SHROOM家族蛋白可能通過介導MIB1影響細胞的形成分化,二者對于細胞分化及胚胎發育至關重要。
GO分析發現,造血干細胞分化這一生物過程所涉及的基因有DLC、NOTCH1a、DLD和MIB1,推測MIB1基因與造血干細胞分化存在一定關系。在MF方面,富集到MIB1的互作蛋白(DLC、DLD)具有與PDZ結構域蛋白結合的功能。PDZ結構域與細胞運輸、各種離子通道、細胞-細胞連接及細胞遷移關系密切,且對神經元信號傳導、記憶和學習至關重要。鑒于其重要的生物學作用,PDZ結構域蛋白被用于開發小分子抑制劑,可作為治療藥物的潛在靶點[17],推測MIB1可能由DLC或DLD介導,與PDZ結構域蛋白發生間接作用,影響細胞進程。
研究表明,MIB1蛋白介導DELTA受體的泛素化,其作為NOTCH蛋白的配體,通過泛素化DELTA胞內結構域,使DELTA受體發生內吞作用,正向調控DELTA介導的NOTCH信號通路[18],而NOTCH信號通路與多種癌癥的細胞轉化和腫瘤發生有關[19]。MIB1還參與NOTCH信號通路調控的許多過程,如胚層的形成、耳中感覺細胞的分化、后腦的神經發生、腸分泌和細胞遷移等,其對早期胚胎的發育至關重要[20]。信號通路分析結果表明,斑馬魚MIB1可能通過與SERRATE的間接作用,從而調節NOTCH信號途徑。
本研究從斑馬魚MIB1啟動子、互作基因、互作蛋白和信號通路入手,由基因表達的上游至下游,系統地探討了MIB1的潛在生物學功能。隨著生物信息學的不斷發展,基因功能的預測將更為精確,可為今后的研究提供更有價值的信息。