楊潮,戴京,張欣宇,陳慧
贛南師范大學 生命科學學院,江西 贛州 341000
轉錄因子在真核生物基因轉錄調控中發揮重要作用,是真核生物基因表達調控的重要手段之一。人叉頭框蛋白是一類富含轉錄因子且廣泛分布于多種組織細胞中的蛋白家族,最早在果蠅中被發現。該家族蛋白具有多種生物學功能,在胚胎發育、細胞周期調控和生理代謝中發揮重要作用[1-2]。隨著研究的深入,發現叉頭框家族成員表達異常與人體多種疾病的發生密切相關,如卵巢疾病、多種惡性腫瘤等疾病[3-4]。
轉錄因子FoxM1B是叉頭框蛋白家族的一員,具有該家族典型的翼狀螺旋結構[5]。FoxM1B主要通過招募共激活因子和轉錄基本因子共同作用來激活相應的靶基因,在細胞的多種生理和病理活動中發揮作用。在細胞增殖中,FoxM1B可與一系列G2和M期相關基因的啟動子結合并進行調控,促進細胞周期中各時相的轉換[6]。近年來研究發現FoxM1B與癌癥的發生發展密切相關,不僅能夠促進上皮間質轉化(EMT)影響癌細胞的遷移、浸潤和轉移等過程,還與腫瘤耐藥、抵抗化療和患者預后不良相關[7-8]。因此,轉錄因子FoxM1B是癌癥治療的潛在靶基因和藥物靶標。我們利用生物信息學方法,對人轉錄因子FoxM1B的基因及其編碼蛋白的性質、結構和互作網絡進行預測分析,為了解FoxM1B的相關性質和機制提供理論參考依據。
登陸NCBI的GenBank數據庫檢索人(HOMO)的FoxM1B基因,獲得其全長基因序列(Gene ID:2305)和氨基酸序列(NP_001230017),并存為FASTA格式,利用表1所列軟件進行預測分析。

表1 在線生物信息學軟件
人FoxM1B基因全長19 475 bp,位于12號染色體,包括10個編碼區,分別位于1~236、2631~3179、4909~5060、8402~8593、10635~10763、11757~11801、12404~12473、12661~12836、15744~15857、17493~19475,可編碼748個氨基酸殘基,相對分子質量為82 742.10,屬于親水性蛋白。
用3種啟動子分析軟件對人FoxM1B基因5'側翼2000 bp序列進行預測,所得結果存在差異(表2)。Network Promoter Prediction分析發現在人FoxM1B基因5'側翼1543~1593 bp位置存在1個啟動子,分值為0.97。FPROM預測表明在1349 bp存在1個啟動子,1315 bp存在1個TATA盒。Promoter 2.0則預測出人FoxM1B基因啟動子區域有2個,分別位于900和1700 bp,均為臨界性預測。
對FoxM1B基因5'側翼2000 bp進行甲基化CpG島圖譜預測,MethPrimer預測表明在1299~1894 bp存在596 bp的甲基化CpG島,EMBOSS預測出長度為613 bp的甲基化CpG島位于1331~1943 bp(圖1)。2種軟件預測的甲基化CpG島位置存在重疊,所以本次啟動子預測結果具有一定的準確性。

表2 人FoxM1B基因啟動子預測

圖1 FoxM1B基因甲基化CpG島圖譜
由于外顯子剪接的不同,FoxM1基因產生了3個不同的亞型FoxM1A、FoxM1B和FoxM1C,其中只有FoxM1B、FoxM1C具有轉錄活性,而FoxM1A因會導致活性區域的斷裂而不具有轉錄活性。研究多集中于FoxM1B,對轉錄因子FoxM1B的分析將有助于更好地理解人體中的基因表達調控過程及其相應的作用機制,進而為癌癥的研究和治療提供新的理論依據和方案。Protparam預測人FoxM1B蛋白的理化性質見表3。
2.3.1 FoxM1B蛋白親疏水性分析 Protscale計算FoxM1B蛋白質親疏水性分布圖,結果如圖2。用Hphob/Kyte&Doolittle算法分析,橫坐標示氨基酸位置,縱坐標示標度得分,<0表示親水,>0表示疏水,結果顯示親水性肽段分布于整個氨基酸序列,且親水性肽段明顯多于疏水性肽段??傮w分析而言,轉錄因子FoxM1B親水性氨基酸較多,由此推測此蛋白為親水性蛋白。Protparam預測結果顯示其蛋白平均疏水指數為-0.616,說明也有一定數量的疏水性氨基酸,這些氨基酸通過疏水作用聚集到蛋白質顆粒的中間部位,親水部位則分布在外,有利于其在細胞中的穩定性。

表3 人FoxM1B蛋白理化性質分析表

圖2 FoxM1B蛋白親疏水性分析
2.3.2 跨膜區結構預測與信號肽分析 TMHMM 2.0軟件分析表明人FoxM1B不含跨膜區,說明其不是跨膜蛋白(圖3A)。信號肽是分泌性蛋白質多肽鏈中用于指導蛋白質跨膜轉位的N端氨基酸序列,一般由15~30個氨基酸殘基組成。用SignalP 4.1軟件對人FoxM1B進行分析(圖3B),發現所有氨基酸的C值、S值、Y值均遠低于平均值0.5,說明人FoxM1B不含信號肽,為非分泌性蛋白。事實上人FoxM1B作為一個轉錄因子,需要進入細胞核與DNA相應區域結合進而發揮轉錄調控的功能,上述預測結果與這一描述在理論上是相符合的。

圖3 FoxM1B蛋白信號肽和跨膜區預測
采用SOPMA工具對FoxM1B蛋白的二級結構進行預測分析,結果如圖4,不同顏色的豎線表征不同的蛋白二級結構,其中藍色豎線為α螺旋,紅色豎線為延伸鏈,綠色豎線為β轉角,紫色豎線為無規卷曲。FoxM1B蛋白二級結構中含有18.98%的α螺旋、10.56%的延伸鏈和2.41%的β轉角,其余68.05%氨基酸殘基均處于無規則卷曲狀態。無規卷曲為FoxM1B蛋白的主要折疊形式,而α螺旋占比相對較少,可能不利于蛋白質的穩定。
2.4.1 模體預測 模體(motif)是一種蛋白的二級結構,是蛋白中具有特定空間構象和特定功能的結構成分。用NCBI的Conserved Domain Search Service(CD Search)軟件,輸入FoxM1B的氨基酸序列,獲得該蛋白質的模體預測結果,包含翼螺旋結構(FH)和 herpesvirus_ICP4_C super familiy結構(圖5)。翼螺旋結構是其DNA結合區,也是Fox蛋白家族的典型特征。

圖4 FoxM1B蛋白的二級結構

圖5 FoxM1B蛋白的模體結構
2.4.2 結構域與蛋白相互作用網絡 轉錄因子在調控基因轉錄時需要與多種輔助因子相互作用形成復合物共同參與調節,因此分析FoxM1B蛋白互作對指導其功能研究具有重要意義。運用Smart軟件預測的FoxM1B蛋白結構域和相互作用網絡結果如圖6。FoxM1B蛋白234~321位氨基酸殘基對應一個FH結構域;FoxM1B與多種蛋白質相互作用,圖6給出了得分前10位的相互作用蛋白質。
2.4.3 蛋白信息預測 對FoxM1B蛋白信息預測結果見圖7,該蛋白存在9個蛋白結合位點,缺少多核苷酸結合位點,有3個螺旋區域。
2.4.4 蛋白三級結構預測 蛋白質的結構決定其生物功能,因此解析蛋白質高級空間結構有利于對其具體的生物學功能進行分析和理解。運用Swiss-model構建FoxM1B蛋白的三級結構模型,得到3個預測結構模型Model01、Model02、Model03,3個模型的氨基酸序列相似性分別為99.20%、45.83%、43.82%。根據序列相似性的比較,選擇Model01作為FoxM1B的三級結構模型進行后續分析,結果如圖8。在目標模板對準結合性質的質量估計(Global Model Quality Estimation,GMQE)中,所得分值為0.07,處于合理范圍(GMQE:0~1);在綜合計分功能的全局分析和局部模型的質量分析估計(Qualitative Model Energy Analysis,QMEAN)中,所得分值為-0.29,表明該模型與實驗中所得到的結構具有較好的相似性。在三級結構模型中可以明顯看到α螺旋和β轉角相對較少,存在大量無規卷曲,預測結果與用SOPMA軟件預測的蛋白二級結構性質吻合。

圖6 FoxM1B蛋白的功能域預測(A)和相互作用分析(B)

圖7 FoxM1B蛋白信息預測
人FoxM1B基因5'側翼存在轉錄起始位點及啟動子,且啟動子的側翼有1個CpG島。人FoxM1B蛋白包含748個氨基酸殘基,理論等電點8.57,脂肪系數75.24,半衰期30 h,不穩定系數77.76超過40,總平均疏水性-0.616為負值,表明該蛋白是一種不穩定的親水性蛋白。二級結構預測表明FoxM1B蛋白既無信號肽,又無跨膜區域,存在9個蛋白結合位點,缺少多核苷酸結合位點,有3個螺旋區域,無規則卷曲為其主要折疊形式。運用Swiss-model構建FoxM1B蛋白的三級結構模型,表明該蛋白含有1個FH結構域,并可能與一些蛋白存在物理性的相互作用。
目前對于FoxM1B的功能研究多集中于癌癥。研究發現FoxM1B在多種惡性腫瘤細胞和臨床樣本中高表達[9-10],并且通過促進Wnt/β-catenin信號通路活化、抑制細胞周期蛋白依賴性激酶抑制劑等多種途徑,影響周期蛋白或周期蛋白依賴性蛋白激酶的活性,還可通過生長激素來促進癌細胞的增殖,進而誘發腫瘤的惡性生長[11-12]。FoxM1B還被發現可調控上皮標志物(E-cadherin)和間質標志物(Snail、N-cadherin、Slug)的表達,促進肺癌細胞發生上皮間質轉化,進而促進癌細胞的侵襲和轉移,在腫瘤的發生和發展中具有重要意義[13-15]。此外還有研究報道FoxM1B能夠促進Rad51的表達進而增加腫瘤細胞的耐藥性和化療抵抗,成為患者預后差的一個主要因素[8,16]。越來越多的研究表明FoxM1B可以作為癌癥治療的靶點,因此研發FoxM1B的抑制劑成為治療癌癥的有力手段。

圖8 FoxM1B蛋白的三級結構預測
本研究從人FoxM1B基因序列出發,通過生物信息學方法預測分析了人FoxM1B蛋白的性質、結構與功能特征。該部分的工作為進一步探索人FoxM1B的生物學功能提供了一定的依據和線索,奠定了重要的信息基礎。