王 凡,徐世明,古同男,王宏娟
(首都醫科大學燕京醫學院生物化學與分子生物學教研室,北京 101300)
人血紅素加氧酶-1(hHO-1)是一種細胞保護酶,在內體廣泛分布。血紅素可被hHO-1催化降解成膽綠素、CO和亞鐵離子[1]。研究表明,hHO-1與呼吸系統、消化系統、心血管系統、泌尿系統、神經系統等疾病發生、發展密切相關[1-2]。有報道稱hHO-1啟動子區(GT)n雙核苷酸重復多態性與腫瘤關系密切,較短的(GT)n雙核苷酸重復可能對食管鱗狀上皮細胞癌的發生起抑制作用,而較長的(GT)n雙核苷酸重復可能會增加患食管鱗狀上皮細胞癌[2],口腔癌和心血管等疾病[3]的風險。本研究利用生物信息學方法,通過對hHO-1基因啟動子轉錄因子結合位點及CpG島的預測分析,探討hHO-1啟動子區與相關疾病的關系,旨在為今后研究hHO-1的生物學功能及調控機制提供有價值的信息。
hHO-1基因及啟動子序列信息的獲取:美國國立生物技術信息中心(NCBI)數據庫(https://www.ncbi.nlm.nih.gov/)。TATA盒預測網站:Softberry(http://linux1.softberry.com/berry.phtml?topic=tssw & group=programs & subgroup=promoter)。轉錄因子結合位點預測網站:PROMO(http://alggen.lsi.upc.es/cgi-bin/promo_v3/promo/promoinit.cgi?dirDB=TF_8.3),Gene regulation(http://gene-regulation.com/)。CpG島位置預測網站:CpGFinder(http://www.softberry.com/berry.phtml?topic=cpgfinder & group=programs & subgroup=promoter),MethPrimer(http://www.urogene.org/cgi-bin/methprimer/methprimer.cgi)。
1.2.1hHO-1基因及其啟動子序列的獲取
在NCBI中搜索人HO-1基因,進入GenBank獲取hHO-1基因序列。在Sequence text view中選取轉錄起始點上游3 000 bp的序列,將序列上傳至Nucleotide BLAST中進行比對,推測出啟動子序列長度。在Softberry中上傳啟動子序列,預測TATA盒。
1.2.2hHO-1啟動子轉錄因子結合位點預測
登錄PROMO網站,在SelectSpecies選項中選擇Only human factors和Only human sites。點擊SearchSites按鈕,將啟動子序列上傳至對話框中,設置Maximum matrix dissimilarity rate參數為5。登錄Gene regulation網站,選擇AliBaba2.1程序,設置Min mat.conservation參數為80%,上傳序列預測即可。
1.2.3hHO-1啟動子CpG島預測
登錄MethPrimer網站,將Window值設置為200,其他數據為默認值(Obp/Exp=0.6,GC%=50),上傳啟動子和外顯子1及部分內含子1序列進行預測。用CpGFinder預測CpG島時使用默認設置預測即可,具體數值設置同上。
Genbank中顯示hHO-1基因位于22q12.3,包含5個外顯子,登錄號為NC_000022,基因全長13 112 bp,其轉錄出的mRNA全長為1 554 nt,基因蛋白質編碼區(CDS)編碼288個氨基酸。本研究選取轉錄起始點上游3 000 bp以內的DNA序列進行比對。Nucleotide BLAST比對結果顯示,所選取DNA序列的第1 006位脫氧核苷酸與信息庫中hHO-1基因啟動子序列的第1位脫氧核苷酸比對上,可以確定hHO-1啟動子區位于轉錄起始點上游1 995 bp以內,Genebank登錄號為AF145047.1(圖1)。Ⅱ類基因的啟動子一般在轉錄起始位點上游-25~-30 bp附近存在TATA盒,富含AT序列,負責基因轉錄起始位點的定位,是RNA聚合酶的結合位點之一。Softberry預測結果顯示,在hHO-1啟動子序列第1 963 bp處(即轉錄起始點上游33 bp處)存在TATA盒,見圖2。

圖1 hHO-1啟動子區Nucleotide BLAST比對結果

圖2 hHO-1啟動子區TATA盒
2.2.1PROMO預測結果
PROMO 3.0.2預測系統使用的是TRANSFAC數據庫8.3版本,經預測并通過手工去重后得到57種轉錄因子結合位點(圖3),圖中顯示出各種轉錄因子及其與啟動子的結合位置,其中GR-alpha、Pax-5、p53、GR-beta、TFII-I、FOXP3、RXR-alpha、C/EBPbeta、STAT4、TFIID、AP-2alphaA、WT1等轉錄因子結合位點的重復次數較高。
2.2.2AliBaba2.1預測結果
AliBaba2.1在線預測軟件使用的是TRANSFAC 4.0版本,經預測并通過手工去重后得到31種轉錄因子結合位點:AP-1、AP-2alpha、c-Myc、C/EBP、C/EBPalpha、C/EBPbeta、COUP、E1、ER、GATA-1、GLO、GCN4、Hb、HNF-1C、HNF-3、Id3、IRF-1、MEB-1、MyoD、NF-ATc3、NF-1、NF-kappaB、NF-muE1、Pit-1a、RAP1、RAR-alph、Sp1、T3R-alpha、TEC1、USF、YY1。將該結果與PROMO 3.0.2預測結果合并,經去重后共得到79種轉錄因子結合位點:AP-1、AP-2alph、AR、c-Ets-1、c-Ets-2、c-Fos、c-Jun、c-Myb、c-Myc、C/EBP、C/EBPalpha、C/EBPbeta、COUP、E1、E2F-1、Elk-1、ELF-1、ER、ER-alpha、FOXO4、FOXP3、GATA-1、GATA-2、GCN4、GCF、GLO、GR、GR-alpha、GR-betaHb、HNF-1C、HNF-3、HNF-3alpha、Id3、Ik-1、IRF-1、IRF-2、LEF-1、MEB-1、MyoD、NF-1、NF-AT1、NF-ATc3、NF-kappaB、NF-muE1、NF-Y、NFI/CTF、p53、Pax-5、PEA3、Pit-1a、PPAR-alpha∶RXR-alpha、PR-A、PR-B、PXR-1∶RXR-alpha、RAP1、RAR-alph、RAR-beta、RXR-alpha、Sp1、SRY、STAT1beta、STAT4、T3R-alpha、T3R-beta1、TBP、TEC1、TFII-I、TFIID、USF、USF1、USF2、VDR、WT1、WT1 I、WT1-KTS、WT1 I-KTS、WT1-del2、I-del2、YY1。預測結果中包括了兩大類反式作用因子的結合位點。一類是通用轉錄因子(TF),其中TFII作用因子又包含TFIIA、TFIIB、TFIID和TFIIE,這些轉錄因子涉及RNA聚合酶、順式作用元件和反式作用因子的相互作用,參與基因表達調控。第二類是特異轉錄因子,能對基本轉錄因子起增效作用,如SP1轉錄因子與啟動子上GC盒結合后可使轉錄效率提高。
2.3.1MethPrimer預測結果
CpG島主要位于基因的啟動子和第一外顯子區域,是富含CpG二核苷酸的一些區域,約有60%以上的基因啟動子區含有CpG島。CpG島不僅是基因的一種標志,而且還參與基因表達的調控。MethPrimer預測結果顯示hHO-1啟動子區CpG島長307 bp,位于1 857~2 163 bp;跨越啟動子區末端,外顯子1及部分內含子1上游序列,具體細節見圖4。

圖3 PROMO 3.0.2轉錄因子結合位點預測結果

圖4 MethPrimer CpG島預測結果
2.3.2CpGFinder預測結果
在CpGFinder預測結果中同樣也預測到hHO-1存在CpG島,預測結果顯示hHO-1啟動子區CpG島長259 bp,位于1 870~2 128 bp(圖5);同樣跨越啟動子區末端,外顯子1及部分內含子1上游序列,長度略短于MethPrimer的CpG島預測結果。

圖5 CpGFinder CpG島預測結果
hHO-1是一種具有免疫調節活性的防御酶,可被多種因素調控進而影響表達結果[4]。其C端被裂解后,可轉移到細胞核內,參與由氧化應激介導的轉錄調節作用[5]。此外血紅素經hHO-1催化降解的產物分別具有抗炎[6]、抗增殖[7]和促血管舒張活性[8]等作用。目前,關于hHO-1啟動子的研究主要在啟動子多態性與疾病關系方面的研究較多。本研究從hHO-1啟動子轉錄因子結合位點入手,探討其在抗逆方面的潛在作用。
通過在NCBI數據庫中進行檢索比對,獲得了hHO-1轉錄起始位點上游1 995 bp的啟動子區域。Softberry的預測結果與理論情況相符。經預測匯總后共得到79種轉錄因子結合位點。其中有多個轉錄因子已被證明與腫瘤、炎癥、熱應激有關,此外還有些轉錄因子是信號通路里的重要組分。如AP-1轉錄因子結合位點,屬于激活蛋白家族成員結合位點,在生長因子、細胞因子、脅迫、病原菌等因素刺激下,AP-1被活化進而調節基因表達[9]。AP-1在惡性腫瘤及自身免疫病當中也有很重要的調控作用[10]。促氧化因子和促炎因子可刺激AP-1的表達上調,各種損傷性刺激可使AP-1上游的信號分子JNK和ERK分別磷酸化c-Jun和c-Fos,c-Jun和c-Fos被磷酸化后進入細胞核進而形成二聚體,與AP-1轉錄因子結合位點結合啟動HO-1基因表達[11]。因此,hHO-1表現出的多種抗逆作用,可以通過其啟動子含有眾多轉錄因子結合位點來解釋。
NF-κB是二聚體轉錄因子,屬于Rel家族成員。當機體受到損傷性刺激時,NF-κB進入細胞核,與HO-1啟動子上的NF-κB轉錄因子結合位點結合,啟動HO-1基因轉錄,以應對損傷刺激[12]。E26轉錄因子1(ETS1)屬于外轉錄間隔區(ETS)家族成員,ETS主要參與細胞的生長與分化及器官的形成,在人的血管生成過程中起到重要作用。ETS1可促進血管內皮細胞的遷移,在血管內皮受損后修復時ETS1表達量有所上調[13]。轉錄因子ETS1、c-Jun和LEF1能協同作用于孕丸X 受體基因的啟動子區域,并增強該基因的表達[14]。轉錄因子LEF1的功能與ETS1相似,LEF1可促進血管內皮細胞的增殖及其在基質中的侵襲能力[15]。由此可見,一個基因可受到多種轉錄因子的調控,且轉錄因子之間存在協同作用。上述轉錄因子結合位點在hHO-1啟動子區都已預測出來,但ETS1轉錄因子與hHO-1啟動子之間的關系還未見報道,推測hHO-1可能與血管內皮細胞再生有一定關系。此外,在hHO-1啟動子區未證實的轉錄因子結合位點還有多種,如c-Ets-2、c-Myb、ELF-1、GATA-1、Id3、LEF-1、MEB-1、NF-AT1等。在今后的研究中,可通過構建熒光素報告載體的方法證實其他轉錄因子結合位點,為更深入地了解hHO-1基因功能及轉錄調控機制奠定基礎。
DNA甲基化是一種表觀遺傳修飾,可在組織特異性基因表達、X染色體失活、基因組印記、細胞增殖及衰老、胚胎發育等生物學進程中起重要作用。哺乳動物的DNA甲基化主要發生在轉錄起始點附近的CpG二核苷酸胞嘧啶殘基上,即CpG島。一般情況下,正常細胞的CpG島由于被保護而處于非甲基化的狀態。在腫瘤細胞中,抑癌基因的CpG島表現為高甲基化,腫瘤抗原表達缺失,抑癌基因表達下調,最終導致腫瘤發生[16-17]。本研究預測結果顯示,hHO-1基因的CpG島位于啟動子區末端,外顯子1及部分內含子1上游序列,hHO-1表現出的多種功能可能與其CpG島的甲基化狀態有一定關系。針對CpG島序列特點可以設計用于DNA甲基化分析的PCR引物,這還有待今后進一步實驗分析。隨著生物信息學的不斷發展,關于啟動子功能元件的預測將更準確可靠,可為研究基因的功能及轉錄調控提供更多有價值的信息。