李法君
(山東省濰坊科技學院 262700)
啟動子(promoter)是一段位于結構基因5′端上游,提供RNA聚合酶識別和結合的DNA序列,長度因生物種類而異, 一般不超過200 bp。它是典型的順式作用元件,與轉錄因子(反式作用因子)相結合調控基因表達的水平、部位及方式。本文介紹了啟動子的相關知識,以便于全面清晰地認識啟動子。
1.1 原核生物的啟動子 一般長度為20~200 bp,通常由4部分組成[1]:①轉錄起始序列CAT:為轉錄起始位點;②pribnow box(-10區):其共有序列為TATAAT,是 RNA 聚合酶的結合位點;③sextama box(-35區):其共有序列是 TTGACA,是 RNA 聚合酶的識別位點;④間隔區:為pribnow box與sextama box之間的區域,當兩者的中心位置相距16~18 bp時,該啟動子的轉錄功能較強,而當兩者的中心位置之間的距離比這更近或更遠時,起始轉錄的功能均會減弱。
1.2 真核生物的啟動子 根據真核基因編碼的產物和RNA 聚合酶的種類,可把真核生物的啟動子分為三類:rRNA基因啟動子(Ⅰ型)、mRNA 基因啟動子(Ⅱ型)和 tRNA 基因啟動子(Ⅲ型)。 Ⅰ型啟動子和Ⅲ型啟動子結構簡單。Ⅱ型啟動子相對復雜,包括4個主要部位[2]:①轉錄起始位點:其堿基大多為A;②TATA box:為真核生物啟動子的核心元件,其共有序列為TATA(A/T)A(A/T),由富含AT的7個核苷酸構成,它的功能與原核啟動子pribnow box相似,能決定 RNA 聚合酶Ⅱ的位置,控制轉錄起始的準確性及效率;③CAAT box:其共有序列為GGNCAATCT,為RNA聚合酶Ⅱ的一個結合點,控制轉錄起始的頻率;④增強子序列:能提高轉錄的速率。
依據轉錄模式的不同,啟動子可分為:①組成型啟動子:在該類型啟動子控制下,結構基因的轉錄大致恒定在一定水平上,在不同組織、部位表達水平沒有明顯差異,如花椰菜花葉病毒的啟動子;②組織特異啟動子:又稱器官特異性啟動子。在這類啟動子調控下,基因往往只在某些特定的器官或組織部位表達,并表現出發育調節的特性,如煙草的花粉絨氈層細胞中特異表達基因的啟動子;③誘導型啟動子:是指在某些特定的物理或化學信號的刺激下,該種類型的啟動子可以大幅度地提高基因的轉錄水平,如光誘導表達基因啟動子、熱誘導表達基因啟動子、創傷誘導表達基因啟動子和真菌誘導表達基因啟動子等。
3.1 生物信息學預測 啟動子作為調控基因轉錄的重要元件,目前主要是通過生物信息學對其結構特征、轉錄結合位點及其結合因子進行預測。常用的預測軟件包括[3]FirstEF(人的啟動子預測)、BDGP(果蠅的啟動子預測)、BIMAS(真核生物的啟動子預測)、CONSITE(轉錄因子結合位點預測)、TRES(轉錄調控因子分析)、TESS(轉錄因子結合位點預測)、TRRD(真核生物轉錄調控區域分析)、Gene-Regulation(真核生物轉錄因子結合位點預測)和TRANSFAC(真核生物轉錄因子結合位點預測)等。筆者曾借助Gene-Regulation軟件分析了日本沼蝦胰島素樣促雄性腺激素基因的啟動子序列,包括轉錄起始位點和可能的轉錄因子結合位點等[4]。
3.2 酵母單雜交實驗 酵母單雜交技術的基本原理為:真核生物基因的轉錄起始需轉錄因子參與,轉錄因子通常由DNA結合結構域和轉錄激活結構域組成。用于酵母單雜交系統的酵母GAL 4蛋白是一種典型的轉錄因子,GAL 4的DNA結合結構域靠近羧基端,含有幾個鋅指結構,可激活酵母半乳糖苷酶的上游激活位點。GAL 4的轉錄激活結構域可與RNA聚合酶相互作用,提高RNA聚合酶的活性。在這一過程中,GAL 4的DNA結合結構域和轉錄激活結構域可完全獨立地發揮作用。基于此,可將GAL 4的DNA結合結構域置換為文庫蛋白編碼基因,只要其表達的蛋白能與目的基因相互作用,同樣可通過轉錄激活結構域激活RNA聚合酶,啟動下游報告基因的轉錄。例如,Rishmawi等[5]在擬南芥中通過酵母單雜交實驗證實WRKY75 蛋白可與 CAPRICE 基因的啟動子序列結合,調控后者的表達。
3.3 染色質免疫共沉淀(ChIP)分析 ChIP也稱結合位點分析法,其原理是在生理條件下將細胞內的蛋白質與DNA交聯,并在活細胞狀態下固定蛋白質-DNA 復合物,之后再用超聲波將所得的復合物隨機切割成不同長度的染色質片段并沉淀之,最后富集、純化及其鑒定特異性目的蛋白結合的DNA片段,從而獲得蛋白質和DNA相互作用的信息。由ChIP衍生的染色質免疫共沉淀-芯片(ChIP-chip)技術和與第二代測序技術相結合的ChIP-seq 技術是目前在啟動子研究領域應用最廣泛的兩種技術。Lei等[6]在模式生物線蟲中同時運用ChIP-chip和ChIP-seq技術證實,HLH-1蛋白可以與多個基因的啟動子序列的E-box區域結合。
3.4 瞬時轉染法 該方法的原理是通過一定的轉染程序將含啟動子序列(調控區)的質粒導入培養細胞。在正常情況下,調控區會調控“報告基因”的表達。報告基因是一類在mRNA和蛋白質分子中均容易被檢測的基因。含“報告基因”的質粒在培養細胞中轉錄后,可在特定時刻測定其生產的mRNA或相應的蛋白質來評價調控區的活性。所以,瞬時轉染法通常用來測定啟動子轉錄活性的高低。Zi等[7]將豬FUT1基因的5′側翼序列構建到含p-GL3 啟動子的報告基因載體中,進而瞬時轉染 HEK293 細胞,結果顯示啟動子序列的1150~849 bp部分是FUT1 基因的重要調控區。
3.5 凝膠阻滯分析 又稱為電泳遷移率分析(electrophoretic mobility shift assay, EMSA)。其基本原理是:蛋白質與末端標記的核酸探針結合后所形成的復合物的電泳遷移速度比無蛋白結合的核酸探針要慢。該方法可以檢測核酸(DNA或RNA)與結合蛋白的相互作用,已經被用于鑒定啟動子的結合蛋白。Seluk等[8]用 EMSA方法證明轉錄因子Elk1 能夠結合到KATNB1基因啟動子上,促進其轉錄。
4.1 啟動子的甲基化 DNA甲基化是指在甲基轉移酶的催化下,DNA的CG兩個核苷酸的胞嘧啶被選擇性地添加甲基,形成5-甲基胞嘧啶,多見于基因啟動子序列的CpG島。啟動子甲基化調節基因表達的機制可能是啟動子甲基化的區域能夠與DNA 結合蛋白相互結合,通過改變染色質的構象或者占據轉錄因子的結合位點而阻斷轉錄因子與順式元件的結合,從而抑制轉錄的發生。FHIT基因是重要的腫瘤抑制基因。研究表明肺癌中FHIT基因啟動子序列甲基化率明顯高于正常肺組織,提示甲基化抑制FHIT基因的表達可能是肺癌發生的原因之一[9]。
4.2 啟動子的多態性 啟動子的多態性主要是指在基因組DNA水平上由于單個核苷酸的變異所引起的啟動子序列多態性。啟動子多態性調控基因表達的原理可能是:單個核苷酸的變異引起轉錄因子結合位點的改變,進而影響基因的表達,并最終影響生物體的性狀。研究表明,務川黑牛STAT3基因啟動子區存在多個單核苷酸多態性位點;相關性分析表明,A-322G位點對務川黑牛體重有極顯著影響,其中AG基因型的個體表現為更出色的體重性狀[10]。
基因的表達調控是多因素、多層次綜合作用的結果,啟動子作為轉錄調控中心一直是研究的熱點,雖然相關研究已經取得眾多研究成果。但是也應認識到,現有實驗手段和方法的局限性以及不同物種啟動子的復雜性,使得人們還不能十分清晰地了解啟動子。相信隨著新的分子生物學技術的出現,啟動子的功能必然會得到全面的揭示。
(基金項目:山東省高等學校科技計劃項目,No. J16LE59;山東省自然科學基金面上項目,No.2016ZRCM12)