韓昂軒,牛辰,呂亮東
復旦大學基礎醫學院醫學分子病毒學教育部/衛生部重點實驗室,上海 200032
G-四鏈體(G-quadruplex,G4)是由富含鳥嘌呤(guanine,G)的核酸序列經折疊堆積所形成的四鏈體螺旋結構。如圖1所示,G-四分體(G-tetrad)作為G-四鏈體的結構單元,是由Hoogsteen氫鍵連接其中的4個G形成的環狀平面,兩層或以上的G-四分體通過π-π堿基堆積作用力形成G-四鏈體[1]。能夠形成G4的DNA序列一般具有以下特征:G3-5NxG3-5NxG3-5NxG3-5,其中G3-5代表3~5個G的串聯重復序列(形成G-tract),Nx代表由1~7個任一堿基組成的間隔序列(形成loop區域)。G4結構可通過圓二色譜等技術進行體外檢測[2]。Lam等利用G4 DNA抗體hf2在癌細胞中分離并檢測到G4[3],證明G4在人基因組中穩定存在。近期研究發現,G4廣泛分布于端粒、啟動子區域等具有重要功能的基因組區域,在外顯子、內含子、3’非編碼區也有G4存在。研究提示,G4結構具有重要的生物學功能,如調控基因表達、影響基因組穩定性、維持端粒長度等[4]。

G-quadruplex structures are based on the stacking of several G-tetrads,which consist each of four guanine bases held together by Hoogsteen-hydrogen bonding,stabilized in the presence of cations (M+) in the central channel of the G4.The sequence motif is G3-5NxG3-5NxG3-5NxG3-5.A G4 motif consists of four runs of at least three guanines (G-tract) per run and separated by other 1-7 bases (Nx).
圖1G-四鏈體示意圖
Fig.1SchematicofaG-quadruplex
牛分枝桿菌(Mycobacteriumbovis,M.bovis)與卡介苗(bacillus Calmette-Guérin,BCG)菌株基因組序列的最大不同是后者出現大的基因組片段丟失,其中RD1區域(包含ESX-1分泌系統的編碼基因Rv3871~Rv3879c)缺失是導致BCG毒力丟失的主要原因之一[5]。espK基因是RD1區域的9個基因之一,編碼的EspK蛋白全長729個氨基酸,富含丙氨酸和脯氨酸,是ESX-1分泌系統組分之一。研究表明,EspK與EspB的分泌有關,是構成結核分枝桿菌Ⅶ型分泌系統的重要蛋白元件。Inwald等比較牛分枝桿菌與結核分枝桿菌H37Rv的EspK同源蛋白序列時,發現GTPITP氨基酸序列的串聯重復多態性[6]。本研究結果顯示,EspK中GTPITP氨基酸重復序列由CCCC串聯重復的間隔核酸序列編碼,其模板鏈上存在G4特征的核酸序列;……