施宏輝 蒲金定 何建行
lncRNA-CCAT1(CCAT1)是1種異常高表達的lncRNA,具有腫瘤細胞增殖等生物學功能。在結直腸癌,胰腺癌以及HBE等的模型中發現Myc直接結合lncRNA-CCAT1的轉錄調控區對其調節并產生促癌功能[1-3]。CCAT1 的表達上調與其基因啟動子區域的E-box(enhancer box,增強子框)元件直接結合 c-Myc 有關,一旦 E-box 元件發生突變,c-Myc 將不能促進 CCAT1 的表達[1,4-5]。在胰腺癌模型中通過RNA免疫沉淀(RIP)和染色質免疫沉淀(ChIP)測定進行分析發現 c-Myc通過E-box元件的結合對CCAT1表達的產生影響[6]。在結腸癌組織也發現了與 CCAT1 上游調控區域,有E-Box的ChIP峰值信號[2]。
在生物機理方面:c-Myc激活的lncRNA CCAT1表達有助于結腸癌腫瘤發生和轉移過程,甚至可以預測結腸癌的預后臨床結果,極有可能是腫瘤治療的潛在lncRNA靶標[1-2]。
該人類基因組版本于2009年發布,相較于GRCh38版本,有充分的基因注釋信息,因此選取該版本。
ENCODE為國立人類基因組研究中心(NHGRI)聯合國際各研究機構針對DNA調控單元發布的基因注釋數據庫,包括具體調控單元,如何轉錄以及基因如何激活控制細胞生命過程等等[7]。截止2018年,在數據庫發布的中A459細胞ChIP Seq數據庫一共374套。(https://www.encodeproject.org/report/?type=Experiment&status=released&assay_slims=DNA+binding&replicates.library.biosample.donor.organism.scientific_name=Homo+sapiens&biosample_type=cell+line&organ_slims=lung&biosample_term_name=A549&biosample_term_name=A549)本研究對該數據集中的重要數據進行數據挖掘和分析。
(http://genome.ucsc.edu/cgi-bin/hgGateway hgsid=663064805_HeAPAiM3KCvSvSQ9LwpAo8UlZAU0)這是加州大學圣科魯茲分校開發的一款可以可視化基因組注釋數據的瀏覽器,通過該瀏覽器,可以分析基因組位點注釋情況,以便后續的功能實驗。
CCAT1的基因組座位為 hg19 版本DNA的8號染色體chr8:128,219,629-128,231,333,總共跨越約12000bp的基因組區域,轉錄方向為反向,轉錄本包含兩個外顯子。Myc的基因組座位hg19 版本8號染色體chr8:128,748,315-128,753,680 總共跨越 5,366bp,轉錄方向為正向,轉錄本共計3個外顯子。CCAT1與Myc基因間的DNA線性距離約為517Kbp。
該區域功能序列如:LOC727677,POU5F1B,PVT1,TMEM75,MiR1204-1205-1207基因簇等。見表1。

表1 操縱子主要基因列表
ENCODE項目主要是注釋DNA序列的功能信息,在UCSCGenomeBrowser的基因調控單元卡中選取“Regulation”(基因調控)下的“ENC TF Binding”(ENCODE項目的轉錄因子結合位點注釋),http://genome.ucsc.edu/cgi-bin/hgTrackUi hgsid=663064805_HeAPAiM3KCvSvSQ9LwpAo8UlZAU0&c=chr8&g=wgEncodeTfBindingSuper,選取Uniform TFBS,并打開設置A549細胞的ChIP Seq信息,截止2018年一共有319套數據,有些鏡像頁面只提供2012年前約100套數據的整合結果,后續新的數據可以直接下載wig文件,上傳到瀏覽器做數據展示。獲得主要的轉錄因子結合序列區域為chr8:128234833-128235142,主要發現該調控區域的實驗為GR轉錄因子的ChIP Seq實驗。該區域很有可能是Myc結合區域。
H3K27Ac為基因激活的信號區域,在該蛋白結合的DNA位置,招募RNApol2進行轉錄的可能性較大。通過2012~2017年的數據集,在ENCODE官網下載H3K27Ac的ChIP Seq數據[7-8]。其主要數據集為“ ENCSR480OHP”(https://www.encodeproject.org/experiments/ENCSR480OHP/)。經基因組瀏覽器發現:CCAT1 上游染色體DNA區域(CCAT1轉錄方向為負)至Myc上游染色體DNA區域(Myc轉錄方向為正)存在大量離散H3K27Ac信號。表明該操縱單元區域轉錄調控活躍。在CCAT1上游附近的區域,chr8:128,227,795-128,249,933;chr8:128,232,576-128,235,366;chr8:128,229,260-128,238,681;此3個區域的H3K27Ac的ChIP結合信號比較活躍,為CCAT1上游啟動子序列中的轉錄因子結合位點的可能性較大,并起到激活基因轉錄表達的作用[9]。
通過基因組瀏覽器,選取“DNA選項”,輸入結果2.2和2.3發現的4個候選區域DNA,根據轉錄的特性選取反向互補序列(CCAT1轉錄方向為負),①chr8:128234833-128235142;②chr8:128,227,795-128,249,933;③chr8:128,232,576-128,235,366;④chr8:128,229,260-128,238,681。CAC(G/A)TG是Myc作為轉錄因子的核心結合序列模式。通過BlastN方法比對Myc特異性結合的CAC(G/A)TG序列,發現該4個區域都有兩種序列存在。所以該區域很有可能是Myc潛在直接結合區域,并調控CCAT1的轉錄。
當基因處于轉錄活性狀態時,相較于無轉錄活性區域,該染色質區域對DNase(1種內切塊酶)降解的敏感性較強[10]。在轉錄活性基因附近的DNA區域,有一中心區域,稱為超敏感區域(hypersensitive region)或超敏感位點(hypersensitive site),其對DNaseⅠ具有高敏感性。這些位點或區域將首先受到DNaseⅠ的剪切。通過ENCODE數據庫的數據挖掘,可發現TFBS以及H3K27Ac的區域是DNaseⅠ的超敏區域[11]。這也暗示了該區域具有雙向調控CCAT1 和Myc等基因的可能。
本研究采用ENCODE數據庫中的A549的共享ChIP Seq數據進行具體案例的表觀遺傳學分析。數據挖掘和預測Myc調控CCAT1上游啟動子的具體結合位點[6]。CCAT1 是近幾年發現的1種具有促癌作用的lncRNA,在多種腫瘤尤其是消化道腫瘤中異常高表達。Myc可促進 CCAT1基因轉錄,但具體的上下游作用機制有待深入研究[1,6]。本研究可為后續在表觀遺傳層面研究CCAT1上游染色質結構的變化提供理論依據。表觀遺傳突變是對染色體的分子遺傳修飾,改變基因表達而不改變DNA序列情況。所涉及的生命過程是DNA甲基化,組蛋白修飾和染色質重塑。癌細胞的性質中,如腫瘤細胞的異質性和對靶向藥物的耐藥性,并無法完全通過遺傳學規律來解釋[12]。越來越多的致癌的表觀遺傳機理被認為比單純的基因變化更普遍。表觀遺傳的機制可導致抑癌基因的失活,癌基因的活化和/或基因印跡模式的改變,而不發生基因組不穩定性[11]。
Myc基因最初被發現是從宿主細胞基因組獲得的1種癌基因 (v-myc),由1個小組的禽白血病病毒。發現細胞c-myc基因及其直系同源基因(MYCN 和 MYCL) 會受到基因的改變,如擴增,染色體易位,病毒整合,在廣泛的癌癥導致腫瘤發生[12]。在正常細胞中,內源性Myc基因的上調表達可以激活有絲分裂和組織發育等下游信號通路。Myc 蛋白功能作為重要的轉錄因子,多方位調控下游各類基因的表達,在細胞生長和增殖過程中發揮重要作用[12-14]。
本研究綜合過往研究文獻發現CCAT1與臨床病理特征顯著相關提示其可能具有成為1種早期診斷、臨床病理分期和預后判斷水平的腫瘤標志物。而且在多種腫瘤細胞里面發現特異高表達[1,2,14],隨著研究的不斷深入及調控機制的逐步明確、以lncRNA為靶點新型抗腫瘤藥物的研發,CCAT1極有可能成為腫瘤診斷與治療中的1個靶標[14]。在胰腺癌細胞以及結直腸癌模型中,生物信息方法分析發現Myc和CCAT1在基因組中距離不遠。暗示Myc和lncRNA CCAT1可能在同一操縱子中。在HBE(支氣管上皮細胞)的模型中甚至發現了同一區域的Myc,CCAT1和let-7存在負反饋調控的模式。該研究在表觀遺傳學角度論證了Myc和lncRNA CCAT1上游調控序列中E-Box的結合,以及let-7對CCAT1,和let-7調控Myc 基因3UTR(3’端非翻譯區)的模式。但至今仍然未見在非小細胞肺癌中Myc如何調控CCAT1的細節。查閱文獻,總結原因為:①CCAT1現今發表的文章還是偏少(Pubmed,70篇);②現今CCAT1腫瘤學的主流研究還是在lncRNA的表達水平這個領域;③非小細胞肺癌體系中lncRNA的研究還是偏向lncRNA調控靶標分子方面,而在lncRNA的上游調控模式這塊,數據偏少。所以本研究還是結合理論實際,采用生物信息方法分析和數據挖掘,以A549為模型,找到Myc調控lncRNA CCAT1的可能位點,為后續表觀遺傳學方法驗證提供支持,甚至為可能存在的非小細胞肺癌中Myc相關負調控模型以及Myc操縱單元中ceRNA負反饋模型等假說提供支持。
聯合本研究中Myc結合區域的預測結果,提出如下基因調控假說:在非小細胞肺癌模型中Myc轉錄因子通過結合①chr8:128234833-128235142;②chr8:128,227,795-128,249,933;③chr8:128,232,576-128,235,366;④chr8:128,229,260-128,238,681四個區域某個或者某幾個E-box結構元件正向調控CCAT1的表達,使其特異性上調表達;從而進一步影響腫瘤細胞增殖的功能。
本研究為表觀遺傳調控模式預測的前置性探索工作。有報道表明在多西他賽耐藥的肺腺癌中,CCAT1的異常表達可以釋放Bcl-xl,結合miRNA let-7,促進腫瘤細胞的化學耐藥性,而CCAT1的下調則可下調降低化療耐藥性[15]。在乳腺癌的放療模型中,CCAT1的敲低后, miR148a的相關通路被擾動,使得乳腺癌細胞放療敏感性增強[16],這也證明了CCAT1具有復雜多元的促癌功能。在臨床方面,CCAT1上游序列在癌癥特異發生過程的表觀遺傳學的證據可以用來作為識別個體風險的聯合指標,并選擇最佳干預措施。特定癌基因驅動的突變以及相關的代謝和信號通路的變化,可以提供腫瘤檢測,診斷和治療研發的新思路。然而,現只有有限數量的分子標記被納入臨床指南,所以該領域有很大的空白空間[17-18]。CCAT1具有腫瘤治療靶點的潛力,但具體的上游的調控研究仍未展開,這是一個極具價值的科學問題。