*
(1.西北農林科技大學動物科技學院, 陜西 楊凌 712100;2.貴州工程應用技術學院畢節試驗區研究院, 貴州 畢節 551700;3.西北農林科技大學動物醫學學院, 陜西 楊凌 712100)
早在19世紀80年代就有關于基因可變剪接的記錄[1],而隨著測序技術的成熟,越來越多的基因被發現可以進行可變剪接,這使得人們不得不重新認識基因的表達的蛋白質的多樣性的關聯。隨著越來越多的生物物種中可變剪接被發現,它的作用也越來越重要,弄清它的調控機制成了至關重要的一步,這也是對可變剪接進行利用的前提。研究發現順式作用元件(Cisacting element)和反式作用因子(Trans-acting element)的相互作用調控著可變剪接的發生,而隨著研究的深入,越來越多的因素被牽扯其中。
可變剪接是在轉錄后水平調控基因表達的一種重要機制,它是指由一個共同的RNA前體在剪接體和其他剪接因子的作用下,通過不同的剪接位點產生不同的成熟RNA的過程。基因的可變剪接豐富了基因的表達產物,每個剪接后成熟的RNA在特定的時期、特定的組織器官中表達并發揮其功能,這對于生物體個體的生長發育和細胞的一系列生理過程有著重要意義,同時可變剪接對于蛋白質的多樣化和時空的基因表達調控都具有重要意義[2-3]。
可變剪接在植物和動物細胞中都有發生,剪接的方式也比較豐富,目前主要的方式有以下幾種:內含子保留(Intron retention),主要發生在植物細胞中;外顯子跳躍(Skipped exon ),這種方式主要在動物細胞中有所發現;5’末端可變剪切和3’末端可變剪切(Alternative donor;Alternative acceptor),互斥外顯子剪切(Mutually exclusive exons)等等,在一次可變剪接中,這些方式有時并不是單獨發生,而是幾種方式的組合,經過這些不同的剪接方式的組合可以產生多種具有不同功能的成熟RNA。
剪接體是由5個小核糖核蛋白復合體(snRNAs)U1,U2,U4,U5和U6和50~100種左右非snRNP蛋白組成的一種復合體。它的形成過程是U1和蛋白質相互作用形成一個復合體,然后再結合U2形成剪接體的前體,最后結合上U4、U5和U6就形成了剪接體[4]。前體RNA的剪接過程包括剪接體的組裝、緊連在一起的兩步轉酯反應以及內含子的降解構成。組裝好的剪接體在分支位點處的腺苷酸羥基發生親核攻擊,使剪接位點的磷酸二酯鍵斷裂從而形成兩個剪接的中間體,一個是5’外顯子,一個是包含內含子和3’外顯子的套索狀分子,然后前一種中間體攻擊套索狀分子,使其中的內含子被去除并降解,進而將兩個外顯子連接起來,完成剪接過程[4]。
在前體RNA上存在著特異性的順式作用元件序列,如果能增強剪接的發生,則稱為剪接增強子(Splicing enhancer),反之則稱為剪接沉默子(Splicing silencer),由于它既可以存在于外顯子中,亦可存在于內含子中,所以將它們細分為外顯子剪接增強子和沉默子(Exonic splicing enhancers,ESEs;Exonic splicing silencer,ESSs),內含子剪接增強子和沉默子(Intronic splicing enhancers,ISEs;Intronic splicing silencer,ESSs)。反式作用因子是一類可以和順式作用元件發生特異性的結合來調控剪接發生的強度的蛋白質,目前發現的主要有SR蛋白質家族和hnRNP蛋白質家族以及一些特異性因子。
SR蛋白是一類富含絲氨酸(S)和精氨酸(R)的剪接因子,它包括氨基末端的RNA結合結構域(RNA Binding Domain,RBD)和位于羧基末端的RS結構域(RS domain),目前發現的SR蛋白有SC35、SF2/ASF、SRp20、SRp30等。SR蛋白識別特異的前體mRNA并與之結合的能力取決于它的RBD,RS結構域則通過自身的磷酸化參與了SR蛋白在細胞內的定位以及SR蛋白之間或與其他因子之間的相互作用[5]。SR蛋白通過這兩個結構域與前體RNA特異性序列結合來協助其它的剪接因子與剪接位點的正確結合[6]。
hnRNP又稱解鏈蛋白,目前,發現了A1、A2/B1和D0等家族成員,它們通常也含有不止一個的RBD,其中A1是在真核生物細胞中存在較為豐富的一種,它能通過自身含有的多個RBD與前體RNA特異性結合形成復合物,然后在SR蛋白的幫助在以球狀調節因子的形式來完成選擇性的跨過外顯子,實現調節基因的可變剪接的功能[7-8]。
KH-domain也是一種蛋白質家族,包括了能與高密度脂蛋白(HDL)結合的vigilin等,目前研究較為透徹的KH-domain剪接因子為FMR1(fragile X mental retardation 1),它含有2個KH結構域,在人類的脆性X染色體綜合征的發生中起作用,它依靠自身α螺旋和β折疊形成的loop結構來識別單鏈的RNA,參與RNA 的可變剪接[9]。
有很多內含子和外顯子的剪接是由內含子RNA序列催化的,根據剪接機制的差異,可以將這些內含子分為I型內含子、II型內含子、核mRNA內含子以及tRNA內含子[10],其中前3種內含子的剪接反應是跟RNA的結構緊密相關的, 特別的I型內含子和II型內含子的剪接是自身催化調控的,所以它們又稱為核酶。
I型內含子催化的前體RNA內含子的切除和外顯子的連接是通過兩步連續的轉酯反應來實現的,第一步是識別剪接位點,第二步反應在鎂離子的協助下導致內含子被剪除并將外顯子連接起來[11]。
II型內含子和核mRNA內含子的剪接反應也是通過兩步轉酯反應完成的,其中核mRNA內含子的兩步轉酯反應是由剪接體完成的,通過U1、U2、U4、U5和U6的一系列反應來達到釋放內含子和連接外顯子的目的[11]。
lncRNAs屬于非編碼RNA的一種,研究發現它可以和SR蛋白相互作用來參與可變剪接的調控,它會影響SR蛋白的磷酸化位點,同時它也可以為特定的剪接因子提供結合位點,從而有利于可變剪接的進行[12]。
snRNPs中與前體RNA剪接有關的有U1、U2、U4、U5和U6等,其中U1A的結構研究的較為透徹,它可以通過自身的RBD識別RNA形成的莖環結構并與之相結合而形成復合物,這種識別具有序列特異性和空間立體化學特異性。另一種比較重要的snRNP是進化上有很強保守性的U5,這種特異性的蛋白在分子結構上的某些改變可以為其他剪接因子和RNA提供結合位點,可以和其他剪接因子形剪接復合物,在前體RNA的可變剪接中發揮重要作用[13]。
一定長度的特定DNA片段在組蛋白八聚體上的纏繞方式就被稱為核小體定位,它保證了龐大的基因組能夠儲存在空間有限的細胞內,并且在復制,轉錄等生物活動中起到重要作用。研究表明,外顯子附近的DNA序列更傾向于形成核小體而內含子以及剪接位點附近則排斥核小體的形成,顯然核小體因為其相對致密的結構不利于剪接的發生,所以排斥核小體形成對該區域剪接復合體的形成更為有利,通過這種方式可以抑制或增強剪接的發生[14]。
表觀遺傳是指DNA序列不發生變化而基因表達卻發生了可遺傳變化的現象,而其中所涉及的DNA甲基化和組蛋白修飾可能與基因的可變剪接的調控有一定關聯。DNA的甲基化的程度在外顯子和內含子區域是不同的,這可能影響基因的可變剪接。有研究表明可以通過特定的組蛋白修飾來募集剪接因子從而改變RNA聚合酶的延伸速率進而調控可變剪接[15]。
基因突變可以改變可變剪接的順式作用元件的結構,從而影響剪接因子與它的結合,進而調節基因的可變剪接。突變導致影響可變剪接的類型有以下幾種[16]:核心調控元件缺失,像內含子開頭的GT和結尾的AG這些堿基若發生變化則會導致內含子保留或者外顯子跳躍這2種類型的剪接;產生新的接頭序列,這會導致出現新的剪接位點而使RNA剪接發生錯誤;剪接的調控序列的改變,如增強子和沉默子,一旦它們發生改變,剪接的效率會受到影響。
另外基因的可變剪接和基因的轉錄過程是緊密聯系在一起的,影響基基因轉錄的因素很多也都會波及到基因的可變剪接,所以在可變剪接的調控方面依然有很多需要去繼續研究。
豬的脂肪與肥胖相關基因(Fat mass and obesity associated,FTO)與豬的肌內脂肪( Intramuscular fat ,IMF)含量呈現出顯著相關,而肌內脂肪是評價豬肉品質的重要指標,它反映了肉的口感和多汁性[17],因此研究FTO基因的可變剪接具有實際的經濟意義。黃的團隊[18]通過對藏豬和大白豬的閹割和非閹割公豬FTO基因的研究,在它們的腹脂和背膘中發現了4種新的FTO可變剪接形式。
組織蛋白酶B(Cathepsin B,CTSB)對肌肉中的蛋白質有廣泛的水解作用,產生小的多肽和游離的氨基酸,調節肉制品尤其是腌制火腿的風味[19]。陳等[20]人通過豬的EST序列分析發現了CTSB基因的新的剪接變異體CTSB2,并通過反轉錄PCR和序列分析等實驗技術對其進行了驗證。
這2個基因的可變形式的發現,就可以通過對FTO基因的表達調控來有目的地創造肉質更為鮮美,口感更為優越的肉豬個體作為優良的種畜進行使用,從而有利于肉豬品種的改良。
脂肪細胞的研究不僅在人的肥胖癥中有重要意義,在畜牧生產中的作用同樣也不可忽略,如提高胴體的瘦肉率和增加IMF含量,而這其中對脂肪細胞中的基因可變剪接的研究顯得尤為重要。杜等[21]通過對絨山羊的肌內脂肪細胞轉錄組測序(RNASeq)數據的研究,發現了除了互斥外顯子剪接的其他四種方式,這些發現為研究可變剪接的機制和生物學功能打下了基礎。
綿羊促卵泡激素受體(Follicle stimulating hormone receptor FSHR)是特異性結合FSH從而調控個體繁殖功能的一種蛋白,由FSHR基因編碼。吳等[22]以綿羊卵泡顆粒細胞為材料,克隆 FSHR基因的cDNA片段,并測序分析該基因可變剪接體的種類及序列特征,鑒定出了FSHR基因的除了經典的編碼695個氨基酸的以外的其它6種FSHR,但有趣的是,能表達出蛋白質分子的只有經典的FSHR剪接形式,至于其它剪接形式的生物學功能則有待研究。
可通過基因表達的調控,可以使其定向表達出特定形式,從而提高胴體的瘦肉率和增加肌間脂肪的含量,同時也可培育出繁殖性能更為優越的綿羊品種,為綿羊的育種提供便利。
信號轉導淋巴細胞激活分子家族7(Signaling lymphocytic activation molecule family member7,SLAMFM7)具有調節自然殺傷力細胞((Natural killer cell,NK)的功能,SLAMFM7基因可能通過基因的可變剪接來在奶牛的乳腺炎的抗性反應中發揮功能。鞠等[23]采樣健康和患有乳腺炎的奶牛組織,運用RT-PCR以及測序技術進行研究,通過序列比較在乳腺細胞中發現了3個新的可變剪接形式,它們編碼不同數目氨基酸的蛋白,本實驗中的一種轉錄本在健康和患病乳腺細胞中的表達量與其它研究的結果不一致,可以推測出SLAMFM7基因的可變剪接具有乳腺炎病原菌特異性。
通過對牛不同組織的研究,利用電子克隆和PCR方法成功驗證并發現了NFIX基因存在5種不同轉錄本,并且在不同組織中顯示出表達多樣化的差異,這說明同一基因的不同亞型可能會具有不同功能[24]。他們還研究了3個脂肪沉積相關基因的可變剪接模式,發現3種基因的亞型在細胞中分布不同且有一定區域性,這顯示可變剪接可能影響基因在細胞質中的分布。
牛的乳腺炎一直是產奶業中危害較大的一種疾病,通過對SLAMFM7基因的誘導調控,可以增強奶牛對于乳腺炎的抗性反應,減少奶的損失,而NFIX基因可在脂肪的沉積上起作用,可通過調控表達,使得牛肉含有更多的肌間脂肪,增加其適口性。
鴨是一種重要的經濟型水禽,同時也是實驗研究的一種模式動物。陳等[25]以北京鴨腹部的脂肪組織為材料,通過RNA-seq序列比較等技術手段發現了18464個基因中有15070個發生了35913次可變剪接,82%的可變剪接率低于人類的95%而高于果蠅的60%。
鴨肉的消費也是禽類中重要的組成部分,而鴨肉的適口性決定了它的受歡迎程度,通過對鴨肉脂肪組織中基因的調控,可以使得鴨肉的肉質更為符合目前消費者的要求。
Lipin1基因的表達顯著影響脂肪的沉積,它的正常表達、微表達和超表達都會引起脂肪沉積量的變化。王的團隊[26]通過對烏雞的不同組織lipin1基因表達的研究發現了2種剪接形式:lipin1-α和lipin1-β。
雞肉中脂肪的含量顯著影響雞肉的品質和口感,因此通過調控lipin1-α和lipin1-β2種形式的相對表達量可以生產出符合消費者需求的雞肉產品。
基因可變剪接連接著基因組與蛋白組,是基因表達調控的重要機制,成為了功能基因組時代研究的重點之一。通過對轉錄本和基因組進行測序比較可以發現可變剪接的形式,但隨著研究的樣本越來越多,數據分析的量越來越大,高通量的實驗技術的發展就顯得尤為重要,同時對于調控機制的研究要結合著其它生物過程以一個整體的思路來進行。
在動物的遺傳育種上,上面那些發現的基因的可變形式,有些類型可以促進某種性狀的發生,而通過對基因可變剪接調控機制的使用,可以定向的剪接出人類生產需要的表達類型,這就為品種的改良提供了一條更為高效的方法。無論是在繁殖性能方面,還是生長肥育方面,亦或是抗病力方面,都可以通過基因的可變剪接來提高相應的經濟性狀,使個體具備更為優良的性狀,為品種的改良和提高奠定基礎。如何利用基因的可變剪接來調控基因的表達從而提高畜產品的質量和數量成為一個可行的方案。
[1]Early,P,et al.Two mRNA can be produced from a single immunoglobulin μ gene by alternative RNA processing pathways.Cell,1980,20(2):313-319.
[2]Barmak M,Christopher L.A genomic view of alternative splicing.Nature Genetics,2002,30(1):13-19.
[3]Christopher L'Qi W.Bioinformaticsa nalysis of alternative splicine.Briefings in Bioinformatics,2005,6(1):23-33.
[4]申杰華.釀酒酵母與擬南芥Pre-mRNA剪接位點的比較[J].科技經濟市場,2005(5):14-15.
[5]TACKE R,CHEN Y,MANLEY J L.Sequence-specic RNA binding by an SR protein required RS domain phosphorylation:creation of an SRp40-specic splicing enhancers.Proc Natl Acad Sci USA,1997,94(4):1148-1153.
[6]ELDRIDGE A G,LI Y,SHAROP P A.The SRm160/300 splicing coactivator is required for exon-enhancer function.Proc Natl Acad Sci USA,1999,96(11):6125-6130.
[7]Xu R M,Jokhan L,Cheng X,et al.crystal structure of human UP1,the domain of hnRNP A1 that contains two RNA-recognition motifs.Structure,1997,5(4):559-570 .
[8]Shamoo Y,Krueger U,Rice L M,et al.crystal structure of the two RNA binding domains of human hnRNP A1 at 1.75? resolution.Nat Struct Biol,1997,4(3):215-222.
[9]Walke S,Bragado-Nilsson E,Seraphin B,et al.Stoichiometry of the Sm proteins in yeast spliceosomal snRNPs supports the heptamer ring model of the core domain.J Mol Biol,2001,308(1):49-58.
[10]Cech TR.Self-splicing of group introns.Ann Rev Biochem,1990,59:543-68.
[11]張翼.RNA在RNA剪接中的功能:從催化到調控.生命科學[J],2008,2(20):202-206.
[12]樊搖波,徐昌水,梁尚棟.長非編碼RNA與人類疾病調控機制的研究進展[J].中國藥理學通報,2013,20(12):1629-1633.
[13]吳瑛,赫榮喬.RNA剪接因子結構與功能研究進展[J].生物化學與生物物理進展,2003,30(4):503-508.
[14]陳偉,羅遼復,張利絨,等.核小體定位與 RNA 剪接[J].生物化學與生物物理進展,2006,36(8):1035-1040.
[15]Laurent L,Wong E,Li G,et al.Dynamic changes in the human methylome during differentiation.Genome Research,2010,20(3):320-331.
[16]鄒永新,龔瑤琴.影響RNA剪接的基因變異[J].遺傳,2017,39(3):200-207.
[17]黃金明,劉剛,劉月平,等.豬肥胖相關基因(FTO)剪切體鑒定及其在閹割與非閹割公豬中的表達分析.第十五次全國動物遺傳育種學術討論會論文集,楊凌,2009.北京:中國畜牧獸醫學會,250.
[18]WOOD J D,ENSER M,FISHER A V,et a1.Fat deposition,fatty acid composition and meat quality:A review[J].Meat Sci,2008,78(4):343-358.
[19]Zwicky,R,et al.Exploring the role of 5’alternative splicing and of the 3’-untransiated region of Cathepsin B mRNA.Biol Chem,2003,384(7):1007-1008.
[20]陳主平,陳磊.豬Cathepsin B基因一種新轉錄變異體的發現.第四屆中國畜牧科技論壇論文集,重慶,2009.中國畜牧獸醫學會.241-244.
[21]杜琛,付紹印,高鴻雁,等.絨山羊肌內脂肪細胞成熟前后比較轉錄組分析[J].畜牧獸醫學報,2014,45(5):714-721.
[22]吳陽升,林嘉鵬,蔣香菊,等.綿羊FSHR基因可變剪接體的克隆、鑒定及表達分析[J].江蘇農業學報,2017,33(3):630-637.
[23]鞫志花,王長法,李秋玲,等.奶牛SLAMF7基因在健康牛和乳腺炎牛中可變剪切體的鑒定與表達研究.第十六次全國動物遺傳育種學術討論會論文集,揚州,北京:中國畜牧獸醫學會,2011.
[24]周揚.秦川牛脂肪沉積相關基因篩選及可變剪接對基因表達和細胞定位的影響研究[D].西安:西北農林科技大學,2017:92-98.
[25]陳黎,李國勤,田勇,等.北京鴨腹部脂肪組織的轉錄組特征分析[J].浙江農業學報,2016,28(5):743-747.
[26]王曉可.雞Lipin1基因在不同能量水平飼糧間的表達差異及其mRNA可變剪接形式研究[D].鄭州:河南農業大學,2009.