夏博策,張凱藝,苗佳坤,彭煥祺,楊 宇,陶 聰,吳添文,王彥芳,楊述林
(中國農業科學院北京畜牧獸醫研究所 動物營養學國家重點實驗室,北京 100193)
富營養飲食和缺乏鍛煉引起的肥胖及相關代謝性疾病,如:2型糖尿病(type 2 diabetes mellitus,T2DM)、代謝性脂肪性肝病、高血壓和心血管疾病等嚴重危害人類健康。動物模型是研究人類疾病的重要手段,相比研究較多的嚙齒類動物,豬與人類的生理特征更相似,更適宜于人類代謝相關疾病的轉化應用研究。已有研究表明,可通過高脂高糖飲食誘導豬模擬人類富營養飲食引起的代謝性疾病發生發展過程,進而探究其分子病理機制。
可變剪接(alternative splicing,AS)是指一個基因的pre-mRNA通過不同剪接方式形成一個或多個成熟mRNA的過程。AS類型主要包括5種,即外顯子跳躍(skipped exon,SE)、內含子保留(retained intron,RI)、外顯子互斥(mutually exclusive exon,MXE)、5′端可變剪接位點(alternative 5′ splice site,A5SS)、3′端可變剪接位點(alternative 3′ splice site,A3SS)。AS普遍發生在基因轉錄過程中,研究表明哺乳動物90%以上的基因可通過AS形成多個可變剪接體,大多數發生AS的基因存在主要可變剪接體,但次要可變剪接體可能會存在不同作用,甚至會引起疾病。已有研究表明,代謝性疾病中的重點基因存在AS,其中瘦素受體(leptin receptor,Lep-R)存在5種可變剪接體,其較長可變剪接體-能夠結合瘦素參與能量動態平衡,而較短可變剪接體-、-和-降解瘦素,減少瘦素信號;胰島素受體(insulin receptor,IR)在人類中存在兩種可變剪接體,可變剪接體-通常存在于胎兒階段,其增加與糖尿病和高血壓相關,可變剪接體-通常存在于成年階段,其在體重減輕時表達量增加。剪接因子(splicing factors,SFs)是一類RNA結合蛋白,參與AS的調控。代謝性疾病相關SFs可被用作疾病的生物標志物和治療靶點,二甲雙胍是一種用于治療T2DM的藥物,可以通過激活和下調來修飾mRNA的AS;剪接因子1可以調控外顯子跳躍,在其小分子抑制劑ABX300作用下可改變三種可變剪接體水平,從而抑制肥胖的發生。綜上表明,AS在代謝性疾病研究中具有重要意義。
目前,對于代謝性疾病的轉錄組大多數分析只停留在mRNA表達水平,然而越來越多的研究提示,AS可能是T2DM等代謝性疾病中的一個重要驅動因素。對于代謝性疾病AS研究,單個基因AS研究較多,而整體AS特征研究少有報道。本實驗室前期通過CRISPR/Cas9 技術將3個人源T2DM和NAFLD疾病風險基因、和3轉入巴馬小型豬內,轉三基因豬表現出糖耐量受損、脂肪組織炎癥、肝炎癥、胰腺脂質浸潤以及胰島肥大等早期代謝性疾病特征,并且與人類代謝性疾病具有高度相似性,成功構建了代謝性疾病易感豬模型。
本研究將基于TG-HFHSD和TG-CD組的脂肪、肝、肌肉和下丘腦組織的RNA-seq數據,鑒定AS事件和分析差異剪接基因(differential splicing genes,DSGs)富集到的功能和信號通路,并著重尋找潛在調控肝代謝相關差異AS事件的SFs,旨在為富營養飲食條件下代謝性疾病早期發生機制解析提供一定的參考。
本研究選用健康狀態、月齡和體重相同的12頭代謝性疾病易感公豬(轉、和3基因豬)作為試驗豬,正常飼料飼喂9個月后,隨機將試驗豬分為兩組,其中8頭試驗豬飼喂高脂高能量飼料(37%蔗糖、53%基礎日糧和10%豬油)2個月作為富營養飲食組(TG-HFHSD),4頭試驗豬飼喂正常飼料2個月作為對照飲食組(TG-CD)。試驗結束后,試驗組平均體重較對照組平均體重高,血清學中TC等部分代謝性疾病相關指標存在顯著差異。動物安樂死后,收集脂肪、肝、肌肉和下丘腦組織樣本,并立即將其置于液氮中保存。本研究中的巴馬小型豬試驗均經中國農業科學院北京畜牧獸醫研究所實驗動物倫理委員會許可(許可證號:IAS2019-12),單欄飼養,每日定時飼喂2次, 自由飲水,溫度16~28 ℃,相對濕度40%~70%。
TRIzol試劑(Invitrogen,美國)法提取TG-HFHSD和TG-CD組試驗豬脂肪、肝、肌肉和下丘腦組織總RNA后,利用NanoPhotometer spectrophotometer儀器(IMPLEN,美國)和Agilent 2100 bioanalyzer儀器(Agilent,美國)檢測RNA純度(OD/OD及OD/OD比值),利用瓊脂糖凝膠電泳檢測RNA完整性(28S、18S、5S三條帶存在,并且28S是18S的兩倍左右)。NEBNextUltraTM RNA Library Prep Kit試劑盒(NEB,美國)進行cDNA文庫構建,Agilent 2100 bioanalyzer(Agilent,美國)對cDNA文庫進行質檢,在北京諾禾致源有限公司Illumina HiSeq X 平臺測序,測序序列讀數(reads)為150 bp。
TG-HFHSD和TG-CD組試驗豬脂肪、肝、肌肉和下丘腦組織的原始測序數據(raw data)經過數據過濾、測序錯誤率檢查、GC含量分布檢查后得到高質量序列數據(clean data)。HISAT2 v2.0.5作為基因組比對工具,將clean data比對到Ensemble數據庫豬參考基因組Sscrofa11.1(網址ftp://ftp.ensembl.org/pub/release-99/fasta/sus_scrofa/)。StringTie(1.3.3b)進行轉錄本拼接,FPKM值作為基因表達水平單位。
rMATS v3.2.3是一種AS分析軟件,主要檢測SE、RI、MXE、A5SS和A3SS五種AS事件,可分析各組織樣品的AS事件以及對應PSI值,并計算組間剪接差異值和矯正值。使用Draw Venn Diagram網站(http://bioinformatics.psb.ugent.be/webtools/Venn/)對組織間和組織內AS基因進行Venn分析,并繪制相關Venn圖。
g:Profiler網站(https://biit.cs.ut.ee/gprofiler/gost)基于Ensemble數據庫,使用網站中的g:GOSt工具可對輸入TG-HFHSD和TG-CD組脂肪、肝、肌肉和下丘腦組織組間DSGs集進行GO功能富集和KEGG通路富集分析,并計算矯正值,篩選顯著富集GO條目和KEGG通路,采用矯正值小于0.05為篩選標準。使用Hipolt網站(https://hiplot.com.cn)中的氣泡圖工具繪制GO和KEGG氣泡圖。STRING網站(https://cn.string-db.org/cgi/input.pl)分析蛋白互作網絡。Cytoscape繪制蛋白互作網絡圖,使用其中的Network-Analyzer功能對網絡進行分析,連接度(degree)大于14的節點被認為是網絡中的樞紐節點。
通過AmiGO2網站(http://amigo.geneontology.org/amigo/landing)和NCBI網站中人和豬基因組功能注釋搜索與AS調控相關基因來獲取SFs。使用DESeq2(1.16.1)軟件分析TG-HFHSD和TG-CD組試驗豬肝組織組間差異表達SFs,計算組間基因表達差異值和矯正值。使用Hipolt網站(https://hiplot.com.cn)中的火山圖工具繪制基因水平SFs火山圖。
使用R語言中皮爾遜相關性檢驗函數cor.test計算差異TG-HFHSD和TG-CD組肝組織組間差異SFs mRNA表達水平FPKM值與組間差異AS事件PSI值的相關性,以<0.001和|r|>0.95為相關性篩選條件。Cytoscape軟件繪制相關性網絡圖,使用NetworkAnalyzer功能對網絡進行分析,連接度(degree)大于14的節點被認為是網絡中的樞紐節點。
根據Ensemble上的22序列(序列號:ENSSSCT00000063346)和1序列(序列號:ENSSSCT00000029403),利用NCBI Primer-BLAST針對其發生AS的位置設計引物U2AF2-P和THOC1-P(兩個基因引物均可產生兩種長度的PCR產物),引物序列見表1。以試驗豬肝組織cDNA 為模板,利用高保真酶2×Phanta@ Max Master Mix(Vazyme,中國)的50 μL體系擴增,高保真酶反應體系(Vazyme,中國):2×Phanta Mix 25 μL,cDNA模板2 μL,正、反向引物各2 μL,ddHO 19 μL;PCR反應程序:95 ℃ 5 min, 95 ℃ 15 s,60 ℃ 15 s,72 ℃ 30 s/kb,34個循環;72 ℃ 5 min。 產物使用1.5%的瓊脂糖凝膠電泳檢測,將不同長度片段分別切膠回收送至北京擎科生物公司進行雙向測序。

表1 PCR引物序列
原始測序數據(raw data)經質檢后得到高質量序列數據(clean data), 平均每個組織樣品clean data 可達8 ~11.45 GB。所有樣品平均GC含量為51.71%,平均Q30大于94%,數據過濾后的clean data可用于后續分析。利用rMATS軟件鑒定AS事件,結果在試驗豬脂肪、肝、肌肉和下丘腦中分別鑒定到48 279、39 536、47 888和52 210個AS事件,分別發生在10 757、9 421、10 023和11 323個AS基因中,平均每個基因發生的AS事件數分別為4.49、4.20、4.78和4.61個,可以發現下丘腦的AS事件和AS基因最多,肝的AS事件和AS基因最少,并且每個基因平均可產生4個以上的AS事件。4種組織鑒定到的5種AS類型中,SE類型事件占比最高,達到77.09%~78.29%,RI、MXE、A5SS和A3SS類型分別為2.28%~2.77%、14.34%~15.26%、1.67%~1.98%、2.97%~3.40%。
通過對AS基因進行venn分析,發現AS基因大部分是4個組織共有的,可達66.77%~80.25%。而各組織特有的AS基因占比較少,僅有3.41%~9.75%(圖1e)。各組織中只發生1種AS類型的基因占發生AS總基因比例為54.59%~56.97%,其中只發生SE類型的基因最多;發生2~4種AS類型的基因占比為42.61%~44.87%,其中SE和MXE類型共發生的基因最多;發生5種AS類型的基因占比為0.42%~0.56%(圖1a-d)。

a.b.c.d.肝、肌肉、脂肪和下丘腦中5種AS類型的基因Venn圖;e. 4種組織總AS基因Venn圖a.b,c,d. The Venn diagrams of the 5 AS types of genes in liver, muscle, adipose and hypothalamus, respectively; e. The Venn diagram of the AS genes of the 4 tissues圖1 AS基因的Venn分析Fig.1 The Venn analysis of AS genes
以<0.05篩選TG-HFHSD和TG-CD的組間DSGs,脂肪、肝、肌肉和下丘腦中分別得到528、1 070、 570和600個DSGs。脂肪組織中鑒定到的SE、RI、MXE、A5SS和A3SS事件分別為346(65.53%)、 28(5.30%)、110(20.83%)、13(2.46%)和31(5.87%)個;肝組織中鑒定到的SE、RI、MXE、A5SS和A3SS事件分別為329(30.75%)、177(16.54%)、471(44.02%)、34(3.18%)和59(5.51%) 個;肌肉組織中鑒定到的SE、RI、MXE、A5SS和A3SS事件分別為390(68.42%)、20(3.51%)、 102(17.89%)、23(4.04%)和35(6.14%) 個;下丘腦組織中鑒定到的SE、RI、MXE、A5SS和A3SS事件分別為448(74.67%)、12(2.00%)、99(16.50%)17(2.83%)和24(4.00%)個(圖2)。各組織綜合比較顯示,除肝以MXE類型為主,其余組織都是以SE類型為主,肝中大幅增加的DSGs主要分布在RI和MXE兩種類型。

圖2 4種組織5種類型DSGsFig.2 5 types of DSGs in the 4 tissues
對TG-HFHSD和TG-CD組的脂肪、肝、肌肉和下丘腦中的DSGs進行富集分析,得出脂肪、肌肉和下丘腦的DSGs主要顯著富集在細胞內解剖結構和細胞器等與細胞組成相關的GO條目。肝DSGs除富集到上述細胞組成相關的GO條目外,還顯著富集到代謝、可變剪接和DNA損傷修復3個方面的GO條目中。代謝相關的GO條目包括,代謝過程、基礎代謝過程、脂質代謝、脂肪酸代謝過程、線粒體、過氧化物酶體、α-氨基酸代謝過程、核糖核蛋白復合物;可變剪接相關的GO條目包括,通過剪接體調控mRNA剪接、mRNA加工的調控、mRNA結合、mRNA代謝過程調控、磷酸核苷代謝過程;DNA損傷修復相關的GO條目包括,DNA損傷刺激的反應、DNA修復調控(圖3a)。KEGG通路顯著富集到代謝、免疫及可變剪接相關的3個方面,其中代謝相關通路包括,代謝途徑、丙酮酸代謝、抗壞血酸和醛糖酸代謝、乙醛酸和二羥酸代謝、脂肪酸降解、過氧化物酶體;免疫炎癥相關通路主要是補體與凝血級聯等;可變剪接相關通路主要是剪接體等(圖3b)。

圖3 肝DSGs的GO和KEGG富集分析Fig.3 GO and KEGG enrichment analysis of DSGs in liver
肝DSGs富集分析中,GO分析富集到代謝過程(GO:0008152)的DSGs有553個,KEGG分析中富集到代謝途徑信號通路(KEGG:01100)的DSGs有152個,兩者進行venn分析獲得579個與代謝相關的DSGs。將579個代謝相關的DSGs進行STRING蛋白互作網絡分析,獲得一個有327個節點和1 114個邊的互作網絡,以連接度(degree)大于14篩選網絡樞紐(hub)基因,主要包括3個方面,一是與剪接調控有關的基因25、3B1、7、17、、;二是與代謝相關的基因、1、1、、2、1、17B4;三是與凝血和纖溶相關的基因2、2、、(圖4)。

圖4 肝代謝相關DSGs的STRING蛋白互作網絡分析Fig.4 STRING protein interaction network analysis of DSGs related to liver metabolism
SFs是調控AS的重要基因。通過AmiGO2網站和NCBI網站中人和豬基因功能富集和注釋查詢到355個SFs。在TG-HFHSD和TG-CD組肝RNA-seq數據中,通過<0.05和|log(FC)|>1篩選得到56個組間mRNA水平差異表達的SFs,其中上調SFs有46個,下調SFs有10個,其中40B上調倍數最高和3下調倍數最低(圖5a);通過<0.05篩選得到49個組間AS水平差異的SFs。將56個mRNA水平差異的SFs與49個AS水平差異的SFs進行Venn分析,存在11個mRNA水平和AS水平都差異的SFs(圖5b),這些兩個水平均差異的SFs可能既可以對其他基因進行剪接調控,又可以對其自身進行剪接調控。

a.SFs的火山圖,圖中已標注出|log2(Fold Change)|>2的基因名稱;b.SFs基本特征:DSG_SF指AS水平差異SFs,DEG_SF指基因水平差異SFsa. The volcano map of SFs, and the gene names with |log2(Fold Change)| > 2 are marked in the figure; b. Basic characteristics of SFs: DSG_SF refers to the differential SFs at AS level, and DEG_SF refers to the differential SFs at mRNA level圖5 肝中SFs的mRNA水平和AS水平分析Fig.5 Analysis of mRNA level and AS level of SFs in liver
將TG-HFHSD和TG-CD組肝組織56個組間mRNA水平表達差異SFs對應的FPKM值與579個代謝相關組間DSGs對應AS事件的PSI值進行皮爾遜相關性分析,以|r|>0.95和<0.001篩選極顯著相關關系,構建了12個重要SFs和222個差異AS事件的相關性網絡圖,其中剪接因子11和是相關性網絡樞紐基因,11和能夠分別與222個AS事件中的119和115個存在相關性,在222個AS事件中,49個事件上調,173個事件下調(圖6a)。12個SFs中的、1、2AF2、25、5、3H13、2A、1、4、1發生了AS,其中2AF2、25、2A、1發生差異剪接。SFs與AS事件的相關性示例中,2、7和2是圖4中STRING蛋白互作網絡中的hub基因(圖6b),說明SFs可能會通過影響關鍵基因來改變肝整體代謝。

a.SFs與AS事件相關性網絡圖:中間菱形圖代表SFs,周圍圓形圖代表AS事件;SFs與AS事件之間的連接線,紅色代表正相關,綠色代表負相關。b.SRSF11和SREK1與AS事件C4BPB-RI、CPB2-MXE、SRSF7-SE和AGXT2-MXE的相關性散點圖:一個AS事件由基因名稱和AS事件類型組成,例如“C4BPB-RI”中,“C4BPB”為基因名稱,“RI”為AS類型a. Network diagram of the correlation between SFs and AS events: the middle diamonds graph represent SFs, and the surrounding circles represent AS events; the connecting line between SFs and AS event, red represents positive correlation, green represents negative correlation. b. Scatter plot of the correlation between SRSF11 and SREK1 and AS events C4BPB-RI, CPB2-MXE, SRSF7-SE and AGXT2-MXE: An AS event consists of gene name and AS event type, for example, in "C4BPB-RI", "C4BPB" is the gene name, and "RI" is the AS type圖6 肝中SFs與代謝相關AS的相關性分析Fig.6 Correlation analysis of SFs and metabolism-related AS in liver
通過半定量PCR驗證代謝性疾病易感豬肝組織中2AF2和1的AS事件(圖7a),DNA雙向測序結果顯示,2AF2存在外顯子2跳躍事件(圖7b),1存在內含子13保留事件(圖7c),分別存在兩個可變剪接體。

a.擴增U2AF2和THOC1兩個可變剪接體以及內參基因18S的瓊脂糖凝膠圖;b.U2AF2兩個可變剪接體反向測序結果;c.THOC1兩個可變剪接體正向測序結果a. Agarose gel image of amplified U2AF2 and THOC1 alternative isoforms and the reference gene 18S; b. Reverse sequencing results of two alternative isoforms of U2AF2; c. The results of forward sequencing of the two alternative isoforms of THOC1圖7 肝AS的PCR驗證Fig.7 PCR verification of AS in liver
目前為止,AS已經被發現40多年,基因通過AS產生多個可變剪接體,使蛋白呈現多樣性,這個過程幾乎參與了機體所有的生理活動。近幾年AS相關研究表明,AS與免疫、肥胖和代謝性疾病之間也存在重要聯系。為探討富營養飲食在代謝性疾病發生過程中對AS和SFs的影響,本研究以代謝性疾病易感豬為材料,進行為期12周的高脂高能量飲食誘導,分析了脂肪、肝、肌肉和下丘腦組織的AS事件,結果顯示4種組織AS總體特征是相似的,SE在總AS事件中占比最高,這與之前豬和雞的研究結果一致;也發現每個基因平均可發生4個以上的AS事件,要高于之前豬睪丸AS研究中的3.67個,可能是因為易感豬體內代謝性疾病高風險基因效應增加了單個基因的AS事件。在發生AS的基因中,大多數基因是4種組織共有的,而各組織特有的AS基因占比較少,也與之前研究一致;發生多種AS事件的基因占比接近一半,并且在多AS事件的基因中SE和MXE共發生的基因占比較多,這可能預示著SE和MXE的發生機制存在某種關聯性。AS差異分析發現,肝在DSGs特征上與其他組織明顯不同,肝組織總AS事件最少,但DSGs最多,并且是以MXE為主,不同于其他3種組織以SE為主的特征,RI也較其它組織顯著增加。
對DSGs進行功能富集分析發現,脂肪、肌肉和下丘腦中DSGs主要顯著富集在細胞結構相關的GO條目,肝DSGs除富集到與細胞結構相關的GO條目外,GO和KEGG還富集到可變剪接及mRNA代謝、脂質代謝、DNA損傷及修復、補體與凝血級聯等過程。有研究發現,高糖飲食能夠引起肝DNA損傷,而DNA損傷反應可調節AS,一些錯誤AS產生的錯誤可變剪接體可被無義介導降解而未被降解,可變剪接體可能被翻譯從而引起疾病。補體與凝血級聯可參與免疫炎癥過程。將肝中代謝相關DSGs進行蛋白互作網絡分析,獲得樞紐基因。這些樞紐基因中,25、3B1、7、17、、是與AS調控有關的基因。2、2、、與凝血和纖溶相關,2是一種凝血酶激活的抗纖溶羧肽酶,2是一種凝血因子,是一種纖溶酶原蛋白,是一種纖維蛋白原。、1、1、、2與線粒體相關,其中可參與催化線粒體脂肪酸β氧化的第一步,也有研究表明其參與肝損傷機制;1是一種線粒體定位的酶,與脂質代謝、T2DM和體重減輕恢復相關。1和17B4與脂肪酸代謝相關,其中1是脂肪酸β氧化途徑的第一個酶,失調會導致小鼠嚴重的微囊性肝脂肪變性和的持續激活,其可變剪接體1b比1a能更有效的調節的穩態,與甘油三酯在肝細胞中積累也有一定關系。結果表明,12周富營養飲食誘導的代謝性疾病易感豬肝組織AS發生了顯著變化,其中DSGs參與了剪接調控、脂代謝、DNA損傷、代謝性疾病以及補體與凝血級聯相關過程。
SFs在AS調控中起著重要作用,在人類胰島素抵抗肥胖患者肝和輕度或晚期代謝性脂肪性肝病患者中都檢測到SFs表達量的改變。本研究在富營養飲食誘導下的代謝性疾病易感豬肝中也發現了mRNA水平表達差異的SFs。參照文獻中SFs與AS事件皮爾遜相關性分析的方法,構建出mRNA 水平差異SFs與代謝相關DSGs相關性網絡。篩選到的重要SFs中,1是一種可自我調節自身AS的基因,并且與糖酵解有關;1與膽固醇代謝調節相關;1表達下降會導致線粒體功能和DNA損傷增加,也可參與促炎過程;3在非酒精性脂肪肝炎(non-alcoholic steatohepatitis,NASH)患者發病機制中可能起重要作用;13參與脂質代謝和高血脂癥相關的代謝綜合征發病;2與肝細胞發育成熟有關,并且與酒精性脂肪肝炎(SAH)相關;-1ɑ與脂質代謝、肥胖、胰島素抵抗和NASH相關;4缺失加劇了高脂誘導的代謝性脂肪性肝病小鼠的肝脂肪變性、胰島素抵抗和炎癥反應,相反,肝4過表達顯著減輕了兩種不同代謝性脂肪性肝病模型的病理改變。可以看出,這些SFs與糖脂代謝、代謝性疾病之間有一定關系,本研究在相關性網絡中篩選到的SFs可能會是調控肝AS并影響肝早期異常代謝的潛在基因。
本研究對富營養飲食條件下代謝性疾病易感豬脂肪、肝、肌肉和下丘腦的AS分布特征進行分析,發現4種組織都可發生AS事件的改變,其中肝改變最顯著,主要是RI型和MXE型的改變;富集分析顯示,肝DSGs主要與剪接調控、脂代謝、DNA損傷以及補體與凝血級聯過程相關;肝差異表達的SFs也會影響糖脂代謝和代謝性疾病發生。綜上表明,AS在富營養飲食引起的肝代謝性疾病中具有重要作用,轉錄組層面的研究應該關注重要SFs通過調控肝AS導致代謝異常的機制,尤其是重要DSGs不同可變剪接體在肝代謝性疾病發生過程中的作用,將為肝代謝性疾病早期發生機制研究提供參考。