999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

果蠅不同細胞組分轉錄本多樣性

2019-04-09 12:30:54劉秋芳
生物加工過程 2019年2期
關鍵詞:水平分析

劉秋芳,李 華

(上海交通大學生物醫學工程學院,上海200240)

真核生物基因能夠產生大量不同的mRNA產物,例如,在人類已注釋的基因中,每個基因平均能夠產生5個已知的轉錄本異構體,有些基因甚至能夠產生多達80個轉錄本異構體(ensembl release 75)[1]。這些轉錄本異構體是由選擇性轉錄起始、可變剪切以及多聚腺苷酸化等轉錄調控過程的共同作用產生的[2-4]。在動物、植物以及其他真核生物中,通過剪接的方式,將同一個基因的外顯子按照多種組合方式拼接在一起形成許多不同的mRNAs[1]。mRNA的表達水平和對應蛋白的水平并不一致,目前,有很多科研工作人員致力于研究造成這種差異的原因[5-7]。研究人員在人類的研究中發現不同的可變剪切形式對蛋白的翻譯水平有顯著的影響,他們發現結合到多核糖體上的轉錄本異構體的3′UTR序列更短[8]??勺兗羟袑虮磉_的影響目前比較公認的是通過2種方式進行的[8]:一是產生不同的可變剪切轉錄本異構體,從而增加蛋白的多樣性;二是產生包含提前終止密碼子的轉錄本,啟動NMD(nonsense-mediated decay)通路降解該轉錄本,從而降低基因的表達水平。核糖體是蛋白質的加工場所,能夠將mRNA序列通過特定的編碼方式翻譯成蛋白質。以前的研究主要著眼于基因水平上的mRNA豐度與蛋白質水平的關系,而忽視了轉錄本異構體本身與核糖體的結合在翻譯中所起的作用。利用傳統的核糖體圖譜法可以收集并提取與核糖體結合的全長轉錄本,然后對這些與核糖體結合的轉錄本進行測序,可以得到翻譯組數據[9]。通過對細胞質和核糖體結合RNA分別進行測序,可以得到這兩種不同細胞組分的RNA。

本文中,筆者收集果蠅早期胚胎0~4 h的轉錄組(細胞質RNA)和翻譯組(核糖體結合RNA)數據,并通過系統的比較分析來揭示果蠅不同細胞組分轉錄本多樣性。

1 材料與方法

1.1 數據

本文中使用的果蠅早期胚胎0~4 h的轉錄組和翻譯組數據來源于Li等[10]公布的數據。

1.2 方法

1.2.1 高通量數據分析

對于來自果蠅不同細胞組分的高通量測序數據,首先,使用TopHat 2(v2.0.9)分別將轉錄組和翻譯組數據比對到果蠅的參考基因組上去[11]。接下來,使用Cufflinks(v2.2.1)的Cuffnorm模塊,利用唯一比對的數據計算果蠅已知轉錄本的豐度,Cuffnorm計算轉錄本的表達水平時會將比對上參考基因組的reads數轉化為FPKM值(fragments per kilobase of exon model per million mapped reads)[12]。最后,為了驗證數據的可靠性,對來自不同細胞組分的數據進行相關性分析。

1.2.2 主要表達轉錄本分析

首先,為了得到不同細胞組分中主要表達的轉錄本,筆者分別對轉錄組和翻譯組數據進行如下處理:一是刪除低表達的基因,在某一細胞組分中,如果一個基因的任意一個轉錄本的表達值大于1,則在該細胞組分中保留該基因[13],否則刪除該基因;二是計算不同細胞組分中主要表達的轉錄本;三是比較不同細胞組分中主要表達的轉錄本,找出主要表達轉錄本發生改變的基因。其次,對于不同細胞組分中主要表達轉錄本發生改變的基因,根據這些基因在不同細胞組分中主要表達轉錄本的非翻譯區(UTR)和編碼序列(CDS)是否發生變化進行分類。最后,將不同細胞組分中主要表達轉錄本CDS發生變化的基因用DAVID(v6.8)進行功能富集分析[14]。

2 結果與討論

2.1 數據比對結果

為了得到不同細胞組分的轉錄本豐度,首先,使用TopHat 2(--library-type=fr-firststrand -G,其他為默認參數)分別將轉錄組和翻譯組數據比對到果蠅的參考基因組上去。由于測序數據會比對到基因組的多個位置,這些比對結果可能是錯誤的比對,會對后續的分析造成一定的影響,因此,為了提高后續轉錄本豐度計算的準確性,去除掉多比對的數據,后續分析只使用唯一比對(unique mapping),數據結果見表1。由表1可以看到細胞質和核糖體結合RNA數據比對上的比率分別為94.49%和93.55%,唯一比對數據的比率分別為92.05%和90.55%,這說明所選擇的數據具有較高的質量,能夠很好地比對到參考基因組上去,可以用于后續的分析。

表1 比對前和比對后的數據

注:Cyto表示細胞質RNA數據(即轉錄組數據),Poly表示核糖體結合RNA數據(即翻譯組數據)。

2.2 相關性分析結果

為了驗證數據的可靠性,對早期胚胎細胞轉錄組和翻譯組數據進行相關性分析。在相關性分析中,要求轉錄本的表達水平在2個細胞組分中的FPKM都高于1,以減少測序噪音對相關性的影響[13]。利用R語言中的cor.test函數計算轉錄組和翻譯組數據的pearson相關系數,結果見圖1。

由圖1可知:早期胚胎細胞的轉錄組和翻譯組的相關系數為0.85,這說明來自不同細胞組分的測序數據具有很好的相關性,符合預期,因此一定程度上支持了數據的可靠性。

圖1 果蠅0~4 h早期胚胎轉錄組和翻譯組數據相關性Fig.1 Correlation between transcriptome data and translatome data of 0~4 h embryo cell in Drosophila melanogaster

2.3 不同細胞組分主要表達轉錄本分析結果

真核生物的基因表達水平與蛋白水平并不具有完全的一致性,有些基因通過選擇性剪切能夠轉錄得到多個轉錄本,每個轉錄本可能對應著不同的轉錄水平,不同的轉錄本可能具有不同的翻譯效率。Floor等[1]研究發現,即使基因水平的表達豐度不變,在轉錄本水平上發生小小的改變也會對蛋白的水平產生巨大的影響。核糖體是轉錄本翻譯成蛋白質的場所,因此,筆者想要研究是否是細胞質和核糖體結合RNA中轉錄本組成差異造成基因與蛋白表達水平的不一致性。

果蠅已知基因數是17 746個,已知轉錄本數是35 113個,平均每個基因含有2個轉錄本。為了得到不同細胞組分中主要表達的轉錄本,首先分別對果蠅轉錄組和翻譯組數據的基因進行篩選,結果見圖2。

圖2 果蠅早期胚胎不同細胞組分表達的基因重合數Fig.2 Overlap of expressed gene number of different cellular compartments in Drosophila melanogaster

由圖2可知:在轉錄組和翻譯組數據中剩余的基因數分別是7 525個(占所有已知基因的42.4%)和7 525個(占所有已知基因的42.4%),不同細胞組分的基因重合數是7 207個(其中表達2個及2個以上轉錄本的基因數為3 650個,占重合基因總數的50.65%),表明不同細胞組分中表達的基因具有較高的一致性。然后,通過計算和比較分析,在表達2個及2個以上轉錄本的重合基因中找出了主要表達的轉錄本發生變化的基因數766個。接下來,對這些基因按照不同細胞組分中主要表達的轉錄本UTR和CDS是否發生變化進行分類,UTR和CDS的信息來源于Flybase數據庫發布的r6.13版本的果蠅已知注釋信息(ftp://ftp.flybase.net/genomes/Drosophila_melanogaster/dmel_r6.13_FB2016_05/gtf/)[15]。

經分類計算,發現400個基因的UTR發生變化,366個基因的CDS發生變化。最后對CDS發生變化的基因用DAVID進行GO功能富集分析和KEGG通路分析,結果見表2~3。由表2可知,這些基因與蛋白結合(protein binding)、GTP酶激活活性(GTPase activator activity)等分子功能相關。由表3可知,這些基因參與到果蠅早期胚胎背腹軸的形成過程。

以上結果表明,基因在細胞質和核糖體結合RNA中主要表達的轉錄本發生了改變。核糖體是蛋白質的生產場所,這可以在一定程度上解釋蛋白質表達水平和轉錄本表達水平的不一致性。

2.4 討論

筆者收集了果蠅早期胚胎細胞的轉錄組和翻譯組數據,并通過系統的分析展示了不同細胞組分中RNA的組成差異。具體而言,首先利用TopHat 2軟件將轉錄組和翻譯組數據比對到果蠅的參考基因組上,得到不同細胞組分中的轉錄本表達豐度。然后,對于表達多個轉錄本的基因,在細胞質和核糖體結合RNA數據中分別找到其主要表達的轉錄本。最后,對于在2個樣本中都表達的基因,計算了這些基因主要表達轉錄本的組成異同。最終,找到了766個主要表達轉錄本發生差異的基因,這表明在果蠅中大量基因的不同轉錄本的翻譯效率差異可能很大。通過對基因序列特征的分析,將主要表達轉錄本發生變化的基因分為兩類:UTR變化類(400個基因)和CDS變化類(366個基因)。轉錄本CDS的改變意味著編碼得到的蛋白也發生了改變,這可以一定程度上解釋蛋白質表達水平和轉錄本表達水平的不一致性。

由于果蠅的基因與人類的基因存在比較大的同源性,對果蠅胚胎發育的研究成果可以一定程度地應用在人類身上,為了解人類的胚胎發育過程提供一定的依據,因此,對果蠅不同細胞組分轉錄本多樣性的研究是很有價值的。

表2 果蠅早期胚胎細胞中CDS發生變化的基因功能富集分析結果

表3 果蠅早期胚胎細胞中CDS發生變化的基因KEGG通路分析結果

3 結論

筆者對果蠅不同細胞組分轉錄本組成多樣性進行了初步的研究,對CDS發生變化的基因進行功能富集分析和KEGG通路分析,發現這些基因顯著富集到某些分子功能上并在特殊的通路中發揮功能。另外,UTR是序列上的非編碼區域,對轉錄本的翻譯起著重要的調控作用。因此,將來有必要對UTR上的調控元件做進一步的研究。

(責任編輯 荀志金)

猜你喜歡
水平分析
張水平作品
隱蔽失效適航要求符合性驗證分析
作家葛水平
火花(2019年12期)2019-12-26 01:00:28
加強上下聯動 提升人大履職水平
人大建設(2019年12期)2019-05-21 02:55:32
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
老虎獻臀
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
做到三到位 提升新水平
中國火炬(2010年8期)2010-07-25 11:34:30
主站蜘蛛池模板: 在线观看免费黄色网址| 国产精品永久久久久| 国产美女主播一级成人毛片| 91麻豆精品国产91久久久久| 亚洲国产精品日韩欧美一区| 国内精品自在自线视频香蕉| 成年人午夜免费视频| 国产男人天堂| 国产精品天干天干在线观看| 国产成人91精品免费网址在线| 亚洲中字无码AV电影在线观看| 久久久久九九精品影院| 超碰aⅴ人人做人人爽欧美| 在线观看亚洲人成网站| 日韩亚洲综合在线| 波多野结衣无码视频在线观看| 国产欧美日韩综合一区在线播放| 色偷偷一区| 另类欧美日韩| 天天做天天爱天天爽综合区| 日韩在线欧美在线| 77777亚洲午夜久久多人| 免费观看精品视频999| 国产人成午夜免费看| 国产精品香蕉在线观看不卡| 亚洲午夜国产片在线观看| 精品国产免费观看一区| 中文字幕 欧美日韩| a毛片在线免费观看| 国产欧美精品一区aⅴ影院| 中文字幕波多野不卡一区| 67194在线午夜亚洲 | 人妻无码中文字幕一区二区三区| 9啪在线视频| 国产欧美日韩在线一区| 国产精品一区二区久久精品无码| 美女国产在线| 亚洲午夜综合网| 亚洲天堂视频在线播放| 在线永久免费观看的毛片| 国产AV无码专区亚洲精品网站| 亚洲a级在线观看| 福利视频一区| 91精品小视频| 99久久精品免费观看国产| 高清无码一本到东京热| 草逼视频国产| 91精品国产麻豆国产自产在线| 亚洲有无码中文网| 色偷偷男人的天堂亚洲av| 这里只有精品在线播放| 亚洲人成电影在线播放| 国产精品免费p区| 婷婷色丁香综合激情| 免费网站成人亚洲| 国产三级毛片| 国产精品高清国产三级囯产AV| 亚洲高清日韩heyzo| 国产Av无码精品色午夜| 久久激情影院| 国产视频久久久久| 呦系列视频一区二区三区| 另类重口100页在线播放| 青草精品视频| 成年人福利视频| 亚洲成人一区在线| 人与鲁专区| A级毛片高清免费视频就| 国产亚洲高清在线精品99| 日韩在线中文| 99久久精品免费看国产电影| 男女精品视频| 无码丝袜人妻| 欧美三级日韩三级| 精品视频一区在线观看| av大片在线无码免费| 国产精品无码久久久久久| 久久semm亚洲国产| 福利国产在线| 无码久看视频| 国产欧美视频一区二区三区| 一级毛片免费高清视频|