999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

轉(zhuǎn)錄組測序技術(shù)的研究和應(yīng)用進展

2019-07-29 02:50:28崔凱吳偉偉刁其玉
生物技術(shù)通報 2019年7期
關(guān)鍵詞:研究

崔凱 吳偉偉 刁其玉

(1. 中國農(nóng)業(yè)科學(xué)院飼料研究所 農(nóng)業(yè)部生物飼料重點實驗室,北京 100081;2. 新疆畜牧科學(xué)院畜牧研究所,烏魯木齊 830000)

轉(zhuǎn)錄組學(xué)是從整體轉(zhuǎn)錄水平系統(tǒng)研究基因轉(zhuǎn)錄圖譜并揭示復(fù)雜生物學(xué)通路和性狀調(diào)控網(wǎng)絡(luò)分子機制的學(xué)科。在高通量測序技術(shù)發(fā)展以前,基于cDNA雜交熒光檢測的高通量基因表達芯片(Expression array)和基因表達系列分析技術(shù)(Serial analysis of gene expression,SAGE)是從整體水平研究動植物組織中基因表達信息的主要手段。

在2008年左右,高通量測序技術(shù)開始應(yīng)用于細(xì)胞和組織中轉(zhuǎn)錄本(主要是mRNA)的種類和表達量的研究,轉(zhuǎn)錄組測序(RNA sequencing,RNA-seq)這樣的名詞開始出現(xiàn)并被廣泛應(yīng)用[1]。與基因表達芯片方法不同,RNA-Seq不僅能夠檢測與現(xiàn)有基因組序列相對應(yīng)的轉(zhuǎn)錄本,并能發(fā)現(xiàn)和定量新的轉(zhuǎn)錄本,對選擇性剪接事件、新基因和轉(zhuǎn)錄本以及融合轉(zhuǎn)錄本的研究更具優(yōu)勢,從而能更加系統(tǒng)地研究轉(zhuǎn)錄組學(xué)。2010年前后,三代測序技術(shù)(單分子測序技術(shù))興起,因其具有測序讀長較長的優(yōu)點,在研究全長轉(zhuǎn)錄本上具有二代測序短reads所不能達到的優(yōu)勢。

隨著測序技術(shù)的發(fā)展和成本的降低,使得核酸的檢測與定量更加便捷和準(zhǔn)確,高通量測序在轉(zhuǎn)錄組學(xué)的研究上越來越普遍,大有替代基因表達芯片的趨勢。運用現(xiàn)有的轉(zhuǎn)錄組研究手段系統(tǒng)、準(zhǔn)確地探究從DNA向RNA轉(zhuǎn)錄這一復(fù)雜而精細(xì)的調(diào)控層次,是揭示生物學(xué)過程中的復(fù)雜性狀和解析轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)的重要方面。

1 高通量測序平臺

1.1 二代測序平臺

20世紀(jì)70年代,第一代測序技術(shù)(Sanger雙脫氧測序技術(shù))的出現(xiàn),實現(xiàn)了對核酸序列進行測序。但Sanger測序法的通量較低,不能滿足大批量測序的要求,難以應(yīng)用在組學(xué)測序的研究中。后來發(fā)展的高通量測序(High-throughput sequencing)技術(shù),即二代測序(Next generation sequencing,NGS)技術(shù),實現(xiàn)了測序的高通量和自動化,加速了轉(zhuǎn)錄組學(xué)研究的快速發(fā)展。目前,二代測序平臺主要包括454 Life Sciences公司推出的454測序技術(shù)、Illumina公司和ABI公司相繼推出的Solexa和SOLID 測序技術(shù)等,其中454測序技術(shù)平臺最早實現(xiàn)商業(yè)化。在過去10年間,Illumina公司的Solexa技術(shù),即邊合成邊測序(Sequencing by synthesis,SBS)技術(shù)發(fā)展迅速,其HiSeq系列的測序平臺逐漸成為二代測序技術(shù)中最被廣泛應(yīng)用的平臺。Illumina/Solexa的測序平臺主要是采用邊合成邊測序(SBS)的方法,此種方法是將提取的核酸片段打斷到幾百bp大小后,加上接頭和測序引物等序列,經(jīng)PCR擴增后建成library,在含有接頭序列的芯片(Flow cell)上對文庫進行反應(yīng),每個反應(yīng)循環(huán)中,標(biāo)記4種熒光染料的堿基通過互補堿基配對被加入到單分子的合成中,這樣通過CCD采集序列上的熒光信號,讀取測序片段的堿基序列。Illumina現(xiàn)有桌面式和生產(chǎn)規(guī)模式兩大類測序平臺(表1),可以滿足中小實驗室以及大規(guī)模平臺的二代測序需求。

1.2 三代測序平臺

三代測序技術(shù)也叫單分子測序技術(shù)(Single molecule sequencing),具有超長讀長(平均讀長10-15 kb,最長讀長可達60 kb)、無PCR擴增偏向性及GC偏好性的特點,被認(rèn)為是進行全基因組de nove組裝、全長轉(zhuǎn)錄本測序及表觀遺傳學(xué)測序的理想測序平臺。PacBio公司的單分子實時測序技術(shù)(Single molecule real time sequencing,SMRT-seq)[2]和Oxford Nanopore Technologies的納米孔單分子測序平臺[3]是目前主流的三代測序平臺。由于三代測序技術(shù)由于在測序時沒有經(jīng)過模板擴增,測序信號的檢測相對于邊合成邊測序的二代測序技術(shù)較弱,容易在堿基識別時產(chǎn)生隨機錯誤。因而PacBio平臺的設(shè)計是對核酸分子進行環(huán)化測序(Circular consensus sequencing,CCS),反復(fù)讀取reads后對堿基序列進行迭代校正,從而有效提高了單分子測序的準(zhǔn)確性[2]。目前,PacBio 公司推出的 Sequel Ⅱ 測序平臺,長序列reads的讀取精確得到進一步提升,平均讀長13.5 kb的長序列reads的讀取精度可達99.8%[4]。

表1 幾種主要測序平臺特點

2 轉(zhuǎn)錄組測序

轉(zhuǎn)錄組測序(RNA-seq)就是利用高通量測序技術(shù)將細(xì)胞或組織中全部或部分mRNA、small RNA和no-codingRNA進行測序分析的技術(shù)。轉(zhuǎn)錄組測序和分析一般流程如圖1所示。目前最常見的轉(zhuǎn)錄組測序是基于二代測序技術(shù),以Illumina的NGS測序平臺為主流。這種方法需要根據(jù)實驗?zāi)康膶NA樣本進行處理,將mRNA,miRNA,lncRNA其中的部分或全部反轉(zhuǎn)錄成cDNA文庫,再利用高通量測序平臺進行測序[1,5]。通常會根據(jù)測序?qū)ο箝L度的不同,在測序建庫的時候會選擇建立不同大小片段的文庫。一般地,進行mRNA 測序,建庫時通常建立幾百bp大小片段的文庫,選擇雙向測序較多;進行miRNA測序時,通常將miRNA進行分離,單獨建立小片段文庫后再進行單向測序;而長鏈非編碼 RNA(long non-coding RNA,lncRNA)存在正向轉(zhuǎn)錄和反向轉(zhuǎn)錄,所以常采用鏈特異性建庫測序。

圖1 轉(zhuǎn)錄組測序和分析流程示意圖

2.1 mRNA測序

對于mRNA測序,利用mRNA在3′端具有poly-A的結(jié)構(gòu)特點,富集出特定組織或細(xì)胞在特定時空條件下轉(zhuǎn)錄出來的不含內(nèi)含子序列的mRNA分子,反轉(zhuǎn)錄成cDNA建庫測序。根據(jù)測序得到的mRNA序列,可以精確地比對至參考基因組序列上,從而判斷外顯子與內(nèi)含子的邊界。對于無參考基因組的物種,通過對序列進行從頭拼接(de noveassembly),得到轉(zhuǎn)錄本具體的序列信息。通過對不同物種、不同發(fā)育階段的不同組織中的轉(zhuǎn)錄組進行研究,可以發(fā)現(xiàn)基因轉(zhuǎn)錄的物種特異性和時空差異的特點,為深入理解物種和性狀的分子機理提供轉(zhuǎn)錄組水平的線索。

2.2 small RNA測序

Small RNA是指長度在20-50 nt的RNA分子,包括miRNA、siRNA、snoRNA和piRNA等,通過參與mRNA降解、抑制翻譯過程、促進異染色質(zhì)形成和DNA表觀修飾等多種途徑來調(diào)控生物學(xué)過程。根據(jù)small RNA 的5′端磷酸基和3′端羥基的結(jié)構(gòu)特點,鏈接測序接頭并篩選small RNA測序文庫進行測序。miRNA在物種間的生物學(xué)功能較為保守,是small RNA測序研究中的重點。Hutvagner等[6]通過small RNA測序鑒定得到miRNA let-7,通過與mRNA不完全匹配發(fā)揮抑制翻譯的作用。

2.3 lncRNA測序

長鏈非編碼RNA(lncRNA)是一類長度在200 nt以上、無編碼蛋白質(zhì)功能的RNA分子,往往具有很強的物種、組織特異性。部分lncRNA位于基因的增強子區(qū)域,通過自身的轉(zhuǎn)錄而實現(xiàn)增強子的功能[7]。lncRNA調(diào)控方式多樣且廣泛存在于各類動植物細(xì)胞中,可以通過參與染色體結(jié)構(gòu)形成以及與轉(zhuǎn)錄因子、蛋白質(zhì)、RNA前體、miRNA結(jié)合等多種方式調(diào)節(jié)各類生物學(xué)分子的功能。部分lncRNA含有ploy-A尾結(jié)構(gòu),因而在mRNA的測序結(jié)果中往往包含部分lncRNA序列信息。目前對于lncRNA的研究,以尋找差異表達的lncRNA分子入手,主要依據(jù)lncRNA與關(guān)鍵編碼基因的位置關(guān)系,進一步預(yù)測兩者之間的調(diào)控關(guān)系。

1) 基于PID控制的參數(shù)為γ1=γ2=0.083,α1=α2=0.21,γ3=0.033,Kr=20。同時對PID控制器進行參數(shù)整定。Kp1=0.5,Kd1=0.002 5,Kd1=8;Kp2=1,Ki2=0.2,Kd2=0。

2.4 circRNA測序

環(huán)狀RNA(circRNA)具有特殊的穩(wěn)定性良好的成環(huán)結(jié)構(gòu),不容易被RNA酶降解,被認(rèn)為在生物體內(nèi)可以長效行使轉(zhuǎn)錄調(diào)控功能。同一段基因組序列可能會產(chǎn)生多種類型的circRNA分子,外顯子和內(nèi)含子的不同剪切組合使得circRNA可能包含多個外顯子或內(nèi)含子序列[8]。circRNA具有吸附miRNA分子的“海綿”作用,介入miRNA對mRNA的調(diào)控過程。circRNA對相同基因組位置上的mRNA轉(zhuǎn)錄有競爭性抑制作用[9],含有外顯子的circRNA還可能開環(huán)并重新翻譯[10]。由于circRNA在生物體內(nèi)穩(wěn)定地行使功能,并具有組織特異性表達模式,與宿主基因表達不太相關(guān),被認(rèn)為在作為相關(guān)疾病的臨床診斷、預(yù)防的分子標(biāo)志物以及藥物治療靶點等方面具有極大的潛力[11]。

2.5 全轉(zhuǎn)錄測序

mRNA的轉(zhuǎn)錄水平受lncRNA、small RNA和circRNA的調(diào)控作用影響,定量分析某個時空的細(xì)胞或特定組織中的生物分子網(wǎng)絡(luò)和調(diào)控途徑時,需要對整個轉(zhuǎn)錄組中全部的RNA分子進行定量和定性的研究。全轉(zhuǎn)錄組測序(Whole transcriptome sequencing)能夠測定樣本中的全部完整的轉(zhuǎn)錄本,主要包括mRNA和非編碼RNA(lncRNA,circRNA和miRNA)。全轉(zhuǎn)錄本測序與常規(guī)RNA-seq的區(qū)別主要是建庫方式的不同。全轉(zhuǎn)錄組測序在建庫過程中需分別建立2個文庫(mRNA+lncRNA+circRNA文庫和miRNA文庫)或3個文庫(mRNA+lncRNA文庫、circRNA文庫和miRNA文庫)。通過全轉(zhuǎn)錄組數(shù)據(jù),不僅可以獲得全部類型轉(zhuǎn)錄本的表達圖譜,在此基礎(chǔ)之上,對不同RNA分子進行鑒定和注釋,分析其編碼蛋白和調(diào)控功能,并對RNA分子之間的互作調(diào)控網(wǎng)絡(luò)進行分析,從整體上全面系統(tǒng)的分析特定細(xì)胞在特定時空下的生物學(xué)特征。

2.6 單細(xì)胞轉(zhuǎn)錄組測序

Eberwine 等[12]和 Brady等[13]分別開發(fā)了通過體外轉(zhuǎn)錄線性擴增和PCR指數(shù)擴增單個細(xì)胞的互補DNA(cDNAs)技術(shù),這類技術(shù)與高通量測序技術(shù)結(jié)合,衍生出了單個細(xì)胞內(nèi)轉(zhuǎn)錄本測序技術(shù)(single cell RNA-seq,scRNA-seq)。單細(xì)胞轉(zhuǎn)錄組測序技術(shù)是在單細(xì)胞水平研究整個轉(zhuǎn)錄組的技術(shù),用于評估單個細(xì)胞間基因表達的差異,能避免細(xì)胞類型混雜而引入的假陰性結(jié)果,有可能識別出無法通過混合細(xì)胞檢測到的罕見的細(xì)胞群體。目前常見的單細(xì)胞測序平臺包括Fluidigm、WaferGen、10×Genomics、和Illumina/Bio-Rad等測序平臺。與其他RNA測序技術(shù)不同,scRNA-seq需要首先分離并獲得單個細(xì)胞內(nèi)的全部轉(zhuǎn)錄組。單細(xì)胞分離是scRNA-seq的關(guān)鍵步驟,主要通過連續(xù)稀釋、顯微操作分離、熒光激活細(xì)胞分選(Fluorescence-activated cell sorting,F(xiàn)ACS)和微流控分離(Microfluidic technology)等技術(shù)實現(xiàn)。2009年,Tang等[14]首次報道利用scRNA-seq技術(shù)來鑒定早期發(fā)育階段的不同類別細(xì)胞。

3 轉(zhuǎn)錄組測序文庫的構(gòu)建

進行轉(zhuǎn)錄組測序時,提取樣本中總RNA后,去除rRNA,對目標(biāo)RNA分子富集后進行測序文庫的構(gòu)建。測序文庫,分為非鏈特異性文庫(Non-strandspecific library)和鏈特異性文庫(Strand-specific library)兩種。非鏈特異性文庫是指,RNA逆轉(zhuǎn)錄成雙鏈cDNA,隨機加上接頭、不區(qū)分RNA的鏈的信息的文庫。測序時以雙鏈cDNA進行測序,無法區(qū)分mRNA的轉(zhuǎn)錄方向(圖2-A)。鏈特異性文庫可以分為2類,一種以化學(xué)修飾標(biāo)記一條鏈,比如通過重硫酸鹽處理RNA分子(圖2-B),或者在第二鏈cDNA合成時引入dUTP(圖2-C),然后降解含有U的鏈;另一種是以不同接頭連接RNA分子或合成cDNA鏈的5′和3′末端,來區(qū)分正反義鏈(圖2DH)。Levin等[15]對不同類型的鏈特性文庫的復(fù)雜性、均勻性和覆蓋連續(xù)性進行評價,并與已知基因組注釋和表達譜的基因定量進行比較,再結(jié)合實驗操作和計算的簡便性,認(rèn)為dUTP第二鏈標(biāo)記的方法和Illumina RNA ligation方法效果較好。

在轉(zhuǎn)錄組測序時,區(qū)分RNA分子鏈的來源能夠避免基因反義鏈上的reads的干擾,能夠提高基因轉(zhuǎn)錄本鑒定和轉(zhuǎn)錄本定量的精確性。利用轉(zhuǎn)錄組數(shù)據(jù)進行從頭拼接時,有助于劃分轉(zhuǎn)錄本的邊界,確定轉(zhuǎn)錄本的正義鏈信息。

4 轉(zhuǎn)錄組數(shù)據(jù)處理流程

轉(zhuǎn)錄本測序數(shù)據(jù)用于比較不同組別之間基因水平或轉(zhuǎn)錄本水平的定量差異時,其分析基本流程包括原始數(shù)據(jù)預(yù)處理、reads比對、轉(zhuǎn)錄本組裝、新轉(zhuǎn)錄本預(yù)測、轉(zhuǎn)錄本表達水平分析等步驟。后續(xù)根據(jù)實驗的目的,可進一步分析實驗組與對照組之間的轉(zhuǎn)錄本表達差異情況,樣本之間基因表達模式聚類,以及和其它組學(xué)數(shù)據(jù)進行聯(lián)合分析等。其中,轉(zhuǎn)錄本組裝是根據(jù)read比對的結(jié)果來識別樣本中所有表達的轉(zhuǎn)錄本。如果沒有可用的參考基因組序列,則可以直接使用從頭組裝方法執(zhí)行此過程。一旦確定了所有轉(zhuǎn)錄本,就可以根據(jù)比對至轉(zhuǎn)錄本序列上的reads數(shù)目估計基因的表達豐度,進而在分組樣本之間計算差異表達轉(zhuǎn)錄本并分析轉(zhuǎn)錄本表達情況與分組設(shè)計之間的生物學(xué)關(guān)聯(lián)。

4.1 原始數(shù)據(jù)預(yù)處理

獲得的二代測序原始數(shù)據(jù)后,需要對數(shù)據(jù)質(zhì)量進行評估并進行質(zhì)量控制(Quality control,QC),評估內(nèi)容包括數(shù)據(jù)產(chǎn)出量、GC含量、rRNA含量、堿基質(zhì)量分布和重復(fù)序列等。將其中低質(zhì)量的reads和接頭序列等去除,得到質(zhì)控后的clean data用于后續(xù)分析。常用的質(zhì)控軟件有Trimmomatic[16]、RSeQC[17]、FASTX(http ://hannonlab.cshl.edu/fastx_toolkit/)、Trim Galore(https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/)等。以常用的Trimmomatic軟件為例,對于雙段測序的Illumina格式的rawdata,其默認(rèn)處理參數(shù)為“ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW :4:15 MINLEN:36”,ILLUMINACLIP:TruSeq3-PE.fa:2:30:10含義是根據(jù)TruSeq3-PE.fa文件中的測序接頭序列信息過濾原始數(shù)據(jù)中的測序接頭和引物序列,允許最大錯配堿基數(shù)為2,plindrome clip閾值為30,simple clip 閾值為10,根據(jù)這三個值的設(shè)定來判斷接頭序列與read的比對程度;LEADING:3,從序列開頭去除堿基質(zhì)量低于3的堿基;TRAILING:3,從序列結(jié)尾去除堿基質(zhì)量低于3的堿基;SLIDINGWINDOW:4:15,設(shè)置4 bp窗口,堿基平均質(zhì)量值閾值為15;MINLEN:36,若質(zhì)控后read長度小于36 bp則丟棄此條read。QC后得到的數(shù)據(jù)稱為clean data,用于后續(xù)的數(shù)據(jù)分析。

圖2 幾種類型文庫的構(gòu)建流程示意圖

4.2 reads比對

轉(zhuǎn)錄組數(shù)據(jù)主要來自基因組的外顯子序列,將測序獲得的轉(zhuǎn)錄組reads比對至基因組序列上,會被內(nèi)含子序列隔斷。應(yīng)用于轉(zhuǎn)錄組數(shù)據(jù)的比對軟件, 常 用 的 有 bowtie[18],bowtie2[19],STAR[20],HISAT/HISAT2[21]等。這類軟件適用于轉(zhuǎn)錄組reads的分割并比對至參考基因組序列。BWA[22]軟件的比對算法被認(rèn)為對于分割比對不敏感,因而不適合用于RNA序列與含有內(nèi)含子序列的基因組序列之間的比對。

4.3 轉(zhuǎn)錄本組裝

4.4 轉(zhuǎn)錄本預(yù)測

大多數(shù)基因有多種剪接形式,且有可能產(chǎn)生多種轉(zhuǎn)錄本,從而編碼產(chǎn)生不同的蛋白,這樣有可能造成一個基因有多種功能。對轉(zhuǎn)錄本測序數(shù)據(jù)進行拼接和組裝后,不僅會得到已知的轉(zhuǎn)錄本信息,也會得到新的轉(zhuǎn)錄本序列,需要對新的轉(zhuǎn)錄本進行鑒定和注釋,特別是之前研究較少的新的ncRNA轉(zhuǎn)錄本。

對于有參考基因組和轉(zhuǎn)錄本參考信息的物種,轉(zhuǎn)錄本結(jié)構(gòu)主要是根據(jù)測序得到reads進行比對,reads覆蓋了全部的轉(zhuǎn)錄本序列,依靠基因組序列組裝出完整的轉(zhuǎn)錄本信息。對于無參考基因組的物種,需要自行組裝出基因的轉(zhuǎn)錄本序列。得到的基因或轉(zhuǎn)錄本序列可以與同物種或近源物種的unigene和EST數(shù)據(jù)庫進行比較,以判斷得到的基因或轉(zhuǎn)錄本序列的可靠性。這一過程中常用blast方法進行比對,快速鑒定序列之間的相似度。在新的lncRNA的鑒定分析中,一般是根據(jù)lncRNA分子特性,在轉(zhuǎn)錄組數(shù)據(jù)中提取外顯子總長>200 nt的轉(zhuǎn)錄本,然后根據(jù)開放閱讀框預(yù)測和與已知的蛋白數(shù)據(jù)庫進行比較,從而進一步將lncRNA從mRNA中分離出來。

4.5 轉(zhuǎn)錄本表達水平分析

將reads比對到相應(yīng)的基因組位置或從頭組裝出轉(zhuǎn)錄本后,得到每個基因或轉(zhuǎn)錄本上的reads數(shù)在一定程度上可以反映其表達豐度。由于樣本間的數(shù)據(jù)總產(chǎn)出量、樣本間基因表達數(shù)目、樣本內(nèi)不同基因長度甚至是同一個基因內(nèi)部不同轉(zhuǎn)錄本分布都可能存在明顯差異,在不同樣本之間對于同一個基因或轉(zhuǎn)錄本的表達量進行比較時,則需要對于樣本間的數(shù)據(jù)進行歸一化處理[29]。處理后的轉(zhuǎn)錄本表達量一般以RPKM(Reads per kilobase per million mapped reads)、FPKM(Fragments per kilobase per million mapped reads) 或 TPM(Transcripts per million) 這3類數(shù)值表示。RPKM針對早期的SE測序,F(xiàn)PKM則是在PE測序上對RPKM的校正,且應(yīng)用于雙段測序的RNA-seq分析中。對于單端測序結(jié)果,基因的RPKM與FPKM值相等。TPM以轉(zhuǎn)錄本條數(shù)代表每個轉(zhuǎn)錄本的表達量,當(dāng)樣本之間表達的基因綜述差異很大的時候,TPM值比FPKM值更能代表轉(zhuǎn)錄本的表達量。Cufflinks[30]、DESeq/DESeq2[31-32]、EDGR[33]等軟件可用來進行表達量的確定。另外在進行不同樣本之間的基因表達量比較分析時,依據(jù)實驗設(shè)計利用統(tǒng)計學(xué)方法檢驗實驗組與對照組之間的差異基因。由于同時對成千上萬的基因進行統(tǒng)計檢驗,因而需要考慮多重檢驗引入的假陽性升高,因而常用FDR等多重檢驗校正的方法對比較分析的顯著性進行校正。

scRNA-seq中基因表達量確定與常規(guī)RNA-seq數(shù)據(jù)處理思路一致,但由于scRNA-seq的產(chǎn)出數(shù)據(jù)中一般噪音較大,并且有大量的空值(Dropouts),在基因表達矩陣中超過50%的基因為空值也很常見,因而需要使用填充算法進行數(shù)據(jù)的修正[34-35]。對于scRNA-seq空值的解釋,除部分基因本身在該單個細(xì)胞中不表達,還可能是因為一些基因表達量較低或者是測序深度不夠,導(dǎo)致在實驗中未被檢出[34]。在數(shù)據(jù)分析中,需要謹(jǐn)慎對待空值,根據(jù)細(xì)胞-細(xì)胞、基因-基因之間關(guān)系對空值進行推斷。推斷scRNA-seq中的技術(shù)噪聲比較困難,單個細(xì)胞之間的測序結(jié)果屬于生物學(xué)重復(fù)而不能用于推斷技術(shù)重復(fù)偏差。

4.6 變異檢測

分析轉(zhuǎn)錄組測序數(shù)據(jù),可以獲得樣本的全部轉(zhuǎn)錄本的序列信息,包括轉(zhuǎn)錄本上全部的SNP和Indel等突變類型。轉(zhuǎn)錄生成的RNA分子在翻譯之前可能會經(jīng)歷多種修飾[36],如A-to-I的RNA編輯過程,從而進一步增加轉(zhuǎn)錄組的復(fù)雜性。分析轉(zhuǎn)錄本中的突變信息,可以捕獲基因從DNA向RNA轉(zhuǎn)錄中修飾過程,從而探究轉(zhuǎn)錄過程中復(fù)雜的調(diào)控機制。SAMtools[37]、BCFtools[38]和 GATK[39]等軟件可用來檢測轉(zhuǎn)錄組中相關(guān)的變異。

5 RNA-seq的應(yīng)用

5.1 確定基因的表達模式

RNA-seq技術(shù)使得研究整個轉(zhuǎn)錄組中基因表達情況更為快速和容易,對于有參考基因組的物種或無參考基因組的物種,采取不同的分析策略,即可高效地獲得某一特定狀態(tài)下細(xì)胞或組織中的全部轉(zhuǎn)錄本信息,進而研究不同組織器官或發(fā)育階段之間的基因表達模式差異。另外,隨著轉(zhuǎn)錄組測序數(shù)據(jù)的積累,從而建立起各類轉(zhuǎn)錄組數(shù)據(jù)庫,這些信息的積累為后續(xù)進一步研究特定生理條件下的轉(zhuǎn)錄本種類和表達量、轉(zhuǎn)錄本之間互作以及轉(zhuǎn)錄調(diào)控研究等提供參考。例如,基于RNA-seq數(shù)據(jù)建立起來的擬南芥的基因表達譜數(shù)據(jù)庫TraVA(http://travadb.org/),包含了79個樣本的25 706個蛋白質(zhì)編碼基因,可以提供不同器官和發(fā)育階段之間的基因表達譜和差異表達基因的研究[40]。基于miRNA-seq建立的miRBase數(shù)據(jù)庫收錄了200多個物種的數(shù)萬條miRNA信息,可用于進行miRNA注釋和比較[41]。

5.2 用于發(fā)現(xiàn)新轉(zhuǎn)錄本

基于NGS技術(shù)的轉(zhuǎn)錄組測序,通過拼接算法可以獲得完整的轉(zhuǎn)錄本序列,但對于存在多個可變剪接形式的基因,不同轉(zhuǎn)錄本之間的識別仍然存在困難。單分子測序技術(shù)應(yīng)用于轉(zhuǎn)錄組測序,可以用測序讀長較長的優(yōu)勢直接獲得完整的轉(zhuǎn)錄本序列,不再需要對于NGS短的reads進行組裝,可以準(zhǔn)確獲得不同可變剪接的轉(zhuǎn)錄本序列和表達量[42]。Wang等[43]利用 Pacbio Isoform Sequence(Iso-seq)平臺分析鑒定玉米和高粱的異構(gòu)體,發(fā)現(xiàn)超過40%的轉(zhuǎn)錄本具有新穎和多種多樣的剪接方式。

5.3 非編碼RNA的調(diào)控機制

非編碼RNA不能形成蛋白產(chǎn)物,但其在生物學(xué)過程中發(fā)揮著不可忽略的重要的調(diào)控功能。近年來,通過NGS技術(shù)和RNA-seq在各種細(xì)胞和組織中發(fā)現(xiàn)了大量的ncRNA,它們的類型和表達量,往往反映了物種特征以及特定生理狀態(tài)。特別在動植物育種、抗病和環(huán)境適應(yīng)性的研究中,ncRNA的作用越來越受到重視。在擬南芥中,病原菌侵染過程中可以激發(fā)一些小RNA,在相應(yīng)的通路中發(fā)揮作用,最終增強植物抗病性。Zhao 等[44]通過對擬南芥進行轉(zhuǎn)錄組的測序,研究lncRNA表達譜,從鑒定出的6 510個lncRNA中進一步分析了影響開花的lncRNA及其作用機理。Ré等[45]通過對低溫環(huán)境中的擬南芥種子進行miRNA測序,鑒定出低溫狀態(tài)下獨立于HYL1/SE產(chǎn)生的特定miRNA,分析其與低溫環(huán)境適應(yīng)性的聯(lián)系。

5.4 單細(xì)胞轉(zhuǎn)錄組

從單個細(xì)胞水平上進行轉(zhuǎn)錄本研究,能夠深入分析細(xì)胞之間的異質(zhì)性,從而解析不同類型細(xì)胞的生理特點。對于特定組織研究其功能,必須要了解區(qū)分其細(xì)胞類型組成,不同的細(xì)胞類型可能發(fā)揮了特異的生理功能。scRNA-seq成為深入研究不同類型細(xì)胞的轉(zhuǎn)錄本的差異以及細(xì)胞之間的組合的解決方案。目前已經(jīng)有多種方法能夠?qū)崿F(xiàn)單細(xì)胞分離并進行scRNA-seq的研究并被大量的應(yīng)用在腫瘤細(xì)胞的轉(zhuǎn)錄組研究中[46-47]。Moffitt等[48]利用 scRNA-seq技術(shù)對大腦中的不同類型細(xì)胞進行鑒定,不僅發(fā)現(xiàn)了之前未知的神經(jīng)元亞型,結(jié)合MERFISH這樣的空間成像技術(shù),還允許對鑒定出來的不同類型細(xì)胞的空間分布進行研究,明確不同的基因在不同類型的細(xì)胞中表達差異。

6 展望

轉(zhuǎn)錄組測序技術(shù)能夠確定信使RNA(mRNA)和非編碼RNAs(ncRNA)序列和轉(zhuǎn)錄基因的結(jié)構(gòu),并定量的動態(tài)表達每個轉(zhuǎn)錄本在不同生物學(xué)下的模式條件。隨著測序技術(shù)的進一步發(fā)展,為轉(zhuǎn)錄組的定位和定量的研究提供了多種新的解決方法。總體來說,目前的RNA-seq仍然以基于二代測序為主,基于三代測序技術(shù)進行RNA-seq成為轉(zhuǎn)錄組學(xué)研究的一個重要方向。目前的高通量測序技術(shù)都需經(jīng)過建庫過程,即首先將大量的RNA分子富集后,轉(zhuǎn)化為cDNA測序文庫,并在建庫過程中對cDNA分子的片段連接上測序引物接頭和樣本標(biāo)記序列。應(yīng)用最廣泛的Illumina二代測序平臺,采用邊合成邊測序的策略,對建庫后的分子進行雙端測序或單端測序。PacBio的單分子實時測序技術(shù),具有讀長較長的優(yōu)點,能夠進行全長轉(zhuǎn)錄組的研究,特別適合用于發(fā)現(xiàn)新轉(zhuǎn)錄本。根據(jù)實驗?zāi)康暮脱芯繉ο螅诂F(xiàn)有的測序平臺,已經(jīng)可以在整體水平系統(tǒng)地開展多種RNA分子的研究,除了全轉(zhuǎn)錄組和全長轉(zhuǎn)錄本的研究外,單細(xì)胞轉(zhuǎn)錄組的研究是近來的研究熱點。隨著單細(xì)胞分離以及單分子測序技術(shù)的發(fā)展,單細(xì)胞轉(zhuǎn)錄組測序技術(shù)在異質(zhì)性細(xì)胞的轉(zhuǎn)錄組研究中具有廣闊的前景。RNA-seq技術(shù)的發(fā)展為從整體轉(zhuǎn)錄水平,細(xì)致精確地研究轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)與性狀之間的關(guān)系提供了有效手段。

猜你喜歡
研究
FMS與YBT相關(guān)性的實證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
關(guān)于遼朝“一國兩制”研究的回顧與思考
EMA伺服控制系統(tǒng)研究
基于聲、光、磁、觸摸多功能控制的研究
電子制作(2018年11期)2018-08-04 03:26:04
新版C-NCAP側(cè)面碰撞假人損傷研究
關(guān)于反傾銷會計研究的思考
焊接膜層脫落的攻關(guān)研究
電子制作(2017年23期)2017-02-02 07:17:19
主站蜘蛛池模板: 久久无码av三级| 亚洲精品片911| 亚洲熟女偷拍| 免费国产高清视频| 自拍欧美亚洲| 国产99热| 亚洲 成人国产| 日韩精品成人在线| 全午夜免费一级毛片| 国产尤物jk自慰制服喷水| 无码人妻免费| 免费毛片a| 精品国产黑色丝袜高跟鞋| av在线人妻熟妇| 污网站在线观看视频| 无码在线激情片| 国产日产欧美精品| 欧美亚洲国产精品第一页| 日韩无码黄色网站| 久久6免费视频| 亚洲午夜福利精品无码不卡 | 无码aaa视频| 无码网站免费观看| 久久综合伊人 六十路| 91区国产福利在线观看午夜 | 在线观看无码av免费不卡网站 | 99国产在线视频| 九九精品在线观看| 欧美在线三级| 亚洲精品自产拍在线观看APP| 一级一级一片免费| 亚洲欧美成人在线视频| 视频一区亚洲| 狼友视频国产精品首页| 国产午夜小视频| 亚洲精品天堂在线观看| 扒开粉嫩的小缝隙喷白浆视频| 亚洲综合色区在线播放2019| 欧美日韩精品综合在线一区| 国产呦视频免费视频在线观看| 国产黑人在线| www.youjizz.com久久| 亚洲一区二区约美女探花| 亚洲另类国产欧美一区二区| 亚洲精品无码成人片在线观看 | 久久久噜噜噜| 久久黄色小视频| 91精品久久久久久无码人妻| 久久精品国产亚洲麻豆| 中文字幕va| 精品欧美日韩国产日漫一区不卡| 中文字幕乱码二三区免费| 天天视频在线91频| 欧美激情福利| 久久综合干| 呦女亚洲一区精品| 国产美女久久久久不卡| 亚洲最大福利视频网| 谁有在线观看日韩亚洲最新视频| 精品国产福利在线| 日韩天堂在线观看| 亚洲欧美日韩视频一区| 亚洲第一区欧美国产综合 | 四虎成人精品在永久免费| 天堂网国产| 国产精选自拍| 久久久久人妻一区精品| 国产成人成人一区二区| 日韩午夜伦| 国产迷奸在线看| 亚洲浓毛av| 亚洲av无码成人专区| 欧美中文字幕在线二区| 91年精品国产福利线观看久久 | 中文字幕免费视频| 国产毛片一区| 欧美天堂在线| 亚洲一区二区在线无码| 欧美在线综合视频| 九色国产在线| 久久综合色天堂av| 国产一区亚洲一区|