甘麥鄰,沈林園,楊東麗,王定國,張順華,朱 礪*
(1.四川農業大學動物科技學院,四川 成都 611130;2.四川農業大學畜禽遺傳資源發掘與創新利用四川省重點實驗室,四川 成都 611130;3.瀘州市農業農村局,四川 瀘州 646000;4.成都市動物疫病預防控制中心,四川 成都 610041)
隨著人類基因組計劃的完成,大量物種的基因組被解析,大大地加快了相關研究的速度和進展[1]。伴隨著相關研究技術和方法的成熟,近年來隨著轉錄組學、蛋白質組學和代謝組學等組學研究的相繼出現,開啟了生命科學研究的后基因組時代[2-3]。轉錄本身是一個高度動態和可變的過程,而轉錄水平的調控是目前研究最廣泛、最重要的調控方式。轉錄組反映特定物種的組織、器官或細胞在特定生理環境和發育狀態下的RNA表達情況。轉錄組同相對穩定的基因組比較,在不同的生理狀態和環境的影響下呈現高度的動態變化,能直觀反映個體或細胞對環境的應答[4]。
豬不僅可以為人類提供重要的肉產品,而且作為良好的動物模型在人類疾病研究中發揮著重要的作用。2009年由美、英、法等多國科學家組成的研究小組首次繪制出了杜洛克豬的基因組草圖,隨后又不斷進行了完善[5-6]。相關研究結果對提高豬肉產量、增強豬只免疫力,提升種豬繁殖性能的研究具有重要的參考意義。此外,由于豬在解剖結構、生理指標、行為模式和營養需求等方面與人類具有很多相似之處;同時豬也具有對流感易感的特性,基于此科學家們可以以豬為相關人類疾病模型研究人類疾病,獸醫專家也可以洞悉豬的疾病;有助于豬流感疫苗、器官移植等涉及人類健康技術的研發。同時為轉錄組測序提供了可靠的參考基因組。
在自然界中生物許多性狀,尤其是大量的經濟性狀通常是由許多基因共同調控的。相較于針對單一基因的研究,對多個基因或整體水平同時進行系統地研究,有時能夠更為準確地反映生物學問題。轉錄組學是解讀基因組功能元件和揭示細胞及組織分子機制的基礎,在生物表觀性狀和基因表達研究中占據了重要地位。
狹義的轉錄組學特指編碼蛋白的RNA——信使RNA(mRNA)[7],而廣義的轉錄組學則包含編碼和非編碼RNA(noncoding RNA,ncRNA),如核糖體RNA(rRNA)、轉運RNA(tRNA)、小RNA(miRNA)、小干擾RNA(siRNA)、長鏈非編碼RNA(lncRNA)、環狀RNA(circRNA)、piRNA(與PIWI蛋白家族成員相結合的小RNA)、tRFs(由特定的核酸酶在tRNA的環上剪切,產生的特定大小的小RNA)等[8-9]。隨著對各種非編碼RNA研究的不斷深入,使得轉錄組研究范圍不斷深化。相較于研究起步最早也最為成熟的編碼RNA,非編碼RNA的研究正如火如荼,尤其以lncRNA和circRNA最甚[10-11]。由于非編碼RNA占了轉錄本的大多數,因此解析非編碼RNA的作用機制及其調控網絡的構建,對進一步解析相關疾病的發生發展和認識生命的奧秘具有重要意義[12]。
當前,針對轉錄組,相關科研團隊開發了許多方法。從技術方法分類來看:較為常用的有基因芯片(Gene chip)[13]、表達序列標簽(EST)[14]、轉錄組測序(RNASeq)[15]等,其中轉錄組測序是當前應用最多的技術手段。轉錄組測序從研究對象來分又可分為:針對mRNA、miRNA、lncRNA、circRNA及全轉錄組的測序及分析技術。轉錄組測序(transcriptme sequencing),也即RNA sequencing (RNA-Seq)又稱新一代測序技術(next-generation sequencing,NGS)。轉錄組測序技術是一種非常有用的遺傳信息搜尋工具,同時也能夠對轉錄組進行綜合分析,還可以用來鑒別、定位以及定量分析轉錄組信息[16]。因轉錄組測序技術具備的眾多優點,因此被廣泛應用在轉錄組的相關研究中。
轉錄組測序的主要流程為:1)細胞或組織總RNA的獲得,通常使用Trizo法提取總RNA,或相應改進試劑盒提取目的RNA,目前已有針對miRNA、piRNA等的專門化提取試劑盒;2)對RNA樣品進行預處理(如富集處理等);3)RNA樣品的片段化處理;4)RNA樣品反轉錄,制成cDNA;5)在反轉錄好的cDNA兩端連接接頭;6)進行高通量測序;7)對測序片段進行拼裝分析獲得轉錄組的序列信息和遺傳信息[17]。
轉錄組測序數據的分析。對于無參考基因組的物種還需要構建參考基因組或使用相近物種的參考基因組[18],針對已有參考基因組的物種,其轉錄組測序數據分析則主要包含以下步驟(見圖1)。
轉錄組測序在解析轉錄本的結構和生物學功能等方面發揮著重要作用,如發現可變剪切、融合基因以及非編碼的轉錄本等。由于轉錄組測序的結果分析,包括了轉錄本的表達水平、對可變剪切的鑒定以及鏈方向特異性等,因此轉錄組測序分析遠比基因組復雜,通常適用于基因組的組裝算法不能夠直接用于轉錄組測序的數據分析。隨著信息技術的發展,生物信息學家又開發了一些新的專門用于轉錄組組裝的軟件,這些軟件主要有基于參考基因組的組裝方法和Denovo組裝等方法[19],解決了部分轉錄組測序分析的困難,為進一步地廣泛使用轉錄組測序技術提供了技術基礎。
利用轉錄組學技術可分析豬某一組織、器官在不同生理狀態、發育階段以及不同處理條件下轉錄產物的類別、結構變異及其表達水平的變化,可篩選差異表達基因,進而將基因和性狀和環境聯系起來,為進一步治療豬病或搜尋豬遺傳育種相關靶點提供了參考[20]。同時還可以進行基于轉錄水平的分子標記物篩選,加快選育進程,提升選育準確度,為生豬養殖過程提供相應的技術支撐。
通常研究人員通過轉錄測序用以發現差異表達基因,進一步研究分析差異基因的功能和調控網絡。對于世界養豬業,DLY(杜洛克豬×長白豬×大白豬)配套組合已經成為經典,并成為使用最為廣泛的商品豬養殖生產模式,極大地推動了世界養豬生產的發展。但由于前期選育主要集中在豬只生長速度和飼料轉化率上,一定程度上忽視了對肉質性狀的選育。同時隨著人們對動物遺傳資源和物種多樣性的進一步理解,地方品種種質資源保護和開發利用也已經成為了養豬生產的一個重要發展方向。因此對于豬肉質相關的轉錄組研究,一方面集中在骨骼肌不同發育階段、生理狀態或差異生產性能下轉錄組差異研究;另一方面通過轉錄組測序比較地方豬種與主流豬種(杜洛克、長白、大白、巴克夏、漢普夏等)轉錄差異,為保種及特殊遺傳資源開發提供參考。
信使RNA作為編碼蛋白的RNA,基于mRNA的測序通常能夠將基因組和蛋白組緊密關聯,發現具有重要遺傳效應的基因,利用轉錄組測序手段大量的研究發現了對豬肉質性狀相關的基因并驗證了部分基因組測序數據。基于轉錄組測序的方法Puig等分析了同一豬種不同脂肪沉積亞群背最長肌轉錄組差異,發現在高脂亞群和低脂亞群鑒定出的131個差異表達基因顯著富集到了脂質代謝通路中。同時該研究團隊發現其中18個基因位于GWAS鑒定到的肌內脂肪組成相關的基因組區域[21]。對背最長肌含有不同IIB型肌纖維的大白豬進行轉錄分析,研究人員鑒定到355個差異表達基因,經過分析發現主要與糖酵解代謝通路和肌細胞收縮過程相關[22]。Sodhi等人對成年濟州豬(JNP豬)和巴克夏豬的背最長肌進行轉錄組分析,通過與巴克夏豬比較在JNP豬背最長肌鑒定到了39個基因的表達,主要富集在代謝、蛋白結合等通路[23]。對25日齡沙子嶺豬和約克夏豬的背最長肌做了轉錄組和蛋白組分析,研究人員鑒定得到488個差異表達基因和23個差異蛋白,對其進行功能分析發現差異表達基因主要涉及到代謝、蛋白結合以及骨骼肌發育的通路[24]。對5月齡皖南花豬與大約克夏豬的背最長肌進行轉錄組分析,差異表達基因主要參與糖酵解代謝、肌肉發育的生物學過程以及與脂肪酸代謝、生長和胴體性狀相關的通路[25]。通過以上數據我們可以發現不同生長發育階段的肌肉轉錄差異主要集中在肌肉發育、脂質代謝和糖酵解代謝等通路。
通過對骨骼肌不同發育階段、生理狀態或差異生產性能下轉錄組差異研究,以及不同特性豬種的轉錄組研究,進一步豐富了基因表達調控網絡,為我們解析基因與環境間的互作和種質資源保護提供了參考。
miRNA是近年來發現的一種非編碼RNA,主要在轉錄后水平對其靶基因發揮調控作用。大量的研究也證實一些與肌肉相關的miRNA,如miR-1、miR-133、miR-206和miR-27等參與豬骨骼肌發育或肉質相關[26-27]。與mRNA相比miRNA物種間保守性更強,預計miRNA的數量大約1 000個左右,但調控著大約60%的基因表達[28]。miRNA的轉錄測序是發現新的miRNA和研究已知miRNA差異表達的重要手段。
2012年南京農業大學研究團隊對豬18個發育階段的背最長肌進行miRNA測序,通過與已有的miRNA進行比對發現已知197個miRNA,新發現78個miRNA[29]。2015年四川農業大學豬研究團隊通過對5個生長發育階段豬的背最長肌進行測序,鑒定了404個已知的豬miRNA,18個新的miRNA和101個在其他哺乳動物中保守的miRNA[30]。2017年重慶市畜牧科學院通過測定豬4個不同發育階段的肌肉和脂肪,鑒定得到329個已知的miRNA和157個新的miRNA[31]。
中山大學陳瑤生團隊對長白豬和藍塘豬骨骼肌發育8個不同階段miRNA進行基因表達譜分析,篩選到差異表達的258個miRNA在所有生長階段的背最長肌中均有表達[32]。中國農業科學院相關團隊基于長白豬、桐城豬、五指山豬胚胎骨骼肌33、65和90 d的miRNA表達譜分析,分別鑒定得到33、18和67個差異表達miRNA,差異表達miRNA的靶基因主要涉及肌肉收縮和肌肉發育等過程[33]。
從以上研究的發表時間來看,在豬骨骼肌中越來越多的miRNA被鑒定,同時也仍在不斷發現新的miRNA。而針對差異miRNA的研究則以其靶基因為核心進行生物功能分析,其靶基因調控通路和生物學過程與前述的mRNA的轉錄測序分析富集通路結果相似,從側面互相印證了miRNA及其靶基因所對應的信號通路和生物學過程。基于miRNA的研究進一步豐富了豬肉質相關信號的調控通路,也為遺傳改良和養豬生產提供了新見解和新思路。
lncRNA是一類長度超過200 nt的非編碼RNA,lncRNA占全部非編碼RNA的80%以上,與miRNA相比其數量龐大,序列保守性較低,曾一度被認為是轉錄噪音[34]。circRNA即環狀RNA,是一種具有閉合環狀結構且能穩定存在于真核細胞中的特殊RNA,隨著研究的進一步深入,lncRNA、circRNA等被證明具有豐富的生物學功能,即可調控表觀遺傳修飾也能影響RNA的可變剪接,對生物個體的正常生長發育和疾病發生發展均有重要作用。
四川農業大學豬研究團隊利用轉錄組測序技術對豬背最長肌和腰大肌進行測序分析,共鑒定出326個lncRNA和56個circRNA[35]。2017年中國農業科學院以貴州小型豬的9種不同組織和3個發育階段的骨骼肌為材料鑒定得到5 934個circRNA,并系統分析了豬circRNA的時空表達差異和與其他物種的保守性,同時相關研究人員還構建了農業動物首張circRNA的時空圖譜和首個數據庫(circRNA-miRNAmRNA多維調控網絡)[36]。華南農業大學以瘦肉型快速生長的外種豬(長白豬)和我國脂肪型地方豬種藍塘豬7 d肌肉為材料,鑒定得到4 360個circRNA,在藍塘豬中1 401個circRNA上調,2 959個下調[37]。此外,2018年7月中國農業科學院又以大白豬和萊蕪豬的脂肪為材料共鑒定得到29 763個脂肪組織中的circRNA,在脂肪型的萊蕪豬中70個circRNA上調,205個下調,相關研究結果進一步為circRNA在豬肉質改良研究提供了參考[38]。
除了lncRNA和circRNA還有小干擾RNA(siRNA)、piRNA、tRFs等非編碼RNA均被證明具有重要的生物學功能[39-40],但由于相關技術手段還不夠成熟,研究成本較高,機制解析困難等因素,在豬肉質研究中還鮮見報道,但隨著相關技術的升級,必將迎來其研究熱潮。
隨著測序及相關分析技術的成熟,測序成本大幅下降,轉錄組測序的高通量優勢極大地促進了相關研究的發展,在豬肉質研究中也取得了一定的成果。但轉錄組的研究仍然存在一定的問題,一方面測序所得的龐雜數據量通常需要大型分析儀器,而這些儀器的使用和維護往往非常專業和昂貴,通常實驗人員需要同專業測序公司合作完成,由于專業背景差異的存在,在一定程度限制了實驗方案的實施;另一方面研究人員面臨海量的測序結果如何進行有效地處理和數據分析仍然是最大的挑戰。