劉玉猛,蔣潔蘭,毛明光*,朱詩裕,王 偉
(1.大連海洋大學海洋科技與環境學院,遼寧大連 116023;2.海南熱帶海洋學院崖州灣創新研究院,海南三亞 572024;3.海南熱帶海洋學院/海南熱帶海洋生物資源利用與保護教育部重點實驗室,海南三亞 572022)
鮭鱒,是鮭魚和鱒魚的統稱[1]。我國鮭鱒養殖是從20世紀60年代開始的,經歷了60多年的發展,已經形成了一定的產業規模,并帶來了巨大的經濟效益[2]。隨著國內需求的增加,養殖體量也不斷增加,2018年我國第一個深海網箱建成并投入使用[3],我國鮭鱒受精卵受制于歐洲,苗種是目前亟待解決的問題,優質的苗種可為下游養成打好基礎和保障。
丹東華美漁業有限公司位于丹東市鴨綠江畔,該公司以鴨綠江為基地,從國外引種優質雜交鮭,并進行了推廣養殖,是當地重要的創匯來源之一。其引進的雜交鮭優點明顯,生長速度快,抗病力強,肉質優良,因肉色似楓葉的顏色,故名“楓葉鮭”。由于楓葉鮭屬于外來物種,且商業品系的信息不全面,尤其是其遺傳信息不明確,這為我國自主繁育造成了瓶頸,也對該地區物種來說是一種潛在的風險。
轉錄組測序技術已廣泛應用于生物學領域[4-5],但其在魚類親子鑒定方面鮮見報道。筆者利用Illumina高通量測序技術對楓葉鮭胸腺和頭腎組織進行轉錄組測序,通過轉錄本拼接、基因功能注釋,揭示楓葉鮭的基因表達特點,根據線粒體母源傳遞的特點,通過對轉錄組中線粒體基因比對分析,確定其母本來源,并根據免疫相關基因的轉錄探討楓葉鮭抗病優勢的原因,旨在為今后利用轉錄測序技術快速揭示未知來源物種的遺傳信息提供科學依據。
1.1 試驗材料楓葉鮭由丹東華美漁業有限公司提供,為400 g。采樣所需的手術剪、咬骨鉗、鑷子等器械均事先通過高壓滅菌鍋進行121 ℃,2 h 滅菌,采樣前使用75%乙醇擦拭且經火焰消毒。將試驗魚解剖,分別取胸腺和頭腎組織儲存于10倍體積的 RNA later。
1.2 試驗方法
1.2.1總RNA的提取及質量檢測。利用RNA提取試劑盒提取楓葉鮭胸腺和頭腎的總RNA。為了保證試驗數據的高質量,將上述提取的RNA用瓊脂糖凝膠電泳檢測其完整性,紫外分光光度計檢測其純度與濃度。將檢驗合格的RNA用于構建cDNA文庫。將上述cDNA文庫利用Qubit DNA檢測試劑盒對回收的DNA 精確定量,以方便按照1∶1 的比例等量混合后進行測序。
1.2.2文庫質檢和測序。將上述檢驗合格的cDNA文庫在Illumina平臺進行測序,首先過濾原始數據中低質量、末端質量低、含測序引物的reads,得到clean reads,然后再進行de novo拼接,最后通過CAP3軟件拼接來獲得最終Unigene序列集合[6]。cDNA 文庫構建與測序由生工生物工程(上海)股份有限公司協助完成。
1.2.3轉錄組數據質控與組裝。測序得到的原始數據中含有帶接頭的、低質量的序列[去除帶N堿基的序列;去除reads中的接頭序列;reads 3′—5′去除低質堿基(Q值<20);reads 5′—3′去除低質堿基(Q值<20);去除reads長度小于35 nt的reads及其配對reads]。為了保證信息分析質量,必須對原始數據過濾,得到Clean數據。
1.2.4基因功能注釋和分類。利用BLAST軟件[7]將Unigene序列分別與NR(NCBI non-redundant protein sequences)[7]、NT(NCBI non-redundant nucleic acid sequences)[7]、GO(Gene ontology)[7]、KEGG(kyoto encyclopedia of genes and genomes)[8]、KOG(kyoto encyclopedia of genes and genomes)[9]、Uniprot(universal protein)[10]以及PFAM(protein family)[11]7個數據庫進行比對分析,獲得Unigene的注釋信息,并對基因功能進行分類。獲取楓葉鮭胸腺和頭腎基因序列與近緣物種基因序列的相似性以及楓葉鮭胸腺和頭腎基因的功能信息,并按照分子功能、細胞組分和生物過程3個大類對其進行GO功能分類。此外,還進行了KOG功能分類,同時獲得 KEGG代謝通路分析結果。
1.2.5基于轉錄組測序的楓葉鮭親本鑒定和雜種抗病優勢分析。通過對轉錄組測序結果數據進行篩選以及利用BLAST軟件進行比對分析,將篩選得到的線粒體DNA(mtDNA)基因序列和基因組基因序列在NCBI數據庫中進行比對,分別確定楓葉鮭的母本及父本來源。將篩得到的免疫相關基因序列進行比對分析,探討楓葉鮭所具有的抗病優勢來源。
2.1 樣本原始數據統計及數據質控采用雙端測序法并經過質量控制后[12],共獲得胸腺的7.29 Gb總堿基數,GC含量為 47.73%,Q30堿基比例平均超過95.33%;共獲得頭腎的6.30 Gb 總堿基數,GC含量為 48.63%,Q30堿基比例平均超過95.12%。
2.2 轉錄組拼接結果統計對測序結果進行組裝、拼接[12],結果表明,胸腺樣本共得到358 880條Transcript和169 204條Unigene,Transcript與Unigene的N50分別為1 463和896 bp;頭腎樣本共得到282 289條Transcript和132 292條Unigene,Transcript與Unigene的N50分別為1 491和918 bp,表明組裝完整性較高。
2.3 基因注釋將楓葉鮭胸腺和頭腎轉錄組測序篩選所得的Unigene序列與數據庫進行比對和注釋。依據各數據庫注釋的Unigene序列數量和比例可知,各數據庫由于篩選條件不同,成功注釋的基因數也不同。胸腺和頭腎基因中以NT數據庫成功注釋的Unigene序列最多,胸腺基因達116 178條,占68.66%;頭腎基因達92 700條,占70.07%,這與其采用序列相似性比對搜索有關。KEGG數據庫注釋的信息最少,胸腺基因僅有3 451條,占2.04%;頭腎基因僅有3 203條,占2.42%。
2.4 NR庫比對注釋通過與NR庫的比對,結果見圖1。從圖1可見物種轉錄本序列與相近物種的近似情況,以及同源序列的功能信息。在所有注釋成功的 Unigene 中,與 NR庫比對的物種相比,楓葉鮭與虹鱒(Oncorhynchusmykiss)的基因相似度最高,其次是大西洋鮭魚(Salmosalar),胸腺分別達32 360條(50.48%)和25 492條(39.77%),頭腎分別達25 721條(49.90%)和20 920條(40.59%)。

注:A為胸腺,B為頭腎。 Note:A is thymus,B is head kidney.圖1 NR庫比對注釋Fig.1 NR database comparison note
2.5 功能分類注釋通過GO數據庫比對注釋,結果如圖2、3所示,胸腺中共得到50 027條注釋基因,約占總Unigene的29.57%;頭腎中共得到40 853條注釋基因,約占總Unigene的30.88%。GO數據庫將注釋基因總共分為三大類別,分別為分子功能(molecular function)、生物過程(biological process)和細胞組分(cellular component)。胸腺和頭腎基因中生物過程(biological process)占比最多的是細胞過程(cellular process),分別為33 722條(67.51%)和27 959(68.44%);細胞組分(cellular component)占比最多的是細胞(Cell),分別為34 404(68.77%)和28 662(70.16%);分子功能(molecular function)占比最多的是結合活性(binding),分別為31 739(63.44%)和26 151(64.01%)。
胸腺和頭腎基因中分別有22 962條和19 648條Unigenes在KOG數據庫中成功進行功能注釋,合計25類。其中數量最多的是信號轉導機制(signal transduction mechanisms),胸腺有5 044條(21.97%),頭腎有4 072條(20.72%)。
胸腺和頭腎KEGG通路富集分類中分別有5 275和4 820個差異表達基因參與到四大類23小類代謝通路中。注釋基因最多的3個通路首先是信號轉導通路(signal transduction pathway),其次是運輸和分解代謝通路(transport and catabolism pathway),排第3位的通路在胸腺和頭腎中分別為細胞群落通路(cellular community pathway)和折疊分類和降解通路(folding sorting and degradation pathway)。

圖2 GO注釋上的胸腺基因功能分類Fig.2 The functional classification of thymus genes on GO annotation

圖3 GO注釋上的頭腎基因功能分類Fig.3 The functional classification of head and kidney genes on GO annotation
2.6 楓葉鮭mtDNA及基因組信息分析將胸腺和頭腎Unigene序列中與mtDNA相關的基因和基因組基因進行篩選,分別篩選出與mtDNA相關基因序列和基因組基因序列,再利用Blast軟件進行比對分析,比對結果見表1、2。通過mtDNA基因序列包含12S rRNA、16S rRNA、28S rRNA、細胞色素b(Cytochrome b,Cyt b)和細胞色素c氧化酶(Cytochrome c oxidase)在內的基因序列比對結果以及根據mtDNA具有的母系遺傳特點[13-14],可以初步判斷楓葉鮭的母本為虹鱒(Oncorhynchusmykiss)(表1)。
通過比對基因組基因序列包含E3泛素蛋白連接酶(E3 ubiquitin-protein ligase,E3)、腫瘤壞死因子-α(Tumor necrosis factor-α,TNF-α)、免疫球蛋白M(Immunoglobulin M,IgM)、T細胞表面抗原CD2(T-cell surface antigen CD2,CD2)、胰島素樣生長因子(insulin-like growth factor,IGF)、不依賴陽離子的甘露糖-6-磷酸受體(Cation-independent mannose-6-phosphate receptor,CI-MPR)、細胞因子誘導型含SH2蛋白(Cytokine-inducible SH2-containing protein,CISH)、肌生成調節糖苷酶(Myogenesis-regulating glycosidase,MYORG)結果可知,在大鱗大麻哈魚(Oncorhynchustshawytscha)、紅大麻哈魚(Oncorhynchusnerka)、銀大麻哈魚(Oncorhynchuskisutch)和大麻哈魚(Oncorhynchusketa)4種魚的基因序列比對中,基因組基因序列的同源性和大鱗大麻哈魚最高,因此初步判斷父本為大鱗大麻哈魚。

表1 線粒體基因序列比對結果Table 1 Results of mitochondrial gene sequence alignment

表2 基因組基因序列比對結果Table 2 Genomic gene sequence alignment results
2.7 楓葉鮭抗病優勢基因將胸腺和頭腎Unigene序列中與免疫相關的基因進行篩選,再利用BLAST在線分析軟件對免疫球蛋白M(Immunoglobulin M,IgM)、腫瘤壞死因子-α(Tumor necrosis factor-α,TNF-α)、T淋巴細胞相關基因(T lymphocyte related genes)和B淋巴細胞相關基因(B lymphocyte related genes)的基因序列進行比對分析,比對結果見表3。根據序列比對結果,推測雜交優質品種楓葉鮭所具有的抗病優勢是遺傳其親本虹鱒而來。

表3 免疫相關基因序列比對結果Table 3 Sequence alignment results of immune-related gene
3.1 楓葉鮭胸腺和頭腎無參轉錄組的組裝與注釋該研究對楓葉鮭進行了轉錄組分析,并結合轉錄組信息作出了親本鑒定和雜種優勢相應的數據分析。為了獲取楓葉鮭轉錄組信息,在未參照基因組的情況下對其胸腺、頭腎這2種組織轉錄組進行了高通量轉錄組測序,對數據進行過濾和質控后,采用Trinity軟件[15]組裝、拼接和轉錄本功能注釋,共得到13.59 Gb的轉錄組clean data信息,Q30堿基比例均超過95%。從轉錄組質量來看,測序數據的各項指標測序質量較高,達到后續數據組裝分析的要求。
該研究分別對楓葉鮭胸腺和頭腎組織轉錄組文庫組裝的169 204條Unigene和132 292條Unigene進行了GO功能分類、KOG功能分類和KEGG代謝通路等分析。通過GO數據庫比對注釋,胸腺Unigene注釋比例較頭腎少1.31百分點。在KOG數據庫中成功進行功能注釋的胸腺和頭腎Unigene序列,其中數量最多的是信號轉導機制,胸腺Unigene注釋比例較頭腎多1.25百分點。通過KEGG代謝通路分析得到的胸腺Unigene注釋比例較頭腎少1.13百分點。該研究通過功能分類注釋獲得了大量的楓鮭胸腺和頭腎組織轉錄組信息,并且初步闡明楓鮭胸腺和頭腎組織相關的基因功能以及生物學過程、代謝途徑和信號傳導途徑。這對將來深入了解楓葉鮭基因功能至關重要,并為發掘楓葉鮭相關功能基因和研究相關生理功能提供基礎數據。
3.2 利用線粒體基因與基因組基因信息判斷楓葉鮭的遺傳背景線粒體是具有自身基因組的細胞內細胞器,現已被證明至少有4種表觀遺傳機制:①調節核基因組表達的表觀遺傳機制通過調節核編碼線粒體基因的表達來影響線粒體;②核基因的甲基化模式由細胞特異性mtDNA含量和線粒體活性決定;③核基因表達模式和核DNA甲基化水平受mtDNA變異影響;④mtDNA也被表觀遺傳修飾[16]。表觀遺傳修飾往往在不改變DNA序列的情況下引起基因表達的改變,包括DNA甲基化、非編碼RNA活性、組蛋白修飾和染色質重塑等[17-18]。作為一種常見的表觀遺傳現象,DNA甲基化可以改變DNA構象或染色質結構,以及DNA的穩定性,DNA與蛋白質相互作用的方式,并最終調節基因的表達[19-21]。動物mtDNA幾乎完全遺傳其母系而來,父本線粒體在受精過程中迅速降解[22]或在此后的復制過程中缺失[23]。 最新研究結果傾向于支持“瓶頸假說”,即mtDNA的母系遺傳是由上一代基因型的少數特殊種系mtDNA分子的差異擴增介導的[24]。在現有的用于系統發育研究的基因中,Cyt b的結構和功能在mtDNA上是較為清楚的,也是常用于進行物種分類鑒定的基因[25]?;诰€粒體表觀遺傳受多種機制調控及DNA甲基化修飾調節機體基因表達等特點,再結合mtDNA母系遺傳的特點,該研究對楓葉鮭的轉錄組信息進行處理分析,將篩選得到的mtDNA基因序列及基因組基因序列進行比對分析,最終初步得出虹鱒是母本,大鱗大麻哈魚是父本的結論。比對結果中發現,有的基因組基因如肌生成調節糖苷酶與銀大麻哈魚的同源性也達到100%,這可能由楓葉鮭商業化生產中父本的來源不確定造成,因此對于父本鑒定的準確性仍有待進一步完善。
3.3 雜交鮭抗病優勢雜交育種在水產動物的品種改良和生產中發揮了重要作用。該方法利用孟德爾遺傳定律,如分離和自由組合定律及連鎖互換定律,重新構建生物體的遺傳力,創造出理想的變異體[26]。雜交育種不產生新的基因,而是將現有生物資源的基因和性狀進行重組,將分散在不同群體中的基因組合起來,建立符合人們意愿的基因型和表型[26-27]。而雜種優勢是自然界普遍存在的生物現象,是指雜種后代在多個性狀(品質、產量、適應性、抗逆性、繁殖能力和生長優勢等)上超越親本的現象[28-30]。該研究中的楓葉鮭則是具有優良抗病性狀的雜交鮭,對其抗病優勢的遺傳信息進行分析能更好地為其他水產動物的雜交育種奠定基礎。
硬骨魚類的IgM為四聚體免疫球蛋白,在魚類的體液免疫中發揮著重要作用[31],并對各種抗原產生有效的特異性體液抗體反應。IgM是B淋巴細胞最早產生的免疫球蛋白分子,也是B淋巴細胞分化過程中的主要表面標志[32]。細胞因子在免疫系統的調節反應中起著至關重要的作用。研究發現,細胞因子在調節和控制免疫反應的分子進化過程中是高度保守的[33]。TNF-α是細胞因子家族的重要成員之一,是導致細胞凋亡和抵抗細胞內病原體的重要因素,是一種重要的抗癌因子[34]。除了引起腫瘤細胞出血性壞死而凋亡外,它還可以介導炎癥和調節免疫功能[34-35]。綜合IgM和TNF-α在魚類機體免疫調節過程中所起到的重要作用,該研究篩選出了楓葉鮭轉錄組信息中的IgM、TNF-α基因序列和T、B淋巴細胞相關基因序列,并進行了物種同源性比較。
該研究在探討了楓葉鮭品種的親本分別是虹鱒(母本)和大鱗大麻哈魚(父本)之后,對其抗病優勢進行分析,盡管該研究所列出的免疫相關基因序列與母本虹鱒的同源性更高,但根據雜交所產生的基因、性狀重組以及雜交子代會出現的雜種優勢,又因為楓葉鮭在商業化生產過程中父本的來源具有不確定性,因此,初步判斷楓葉鮭所具有的雜種抗病優勢是由其親本雙方的抗病優勢基因的基因重組所產生的結果。
該研究應用Illumina高通量測序技術對楓葉鮭遺傳信息進行了探討,可以快速判斷父、母本的來源,并獲得大量遺傳信息,具有較好的應用前景,后續也可為其他水產養殖動物的親本鑒定和雜種優勢分析提供科學依據。