艾鑫,趙文君,律鳳霞
(牡丹江師范學(xué)院生命科學(xué)與技術(shù)學(xué)院,黑龍江 牡丹江 157012)
白靈菇(Pleurotusostreatus),在我國是一個非常重要的食用菌,常常被認為等同于阿魏菇[1],戴玉成課題研究組從分子生物學(xué)角度鑒定表明:白靈菇為刺芹側(cè)耳獨立進化的新分支,學(xué)名刺芹側(cè)耳托里亞種(Pleurotuseryngiisubsp.tuoliensis),因此,白靈菇被提升為單獨的新種[2]。分類學(xué)上隸屬于菌物界、擔子菌門、傘菌綱、傘菌目、側(cè)耳科,其子實體形似靈芝,顏色純白,故稱白靈菇[3]。白靈菇子實體較大,菌蓋直徑8~15 cm或更大,厚3~4 cm,初期近扁球形,多側(cè)生或偏生,表面近平滑偶有絨狀膜,菌肉白色,肉質(zhì)脆嫩[4]。
我國白靈菇主要分布于新疆的阿勒泰、伊犁、托里、塔城和木壘等高原地區(qū),腐生或寄生于阿魏植物的根部或根莖處[5]。近年來,關(guān)于白靈菇在藥理作用研究方面受到廣泛關(guān)注,研究表明白靈菇具有抗氧化活性[6]、免疫活性[7]、抗腫瘤作用[8]、降血脂[9]和疲勞恢復(fù)作用[10]。目前國內(nèi)外對白靈菇的研究大多集中在營養(yǎng)成分、藥用價值和栽培技術(shù)等方面的研究,部分有關(guān)白靈菇地理分布和資源利用以及資源品質(zhì)的研究[11-13],但關(guān)于白靈菇的分子生物學(xué)研究以及轉(zhuǎn)錄組信息和基因組數(shù)據(jù)未見報道。
本研究基于SBS(sequencing by synthesis)技術(shù),用IIIumina Hiseq高通量平臺對白靈菇菌絲體進行轉(zhuǎn)錄組測序[14-15],通過數(shù)據(jù)過濾、拼接、組裝重建形成了白靈菇轉(zhuǎn)錄組Unigene數(shù)據(jù),將數(shù)據(jù)與7大數(shù)據(jù)庫進行功能注釋比對、分類以及SSR分子標記。為今后有關(guān)白靈菇的有效成分利用、基因篩選、調(diào)控機制研究以及功能分析提供一定的理論依據(jù)[16-20]。
白靈菇:牡丹江師范學(xué)院生科院教研室提供。
培養(yǎng)基配方:葡萄糖20%,胰蛋白胨1%,KH2PO40.1%,MgSO40.05%,VB10.03%,pH值自然。
白靈菇總RNA:白靈菇菌26 ℃150 r/min振蕩培養(yǎng)10 d過濾得菌絲球,Plant Total RNA Isolation Kit(50T)試劑盒提取總RNA,檢測提取物的濃度、完整性及污染情況,符合要求的RNA進行測序。
用軟件Bcl2fastq對測序原始數(shù)據(jù)進行圖像堿基識別,lllumina內(nèi)置軟件篩選每個測序結(jié)果片段,形成原始測序數(shù)據(jù)(Pass Filter Data)[21-22],以FASTQ文件格式儲存。去除3`端接頭序列,過濾低質(zhì)量數(shù)據(jù),清除基因組污染。利用軟件Trinity(v2.2.0)對處理后數(shù)據(jù)從頭組裝,通過序列聚類對組裝結(jié)果進一步序列拼接和清冗余處理,保留大于200bp的序列數(shù)據(jù),獲到非冗余Unigene序列。Unigene序列與COG、GO、KEGG、Nr和Swiss-Prot等數(shù)據(jù)庫進行BLAST比對,對比對的注釋基因進行功能分類和統(tǒng)計分析。用三種SSRs預(yù)測軟件對樣本序列進行SSR位點預(yù)測,將共有結(jié)果保留用于下一步的引物設(shè)計[23-25]。
利用Illumina測序平臺對白靈菇的液體菌球進行轉(zhuǎn)錄組測序,數(shù)據(jù)經(jīng)過嚴格的質(zhì)量控制后過濾后數(shù)據(jù)共獲得26973356條純凈序列,共計4.02Gb個堿基,GC含量為53.09%,堿基質(zhì)量值 Q20 和 Q30 分別為 98.52%和 95.56%(表1)。以上結(jié)果說明白靈菇測序質(zhì)量較高,為后續(xù)的組裝和分析奠定了良好的基礎(chǔ)。

表1 測序數(shù)據(jù)質(zhì)量統(tǒng)計
采用軟件Trinity對樣品數(shù)據(jù)進行序列組裝,組裝結(jié)果通過序列聚類做進一步序列拼接和去冗余處理,得到長的非冗余的Unigene序列32969條,總堿基數(shù)量57.1318 M,序列數(shù)量與長度是組裝質(zhì)量的重要評價標準,N50長度為2701 bp ,遠大于其對應(yīng)平均長度1732.90 bp,說明組裝結(jié)果較好。統(tǒng)計Unigene數(shù)量與長度分布情況見表2。

表2 Unigene數(shù)量與長度分布統(tǒng)計
表2顯示:Unigene最小長度201bp,最大長度15498 bp,平均長度1732.90 bp,以500 bp為間距進行分組(除200 bp以下部分),長度在2000 bp以上的數(shù)目最多,達到11011條占比33.40%;200~500 bp占比23.83%;500~1000 bp占比17.10%;1000~1500 bp占比13.93%;1500~2000 bp占比11.74%(圖1)。

圖1 白靈菇Unigene 不同長度分布比例
使用BLAST軟件將組裝得到的白靈菇Unigene對比到常用的7大數(shù)據(jù)庫(圖2),獲得注釋Unigene共有21808條,占總Unigene的66.15%。白靈菇Unigene在不同數(shù)據(jù)庫的注釋數(shù)目有較大差異,其中注釋數(shù)目最多的是Nr數(shù)據(jù)庫,共有21664條Unigene得到注釋,占比65.71%;其次為Swiss-Prot(12542條,占38.04%)、COG(12461條,占37.80%);白靈菇Unigene注釋數(shù)目最少的為KEGG數(shù)據(jù)庫,僅有1304條Unigene,占比3.96%。

圖 2 Unigene各數(shù)據(jù)庫注釋結(jié)果Venn圖
白靈菇Unigene在Nr數(shù)據(jù)庫比對后同源序列注釋最多,21664條(99.34%)。同源排序前十位的物種為(圖3):真姬菇(Hypsizygusmarmoreus)6603條同源注釋(30.48%);Moniliophthoraroreri1117條(5.16%);奧氏蜜環(huán)菌(Armillariasolidipes)1072條(4.95%);光蓋裸蓋菇(Psilocybecyanescens)1028條(4.75%);高盧蜜環(huán)菌(Armillariagallica)994條(4.59%);熱帶紫褐裸傘(Gymnopilusdilepis)974條(4.50%);阿太菌科FibularhizoctoniaspCBS 10969)785條(3.62%);TermitomycesspJ132 669條(3.09%);暗藍斑褶菇(Paneoluscyanescens)647條(2.99%);白環(huán)菌屬的LeucoagaricusspSymC.Cos636條(2.94%),另有32.93%的Unigene在其他物種中獲得注釋。

圖3 Unigene的Nr功能注釋物種分布Top10

1.催化活性;2.結(jié)合;3.轉(zhuǎn)運活性;4.核酸結(jié)合轉(zhuǎn)錄因子活性;5.酶調(diào)節(jié)劑活性;6.結(jié)構(gòu)分子活性;7.抗氧化活性;8.蛋白質(zhì)結(jié)合轉(zhuǎn)錄因子活性;9.分子轉(zhuǎn)導(dǎo)活性;10.鳥苷酸交換因子活性;11.電子載流子活度;12.分子功能調(diào)節(jié)劑;13.營養(yǎng)庫活性;14.翻譯調(diào)節(jié)活性;15.蛋白標簽;16.受體調(diào)節(jié)活性;17.金屬血紅素活性;18.趨化活性;19.化學(xué)活性;20.通道調(diào)節(jié)活性;21.細胞部分;22.細胞器;23.細胞器部分;24.膜部分;25.大分子復(fù)合物;26.膜;27.胞外區(qū);28.膜封閉腔;29.胞外區(qū)部分;30.細胞連接;31.突觸部分;32.突觸;33.細胞外基質(zhì);34.細胞;35.細胞外基質(zhì)成分;36.類核;37.其他有機體部分;38.膠原三聚體;39.病毒部分;40.細胞過程;41.代謝過程;42.單生物過程;43.生物調(diào)控;44.本土化;45.應(yīng)激反應(yīng)的過程;46.發(fā)展過程;47.多細胞生物進程;48.細胞組織或生物合成;49.免疫過程;50.生長;51.生殖進程;52.運動;53.信號;54.生物粘附;55.有節(jié)奏的過程;56.再生作用;57.行為;58.多細胞生物生長過程;59.細胞死亡;60.激素分泌;61.細胞聚集
白靈菇Unigene在GO數(shù)據(jù)庫中比對,主要功能分類包括細胞組成、分子功能和生物過程三個主類61個亞類(圖4)。分子功能功能主類內(nèi)含20個亞類,Unigene功能以催化活性和結(jié)合的數(shù)量最多;細胞組成主類內(nèi)含19個亞類,Unigene功能以細胞部分數(shù)量最多,細胞器、細胞器部分和膜部分次之;生物過程主類內(nèi)含22個亞類,Unigene功能以細胞過程、代謝過程和單生物過程為主。

1.全局和總覽圖;2.碳水化合物代謝;3.氨基酸代謝;4.脂質(zhì)代謝;5.核苷酸代謝;6.能量代謝7.其他氨基酸代謝8.輔助因子和維生素的代謝9.糖的生物合成和代謝10.萜類和多酮類化合物的代謝11.其他次生代謝產(chǎn)物的生物合成12.異生素的生物降解和代謝13.翻譯14.折疊、分類和降解15.轉(zhuǎn)錄16.復(fù)制和修復(fù)17.運輸和分解代謝18.細胞生長和死亡19.信號轉(zhuǎn)導(dǎo)20.膜運輸
白靈菇Unigene的KEGG生物通路富集分析顯示,共有1304個Unigene得到注釋,涉及到111條生物通路。KEGG數(shù)據(jù)庫的生物通路分四大類,細胞過程、環(huán)境信息處理、遺傳信息處理和新陳代謝,內(nèi)含20個二級亞類。亞類中涉及新陳代謝相關(guān)通路的最多,12條通路2053個基因(67.09%);其次是遺傳信息處理有4條通路694個基因(22.68%)、細胞過程有2條通路222個基因(7.25%)、環(huán)境信息處理有2條通路91個基因(2.97%)。
白靈菇Unigene與COG數(shù)據(jù)庫比對顯示(圖6):有12461條Unigene注釋到25個功能類別。一般功能預(yù)測功能注釋數(shù)目最多,有2187條(17.55%);翻譯后的修飾、蛋白質(zhì)轉(zhuǎn)換和分子伴侶類群等功能注釋有1204條(9.66%);信號轉(zhuǎn)導(dǎo)機制功能注釋有1093條(8.77%);次生代謝產(chǎn)物的生物合成,運輸和分解代謝功能注釋有1005條(8.07%);細胞運動功能注釋有15條Unigene,僅占總數(shù)的0.12%,是注釋數(shù)目最少的類別。

A.RNA加工和修飾;B.染色質(zhì)結(jié)構(gòu)和動力學(xué);C.能量生產(chǎn)及轉(zhuǎn)換;D.細胞周期控制,細胞分裂,染色體分裂;E.氨基酸的運輸和代謝;F.核苷酸轉(zhuǎn)運和代謝;G.碳水化合物的運輸和代謝;H.輔酶的運輸和代謝;I.脂質(zhì)運輸和代謝;J.核糖體結(jié)構(gòu)和生物起源;K.轉(zhuǎn)錄;L.復(fù)制重組和修復(fù);M.細胞壁/細胞膜/包膜的生物發(fā)生;N.細胞運動;O.翻譯后的修飾,蛋白質(zhì)轉(zhuǎn)換,分子伴侶. P.無機離子的轉(zhuǎn)運和代謝;Q.次生代謝產(chǎn)物的生物合成,運輸和分解代謝;R.一般功能預(yù)測;S.未知函數(shù);T.信號轉(zhuǎn)導(dǎo)機制;U.細胞內(nèi)運輸,分泌和囊泡運輸;V.防御機制;W.細胞外結(jié)構(gòu);Y.核結(jié)構(gòu);Z.細胞骨架
白靈菇轉(zhuǎn)錄組測序數(shù)據(jù)共檢索到3014個SSR位點(圖7),三核苷酸重復(fù)數(shù)為1869個,占SSR位點總數(shù)的62.01%,而三核苷酸重復(fù)中CGA/GAC重復(fù)基元最多(390個);單核苷酸重復(fù)有738個(24.49%),C/T重復(fù)基元最多(555個);二核苷酸重復(fù)數(shù)284個(9.42%),CG/CT重復(fù)基元最多(167個);四核苷酸重復(fù)數(shù)65個(2.16%),TGAG/AGGG重復(fù)基元為主(46個);六核苷酸重復(fù)數(shù)最少,65個占總SSR位點的1.92%。

圖7 白靈菇SSR位點5種類型統(tǒng)計分析
白靈菇RNA轉(zhuǎn)錄組測序及數(shù)據(jù)處理后,獲得32969條Unigene,序列平均長度1732.90bp,N50為2701bp。其中21808條Unigene被注釋到GO、KEGG、Nr和COG等7大數(shù)據(jù)庫,占總Unigene的66.15%。這些被注釋的Unigene為今后有關(guān)白靈菇的有效成分利用、基因篩選、調(diào)控機制研究以及功能分析提供一定的理論依據(jù)。此外,還有11161條Unigene未得到注釋,推測可能是白靈菇的特異性新基因、非編碼RNA序列或目前公共基因數(shù)據(jù)庫尚未完善。
白靈菇Unigene數(shù)據(jù)在Nr數(shù)據(jù)庫中注釋21664條,30.48%同源注釋到真姬菇,真姬菇與白靈菇均屬于菌物界、擔子菌門、傘菌綱、傘菌目,同目不同屬下同源基因數(shù)目較多;還有32.93%的Unigene序列未匹配到同源序列,可能由于Unigene片段較小而無法同源匹配到單數(shù)據(jù)序列。
白靈菇Unigene數(shù)據(jù)在GO功能分類中共注釋到3個主類和61個亞類,主要集中在催化活性、結(jié)合功能和細胞部分功能等。白靈菇的KEGG代謝通路富集分析主要富集在次級代謝產(chǎn)物的生物合成、抗生素的生物合成和核糖體等路徑,表明白靈菇的生物合成表達上具有較高的基因豐度。分子標記技術(shù)被廣泛應(yīng)用于研究的各個領(lǐng)域,其中SSR位點是目前應(yīng)用較為廣泛的一種標記類型。本研究挖掘到3014個SSR位點在不同核苷酸重復(fù)類型中均有分布,證實白靈菇基因位點較為豐富。本研究對白靈菇進行轉(zhuǎn)錄組測序及數(shù)據(jù)處理,獲得了高質(zhì)量的Unigene序列信息,經(jīng)生物信息學(xué)相關(guān)軟件對白靈菇Unigene進行功能注釋分類、代謝通路富集分析及SSR位點的類型等多方面分析研究,為后續(xù)白靈菇基因組學(xué)功能研究、分子標記輔助育種、種質(zhì)資源開發(fā)利用和遺傳多樣性修復(fù)等提供數(shù)據(jù)參考。