朱風麗,徐曉蘭,陳體強,石林春,繆曉青**,蘭 進
(1.福建農林大學食品科學學院 福州 350002;2.福建農林大學蜂學學院 福州 350002;4.中國醫3.學福科建學省院農北業京科協學和院醫食學用院菌藥研用究植所物 研福究州所3 5北0 0京1 4 ;1 00193)
靈芝(Ganoderma)也被稱為“不朽的蘑菇”、“傳統中藥的象征”,是著名的藥用真菌之一。《中華人民共和國藥典》(2015 年版)中收錄赤芝(Ganoderma lucidum)和紫芝(G.sinense)為靈芝的藥材來源。靈芝能夠產生大量的生物活性物質,現有400多種化合物被鑒定,主要是三萜和多糖類物質。靈芝種類較多,栽培種主要為赤芝[1]。近年來,由于野生靈芝資源的破壞較為嚴重,使得具有重要藥用價值的野生靈芝種質資源瀕臨滅絕。我國靈芝的主栽品種部分來自韓國和日本等地,由于與引進品種產地的氣候環境相差較大,菌種的長時間栽培導致品種衰退,出現產量下降、品質降低、抗病蟲及雜菌能力較差等缺點。因此應大力推動自主選育的適于我國生長的優良品種[2]。目前選育技術方法傳統、育種周期長、遺傳改良效率偏低。2011年,赤芝CGMCC5.0026 基因組測序的完成推進了赤芝基因組學的研究進程[3],使赤芝在基因組范圍內進行遺傳分析成為可能,為分子標記輔助育種提供技術手段,這為赤芝新品種的選育打下基礎。
近年來,隨著測序技術的發展及許多物種基因組測序的不斷完成,重測序技術也得到了廣范的應用,利用全基因組重測序技術可以在全基因組范圍內挖掘單核苷酸多態性(SNP)、插入缺失標記(InDel)、結構變異(SV)和基因拷貝數變異(CNV),并廣泛應用于變異檢測、遺傳圖譜構建、性狀定位和群體進化研究等[4]。Shin 等[5]將韓牛重測序數據分別與UMD 3.1 和Btau 4.6.1兩個牛的參考基因組進行比對,分別發現了46 301和28 613 個SNP,這些SNP 是韓牛特有的可能與產奶機制、多汁性以及黃色的牛毛有關,同時發現了大多數的SNP 位于啟動子區域,這表明SNP 調控了與性狀相關基因的表達。Zhang 等人[6]通過全基因組重測序技術,將芥菜中與花色相關的基因BjPC2 定位到了染色體B04 上。Varshney 等人[7]將包含選育品系、地方品種、野生種等在內的292種木豆進行基因組重測序,在基因組上發現了幾個可能與馴化、育種相關的區域。并通過基因組關聯分析,確定了一些后選基因與農藝重要性狀之間的相關性。Lee 等人[8]將起源于韓國的早花大豆突變株系進行全基因組重測序共篩選出了30個與開花相關的SNPs和25個Indels。
為了研究韓國赤芝菌株的基因組序列情況,應用二代測序的方法對韓國赤芝菌株進行了全基因組重測序。本文將韓國赤芝基因組重測序數據與赤芝CGMCC5.0026(參考基因組)進行比較以揭示其在SNP、InDel、SV存在的變異,旨在發現韓國赤芝菌株特有的序列特征,為研究不同來源的菌株之間的差異提供數據。并且初步探索了與菌絲生長速度和靈芝三萜合成相關的基因變異,為赤芝的分子標記育種及完善藥用真菌模式體系提供基礎。
赤芝CGMCC5.0026[3]保存于本實驗室,韓國赤芝(韓芝)由中國醫學科學院藥用植物研究所蘭進教授饋贈。兩種菌株均為二倍體。
1.2.1 赤芝菌絲的生物量
將2 個赤芝菌株在28℃恒溫培養箱中進行活化,將活化好的菌株轉接至PDA培養基中,當菌絲生長至直徑為5-6 cm 時,用打孔器在菌絲邊緣處打孔,并將10個直徑為1 cm的菌絲塊轉接至PDA液體培養基中,28℃,180 rpm黑暗下培養8 d,然后用超純水沖洗至洗脫液為無色。45℃烘干至恒重。每個實驗平行3次。
1.2.2 靈芝三萜含量的測定
菌絲的PDA 液體培養方法同“1.2.1”項下。將清洗干凈的菌絲液氮研磨成細粉后烘干至恒重。根據實驗室前期得到的提取靈芝三萜的條件,采用香草醛-高氯酸顯色法測定靈芝三萜含量。稱取0.05 g左右干燥的靈芝菌絲細粉,加入3 mL 80%的乙醇浸提4 h,然后在溫度為60℃下超聲提取20 min。將提取液定容至10 mL,取1 mL 水浴揮干后加入0.2 mL 5%的香草醛-冰醋酸和0.8 mL的高氯酸溶液,70℃水浴15 min,冷卻至室溫,最后加入4 mL 的冰醋酸,搖勻后在560 nm 處測定吸光度值。
1.2.3 韓芝的全基因組重測序
用植物基因組DNA 提取試劑盒(天根生化科技(北京)有限公司)進行DNA的提取。將提取的質量較好的DNA 送至北京百邁客生物科技有限公司進行全基因組重測序。首先對提取的基因組DNA進行檢測,合格后用超聲波法將DNA 片段化,然后將片段化的DNA 進行片段純化、末端修復、3'端加A、連接測序接頭,然后用瓊脂糖凝膠電泳進行片段大小選擇,進行PCR 擴增以形成測序文庫,建好的文庫先進行文庫質檢,質檢合格的文庫用Xten進行測序。對測序得到的原始reads(雙端序列)進行質量評估,并過濾得到Clean Reads,用于后續生物信息學分析。用bwa 軟件[9]將Clean Reads 與參考基因組序列進行比對,基于比對結果進行SNP、Small InDel、SV 的檢測和注釋,并對DNA水平差異基因進行挖掘與注釋分析。
1.2.4 韓芝與赤芝CGMCC5.0026 基因組間變異的檢測與注釋
根據韓芝的Clean Reads 在赤芝CGMCC5.0026 基因組[3]上的定位結果,用GATK 軟件工具包[10]進行SNP和Small InDel 的檢測,其中SNP 的檢測是根據Clean Reads 在參考基因組的定位結果,使用Picard(http://sourceforge.net/projects/picard/.(Picard))進 行 去 重 復(Mark Duplicates)、GATK 進 行 局 部 重 比 對(Local Realignment)、堿基質量值校正(Base Recalibration)等預處理,以保證檢測得到的SNP準確性,再使用GATK進行SNP的檢測,過濾,并得到最終的SNP位點集。并用SnpEff 軟件[11]進行SNP 和Small InDel 變異的注釋與預測。使用breakDancer 檢測SV變異,并對SV進行注釋。
1.2.5 DNA水平變異基因的挖掘與功能注釋
尋找韓國赤芝與赤芝CGMCC5.0026 間發生的非同義突變SNP、CDS區發生的InDel與SV的基因,將這些變異基因通過BLAST[12]與NR[13]、SwissProt[13]、GO[14]、COG[15]、KEGG[16]功能數據庫進行比對,并對這些基因的功能進行注釋。
1.2.6 RT-PCR檢測
將“1.2.1”中培養的菌絲使用TranZol UP(北京全式金)提取RNA,然后用TaKaRa PrimeScript TM RT reagent Kit with gDNA Eraser Kit(購自TaKaRa)反轉錄成cDNA。根據靈芝全基因組測序的結果,找出本實驗中注釋到的9 個與生長相關的轉錄因子的CDS 序列,使用Primer premier 5 軟件設計引物,引物序列(表1),以靈芝菌絲cDNA 為模板,用SYBR?Premix Ex Taq TM Ⅱ(Tli RNaseH Plus)(購自TakaRa)進行PCR。反應程序為:94℃預變性30 s,94℃變性5 s,60℃退火30 s,共40個循環。熒光定量用甘油醛-3-磷酸脫氫酶(GPD)作為內參基因,基因的相對表達量用2-ΔΔCT計算。

表1 RT-PCR引物序列

圖1 兩種菌絲的生物量

圖2 兩種菌絲的三萜含量
1.2.7 數據處理
數據分析使用SPSS17.0,顯著性分析采用單因素方差分析和多重比較。P <0.05為差異性顯著,P <0.01為差異性極顯著。
液體搖培8 天后,兩種赤芝的菌絲干重(圖1)所示,赤芝CGMCC5.0026 的菌絲干重為0.51 g 是韓芝的1.97倍,并在統計學上表現為顯著性差異。
對赤芝CGMCC5.0026 和韓芝菌絲的三萜含量進行比較,結果表明(圖2),韓芝菌絲的三萜含量為20.00 mg·g-1是赤芝CGMCC5.0026的1.30倍,在統計學表現為極顯著差異。
對重測序的Q30、GC 含量、與參考基因組的比對率、平均覆蓋深度進行統計,其統計結果(表2)。得到的reads 數目有7 679 704 個,將重測序結果與赤芝CGMCC5.0026基因組比較,發現與參考基因組的匹配率為87.79%,測序深度為44倍。
韓芝的SNP 檢測結果表明,總共檢測到的SNP 數量為291212 個,其中SNP 的Ti/Tv(轉換/顛換)的比值為2.81,其中雜合類型的SNP比例為62.87%。SNP變異的基因數量為13 914,占靈芝預測總基因的86.35%。對SNP的檢測結果進行注釋,發現,SNP的變異主要發生在CDS區(37.04%),在CDS區中主要的突變類型為同義編碼突變(58.57%)和非同義編碼突變(40.53%)(表3)。
根據樣品的Clean Reads 在參考基因組上的定位結果,檢測韓芝與參考基因組間在CDS區的Small InDel變異,其變異總數為9 458個(表4)。根據檢測得到的Small InDel 位點在參考基因組上的位置信息,對比參考基因組的基因、CDS 位置等信息,對InDel 位點進行功能或類型的分類,結果(表5)所示。從表中可以看出,InDel 變異多發生在基因的上游(37.31%)、下游(33.43%)區域和CDS 區域(12.71%),在CDS 區中,發生的變異大多為移碼突變(50.58%)。
使用breakDancer 對SV 進行檢測的結果表明,韓芝的結構變異總數為3925,其中,變異最多的為缺失類型變異,其數量為1437(表6)。根據檢測到的SV變異在參考基因組上的位置信息,對比參考基因組的基
因、CDS位置等信息,對韓芝SV變異進行位置的注釋,并對缺失(DEL)、插入(INS)、反轉(INV)三種類型的結構變異進行注釋,其結果(表7)所示,從表中可以看出,SV的變異主要發生在外顯子區域。

表2 赤芝5.644 測序數據統計

表3 SNP注釋結果

表4 Small Indels的CDS區統計

表5 Small Indel注釋結果

表6 SV統計

表7 SV注釋
在CDS區發生的變異可能會引起基因功能的變化,檢測到韓芝與參考基因組間發生的非同義突變SNP、CDS 區發生的InDel 與SV 的基因數量分別為10 607、4 774、1 428。共有9 649個變異基因得到了注釋,COG共注釋到了4061個變異基因,其中存在較多變異基因的功能類為氨基酸運輸和代謝(361 個)、次生代謝物的生物合成、運輸和分解代謝(352個)、碳水化合物的運輸和代謝(315 個)(圖3)。將得到的9649 個變異基因進行KEGG 分析,這些變異基因主要注釋到的代謝通路為碳代謝(79 個)、氨基酸的生物合成(72 個)和RNA轉運(70個)(圖4)。
這些變異基因中有86個為轉錄因子,目前對于靈芝中轉錄因子的研究,分析與靈芝菌絲生長及靈芝三萜含量相關的轉錄因子GlSwi6[17]和GlPacC[18]發現,兩個基因CDS 區發生的變異類型分別為密碼子刪除和非同義編碼突變。除此之外,從這些變異的轉錄因子中還發現了4個可能與韓芝菌絲生長相關的候選基因PacC/Rim101、Zap1、Spt8 和Bfr2。這 些 轉 錄 因 子 的CDS區均發生了非同義編碼突變(表8)。
注釋為細胞色素P450 的變異基因有195 個,與已報道的[3]和羊毛甾醇合酶(LSS)高度相關的78 個CYP基因相比,有70 個相同的基因,其中有12 個CYP512和1個CYP5144,這13個基因在CDS區均發生了變異,變異類型為非同義編碼突變、移碼突變、終止密碼子獲得、密碼子改變+密碼子刪除及密碼子(3 的整數倍)插入(表9)。對基因GL15605 的變異進行圖示,該基因DNA 序列2186核苷酸處發生單堿基突變(圖5 A),使得氨基酸從精氨酸轉變為賴氨酸(圖5 B)。

圖3 變異基因COG注釋圖

圖4 變異基因的KEGG注釋圖

表8 與生長相關的轉錄因子的變異

表9 細胞色素P512和P5144家族的變異

圖5 基因GL15605序列比對
對注釋的與生長相關的6 個轉錄因子進行RTPCR分析,結果表明(圖6),韓芝的基因表達量高于赤芝CGMCC5.0026,注釋為PacC/Rim101(GL27476)和Zap1(GL21797)的基因,在兩種菌絲中的差異具有統計學意義。其它4個基因的表達量差異不顯著。
隨著越來越多生物的基因組被測序,其基因組重測序技術已成為分子育種研究的重要手段。本文對韓芝進行基因組重測序,得到了大量的變異基因,在COG注釋中,這些變異基因主要注釋到了氨基酸的運輸和代謝,次生代謝物的生物合成、運輸和分解代謝,碳水化合物的運輸和代謝。
變異基因中,注釋到的轉錄因子共有86 個,主要的類型為bZIP、C2H2、CBF、HTH、MADS、TFII_related和一些真菌特有的轉錄因子。其中,C2H2類型轉錄因子PacC 的缺失對真菌菌絲的生長和分生孢子的產量具有一定的抑制作用[19,20]。赤芝轉錄因子GlPacC 沉默,對菌絲生長速度、子實體發育和靈芝酸合成具有抑制作用。韓芝中該基因CDS 區發生了密碼子刪除(3的整數倍),CGCCCCCGC堿基缺失。在韓芝中還發現了另一個pH響應轉錄因子PacC/Rim101(GL27476)在CDS 區也發生了非同義編碼突變。此外,Swi6 轉錄因子屬于APSES 家族,是真菌特有的一個蛋白家族[21]。有研究表明,赤芝中轉錄因子GlSwi6基因沉默菌株降低了菌絲生長速度,增加了菌絲分支,并且抑制了原基和子實體的形成,降低了靈芝酸的含量[17],本研究發現韓芝中該基因CDS 區發生了非同義編碼突變。除此之外,還發現了一些與生長相關的轉錄因子Zap1、Spt8和Bfr2在CDS區也發生了非同義編碼突變。有研究表明,酵母菌在鋅受限型培養基中生長受到限制,這與Zap1 轉錄因子的靶基因有關[22]。SPT 包括SPT3、SPT7、SPT8 和SPT20,是SAGA 復合體的重要成分蛋白。禾谷鐮刀菌中,與野生型相比,Fgspt3 和Fgspt8缺失突變株的菌絲生長明顯受到抑制,并且不能產生分生孢子,同時與孢子形成相關的基因FgFlbC和FgRen1的表達量也下調[23]。Bfr2基因對細胞生長周期具有調控作用[24]。菌絲生長受很多基因和通路的調控,調控過程比較復雜。轉錄因子在結合區域產生的SNP可能會影響轉錄因子的結合特性,影響轉錄因子在等位基因上的結合強度,從而影響SNP 所在基因的表達情況[25]。在研究中我們發現,赤芝CGMCC5.0026 的生物量高于韓芝。對靈芝中注釋的與生長相關的6個轉錄因子,通過RT-PCR 檢測發現赤芝CGMCC5.0026 的表達量均低于韓芝,由于在RT-PCR中使用甘油醛-3-磷酸脫氫酶(GPD)作為內參基因,該內參基因在不同靈芝中的表達量有所差異,本實驗中發現韓芝中的GPD表達量(Cq值為24.5)要高于赤芝CGMCC5.0026(Cq值為22.17),因此在計算基因的相對表達時,韓芝中基因的表達量要高于赤芝CGMCC5.0026。這6個轉錄因子的變異是否會參與靈芝菌絲的生物量以及如何參與菌絲生長的調控還需要后續實驗的進一步驗證。

圖6 不同菌絲的基因相對表達量
肌動蛋白骨架在真菌細胞極性生長、產孢、應激和維持細胞形態等方面發揮重要作用。本文中,韓芝中部分肌動蛋白相關蛋白CDS 區發生了非同義編碼突變、移碼突變。肌動蛋白相關蛋白(ARP5)缺陷型植物表現出植株矮小和細胞大小異常[26],本研究注釋到的兩個肌動蛋白相關蛋白(ARP5)均發生了非同義編碼突變。
此外,本研究還發現,注釋為細胞色素P450 的變異基因有195個,這些基因在KOG分類注釋中,有135個變異基因參與次生代謝產物的生物合成,轉運和分解代謝,4 個變異基因參與了能量的產生和轉化。與Chen 等人研究中78 個可能和赤芝三萜合成相關的CYP450相比,發現有70個相同的CYP450,其中,有12個CYP512 和1 個CYP5144,研 究 表 明,在 動 物 中CYP512 和CYP5144 對甾體激素和睪酮等激素的結構具有修飾作用,并且這兩個P450家族與羊毛甾醇合酶(LSS)共表達[3],由于細胞色素P450 基因變異較多,因此本實驗對不同菌株菌絲的三萜含量進行測定,發現韓芝菌絲三萜含量明顯高于赤芝CGMCC5.0026,這說明韓芝中大量細胞色素P450 的變異可能會影響赤芝三萜的含量。這將為細胞色素P450 參與三萜的合成提供新的證據。
赤芝全基因組測序的完成為靈芝成為藥用模式真菌奠定了堅實的基礎[3]。靈芝生長發育和發酵與栽培的研究為靈芝的一般生物學研究奠定了基礎[27]。靈芝的藥用成分豐富,目前已分離出400多種活性物質,包括多糖、萜類、甾醇類、生物堿等[28]。靈芝的基因組分析進一步證實了靈芝具有三萜、聚酮、倍半萜等多條次生代謝合成途徑[27],目前研究較多的是合成靈芝三萜的MVA 途徑,其上游途徑中的一些關鍵酶基因如AACT[29]、HMGS[30]、HMGR[31]、FPS[32]、MVD[33]、LSS[34]和SQS[35]已被克隆及進行基因過表達研究。赤芝基因組測序的完成篩選出600 多個轉錄調控蛋白和219 個CYP450 編碼基因[3]。目前,靈芝遺傳轉化的研究也進一步開展,如電擊法[36]、PEG介導法[37]以及農桿菌介導法[38]。這為靈芝功能基因組學的研究奠定了基礎。本研究進行韓芝全基因組重測序,篩選出一些潛在的與菌絲生長相關的轉錄因子,并且對細胞色素P450對三萜含量的影響具有指導意義,這對完善靈芝模式真菌研究體系提供了基礎。
綜上所述,本研究通過全基因組重測序篩選了韓國赤芝與中國赤芝間變異的轉錄因子和細胞色素P450,并對韓芝菌絲生長和三萜合成相關基因的變異進行初步挖掘和分析,對揭示赤芝菌絲生長和三萜合成的遺傳機制具有重要意義,而這些變異基因的具體功能還有待進一步驗證。