上官小霞 楊琴莉 李換麗
山西農業大學棉花研究所, 山西運城 044000
堿性螺旋-環-螺旋(basic helix-loop-helix, bHLH)轉錄因子廣泛存在于植物、動物和真菌中, 是繼MYB家族之后的第二大轉錄因子家族。bHLH轉錄因子不僅普遍參與植物的生長發育和代謝過程[1-2]、各種信號轉導如油菜素內酯(brassinosteroids,BR)[3]、茉莉酸(jasmonic acid, JA)信號轉導[4]等過程,而且在植物對非生物脅迫, 如干旱、鹽、寒冷、缺鐵等逆境反應中也起重要作用[5-8]。
bHLH蛋白保守結構域由50~60個氨基酸組成,包含2個功能不同的區域, 即N末端堿性區域(basic)和C末端螺旋-環-螺旋(HLH)區域。堿性區域可以識別和結合DNA, HLH區域包含2個α螺旋, 可以相互作用形成同源或異源二聚體, 從而與靶基因啟動子的不同部位結合進而對基因的轉錄發揮調控作用[9]。部分HLH蛋白因為缺失堿性區域, 不能與DNA結合, 但可以通過與bHLH蛋白結合形成異源二聚體發揮功能[9]。四倍體陸地棉中包含432個bHLH/HLH轉錄因子[10], 其中385個為典型的bHLH轉錄因子, 數量遠大于擬南芥(166個)、水稻(167個)、馬鈴薯(124個)、小麥(225個)、玉米(206個)[11]等其他植(作)物中bHLH轉錄因子的數量, 表明bHLH轉錄因子家族在棉花生長發育過程中發揮重要的調控作用。在棉花的430多個bHLH/HLH轉錄因子中, 有77個在棉花纖維發育過程中相對高表達[12], 暗示這些bHLH轉錄因子可能參與了對棉花纖維發育的調控。我們先前的研究表明, 棉花中一個編碼bHLH轉錄因子的基因GhDEL65在調控植物表皮細胞發育過程中起重要作用[13]。野生型擬南芥中表達GhDEL65基因可以顯著增加植株表皮毛數量, 棉花中過量表達該基因也可以促進纖維細胞的伸長。GhDEL65可能通過與棉花R2R3 MYB以及WD40蛋白相互作用形成MYB-bHLH-WD40復合體調控纖維細胞的發育[13]。GhPRE1基因編碼一個非典型的bHLH轉錄因子, 僅含有HLH區域, 在棉花快速伸長期高表達。棉花中過量表達該基因, 可顯著促進纖維細胞伸長[14]。GhbHLH18基因在纖維發育過程中起負調控作用, 通過激活過氧化物酶介導的木質素代謝來負調控棉纖維的品質,GhbHLH18基因敲除的棉花纖維長度和強度皆比對照明顯增加[15]。棉花體內的多個bHLH轉錄因子的表達受不同激素的誘導, 表明這些bHLH轉錄因子可能通過激素信號途徑對棉花纖維發育進行調控[12,16]。GhFP1作為一個正向的棉纖維發育調控因子, 通過激活BR的生物合成和信號轉導途徑, 參與控制纖維的伸長。過量表達GhFP1的轉基因棉花的纖維長度明顯長于對照, 而抑制GhFP1基因的表達則阻礙了纖維的伸長[16]。相對于野生型的纖維, 轉基因纖維中的BR含量明顯改變。此外, GhFP1蛋白可以直接與GhDWF4和GhCPD基因的啟動子結合, 激活這些BR相關基因的表達[16]。
綜合以前的研究報道可知, bHLH轉錄因子在調控棉花纖維細胞分化及發育方面發揮了重要的生物學功能。但相對于棉花中龐大的bHLH轉錄因子家族以及70多個在纖維發育過程中相對高表達的bHLH基因, 目前僅有幾個與棉花纖維發育相關的bHLH轉錄因子的功能被深入解析, 相關研究報道還相對較少。本文對棉花GhbHLH71轉錄因子的基本信息及生物學功能進行了初步的分析研究, 為進一步解析bHLH轉錄因子在棉花生長發育方面的調控機制提供了一定的理論基礎。
1.1.1 植物材料 陸地棉R15以及基因編輯棉花于人工氣候室或試驗田種植, 人工氣候室栽培條件為(28±2)℃, 光照16 h。棉花開花后掛牌標記當日盛開的花朵, 根據試驗需要收集不同發育期的胚珠和纖維?;ò辍⑿廴铩⒋迫锶¢_花當天的材料, 葉片為生長2個月左右的植株嫩葉, 液氮冷凍, –70℃保存備用。
1.1.2 載體、菌株、試劑 棉花基因編輯載體為GhU6-7 (圖1), 由華中農業大學張獻龍老師實驗室惠贈。靶標基因的sgRNA (small guide RNA, sgRNA)序列經PCR擴增后插入載體GhU6-7啟動子后的2個BsaI位點之間。該載體中包含Cas9基因和NPTII篩選標記基因, 可用于轉基因植株的陽性鑒定。大腸桿菌菌株(Escherichiacoli) DH5α和農桿菌菌株(Agrobacterium tumefaciens) LBA4404由本實驗室保存。

圖1 棉花基因編輯載體示意圖Fig. 1 Sketch image of gene editing vector in cotton
PCR檢測試劑盒2×Hieff PCR Master Mix (with Dye)購自上海翊圣生物科技有限公司; 反轉錄試劑盒EasyScript One-Step gDNA Removal and cDNA Synthesis SuperMix、Real-time PCR試劑盒TransStrat Green qPCR SuperMix、連接試劑盒pEASY-Blunt Zero Cloning Kit、膠回收試劑盒EasyPure Quick Gel Extraction Kit購自北京全式金生物技術有限公司;多糖多酚RNA提取試劑盒購自天根生化科技(北京)有限公司。
1.2.1 棉花轉化 棉花基因轉化受體品種為R15,以5~7 d無菌苗下胚軸為外植體, 采用農桿菌介導法進行轉化, 具體的轉化方法參考文獻[17]進行。
1.2.2 DNA提取及轉基因植株陽性鑒定 采用CTAB法提取棉花葉片DNA。轉基因植株陽性鑒定以載體上的Cas9基因作為參考。根據Cas9基因序列設計特異性PCR檢測引物: Cas9-787-F和Cas9-1550-R,序列見表1, 擴增片段大小約為750 bp。PCR反應體系: 2×Hieff PCR Master Mix 10 μL, 2條引物各1 μL,DNA模板1 μL, 補水至總體積20 μL。檢測樣品包含不同基因編輯株系, 同時用轉化的質粒作為PCR檢測正對照。
1.2.3 編輯位點突變檢測 參照GhbHLH71基因的基因組DNA (gDNA)序列, 在包含2個gRNA位點的上下游約250~300 bp處設計引物CRS25-F和CRS25-R (表1), 以不同T0或T2基因編輯突變體葉片的gDNA為模板, 擴增目的片段, PCR產物經瓊脂糖凝膠電泳后, 進行膠回收、連接、轉化, 涂板, 具體方法參考試劑盒說明書進行。待平板上長出單克隆后, 挑取不同單克隆進行菌落PCR鑒定, 每個轉化子挑選5~8個陽性單克隆送生工生物工程(上海)股份有限公司測序, 采用DNAstar和chromas軟件或clustalW軟件對序列進行分析。
編輯位點突變的純合鑒定采用Hi-TOM基因編輯突變檢測技術(中國農業科學院水稻研究所研發)進行檢測。在第1個sgRNA上下游分別設計引物CRS25-Hi-F和CRS25-Hi-R, 正向引物前段加搭橋序列5'-ggagtgagtacggtgtgc-3', 反向引物前段加搭橋序列5'-gagttggatgctggatgg-3', 引物序列見表1。以不同T2代基因編輯突變體葉片的gDNA為模板進行PCR擴增。PCR產物送中國水稻研究所進行檢測, 測序數據通過Hi-TOM在線分析網站(https://www.hi-tom.net/hi-tom/)進行下載及分析。
1.2.4 RNA提取及qRT-PCR檢測 采用多酚多糖RNA提取試劑盒提取不同組織RNA, 具體步驟參考試劑盒說明書。使用EasyScript One-Step gDNA Removal and cDNA Synthesis SuperMix 第一鏈反轉錄試劑盒進行總RNA反轉錄。反應體系: 1 μL RNA(~1 μg), 1 μL逆轉錄酶, 1 μL oligo Dt, 1 μL gDNA Remover, 10 μL 2×反應緩沖液, 補水至20 μL。42℃反應30 min, 85℃反應15 s, 加水稀釋3~5倍后于4℃冰箱保存備用。
采用嵌合熒光法進行Real-time RT-PCR檢測。反應體系為20 μL, 包含2×TransStrat Green qPCR SuperMix 10 μL、ddH2O 8 μL、引物bHLH71-RT-F和bHLH71-RT-F (表1)各0.5 μL、Template 1 μL。以棉花Histone3基因(AF024716)作為內參, 引物序列見表1, PCR反應循環數依照不同基因的表達強弱而定。試驗重復3次, 取各組數據的平均值和方差, 采用Rotor-Gene Q Software (Corbett Research, NSW,澳大利亞)進行基因表達量分析, 采用Microsoft Excel 2016繪制圖表。
1.2.5 蛋白序列分析 利用ExPaSy (http://www.expasy.org/)在線工具對GhbHLH71蛋白的分子量、等電點等基本參數進行分析。利用NCBI中的在線工具Conserved Domain Search Service (CD Search)對GhbHLH71蛋白的保守結構域進行預測。
1.2.6 轉基因棉花纖維品質分析 大田種植不同突變體T1代和T2株系, 每個株系種植2~4個株行, 同時種植R15材料作為對照。于生長期通過卡那霉素檢測[17]和Cas9基因的PCR檢測分析確定不同突變體的陽性植株。收獲期于每個突變株系的不同株行挑選單株進行纖維長度檢測, 集中采收每個單株中部吐絮的棉鈴, 每株采收鈴數大于5個, 每個棉鈴隨機挑選3~4粒帶纖維的種子, 手工測量纖維長度, 每株共計檢測20粒種子, 每個突變體各統計10株以上, 利用Microsoft Excel 2016進行差異顯著性分析并作圖。
根據NCBI數據庫中GhbHLH71基因的cDNA序列(LOC107946837)設計引物, 從陸地棉R15的葉片中分離到該基因的cDNA序列, 測序并經序列比對, 所獲得的序列與NCBI數據庫登錄的GhbHLH71基因序列100%相同。GhbHLH71基因cDNA全長996 bp, 編碼331個氨基酸。對GhbHLH71蛋白序列及其理化性質進行預測分析發現, 該蛋白相對分子質量為37.59 kD, 理論等電點(pI)為8.38, 氨基酸組成中含量最高的是Leu(L), 占10.0%。該蛋白含有一個典型的bHLH保守結構域(圖2), 為棉花bHLH轉錄因子家族成員。從陸地棉R15葉片DNA中擴增到該基因的gDNA序列并與cDNA序列進行比對發現, 該基因gDNA序列全長2172 bp, 包含3個外顯子。在第1個外顯子內設計了2個sgRNA序列用于后續的CRISPR/Cas9基因編輯研究。

圖2 GhbHLH71蛋白氨基酸序列及保守結構域Fig. 2 Amino acid sequence and conserved domain of GhbHLH71 protein
本研究檢測了GhbHLH71基因在四倍體陸地棉R15不同組織和棉纖維不同發育時期的表達情況(圖3),GhbHLH71基因在棉花纖維快速伸長期3~12 DPA表達量相對較高, 而在同期發育的胚珠中表達量則相對較低, 棉花葉片中的表達量相對高于花器官不同組織。暗示棉花中GhbHLH71基因可能在棉花纖維快速伸長過程中發揮調控作用。

圖3 GhbHLH71基因在棉花不同組織的表達特征分析Fig. 3 Relative expression pattern of GhbHLH71 gene in different cotton tissue
為進一步了解GhbHLH71基因在棉花生長發育及纖維細胞分化及伸長過程中的作用, 本研究構建了該基因的CRISPS/Cas9基因編輯載體, 以陸地棉R15的無菌苗下胚軸為外植體, 用農桿菌介導法進行棉花轉化, 經過愈傷誘導、愈傷增殖培養、胚性愈傷誘導、幼胚分化成苗等過程, 最終獲得11株T0代植株。提取這11個株系葉片DNA, 用Cas9基因特異引物進行T0代植株的陽性檢測(圖4), 1#、2#、4#、7#、8#、11#共6株Cas9基因的PCR檢測結果為陽性。T0代陽性植株于人工氣候室種植, 后續的基因突變檢測分析及纖維表型分析皆圍繞這6個株系進行。

圖4 不同T0代再生植株的Cas9基因的PCR檢測Fig. 4 Cas9 PCR amplification assay of different T0 regeneration plants
本研究對GhbHLH71的基因編輯共設計了2個sgRNA位點(圖5-A), 皆位于第1個外顯子中, 2個位點之間相距178 bp。在GhbHLH71基因sgRNA1位點上游和sgRNA2位點下游分別設計正向和反向引物進行PCR擴增及突變位點檢測分析, 結果如圖5所示。6個陽性T0基因編輯株系中, 1#、7#、8#、11# 4個株系的2個sgRNA位點皆發生突變, 通過插入或缺失不同的堿基數, 造成GhbHLH71蛋白譯碼突變或翻譯提前終止, 從而喪失了生物學功能。2#和4# 2個株系測序結果顯示sgRNA1位置的序列與野生型一致, 未發生任何突變, 僅sgRNA2位點發生了不同程度的缺失突變。棉花為異源四倍體植物,本研究中設計的sgRNA1位點20個bp序列中A和D基因組存在1個堿基的差異(圖5-A中紅色標記),載體序列設為D基因組的序列。對T0轉化子進行突變位點檢測發現, 所檢測株系中1#株系sgRNA1位點的突變發生在A基因組, 7#、8#、11# 3個株系sgRNA1位點突變發生在D基因組。對異源四倍體棉花進行基因編輯時sgRNA設計的基本原則之一是A組和D組的序列完全一致, 二是CG含量在40%~60%之間[18-19], 這樣有利于提高sgRNA編輯效率。本研究對GhbHLH71進行編輯的sgRNA1位點A組和D組存在1個堿基的差異, 造成sgRNA1的編輯效率明顯低于sgRNA2。對T0代不同突變體的檢測結果未發現同一株系A、D基因組皆被編輯突變的現象, 需要種植后代進行進一步的檢測分析。

圖5 不同T0株系GhbHLH71基因CRISPR/Cas9編輯效率檢測Fig. 5 CRISPR/Cas9 editing effect of GhbHLH71 gene in different T0 regeneration lines
種植不同T0代基因編輯株系的T1代苗, 觀察GhbHLH71基因編輯突變對棉花生長發育的影響。本研究所用基因編輯載體的篩選標記基因為NPTII基因, 所以在T1代棉花營養生長期間, 首先通過田間卡那霉素涂抹試驗篩選陽性植株, 然后通過Cas9基因的PCR檢測分析確定不同株系T1代陽性植株并做好標記進行觀察。在整個棉花生長發育期, 不同基因編輯突變體株系棉花的生長情況、開花時間、結鈴及吐絮等性狀與對照相比皆無明顯的差異。收獲期單株采收不同植株中部棉鈴進行纖維檢測分析,每個株系檢測10個以上單株。檢測結果顯示(圖6-A):6個基因編輯株系的棉花纖維長度與對照相比皆顯著變短, 其中纖維變短最為明顯的為4#株系, 其纖維長度(22.69 mm)與對照(30.31 mm)相比, 縮短比率達25%, 表明GhbHLH71基因主要參與對棉花纖維細胞伸長的調控。

圖6 不同T1、T2代GhbHLH71基因編輯株系纖維表型分析Fig. 6 Fiber phenotype of different GhbHLH71 T1 and T2 gene editing lines
挑選了T1代株系中纖維較短的4#、8#、11# 3個株系種植T2代植株進行后代的遺傳分析, 結果見圖6-B, 3個突變體株系的T2代表型與T1代相似, 與對照相比, 僅纖維細胞的伸長受到明顯影響, 3個株系的纖維長度皆明顯短于對照, 表明突變GhbHLH71基因造成的纖維變短的表型可以穩定遺傳。其中,4#、8#株系的纖維與對照相比, T1和T2兩代材料的纖維縮短比例皆達20%以上。
挑選纖維較短的4#和8# 2個株系的T2代突變材料, 進行靶位點不同基因組的編輯情況分析, 檢測編輯位點的突變是否純合。每個株系選取5個單株, 用引物CRS25-F和CRS25-R進行PCR擴增, 連入載體后每株挑8個單克隆進行測序。檢測結果表明, 這2個株系T2代皆檢測到A和D基因組皆突變的植株。圖7顯示了每個T2單株各2個具有代表性的檢測結果, 其中8-2、8-4、8-5、4-3在挑選的8個單克隆中檢測到A、D基因組皆發生突變, 說明這4株突變體材料已經純合。其余單株僅檢測到D基因組突變, 其原因一是可能突變僅發生在D基因組,二是因為PCR擴增是以四倍體棉花gDNA為模板,而PCR擴增所用引物為A/D基因組通用, 挑選的單克隆比較隨機, 沒挑選到A基因組片段。
為了進一步分析T2代突變材料的基因編輯情況,本研究采用Hi-TOM檢測技術對4#和8#株系的不同植株進行了高通量測序, 2個株系各檢測15株, 每株檢測5000 reads, 相當于5000個單克隆。2個株系所檢測的30個單株編輯位點皆發生了突變, 4#和8#株系分別獲得10株和12株A、D基因組皆突變的植株。表2顯示了部分植株的Hi-TOM檢測結果, 其中已經過濾掉突變比例小于5%的樣品。Hi-TOM檢測結果表明GhbHLH71基因編輯突變體T2代已經獲得純合植株。

表2 T2代株系的Hi-TOM編輯突變檢測Table 2 Hi-TOM editing mutations detection in T2 generation lines
CRISPR/Cas9介導的棉花基因組編輯技術的不斷發展和完善, 為棉花基因功能研究提供了重要的技術基礎[19-22]。越來越多的棉花功能基因通過CRISPR/Cas9基因編輯技術被鑒定或解析[21-24]。本文通過基因編輯技術對陸地棉GhbHLH71的基因功能進行初步分析發現, 該基因主要在棉花纖維細胞伸長方面起調控作用,GhbHLH71基因編輯株系棉花纖維長度與對照相比明顯變短。但本文對于該基因調控棉花纖維伸長的分子機制缺乏進一步的分析研究。該基因參與的激素信號途徑、上游調控因子、下游靶基因的選擇、相互作用蛋白等都是我們需要深入研究的方向, 這些研究將有助于我們較全面地了解該轉錄因子調控棉花纖維發育的分子機制。
轉錄因子在棉花纖維細胞的分化與伸長過程中發揮重要的調節作用[25-26], 其中的一些關鍵的調控因子如GhHOX3、GhMYB25-Like等對纖維細胞分化與伸長起決定性的調控作用。棉花中降低GhHOX3基因的表達, 棉花纖維細胞伸長完全受到抑制[27], 降低GhMYB25-Like基因的表達, 則完全抑制纖維細胞的分化與起始[28]。突變GhbHLH71基因雖然對棉花纖維的伸長造成一定的影響, 但相對于GhHOX3、GhMYB25-Like等關鍵因子來說,GhbHLH71基因突變對纖維發育的影響效果相對較小。棉花中有77個bHLH家族基因在棉花纖維發育過程的中表達量相對較高[12], 這些bHLH/HLH轉錄因子之間可能存在功能冗余。因此利用基因編輯技術突變棉花GhbHLH71基因, 雖然棉花纖維發育受到了一定的影響, 但其分化與伸長并為完全被抑制。
棉花中bHLH轉錄因子數目眾多, 功能多樣。除調控棉花纖維發育的功能外, bHLH轉錄因子也被報道參與棉花生長發育、次生代謝、逆境響應等過程[29-33]。GoPGF基因編碼一個典型的bHLH轉錄因子, 在調控棉花表皮細胞腺體發育過程中起關鍵作用, 該因子突變會導致棉花表皮腺體發育完全被抑制[29]。棉花中GhbHLH1基因的表達主要富集在7 DPA纖維中, 并且其表達水平受脫落酸(abscisic acid, ABA)和干旱處理的誘導[30], 另一個bHLH轉錄因子GhbHLH130的表達也受干旱、高鹽、低溫以及外源ABA的顯著誘導[31], 表明這2個基因可能作為調控基因參與棉花對逆境的響應[30-31]。GhBEE1-Like基因編碼一個核定位的bHLH蛋白,其表達可以被BR誘導, 在調控棉花花藥開裂方面發揮重要作用[32]。棉花中過表達GhbHLH171基因,可以激活JA合成及信號轉導途徑基因的表達, 從而提高棉花對大麗輪枝菌V.dahliae的耐受性[32]。隨著植物生物技術以及基因組學、轉錄組學、代謝組學等技術的不斷發展, 棉花中越來越多的bHLH/HLH轉錄因子的功能將會被解析, bHLH/HLH轉錄因子調控棉花生長發育特別是棉花纖維細胞的生長發育以及抗逆調控機制將會越來越清晰, 這對棉花高產優質抗逆新種質材料的創制以及棉花分子設計育種具有重要的理論及實踐意義。
本研究通過CRISPR/Cas9基因編輯技術, 創制了棉花GhbHLH71基因編輯突變體, 并對其表型進行了分析。結果表明GhbHLH71基因主要在棉花纖維細胞伸長過程中起調控作用, 該基因的突變會導致棉花纖維長度與對照相比明顯變短。本研究結果為進一步闡明GhbHLH71的轉錄調控機制以及全面解析棉花纖維發育的分子機理提供了理論參考。