陳 天 李昱櫻 榮二花 吳玉香
山西農業大學農學院, 山西晉中 030801
多倍體化在植物多樣化、進化、馴化以及育種中發揮著極其重要的作用[1], 棉花是世界范圍內經濟價值最高的纖維作物, 同時也是研究多倍體進化的模式作物[2]。草棉(G.herbaceun, A1A1)是A 基因組二倍體栽培棉, 起源于非洲, 雖然沒有大規模種植,但有著天然的優良性狀, 如抗鹽堿、抗旱、極早熟性等。雷蒙德氏棉(G.raimondii, D5D5)是D 基因組二倍體野生棉, 有著抗角斑病、生長旺盛、具有提高纖維細度和拉力的潛在能力。通過遠緣雜交將親本的有益性狀結合起來, 能有效拓寬棉花種質資源,染色體加倍是恢復遠緣雜種育性的最有效手段[3-4]。
分子標記技術基于DNA, 在植株整個生長期各個器官組織均可檢測到, 不受環境影響; 多態性豐富; 數量多; 檢測方便快捷等[5]。與其他的分子標記相比, SSR 是共顯性標記, 能夠提供更豐富的遺傳信息, 已廣泛用于雜種鑒定[6]、雜種純度[7]及種質資源遺傳多樣性分析[8-10]中。
轉錄組(Transcriptome)是指特定生物體在某種狀態或某一生理條件下, 細胞內所有基因轉錄產物的總和[11]。近年來本實驗室進行了大量基于轉錄組測序在棉花育種上的應用與分析: 申狀狀等[12]對陸地棉和斯特提棉的雜種植株及人工異源六倍體植株(基因組AADDCC)進行無參轉錄組測序, 分析了三倍體雜種植株及異源六倍體植株與親本的基因表達水平; 楊亞杰等[13]對草棉二倍體以及誘變獲得的草棉三倍體和草棉四倍體進行轉錄組測序, 找到草棉多倍體在抗性及光合效率方面均優于二倍體的原因。隨著棉花轉錄組測序研究的深入, 棉花基因組數據庫逐漸完善, 為棉花新基因挖掘和種質創新提供了技術支持和數據庫平臺。
本研究以實驗室前期人工合成的草棉與雷蒙德氏棉的人工異源四倍體(A1A1D5D5) S2、S3、S4代植株為材料, 并與陸地棉(G.hirsutum, AADD)進行纖維性狀、生理生化、SSR 分子標記等方面的比較研究, 旨在將人工異源四倍體與自然界異源四倍體進行比較及性狀鑒定。并通過花器轉錄組學分析, 比較人工異源四倍體與陸地棉的差異表達基因, 找到人工異源四倍體結實率低的真正原因, 為恢復其育性尋找有效途徑, 進一步創新棉花種質資源。
本研究試驗材料采用實驗室前期合成的草棉與雷蒙德氏棉的人工異源四倍體自交2 代(S2)、自交3代(S3)、自交4 代(S4)植株以及親本和陸地棉TM-1。人工異源四倍體合成過程: 以栽培種紅星草棉為母本和野生種雷蒙德氏棉雜交, 對雜種F1進行秋水仙堿誘變加倍[14]。異源四倍體植株逐年種植, 除去自然死亡的植株, 最后用于本研究共7 株, 分別用阿拉伯數字1~7 進行編號, 試驗材料在培育前均進行65℃浸種4 h 及2%次氯酸鈉消毒30 min, 苗期在人工氣候箱培育, 待出現2 片真葉后移栽溫室花盆,每穴1 株, 盆栽間隔0.5 m。草棉和陸地棉盆栽若干株, 分別取長勢良好的3 株作重復。雷蒙德氏棉1株。研究材料具體信息見表1, 人工異源四倍體1~4號植株為S2代, 5~6 號植株為S3代, 7 號植株為S4代。多倍體后代株系關系如圖1 所示, 其中2~5 號植株同期種植, 6~7 號植株同期種植。

表1 研究材料基本信息Table 1 Basic information of research materials
1.2.1 生理指標測定 在試驗材料整體進入現蕾期,選取不同植株新鮮嫩葉, 迅速用液氮預冷后轉移至–80℃冰箱保存。根據北京盒子生工科技有限公司提供的試劑盒及方法分別測定丙二醛(malondialdehyde,MDA)含量、超氧化物歧化酶(superoxide dismutase,SOD)、過氧化物酶(peroxidase, POD)、過氧化氫酶(catalase, CAT)活性。每個指標均設置3 個生物學重復, 使用96 孔板測定吸光值, 檢測所用酶標儀型號為Multiskan FC。
1.2.2 SSR 分子標記 通過基于PCR 的簡單重復序列標記 (simple sequence repeats, SSR)對提取的DNA 樣品進行多態性分析。PCR 反應體系為10 μL:5 μL 2×TaqPCR Master Mix (含染料), 1 μL 正向引物(1 μmol L–1), 1 μL 反向引物(1 μmol L–1), 1 μL 模板DNA (50 ng μL–1), ddH2O 補齊。PCR 擴增程序: 94℃預變性5 min; 94℃變性60 s, 退火60 s, 72℃延伸90 s, 35 個循環; 72℃延伸10 min; 4℃保存。電泳程序及銀染操作參照實驗室前期方法[15], 顯影至出現清晰條帶后, 置于顯影儀上人工讀帶, 有條帶記1, 無條帶記 0, 并計算引物的多態信息含量(polymorphism information content, PIC)。從棉花標記數據庫(http://www.cottonmarker.org/Downloads.shtml)篩選11 對多態性好的SSR 引物, 信息見表2,由生物工程股份有限公司合成, 試驗所用PCR 擴增儀型號為東勝ETC811, 電泳儀電源型號為北京六一DYY-6D, 電泳槽型號為北京六一DYCZ-24B, 顯影儀型號為北京六一WD-9406。Marker 由北京索萊寶科技有限公司提供。PIC 計算公式[16]:

表2 SSR 引物序列信息Table 2 Sequence information of SSR primers
式中,k是一對SSR 引物擴增的等位位點的數目,Pi是第i個等位位點的頻率。
1.2.3 轉錄組測序分析 由于無法準確判斷雜種可育株的某個花器是否能成功結鈴, 本研究選取S2代同期種植的2、3、4 號株(目前未結鈴)的花器作為試驗樣品, 記為CL; 并以陸地棉TM-1 花器作為參照, 記為CK。以上試驗樣品均設置3 個生物學重復。將樣品送百邁客生物科技有限公司進行RNA 提取及使用Illumina NovaSeq 6000 測序平臺進行PE150模式測序。將下機原始數據(Raw Data)質控后獲得的高質量序列(Clean Data)比對到陸地棉參考基因組上,進行后續分析。參考基因組的版本信息:Gossypium_hirsutum.TM_1.genome.fa。
1.2.4 數據處理 采用Microsoft Excel 2016 整理試驗數據, 利用SPSS 26 軟件進行數據處理與分析,利用Origin 2021 軟件作圖。
對人工異源四倍體及親本纖維性狀比較觀察(圖2)發現, 父本雷蒙德氏棉纖維呈褐色, 纖維粗短,母本草棉纖維呈白色, 人工異源四倍體纖維顏色介于親本之間, 呈淺黃色, 纖維長于親本。對人工異源四倍體和陸地棉纖維性狀比較(圖3)發現, 人工異源四倍體纖維長度與陸地棉接近, 但較陸地棉纖維稀疏, 淺黃色纖維性狀較有優勢。

圖2 親本及人工異源四倍體纖維形態Fig.2 Fiber morphology of G.herbaceum, G.raimondii, and artificial allotetraploid

圖3 人工異源四倍體及陸地棉纖維形態Fig.3 Fiber morphology of artificial allotetraploid and G.hirsutum
研究材料由于遺傳背景不同, 生理變化趨勢也有所不同。對草棉、雷蒙德氏棉、人工異源四倍體后代以及陸地棉超氧化物歧化酶、過氧化物酶、過氧化氫酶活性和丙二醛含量進行檢測發現(表3), 人工異源四倍體植株SOD、POD、CAT 活性及MDA含量均顯著高于親本和陸地棉, S2、S3、S4代之間酶活性有高有低, 無明顯差異。表明人工異源四倍體在經過遠緣雜交及加倍后, 抗逆性得到加強。

表3 各世代生理指標結果Table 3 Physiological indexes among different generations
在棉花標記數據庫篩選出11 對多態性好的SSR引物對7 株人工異源四倍體及親本和陸地棉DNA 進行SSR 分子標記鑒定。SSR 擴增結果表明(表4), 11對引物總共擴增出59 個等位位點, 其中55 個位點具有多態性, 平均每對引物擴增出5 個多態位點。引物NAU2026 (圖4-B)、引物NBRI_GL015 (圖4-C)擴增出10 個位點數, NAU1169 擴增的位點數最少,擴增出2 個。11 對SSR 引物的多態信息含量PIC 在0.498~0.892 之間, 平均為0.742, 引物NAU2026、引物NBRI_GL015 的PIC 值最高, 說明這2 對引物多態性豐富, 能較好的揭示試驗材料間的遺傳多樣性。引物NAU1169 的PIC 值最低。由圖4 可知, 引物BNL4108、引物NAU2026、引物NBRI_GL015均可作為S2的特征引物, 引物NBRI_gM7 可作為人工異源四倍體的特征引物。

圖4 部分SSR 引物擴增結果Fig.4 Part information of SSR primers

表4 SSR 引物擴增結果Table 4 SSR primers information
對人工異源四倍體及親本的11 對SSR引物多態性位點進行統計分析(表5), S2代有13 個位點與母本相同, 有10 個位點與父本相同, 有28 個特異位點,平均每對引物有2.55 個特異位點, 有2 個缺失位點;S3代有9 個位點與母本相同, 有6 個位點與父本相同, 有7 個特異位點, 平均每對引物有0.64 個特異位點, 有12 個缺失位點; S4代有10 個位點與母本相同, 有6 個位點與父本相同, 有8 個特異位點, 平均每對引物有0.73 個特異位點, 有11 個缺失位點。分析表明人工異源四倍體后代的多態性位點在逐代減少, 推斷是因為人工異源四倍體的基因片段隨著繁殖代數增加在自行協調優化, 因此逐代自交能夠提高人工異源四倍體育性。

表5 人工異源四倍體及親本SSR 引物多態性分析Table 5 Analysis of SSR primer polymorphisms for artificial allotetraploid and its parents
對人工異源四倍體相對于親本擴增出的特異性位點進行分析(圖5-A), S2的特異位點數最多,有28 條, S3、S4的特異條帶數分別是7 條和8 條。其中各世代共同擴增出的特異條帶有5 條, S2獨有的特異條帶有18 條, S3、S4均無單獨擴增的特異條帶。對人工異源四倍體與陸地棉的SSR 條帶進行比較分析(圖5-B), S2、S3、S4與陸地棉相同的條帶分別是37 條、19 條、20 條, 其中有17 條是人工異源四倍體各世代與陸地棉共有的, 表明人工異源四倍體與陸地棉有相同的遺傳背景, 其中 S2代同源性最強。

圖5 人工異源四倍體的SSR 多態位點分布Fig.5 Resources of SSR polymorphism for artificial allotetraploid
2.4.1 差異表達基因的篩選 本研究轉錄組測序共獲得38.29 Gb Clean Data, 各樣品Clean Data 均達到6.08 Gb, Q30 堿基百分比在92.46%及以上, 分別將各樣品的Clean Reads 與指定的參考基因組進行序列比對, 比對效率從94.42%到97.50%不等。采用FPKM 值對3 個生物學重復樣品基因表達量進行標準化(FPKM > 1 的基因是表達的)。在陸地棉和人工異源四倍體的花器中分別有49,138 個和48,214 個基因表達, 其中有45,688 個基因是兩者共同表達, 兩者特異表達的基因分別是3450 個、2526 個。對陸地棉和人工異源四倍體花器中的表達基因進行比較,分析差異表達基因(differentially expressed genes,DEGs), 將差異倍數|log2(Fold Change) |≥2 且顯著性FDR<0.01 作為篩選標準。在陸地棉與人工異源四倍體中一共篩選出5653 個差異表達基因, 其中上調表達基因有3062 個, 下調表達基因有2591 個。為了對差異表達基因分布有更直觀地了解, 對其繪制了火山圖(圖6), 從圖中也可以看出人工異源四倍體與陸地棉之間存在無差異表達的基因。

圖6 差異表達基因火山圖Fig.6 Volcanic map of differentially expressed genes
2.4.2 差異表達基因GO 富集分析 GO 注釋系統包含生物學過程(biological process, BP)、細胞組分(cellular component, CC)和分子功能(molecular function, MF) 3 個主要分支。對篩選出的DEGs 進行GO富集分析, 結果表明, DEGs 共富集到3856 個GO 條目(term), 其中BP、CC、MF 分別富集到2422、520、914 個。對每個分類富集顯著性Q-value 最小的前20個GO term 進行統計分析(圖7), 在BP 中富集最顯著的term 為“光合作用” (GO:0015979)、“蛋白質發色團連接” (GO:0018298)、“光合作用, 光吸收”(GO:0009765)、“對除草劑的響應”(GO:0009635)、“碳固定, 固碳作用” (GO:0015977)等; 在CC 中富集最顯著的term 為“光系統II” (GO:0009523)、“光系統 I” (GO:0009522)、“光系統 I 反應中心” (GO:0009538)、“光系統II 放氧復合物” (GO:0009654)、“葉綠體類囊體膜” (GO:0009535)等; 在MF 中富集最顯著的term 為“RNA 指導的DNA 聚合酶活性” (GO:0003964)、“ADP 結合” (GO:0043531)、“葉綠素結合” (GO:0016168)、“RNA-DNA 雜交核糖核酸酶活性” (GO:0004523)、“單氧酶活性” (GO:0004497)等。

圖7 差異表達基因GO 富集柱狀圖Fig.7 GO enrichment histogram of differentially expressed genes
2.4.3 差異表達基因KEGG 通路分析 對DEGs進行KEGG 富集分析, 對富集最顯著的前20 個通路進行分析, 結果表明(圖8), 人工異源四倍體與陸地棉DEGs 共富集到130 個通路, 其中最顯著的通路是“光合作用-天線蛋白” (ko00196)、“光合作用”(ko00195)、“異黃酮的生物合成”(ko00943)、“苯并惡嗪類生物合成”(ko00402)、“2-氧代羧酸代謝”(ko01210), 富集的DEGs 數目分別是24、51、16、12、49 個。富集DEGs 數目最多的通路是“植物病原互作” (ko04626), 共富集到205 個DEGs。

圖8 差異表達基因KEGG 富集氣泡圖Fig.8 KEGG enrichment bubble diagram of differentially expressed genes
2.4.4 差異表達基因功能分類 植物通過光合作用為自身提供能量, 對植物的生長有重要意義。根據人工異源四倍體與陸地棉的差異表達基因KEGG富集最顯著的前20 個通路分析結果(表6), 獲得3個與光合作用相關的通路, 分別是“光合作用-天線蛋白” “光合作用” “光合生物中的碳固定”。在“光合作用-天線蛋白”通路中, 24個差異表達基因全部為上調表達。在“光合作用” “光合生物中的碳固定” 2個通路中上調表達的基因分別是70 個(93.33%)、25個(78.13%)。分析還表明一些與活性物質合成及代謝相關的基因也出現了差異表達, 其中與“氨基酸的生物合成”相關的基因有107 個, 且57 (53.27%)個上調表達; 有31 個基因與“類黃酮生物合成”相關, 其中22 個(70.97%)上調表達; 有32 個基因與“脂肪酸降解”相關, 其中22 個(68.75%)上調表達; 有55 個基因與“糖酵解/糖異生”相關, 其中42 個(76.36%)上調表達; 有89 個基因與“淀粉和蔗糖代謝”相關, 其中56 個(62.92%)上調表達。此外, 還有34 個基因與“ABC 轉運蛋白”相關, 有18 個(52.92%)基因呈上調表達。

表6 CK vs CL 差異表達基因功能分類Table 6 Functional classification of differentially expressed genes in CK vs CL
與陸地棉相比, 人工異源四倍體除了“精氨酸生物合成” “2-氧代羧酸代謝”通路相關的基因上調表達少于下調表達外, 上調基因分別是8 個(22.86%)、18 個(36.73%), 其余的通路都是上調表達基因數量多于下調表達基因數量, 表明人工異源四倍體在光合、抗性、代謝等方面均表現出優勢。
2.4.5 育性相關基因的篩選與分析 對可能影響人工異源四倍體育性的差異表達基因進行GO 功能注釋, 結果如表7 所示, 共注釋到23 個差異表達基因, 劃分為7 個功能組, 這些功能組全部分布在生物過程類別中, 且注釋到的下調基因數目多于上調基因數目, 下調基因17 個, 上調基因6 個。7 個功能組分別為“花粉萌發” “花粉識別” “花粉發育”花粉管發育” “花的發育” “花粉管導向” “花藥發育”。其中“花粉萌發”注釋到2 個差異基因, 1 個上調表達, 1個下調表達; “花粉識別”注釋到的差異基因數最多,注釋了14 個基因, 其中3 個上調表達, 11 個下調表達; “花粉發育”注釋到3 個下調基因; “花粉管發育”注釋到2 個下調基因; “花的發育”注釋到2 個上調基因和1 個下調基因; “花粉管導向”注釋到1 個下調基因; “花藥發育”注釋到1 個下調基因。

表7 CK vs CL 育性相關差異表達基因Table 7 Functional classification of differentially expressed genes in CK vs CL
利用在線工具NovoPro 對上述23 個差異表達基因進行蛋白信號肽預測, 對可能影響人工異源四倍體育性的差異表達基因進一步篩選。篩選結果如表8 所示, 總共篩選出 7 個候選基因, 分別是Gh_D04G029900、Gh_A01G062500、Gh_D02G100100、Gh_D01G067500、Gh_D05G168100、Gh_D02G075200、Gh_A05G248700, 7 個候選基因信號肽類型均為SP(Sec/SPI)。利用TMHMM2.0 在線軟件對這7 個候選基因的蛋白跨膜結構域進行預測, 預測結果顯示(表8), 7 個候選基因都有跨膜結構域, 其中差異基因Gh_A05G248700有3 個跨膜結構域, 其余6 個候選基因均有1 個跨膜結構域。利用在線工具Pfam 和TBtools軟件對功能結構域預測, 預測結果顯示(圖9),7個候選基因均預測到4個相同的功能結構域, 胞外結構域是 D-甘露醇結合凝集素結構域(B_lectin,PF01453)、S 位點糖蛋白結構域(S_locus_glycop,PF00954), 胞內結構域是蛋白激酶結構域(Pkinase,PF00069)、蛋白質酪氨酸和絲/蘇氨酸激酶結構域(PK_Tyr_Ser-Thr, PF07714), 其中Pkinase 結構域和PK_Tyr_Ser-Thr 結構域在候選基因的蛋白序列上有重疊。

圖9 候選基因功能結構域Fig.9 Functional domain of candidate genes

表8 候選基因信息Table 8 Candidate gene information
利用MEGA7 軟件對候選基因進行聚類分析(圖10)發現, 基因Gh_D01G067500與Gh_D05G168100親緣關系最近, 與Gh_A01G062500聚為1 個小亞群, 其余4 個候選基因聚為1 個較大的群。由NR 注釋列(表7)可知, 基因Gh_D01G067500、Gh_D05G168100、Gh_A01G062500均為G 型凝集素類受體絲氨酸/蘇氨酸蛋白激酶, 且這3 個基因均下調表達, 因此這3個基因的差異表達可能是導致人工異源四倍體結實率低的主要原因。

圖10 候選基因聚類分析Fig.10 Cluster analysis of candidate genes
遠緣雜交是人工合成新物種、新類型的重要手段, 在遠緣雜交的后代中, 會出現因自然選擇而消失了的中間物種或類型, 同時也會打破種間限制,把2 個或多個物種經過自然界長期進化積累的有益特性重新組合, 形成新的類型或新種。但是親緣關系較遠的種間雜交時, 得到的雜種是高度不育的,為打破這種雜種后生殖隔離, 使用秋水仙堿對雜種進行染色體加倍是恢復育性的有效手段。實驗室前期Wu 等[14]研究發現, 草棉與雷蒙德氏棉二倍體雜種后代的花粉母細胞存在大量的異常減數分裂行為,導致雜種高度不育。但對二倍體雜種加倍后, 所獲得的人工異源四倍體早代出現結鈴, 表明育性有所恢復。
棉花通過遠緣雜交加倍獲得新種有許多成功的例子, 聶以春等[17]1985 年以培育的亞洲棉品種與野生種司篤克氏棉雜交獲得雜種, 并加倍成異源四倍體, 經過多年自交培育出植株形態和農藝性狀穩定、結鈴性強的異源四倍體(亞洲棉×司篤克氏棉)。目前關于草棉與雷蒙德氏棉的人工異源四倍體的研究鮮有報道, 本研究以人工異源四倍體為材料, 從生理指標結果可以看出, 在溫室生長環境中(生長期溫度控制不高于35℃), 其SOD、POD、CAT較親本及陸地棉活性均顯著增加, MDA 含量提高,表明其抗逆性較親本增強, 可能的原因是多倍體植株同一位點基因劑量加倍, 從而導致基因表達量增強, 引起植株表型和生理狀態發生改變。Jiang 等[18]使用定量遺傳方法QTL 分析陸地棉與海島棉F2后代中的纖維相關性狀, 發現影響纖維產量和質量的基因座大多數是在D 基因組而不是在A 基因組中,這解釋了相比較于二倍體栽培棉, 異源四倍體栽培棉纖維產量和品質的優越性。本研究的異源四倍體纖維長度比親本長, 與陸地棉接近; 并且纖維顏色為彩色, 介于親本之間, 具有彩色纖維相關基因的挖掘潛力, 可以作為纖維性狀遺傳的研究材料, 后期可以與陸地棉或海島棉雜交, 有望育成天然彩棉新品系。
自然界棉屬異源四倍體祖先供體種是棉屬進化研究的熱點。多年來普遍一致的看法是雷蒙德氏棉是D 基因組的祖先供體種[19], 但A 基因組的祖先供體種一直存在爭議。Huang 等[20]最近采用測序及Hi-C 技術第一次組裝了非洲草棉A1基因組, 并重新組裝了高質量已測序的亞洲棉石系亞A2和陸地棉標準系TM-1 基因組, 揭示了所有現存的A 組都可能起源于共同的祖先A0, 而不是現存的二倍體A1和A2。本研究人工異源四倍體與陸地棉基因組相同,SSR 分子標記顯示, 人工異源四倍體不僅擴增出親本的互補條帶與特異性條帶, 還擴增出與陸地棉相同的條帶, 這為研究棉屬系統進化提供了有價值的材料。同時SSR 標記特異性分析顯示, 隨著人工異源四倍體自交繁殖代數增加, 條帶特異性呈現逐漸降低的趨勢, 這與蓋樹鵬的研究結果一致[21]。
轉錄組研究是基因功能及結構研究的基礎和出發點, 已廣泛應用到棉花生長發育、非生物脅迫、突變表型和分子育種等領域。陳全家[22]對陸地棉和海島棉2 個棉種胚珠進行轉錄本測序, 篩選差異基因并分析, 認為GbMYB25與GbDET2基因可能參與調控棉花纖維起始發育。邵冰欣[23]發現基因GbDRP66319和GbHIR42734沉默表達的棉花植株比對照株黃萎病發病更嚴重, 認為基因GbDRP66319和GbHIR42734在棉花抗黃萎病方面起作用。包秋娟[24]對早熟棉種“新陸早17”進行干旱脅迫處理, 發現處理之后的棉花植株可誘導油質蛋白基因GhOleosin1的表達。本研究對人工合成的草棉與雷蒙德氏棉人工異源四倍體與陸地棉進行轉錄組測序,共獲得5653 個差異基因, 其中上調表達基因有3062個, 下調表達基因有2591 個, GO 富集分析顯示DEGs 共富集到3856 個GO 條目, 在光合作用、光系統II、RNA 指導的DNA 聚合酶活性所占比例較高, 對差異表達基因KEGG 富集表明, 差異基因共富集到130 個代謝通路, 主要富集在光合作用-天線蛋白、光合作用和異黃酮的生物合成相關代謝通路等, 表明人工異源四倍體在光合作用和抗逆等方面有著多倍體及雜種優勢。此外, 為了探究人工異源四倍體結實率低的關鍵因素, 我們進一步對差異基因進行了篩選, 總共篩選出7 個影響人工異源四倍體不育的候選基因, 發現這些基因影響花粉發育及識別, 最終導致花粉敗育, 這符合我們觀察發現的人工異源四倍體花粉出現干癟的現象。
凝集素是植物生命的基礎, 在細胞信號識別、細胞發育、細胞防御有著重要作用[25]。早期人們對凝集素類受體蛋白激酶家族的研究停留在基礎結構研究和基因表達層面, 隨著生物信息技術的發展,一系列研究表明凝集素表現出不同的分子機制, 如花粉發育、雄性不育、抗病、應激反應、激素信號傳導、植物-真菌共生等。Walker 等[26]在玉米中鑒定出了第一個G 型凝集素類受體蛋白激酶ZmPK1, 該蛋白激酶的催化結構域通過跨膜結構域連接到一個類似于蕓薹屬自交不親和位點中編碼的糖蛋白的胞外結構域, 這些糖蛋白參與花粉和柱頭之間的識別系統。Zuo 等[27]通過cDNA 文庫篩選, 從陸地棉中克隆了一個凝集素類蛋白激酶新基因GhlecRk, 并對其進行表達模式分析得出GhLecRK在發育中的棉鈴富集, 在根和莖中含量較低, 在葉中沒有表達。結構域分析顯示GhlecRK蛋白具有多個結構域, 包括ATP 結合位點、一個跨膜區、一個凝集素類結構域和一個激酶結構域, 判斷GhlecRK是一種凝集素類蛋白, 在纖維發育階段參與調控。對本研究中篩選的育性候選基因Gh_D01G067500、Gh_D05G168100、Gh_A01G062500進行結構域分析,這3 個候選基因的胞外都含有S-locus 結構域, 此結構域在被子植物自交不親和系統中起作用[28]。Wan等[29]研究表明, 一個凝集素類受體蛋白激酶基因LecRK-IV.2突變引起花粉發育缺陷導致擬南芥雄性不育, 該突變表型可能是由該突變引起的一種尚未明確的孢子體缺陷引起的, 因此LecRK-IV.2在花粉發育中起關鍵作用。畢真真[30]在水稻中發現一個凝集素類受體激酶基因OsL-LecRK7, 通過半定量RT-PCR 說明OsL-LecRK7調控花粉發育, 隨之將OsL-LecRK7突變體與野生型正反交發現結實率顯著提高。因此后續期望將人工異源四倍體與陸地棉進行正反交試驗來克服自交不親和性, 進而恢復其育性。
新合成的草棉與雷蒙德氏棉人工異源四倍體的纖維顏色呈淺黃色, 長度與陸地棉接近。人工異源四倍體SOD、POD、CAT 活性以及丙二醛含量均顯著高于親本及陸地棉。SSR 分子標記鑒定結果表明,S2、S3、S4與陸地棉相同的條帶分別是37 條、19 條、20 條, 其中17 條是各世代與陸地棉共有。轉錄組測序結果表明, 人工異源四倍體與陸地棉中共有5653個差異表達基因; 富集發現人工異源四倍體在光合和抗逆方面均優于陸地棉; 通過對育性相關基因聚類, 基因Gh_D01G067500、Gh_D05G168100、Gh_A01G062500均為G 型凝集素類受體絲氨酸/蘇氨酸蛋白激酶, 這可能是導致人工異源四倍體自交不親和的關鍵基因。