劉江楓
(福州市于山風景名勝公園管理處,福建 福州 350001)
【研究意義】鐮翅羊耳蒜(Liparis bootanensis)隸屬于蘭科(Orchidaceae)羊耳蒜屬,廣泛分布于亞洲熱帶和亞熱帶區域,常附生于林中樹干和巖壁上[1],已被列入國家II 級重點保護(第二批,討論稿)和CITS 附錄II(http://www.iplant.cn/rep/protlist)植物中。物種在長期的進化過程中,傾向于使用某種或某幾種同義密碼子,形成了密碼子偏好性(Coden usage bias)。葉綠體是綠色植物進行光合作用的細胞器,其基因組具有母系遺傳、拷貝數多、表達效率高、遺傳相對保守等特點,可作為理想的轉化載體,具有明顯的高表達優勢[2,3]。因此,通過鐮翅羊耳蒜葉綠體基因組密碼子分析,將為鐮翅羊耳蒜系統進化、遺傳轉化和制定保育策略提供基礎依據。【前人研究進展】鐮翅羊耳蒜具有較高的藥用價值,為我國傳統藥用植物[4],具有解熱止咳、止血、止痛作用[5-6]。目前,對于鐮翅羊耳蒜的研究主要有化學成分、繁殖生物學和葉綠體基因組等方面[7-9]。密碼子偏好性在不同物種、組織或基因中存有多樣性,受多種因素影響,但突變和選擇是影響密碼子偏好性形成的主要因素[10-15]。【本研究切入點】關于鐮翅羊耳蒜的遺傳學研究較少,其葉綠體基因組密碼子尚待進一步研究。【擬解決的關鍵問題】本研究對鐮翅羊耳蒜葉綠體基因組密碼子組成、偏好性及影響因素進行分析,并確定最優偏愛密碼子。
鐮翅羊耳蒜葉綠體基因組數據來源于NCBI 數據庫(GenBank 收錄號為MN627759),全長為158 325 bp,其中GC 含量為36.9%,共包含有83 條CDS[9]。根據基因組注釋信息,為減少樣本誤差,首先使用Seqkit剔除重復序列,然后選擇以ATG 為起始密碼子,以TAA、TAG、TGA 為終止密碼子,且編碼區序列長度超過300 bp 的基因序列,共得到47 條CDS。
基因的總GC 含量(GCall)、密碼子第1、第2 和第3 位的GC 含量(GC1、GC2 和GC3)通過CUSP(http://emboss.toulouse.inra.fr/cgi-bin/emboss/cusp)計算;相對同義密碼子使用度(Relative synonymous condon usage,RSCU),有效密碼子數(Effective number of Codon,ENC)通 過CodonW(http://mobyle.pasteur.fr/cgi-bin/portal.py?form=codonw)計算。運用SPSS 25.0 對數據進行相關性分析。以GC3 為橫坐標,GC12(GC1 和GC2 的平均值)為縱坐標做中性繪圖分析;以GC3s(同義密碼子第3 位GC 含量)為橫坐標,ENC 值為縱坐標,繪制ENCPlot 二維散點圖,標準曲線公式為ENC=2+GC3+29/[GC32+(1-GC3)2],并結合ENC 比值分布進行分析;以G3/(G3+C3)為橫坐標、A3/(A3+T3)為縱坐標繪制二維散點圖,進行RP2 偏倚分析;通過上述分析以確定鐮翅羊耳蒜葉綠體基因組密碼子的使用偏性的規律[16-19]。通過高表達優越密碼子和高頻密碼子分析,以兩者共有的密碼子作為最優密碼子[20]。
由表1 可知,47 條葉綠體蛋白編碼基因密碼子3 個堿基平均GC 含量為38.13%,GC3 為27.99%,低于GC1(47.00%)和GC2(39.41%),表明密碼子不同位置上GC 含量不同,以A 或T 堿基結尾的密碼子使用頻率較高;ENC 值范圍為40.85~56.80,平均值為47.27,表明鐮翅羊耳蒜葉綠體基因組密碼子偏好性較弱。

表1 編碼基因密碼子不同位置GC 含量Table 1 GC content in various positions of codon in chloroplast gene
通過密碼子參數相關性分析,由表2 可知,GCall與GC1、GC2、GC3 之間均呈極顯著相關(r=0.802,P<0.01;r=0.758,P<0.01;r=0.396,P<0.01)。GC1與GC2 呈極顯著相關(r=0.390,P<0.01),GC3 與GC1、GC2 均無顯著相關(r=0.047,P>0.05;r=0.035,P>0.05),說明密碼子第1 和第2 位的堿基組成相似,與第3 位堿基組成存在差異。ENC 與GC1、GC2之間均無顯著相關(r=0.022,P>0.05;r=-0.277,P>0.05),與GC3 呈極顯著正相關(r=0.455,P<0.05),說明密碼子第3 位堿基組成對密碼子偏好性影響較大;ENC 和密碼子數目(N)之間無顯著相關(r=0.196,P>0.05),表明N 對ENC 的影響較弱。

表2 編碼基因密碼子參數的相關性Table 2 Correlations among individual related parameters of genes
由表3 可知,RSCU>1 的密碼子共有30 個,其中僅有1 個密碼子以G 結尾,其余29 個密碼子皆為以A 或U 結尾;RSCU<1 的密碼子共有16 個,其中3 個密碼子以G 或C 結尾,其余13 個皆為以A 或U 結尾。

表3 相對同義密碼子使用度分析Table 3 RSCU analysis on protein coding region
由圖1可知,GC12值范圍為0.312 0~0.525 8,GC3值范圍為0.189 4~0.373 4。GC12 與GC3 的相關性不顯著(r=0.05,P>0.05),回歸系數為0.064 9,表明密碼子第1、2 位和第3 位堿基組成存在差異,密碼子偏好性主要受到選擇的影響,突變作用較弱。

圖1 中性繪圖分析Fig.1 Neutrality plot
由圖2 可知,大部分基因落在期望曲線的附近兩側,表明ENC 實際值與ENC 預期值之間較為接近。通過ENC 比值頻數分布進一步分析,由表4 可知,47%基因的ENC 比值頻數分布在-0.05~0.05 區間,即有22 個基因ENC 值與預期ENC 值接近,表明這部分基因密碼子偏好性更多地受突變的影響,而受選擇的影響較弱;其他53%基因的ENC 比值頻數分布在-0.05~0.05 區間之外,即有25 個基因與預期ENC 值相差較遠,表明這部分基因密碼子偏好性更多受選擇的影響,而受突變的影響較弱。

表4 ENC 比值頻數分布Table 4 Distribution of ENC ratios

圖2 ENC-plot 繪圖分析Fig.2 ENC-plot
由圖3 可知,多數基因處于平面圖的下半部,尤其右下方,說明從使用頻率方面來看,A>T、G>C。如果4 個堿基的使用頻率相當,則密碼子偏好性完全受突變因素影響,因此,鐮翅羊耳蒜葉綠體基因組密碼子偏好性除了受突變因素影響外,還受到選擇等因素的共同影響。
由表5 可知,通過高表達優越密碼子分析法得到的△RSCU>0.08 的有25 個密碼子,其中有6 個密碼子以A 結尾,11 個密碼子以U 結尾,2 個密碼子以G 結尾,6 個密碼子以C 結尾。結合高頻密碼子分析,最后確定17 個最優密碼子,分別為UUU、UUG、CUU、AUU、GUU、UAU、GAA、UCU、CCU、ACU、ACA、GCA、CGU、CGA、AGU、AGA、GGU。

表5 最優密碼子分析Table 5 Analysis on preferred codon

續上表
本研究通過統計分析鐮翅羊耳蒜葉綠體基因組47 條CDS 的不同位置GC 含量,結果顯示密碼子3 個堿基平均GC 含量為38.13%,與鐮翅羊耳蒜葉綠體基因組GC 含量(36.9%)[9]較為接近。GC3 為27.99%,低于GC1(47.00%)和GC2(39.41%),表明鐮翅羊耳蒜葉綠體基因組中以A 或T 堿基結尾的密碼子使用頻率較高,這與沙棗[15]、苦蕎[20]、蝴蝶蘭[21]、文心蘭[22]、糜子[23]等植物葉綠體基因組密碼子組成分析結果一致。
GC3 常被作為密碼子使用模式分析的重要依據[21,24]。本研究通過相關性和中性繪圖分析顯示密碼子第1 和第2 位的堿基組成較相似,與第3 位堿基組成存在差異,表明突變對鐮翅羊耳蒜葉綠體基因組密碼子偏好性影響較弱,可能更多受選擇影響。通過ENC-plot 分析和PR2-plot 繪圖分析,表明鐮翅羊耳蒜葉綠體基因組密碼子偏好性除了受到突變因素影響外,還受到選擇等因素的共同影響。因此,綜上分析,本研究認為鐮翅羊耳蒜葉綠體基因組密碼子偏好性主要受突變和選擇作用共同影響,同時還受其他因素影響,是多因素綜合影響的結果[23,25]。
本研究通過高表達優越密碼子和高頻密碼子分析,以兩者共有的密碼子作為最優密碼子,共計有17 個密碼子,其中5 個密碼子以A 結尾,11 個密碼子以U 結尾,僅1 個密碼子以G 結尾,為今后通過對目的基因的密碼子進行優化,提高表達效率,改良鐮翅羊耳蒜奠定基礎。