王 飛,趙文植,董章宏,馬路遙,李衛英,夏茂甜,王正德,辛培堯*
扁核木屬植物葉綠體基因組特征分析
王 飛1,2,趙文植1,2,董章宏2,馬路遙1,2,李衛英1,2,夏茂甜1,2,王正德1,2,辛培堯2*
1. 西南林業大學國家林業和草原局西南風景園林工程技術研究中心,云南昆明 650224;2. 西南林業大學西南地區生物多樣性保育國家林業和草原局重點實驗室,云南昆明 650224
扁核木屬()植物在中國分布有4個種,均具有極高的食用和藥用價值。為解析扁核木屬植物的葉綠體基因組特征,基于現已發表的扁核木屬植物葉綠體基因組,利用相關生物信息學手段進行其葉綠體基因結構、SSR、密碼子偏好性和序列變異情況分析,并構建系統發育樹。結果表明,2種扁核木屬植物葉綠體基因組大小介于159 179~ 168 206 bp之間,平均GC含量為37.3%,從編碼基因數目來看,僅相差2個tRNA,而蛋白編碼基因和rRNA數目均一致,種間具有較高的保守性;在扁核木和蕤核葉綠體全基因組序列中各檢測出分散重復49個,其中以正向重復和回文重復為主,占比達73%~82%,而串聯重復數目分別為49個和58個,經簡單重復序列SSR分析,分別在2種植物葉綠體基因組序列中分別篩選出100個和84個SSR位點,且多是以A/T堿基為主的單核苷酸重復類型;扁核木屬植物葉綠體基因組密碼子偏好性分析發現GC3的堿基含量顯著低于GC1和GC2,說明密碼子偏好以A、U結尾,ENC取值均大于48%,表明其密碼子偏性較弱,中性繪圖和PR2-plot分析發現自然選擇是影響扁核木屬植物密碼子使用偏好性的主要原因,通過建立高、低基因表達庫,以RSCU值為參考,確定了6個扁核木屬最優密碼子。經葉綠體基因組序列變異分析,根據核苷酸多態性指數>0.015篩選出-GUG-,UCCCAU和等3個高變區,以蕤核葉綠體基因組為參考,在扁核木葉綠體基因組編碼區發現存在大量的插入、缺失和SNP突變位點,并在蕤核葉綠體基因組中發現了多個該物種的特有基因。基于葉綠體基因組的間隔區構建的系統發育樹顯示,4種扁核木屬植物可分為南系(扁核木、臺灣扁核木)和北系(蕤核、東北扁核木)兩類。研究結果可為扁核木屬植物的系統發育、分類鑒定及其資源的開發利用等相關研究提供理論基礎。
扁核木屬;葉綠體基因組;特征分析;系統發育
扁核木屬(Royle)隸屬薔薇科(Rosaceae)李亞科(Prunoideae),具有極高的藥用價值和保健作用。屬內共有5個種,中國分布有4個種,分別是扁核木()、蕤核()、東北扁核木()和臺灣扁核木()[12]。已有相關扁核木屬植物的研究主要集中于其提取物藥理作用、生理特性、地理譜系和形態學分類、資源分布以及繁殖等方面[13-18]。但有關扁核木屬植物葉綠體基因組方面的研究報道相對較少,WANG等[19]基于扁核木質體基因組測序,解析了其質體基因組特征,通過與同科其他4個物種的葉綠體基因組比對,構建了系統發育樹,為研究薔薇科植物葉綠體基因組進化和突變模式提供了理論依據;而劉家奇等[15]則利用3個葉綠體DNA片段從譜系地理學的角度,分析了蕤核的遺傳結構及種群歷史動態。同年,研究人員報道了蕤核全葉綠體基因組序列,并簡單闡述了其基本結構[20]。
本研究基于NCBI庫中現已發表的2種扁核木屬植物完整葉綠體基因組序列,對比分析了葉綠體基因組的基本特征,檢測重復序列和SSR位點,解析密碼子使用模式和影響因素;利用比較基因組學分析核酸變異程度,并統計基因編碼區的突變數量及形式;通過系統發育樹來確定屬間各物種之間的親緣關系。以期為扁核木屬植物的分子鑒定、葉綠體基因組結構和功能的研究提供參考。
從NCBI數據庫中下載南北方扁核木屬的代表植物扁核木和蕤核的完整葉綠體基因組序列,Genbank登錄號分別為MW332618、MZ270554。
1.2.1 可視化處理 利用Geneious 8.1.3軟件對序列進行可視化處理,統計葉綠體基因組大小、GC含量、基因數目,區劃葉綠體基因組,并計算各區長度和GC含量等信息,運用OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)在線軟件繪制扁核木屬植物葉綠體基因組物理圖譜。
1.2.2 重復序列與SSR分析 重復序列包括散在重復和串聯重復,其中散在重復又包含了正向重復(forward repeats, F)、反向重復(reverse repeats, R)、回文重復(palindromic repeats, P)和互補重復(complement repeats, C)。散在重復序列利用REPuter軟件[21]進行預測,參數設置為:最小長度(minimum length)為30 bp,海明距離(hamming distance)為3;串聯重復序列通過在線Tandem Repeats Finder工具[22]進行分析。使用MISA軟件[23]檢測扁核木屬植物葉綠體基因組中的簡單重復序列(simple sequence repeats, SSR),SSR搜索參數設置為:單核苷酸重復≥10,二核苷酸重復≥5,三核苷酸重復≥4,四核苷酸及以上核苷酸重復≥3。
1.2.3 葉綠體基因組學序列分析 以蕤核葉綠體基因組作為參考,利用在線工具MAFFT v.7 (https://mafft.cbrc.jp/alignment/server/)及Geneious 8.1.3軟件檢測分析2種扁核木屬植物葉綠體基因組編碼基因變異位點上的差異。
1.2.4 密碼子偏好性分析 利用Geneious軟件各獲取了84條編碼蛋白質的基因序列(CDS)。為減少實驗誤差,根據以下條件對CDS進行篩選:(1)組成CDS的堿基必為A、T、C、G;(2)CDS的起始和終止密碼子正確,即ATG起始,TAA、TAG或TGA終止;(3)剔除長度小于300 bp以及重復的CDS序列。最終分別獲得了52條符合條件的CDS用于后續分析。
(2)真實反映學習過程,暴露學習問題.動態生成的課堂給了師生更多的探索空間,教師和學生更容易發現探索過程中遇到的問題,進而針對性地解決這些問題,減少將來的麻煩.
①密碼子組成分析。密碼子第1、2、3位上堿基的種類和含量是評判密碼子使用模式有效指標[24]。利用CodonW分析篩選出來的52條CDS的ENC值(有效密碼子數)和各氨基酸所對應密碼子的RSCU值(相對同義密碼子使用度),并應用在線程序CUSP(http://imed.med.ucm.es/EM-B-O-SS/)計算各基因總的GC含量及密碼子第1~3位上的GC含量,分別以GCall、GC1、GC2和GC3表示。
②中性繪圖。中性圖是以GC3值作為橫坐標,每個基因的GC1和GC2的平均值GC12作為縱坐標進行散點圖的繪制,進而分析二者相關性,以此來初步判斷影響密碼子使用偏好性的因素,圖中的每個點都作為獨立的基因存在[25]。
③PR2-plot分析。統計各密碼子第3位上各堿基含量,以A3/(A3+T3)值為縱坐標、G3/(G3+C3)值為橫坐標繪制偏倚圖,分析密碼子第3位上嘌呤(A、G)和嘧啶(C、T)的使用情況及關系,當互補堿基含量相等時,即G=C,A=T,表明密碼子無偏向性[26]。
④最優密碼子分析。根據ENC值大小分別對2種扁核木屬植物的葉綠體基因進行排序,從兩端各選取基因總數的10%(5條)來建立高、低基因表達庫。利用CodonW軟件統計高、低表達基因的RSCU值,并計算ΔRSCU值(ΔRSCU= RSCU高表達-RSCU低表達),以RSCU>1且ΔRSCU≥0.08兩個條件為標準來篩選扁核木屬植物的最優密碼子。
1.2.5 核苷酸變異分析 利用DnaSP 6軟件[27]分析扁核木和蕤核葉綠體基因組的核苷酸多樣性(),滑動窗口長度設為600 bp,步長設為200 bp。
1.2.6 系統發育分析 研究表明-間隔區能提供豐富的信息位點且引物通用,在種間及近親屬間的系統發育研究中應用廣泛[28]。因此,為了確定扁核木屬植物的系統發育位置及種間親緣關系,基于現已發表的4種扁核木屬植物葉綠體基因組的基因片段,利用RAxML 8.2.12軟件下的模型構建系統發育樹,進而分析扁核木屬植物系統發育位置。
扁核木和蕤核的葉綠體基因組基本信息如表1所示。2種植物葉綠體基因組總長度分別為168 206、159 179 bp,相差9027 bp。從編碼基因數來看,扁核木比蕤核少2條tRNA,即-UAG和-UGC,而蛋白編碼基因和rRNA數目沒有發生變化,分別是84個和8個。葉綠體基因組的GC含量相差也不大,分別為38.0%和36.6%。經基因類別統計,在2種扁核木屬植物葉綠體基因組中各發現了18個含有內含子的基因,其中含有1個內含子的基因有15個,含有2個內含子的基因有3個。值得注意的是,基因僅在蕤核葉綠體基因組中含有2個內含子,而在扁核木葉綠體基因組中只含有1個內含子。根據扁核木和蕤核的葉綠體全基因組序列,運用在線軟件OGDRAW繪制出扁核木屬植物葉綠體基因組物理圖譜(圖1)。

表1 扁核木和蕤核葉綠體全基因組特征

圖1 扁核木屬植物葉綠體全基因組物理圖譜
扁核木和蕤核葉綠體基因組中的分散重復和串聯重復序列分別利用REPuter軟件和Tandem Repeats Finder軟件進行分析,在2種植物葉綠體基因組中各鑒定出49個分散重復序列,其中扁核木中有30個正向重復、16個回文重復、2個反向重復和1個互補重復;而蕤核中有18個正向重復、22個回文重復、6個反向重復和3個互補重復。串聯重復序列分別有49個和58個(圖2A)。經MISA軟件分析,在扁核木葉綠體基因組中共篩選出100個SSRs位點,其中單核苷酸重復有77個(均是A/T堿基重復,沒有C/G堿基重復)、雙核苷酸重復有3個、三核苷酸重復有3個、四核苷酸重復有7個、六核苷酸重復有8個,沒有五核苷酸重復類型;而在蕤核葉綠體基因組中僅篩選出84個SSRs位點,其中單核苷酸重復有59個(A/T堿基重復58個,C/G堿基重復1個),雙核苷酸重復(AT)11個、三核苷酸重復2個、四核苷酸重復10個、五核苷酸重復3個,無六核苷酸重復類型(圖2B)。

圖2 重復結構與SSR類型
以蕤核葉綠體基因組作參考,檢測扁核木葉綠體基因組中蛋白質編碼基因變異位點上的差異。其中,基因上的插入和缺失位點數均大于10,而基因上的插入和缺失總位點數更是達55個。其次是和基因,基因上的插入和缺失位點均有3個,插入位點最大有276 bp(圖3)。扁核木葉綠體基因組特有基因為,蕤核特有基因為UAGUGC和。
SNP(single nucleotide polymorphism,單核苷酸多態性)標記作為最豐富的突變類型,在扁核木葉綠體基因組編碼區共檢測到6971個SNP,包括4288個Ts(Transition,轉換)和2683個Tv(Transversion,顛換),Ts與Tv的比率是1.60∶1。其中,C與T之間的Ts有2247個,A與G之間的Ts有2041個;而A與T之間的Tv有728個,C與G之間的Tv有409個。在眾多替換位點中,基因上的替換位點占總替換位點數的20.63%,占有較高水平,說明基因具有較高的進化率(表2)。

圖3 扁核木葉綠體基因組的插入與缺失

表2 扁核木、蕤核葉綠體基因組編碼區單核苷酸突變情況
2.4.1 密碼子組成分析 經CodonW 1.4.2和在線CUSP分析,如表3所示,扁核木和蕤核葉綠體基因組密碼子第3位堿基中T3s分別是46.04%、46.46%,A3s分別是42.63%、43.09%,說明扁核木屬植物的葉綠體基因組密碼子偏好A/U結尾。20~61是ENC的理論取值范圍,ENC值越接近20,其同義密碼子偏性越強,反之越弱。扁核木、蕤核的ENC值分別為48.74和48.43,說明扁核木屬植物的密碼子偏好性較弱。
利用熱圖統計扁核木和蕤核編碼基因密碼子的相關參數值,行列名分別對應每個基因的名稱和相關參數。如圖4所示,在2種扁核木屬植物中,基因不同,其GC含量也存在差異,多數基因的GC1和GC2含量高于GC3;扁核木和蕤核的ENC實際取值范圍分別為38.44~61.00和35.94~60.48,所有基因的ENC值均大于35,進一步表明扁核木屬植物葉綠體基因密碼子偏性較弱。另外,和基因的ENC值在扁核木與蕤核間的極差均大于5,說明同屬植物間部分基因的密碼子偏好性存在較大差異。

表3 扁核木和蕤核葉綠體基因組密碼子相關參數

圖4 扁核木和蕤核葉綠體編碼基因密碼子GC含量
2.4.2 中性繪圖分析 從圖5可以看出,扁核木GC12的取值介于0.34~0.52之間,GC3取值介于0.22~0.38之間,GC12與GC3相關系數=0.1975;蕤核GC12取值在0.31~0.54之間,GC3取值在0.22~0.37之間,GC12與GC3相關系數=0.2555,這說明扁核木屬植物GC12與GC3的相關性弱,密碼子第1、2位與第3位之間堿基的相關性不顯著,進化方式存在一定差異,進而可判斷選擇壓力是影響密碼子偏好性的主要原因。

圖5 中性繪圖
2.4.3 PR2-plot分析 PR2-plot繪圖可直觀地看出密碼子第3位嘌呤(A、G)和嘧啶(C、T)的使用頻率,若各編碼基因在4個區域內均勻分布,則4個堿基的使用頻率相等,密碼子偏好性完全受突變影響。從圖6中可以看出2種扁核木屬植物葉綠體基因分布并不均勻,多數基因匯集在右下方區域,從堿基使用頻率來看,T>A、G>C,密碼子第3位的嘧啶使用頻率高于嘌呤,說明2種植物葉綠體基因組密碼子偏好性除了受突變的影響,還與其他因素有關。

圖6 PR2-plot繪圖
2.4.4 最優密碼子確定 根據ENC值對2種扁核木屬植物葉綠體基因組CDS進行排序,分別建立高、低表達基因庫,計算表達庫中密碼子的RSCU值和ΔRSCU值。以既符合高表達密碼子(ΔRSCU≥0.08)又符合高頻密碼子(RSCU>1)為條件來篩選最優密碼子。結果如圖7所示,扁核木含有高表達密碼子29個,高頻密碼子24個,同時滿足高表達、高頻的最優密碼子有15個,其中以U結尾的有9個,以A結尾的有6個;而蕤核含有高表達密碼子25個,高頻密碼子28個,同時滿足高表達、高頻的最優密碼子有15個,其中7個以U結尾,7個以A結尾,還有1個以G結尾。通過對最優密碼子的進一步分析,發現了2種植物中共有6個最優密碼子,分別是UGU、UUA、GAA、CAA、AUU、GCU。
利用DnaSP6軟件分析2種扁核木屬植物葉綠體基因組序列的核苷酸變異程度。結果表明大部分變異發生在LSC區域,且與SSC和IR區相比表現出更高的核苷酸變異。核苷酸多態性指數>0.015的3個間隔區均位于LSC區,分別為GUG(1~1362 bp),UCCCAU(39 550~41 465 bp)和(74 082~75 529 bp)(圖8)。

注:框選的密碼子為扁核木最優密碼子; 框選的密碼子為蕤核最優密碼子;加粗的密碼子為2種植物共有的最優密碼子。
以黑刺李()為外類群,基于葉綠體基因組的間隔區序列構建扁核木屬植物系統發育樹。結果如圖9所示,系統發育樹以100%的支持率將4種扁核木屬植物劃分為2個小類,扁核木和臺灣扁核木聚為一類,蕤核和東北扁核木聚為另一類,由此可以看出,扁核木屬植物具有明顯的南北系分化。

圖8 扁核木屬植物葉綠體基因核苷酸多態性

圖9 基于葉綠體基因組的trnS-trnG間隔區序列構建的系統發育樹
SSR現已作為一種高效的分子標記工具被廣泛應用于遺傳圖譜構建、目的基因標定、種質資源鑒定等方面[29-30]。利用SSR分析從2種扁核木屬植物葉綠體基因組中分別篩選出100個和84個SSR位點,其中多是以A/T堿基為主的單核苷酸重復類型,占總位點數的69.04%~77.00%;其次是二核苷酸、三核苷酸和四核苷酸,但占比均不到10%,說明隨著核苷酸數的增加,占比會逐漸降低。這與在柴胡屬植物葉綠體基因組得出的隨著拷貝數目的增加SSRs數量明顯減少這一結論相一致[31]。另外,二核苷酸及以上核苷酸重復單元也主要由A、T堿基組合而成,如二核苷酸重復(AT)、三核苷酸重復(AAT/ATT)、四核苷酸重復(AAAT/ATTT/AATT)等。蕤核葉綠體基因組中AT重復在二核苷酸重復類型中占到了100%,AAT/ATT重復在三核苷酸重復類型也占比100%,這進一步說明葉綠體基因組中的SSR序列組成堿基主要是A、T,較少有C、G串聯重復[32]。篩選出來的這些SSR位點可以為扁核木屬植物的種質鑒定及遺傳多樣性分析等研究提供分子標記基礎。同時,核苷酸多樣性分析發現,>0.015的高變異區有3個,包括了9個基因(-GUG、、、-UCC、-CAU、),其中UCCCAU和之前已經在不同植物中被檢測到作為高度可變的區域,其中一些被用作DNA條形碼[33-34]。
選用蕤核葉綠體基因組為參考,統計分析扁核木葉綠體基因組突變的數量、形式及特有基因。發現二者葉綠體基因組編碼區存在大量的插入、缺失和SNP突變位點,從而導致扁核木和蕤核葉綠體基因組大小以及以和等為代表的編碼基因序列存在較大差異,這些差異顯著的基因將有助于后期的物種分類研究。WANG等[19]通過薔薇科葉綠體基因組進化和突變模式的研究,發現在所有蛋白編碼基因中序列的分化程度最高,相比其他基因更有助于物種區分,這與本研究結果一致。相關研究表明,第四紀以來多次氣候(冰期與間冰期)的周期性波動很大程度上影響了現今植物種群分布和遺傳格局[35]。劉家奇等[15]基于葉綠體基因組、和片段分析發現蕤核與我國北方多數植物類群一樣,其遺傳結構受氣候及環境影響有著明顯的遺傳分化。而經基因類型比較,在蕤核葉綠體基因組中發現多個新編碼基因,推測其可能與北方長期特殊的氣候和環境響應有關。
葉綠體基因組間隔區序列不受基因功能限制,進化速率快。研究表明-間隔區能提供豐富的信息位點且引物通用,在種間及近親屬間的系統發育研究中應用廣泛[28]。因此,本研究基于扁核木屬葉綠體基因組的間隔區序列來構建系統發育樹,將4種扁核木屬植物按遺傳距離及親緣關系遠近劃分為南系(扁核木、臺灣扁核木)和北系(蕤核、東北扁核木)兩類。而陸玲娣[36]根據花蕊數量分類以及楊瑞林等[16]根據葉表皮角質膜及花粉外壁條脊排列形態進行聚類分析的研究結論與此一致。同時,通過核苷酸多態性分析發現,間隔區在> 0.015的高變區內,具有較顯著的多態性,大小為1039 bp,進一步說明葉綠體基因組中的基因片段用于扁核木屬植物的分類鑒定是可行的。
扁核木屬植物葉綠體基因組同義密碼子偏好以A/T結尾,這與多數陸生植物的研究結果一致,如:槲蕨屬[37]、石斛屬[38]植物等,并且扁核木葉綠體基因組中篩選出來的SSR序列也多是A、T串聯重復,這可能與陸生植物葉綠體基因組富含A、T堿基且進化相對保守等有關。
同義密碼子使用偏倚現象在絕大多數生物中均存在,但偏倚程度卻因物種不同而異[39]。相關研究表明,造成密碼子使用偏倚的原因并非單一因素所決定的,各物種在不同的環境中長期受選擇壓力、堿基突變、基因漂移等多因素影響,而密碼子使用偏性就是在這個復雜的物種選擇進化過程中形成的[40-41]。密碼子第3位上的堿基突變不改變氨基酸類型,受到的選擇壓力較小[42]。因此,本研究基于GC3含量通過中性繪圖分析發現自然選擇是影響扁核木屬植物密碼子偏好性的主導因素。另外,從PR2-plot繪圖可看出密碼子第3位嘌呤(A、G)和嘧啶(C、T)的使用頻率不盡相同,T>A、G>C,說明2種植物葉綠體基因組密碼子偏好性除了受突變的影響,還與選擇、堿基組成等其他因素有關。這與香花枇杷[10]、燈盞花[43]、杜梨[44]等植物葉綠體基因組密碼子偏好性分析結果一致,說明選擇和突變是造成植物密碼子偏倚的主要動力來源。
[1] HENRY D, IN C S, YU M, CHANG W J. Chloroplast genomes: diversity, evolution and applications in genetic engineering[J]. Genome Biology, 2016, 17(1): 134.
[2] PARK I Y, SONG J H, YANG S Y, MOON B C. Comparative analysis ofchloroplast genomes and molecular marker development for the identification of authentic[J]. Plants, 2020, 9(2): 157.
[3] CLAUDIA L H, ABDULLAH, IBRAR A, MONICA M C, ALEJANDRO Z, THOMAS B C, MICHAEL R M. Evolutionary dynamics of chloroplast genomes in subfamily(Araceae)[J]. Genomics, 2020, 112(3): 2349-2360.
[4] 段義忠, 張 凱. 沙冬青屬植物葉綠體基因組對比和系統發育分析[J]. 西北植物學報, 2020, 40(8): 1323-1332.
DUAN Y Z, ZHANG K. Comparative analysis and phylogenetic evolution of the complete chloroplast genome of[J]. Northwestern Journal of Botany, 2020, 40(8): 1323-1332. (in Chinese)
[5] 德 偉, 張一鳴. 生物化學與分子生物學[M]. 南京: 東南大學出版社, 2018.
DE W, ZHANG Y M. Biochemistry and molecular biology[M]. Nanjing: Southeast University Press, 2018. (in Chinese)
[6] 王 婧, 王天翼, 王羅云, 張建國, 曾艷飛. 沙棗葉綠體全基因組序列及其使用密碼子偏性分析[J]. 西北植物學報, 2019, 39(9): 1559-1572.
WANG J, WANG T Y, WANG L Y, ZHANG J G, ZENG Y F. Assembling analysis of the whole chloroplast genome sequence ofand its codon usage bias[J]. Northwest Botany, 2019, 39(9): 1559-1572. (in Chinese)
[7] LIU S S, QIAO Z Q, WANG X M, ZENG H J, LI Y X, CAI N, CHEN Y. Analysis of codon usage patterns in “lonicerae flos” (Hand.-Mazz.) based on transcriptome data[J]. Gene, 2019(705): 127-132.
[8] 王占軍, 丁 亮, 蔡倩文, 李 杰, 吳子琦, 姚懷桐, 王 悅, 焦春燕, 歐祖蘭, 徐忠東, 施季森, 陳金慧. 3種木薯全基因組的密碼子偏好性模式與變異來源比較[J]. 應用與環境生物學報, 2021, 27(4): 1013-1021.
WANG Z J, DING L, CAI Q W, LI J, WU Z Q, YAO H T, WANG Y, JIAO C Y, OU Z L, XU Z D, SHI J S, CHEN J H. Comparison of codon preference patterns and variation so-u-rces in cassavagenomes[J]. Journal of Application and Envir-onmental Biology, 2021, 27(4): 1013-1021. (in Chinese)
[9] 辛雅萱, 黎若竹, 李 鑫, 陳麗瓊, 唐軍榮, 屈亞亞, 楊琳懿, 辛培堯, 李云芳. 杧果葉綠體基因組密碼子使用偏好性分析[J]. 中南林業科技大學學報, 2021, 41(9): 148-156, 165.
XIN Y X, LI R Z, LI X, CHEN L Q, TANG J R, QU Y Y, YANG L Y, XIN P Y, LI Y F. Analysis on codon usage bias of chloroplast genome in[J]. Journal of Central South University of Forestry & Technology, 2021, 41(9): 148-156, 165. (in Chinese)
[10] 屈亞亞, 辛 靜, 馮發玉, 董章宏, 瞿紹宏, 王海洋, 李 斌, 辛培堯. 香花枇杷質體基因組序列密碼子偏性分析[J]. 西北林學院學報, 2021, 36(4): 138-144, 158.
QU Y Y, XIN J, FENG F Y, DONG Z H, QU S H, WANG H Y, LI B, XIN P Y. Codon usage bais in chloroplast genome ofChamp. ex Benth.[J]. Journal of Northwestern Forestry College, 2021, 36(4): 138-144, 158. (in Chinese)
[11] 原曉龍, 劉 音, 康洪梅, 陳中華, 李云琴, 王 毅. 蒜頭果葉綠體基因組密碼子偏好性分析[J]. 西南林業大學學報(自然科學), 2021, 41(3): 15-22.
YUAN X L, LIU Y, KANG H M, CHEN Z H, LI Y Q, WANG Y. Analysis of codon usage bias in chloroplast genome of[J]. Journal of Southwest Forestry University (Natural Sciences), 2021, 41(3): 15-22. (in Chinese)
[12] 周海燕, 楊峻山. 扁核木屬植物化學成分及藥理作用研究進展[J]. 中國現代中藥, 2011, 13(5): 44-47.
ZHOU H Y, YANG J S. Progress in chemical composition and pharmacological action of[J]. Modern Chinese Medicine, 2011, 13(5): 44-47. (in Chinese)
[13] 解仲伯, 林華慶, 余楚欽, 王遠蘋. 青刺果各類提取物的藥理作用研究進展[J]. 中成藥, 2016, 38(12): 2651-2656.
XIE Z B, LIN H Q, YU C Q, WANG Y P. Progress in the pharmacological effects of various extracts of[J]. Chinese Patent Medicine, 2016, 38(12): 2651-2656. (in Chinese)
[14] 李新蕾, 李葉芳, 李鳳榮, 關文靈. 干旱脅迫對扁核木種子萌發及幼苗生理特性的影響[J]. 云南農業大學學報(自然科學), 2020, 35(4): 682-687.
LI X L, LI Y F, LI F R, GUAN W L. Effects of drought stress on seed germination and seedling physiological characteristics of[J]. Journal of Yunnan Agricultural University (Natural Sciences), 2020, 35(4): 682-687. (in Chinese)
[15] 劉家奇, 付孟嬌, 吳海洋, 田 斌. 基于葉綠體DNA的黃土高原特有植物蕤核的譜系地理學[J]. 廣西植物, 2021, 41(3): 396-403.
LIU J Q, FU M J, WU H Y, TIAN B. Phylogeography of the Loess Plateau endemic plantinferred from the chloroplast DNA[J]. Guangxi Plants, 2021, 41 (3): 396-403. (in Chinese)
[16] 楊瑞林, 魏學智. 中國扁核木屬植物花粉和葉表皮微形態研究[J]. 植物研究, 2015, 35(2): 172-178.
YANG R L, WEI X Z. Micromorphological observations on leaf epidermis and pollen ofRoyle in China[J]. Plant Research, 2015, 35(2): 172-178. (in Chinese)
[17] 葉俊偉, 田 斌. 中國西南地區重要木本油料植物扁核木的遺傳結構及成因[J]. 生物多樣性, 2021, 29(12): 1629-1637.
YE J W, TIAN B. Genetic structure and causes of an import-ant woody oil plants in Southwest China of[J]. Biodiversity, 2021, 29(12): 1629-1637. (in Chinese)
[18] 范志遠, 習學良, 歐陽和, 陳 武, 廖永堅, 鄒偉烈. 青刺果的植物學特性及其人工栽培技術[J]. 西部林業科學, 2005(4): 47-52, 66.
FAN Z Y, XI X L, OU Y H, CHEN W, LIAO Y J, ZOU W L. Phyany properties ofand their artificial cultivation techniques[J]. Western Forestry Science, 2005(4): 47-52, 66. (in Chinese)
[19] WANG S, SHI C, GAO L Z. Plastid genome sequence of a wild woody oil species,, provides insights into evolutionary and mutational patterns of Rosaceae chloroplast genomes[J]. Public Library of Science, 2017, 8(9): 73946.
[20] WANG Y L, NIU Y, QIANG Z, TIAN Y, LI Y. The complete chloroplast genome of(Rosaceae), a medicinal plant found in northwest China[J]. Mitochondrial DNA Part B, 2021, 6(10): 3057-3058.
[21] KURTZ S, CHOUDHURI J V, OHLEBUSCH E, SCHLE-IERMACHER C, STOYE J, GIEGERICH R. REPuter: the m-a-nifold applications of repeat analysis on a genomic sc-ale[J]. Nucleic Acids Research, 2001(29): 4633-4642.
[22] BENSON G. Tandem repeats finder: a program to analyze DNA sequences[J]. Nucleic Acids Research, 1999(27): 573- 580.
[23] 王 希, 陳 麗, 趙春雷. 利用MISA工具對不同類型序列進行SSR標記位點挖掘的探討[J]. 中國農學通報, 2016, 32(10): 150-156.
WANG X, CHEN L, ZHAO C L. Exploration of SSR marker site mining for different types of sequences using the MISA tools[J]. China Agriculture Bulletin, 2016, 32(10): 150-156. (in Chinese)
[24] 傅建敏, 索玉靜, 劉慧敏, 譚曉風. 柿屬植物葉綠體蛋白質編碼基因密碼子用法[J]. 經濟林研究, 2017, 35(2): 38-44.
FU J M, SUO Y J, LIU H M, TAN X F. Codon usage of chloroplast protein-coding genes in[J]. Economic Forest Study, 2017, 35(2): 38-44. (in Chinese)
[25] JIANG Y, DENG F, WANG H L, HU Z H. An extensive analysis on the global codon usage pattern of baculoviruses[J]. Archives of Virology, 2008, 153(12): 2273.
[26] YANG G F, SU K L, ZHAO Y R. Analysis of codon usage in the chloroplast genome of[J]. Acta Pharmacologica Sinica, 2015, 6(12): 171-179.
[27] 杜致輝, 楊 瀾, 張朝君, 許紅娟, 陳之林. 黑喉石斛葉綠體基因組特征及比較分析[J]. 熱帶作物學報, 2021, 42(11): 3111-3119.
DU Z H, YANG L, ZHANG C J, XU H J, CHEN Z L. Characteristics of the complete chloroplast genome ofand its comparative analysis[J]. Journal of Tropical Crops, 2021, 42(11): 3111-3119. (in Chinese)
[28] 董雷雷. 葉籽銀杏序列分析及系統發育研究[D]. 濟南: 山東農業大學, 2009.
DONG L L.sequence analysis and phylogenetic study ofL.[D]. Jinan: Shandong Agricultural University, 2009. (in Chinese)
[29] 耿樹香, 楊生超, 寧德魯, 李勇杰. 麗江油橄欖品種表型及SSR標記的多樣性及聚類分析[J]. 西部林業科學, 2018, 47(6): 30-34.
GENG S X, YANG S C, NING D L, LI Y J. Diversity and cluster analysis ofphenotype and SSR markers in Lijiang[J]. Western Forestry Science, 2018, 47(6): 30-34. (in Chinese)
[30] CHMIELEWSKI M, MEYZA K, CHYBIKI I J, DZIALUK A, LITKOWIEC M, BURCZYK J. Chloroplast microsatellites as a tool for phylogeographic studies: the case of white oaks in Poland[J]. iForest Biogeosciences and Forestry, 2015(8): 765-771.
[31] 張明英, 張雨曲, 李依民, 高 靜, 沈 霞, 楊新杰, 顏永剛, 王昌利, 張 崗. 北柴胡、紫花闊葉柴胡葉綠體全基因組解析及柴胡屬藥用植物葉綠體基因組比較與系統發育分析[J]. 藥學學報, 2021, 56(2): 618-629.
ZHANG M Y, ZHANG Y Q, LI Y M, GAO J, SHEN X, YANG X J, YAN Y G, WANG C L, ZHANG G. Complete plastid genomes ofDC. andH. Wolff, with comparative and phylogenetic analyses of medicinalspecies[J]. Pharmaceutical Journal, 2021, 56(2): 618-629. (in Chinese)
[32] KUANG D Y, WU H, WANG Y L, GAO L M, ZHANG S Z, LU L. Complete chloroplast genome sequence of(Magnoliaceae): implication for DNA barcoding and population genetics[J]. Genome, 2011(54): 663-673.
[33] HU Y, WOESTE K E, ZHAO P. Completion of the chloroplast genomes of five Chineseand their contribution to chloroplast phylogeny[J]. Frontiers in Plant Science. 2016(7): 1955.
[34] LI X, YANG Y, HENRY R J, ROSSETTO M, WANG Y T, CHEN S L. Plant DNA barcoding: from gene to genome[J]. Biological Reviews of the Cambridge Philosophical Society, 2015, 90(1): 157-166.
[35] PROVAN J, BENNETT K D. Phylogeographic insights into cryptic glacial refugia[J]. Trends in Ecology and Evolution, 2008, 23(10): 564-571.
[36] 陸玲娣. 中國植物志: 第38卷[M]. 北京: 科學出版社, 1986.
LU L D. Chinese flora: Volume 38[M]. Beijing: Science Press, 1986. (in Chinese)
[37] 沈宗芳, 陸添權, 張志榮, 蔡傳濤, 田 波. 槲蕨屬葉綠體基因組密碼子偏好性分析[J]. 廣西植物, 2021, 41(2): 266-273.
SHEN Z F, LU T Q, ZHANG Z R, CAI Z T, TIAN B. Analysis of codon preference in the chloroplast genome of[J]. Guangxi Plants, 2021, 41(2): 266-273. (in Chinese)
[38] 王曉雙, 楊 芳, 羅 茜, 劉映良, 朱 斌. 石斛屬葉綠體基因組密碼子使用偏性及系統發育分析[J]. 分子植物育種, 2021(3): 1-22.
WANG X S, YANG F, LUO Q, LIU Y L, ZHU B. Codon usage bias and phylogenetic analysis of chloroplast genome of[J]. Molecular Plant Breeding, 2021(3): 1-22. (in Chinese)
[39] LI G L, PAN Z L, GAO S C, HE Y Y, XIA Q Y, JIN Y, YAO H P. Analysis of synonymous codon usage of chloroplast genome in[J]. Genes and Genomics, 2019, 41(10): 1173-1181.
[40] XU C, CAI X M, CHEN Q Z, ZHOU H X, CAI Y, BEN A L. Factors affecting synonymous codon usage bias in chloroplast genome ofRamsey[J]. Evolutionary Bioinformatics, 2011(7): 271-278.
[41] TANG D F, WEI F, CAI Z Q, WEI Y Y, KHAN A, MIAO J H, WEI K H. Analysis of codon usage bias and evolution in the chloroplast genome ofBenth[J]. Development Genes and Evolution, 2020, 11(4): 670-679.
[42] 葉友菊, 倪州獻, 白天道, 徐立安. 馬尾松葉綠體基因組密碼子偏好性分析[J]. 基因組學與應用生物學, 2018, 37(10): 4464-4471.
YE Y J, NI Z X, BAI T D, XU L A. Codon preference analysis ofchloroplast genome[J]. Genomics and Applied Biology, 2018, 37(10): 4464-4471. (in Chinese)
[43] 李顯煌, 楊生超, 辛雅萱, 屈亞亞, 楊琳懿, 馮發玉, 范 偉, 辛培堯. 燈盞花葉綠體基因組密碼子偏好性分析[J]. 云南農業大學學報(自然科學), 2021, 36(3): 384-392.
LI X H, YANG S C, XIN Y X, QU Y Y, YANG L Y, FENG F Y, FAN W, XIN P Y. Analysis of the codon usage bias of chloroplast genome in(Vant.) Hand- Mazz[J]. Journal of Yunnan Agricultural University (Natural Sciences), 2021, 36(3): 384-392. (in Chinese)
[44] 辛雅萱, 董章宏, 瞿紹宏, 劉 成, 葉 鵬, 辛培堯. 杜梨葉綠體基因組密碼子偏好性分析[J]. 河北農業大學學報, 2020, 43(6): 51-59.
XIN Y X, DONG Z H, QU S H, LIU C, YE P, XIN P Y. Analysis on codon usage bias of chloroplast genome inBge.[J]. Journal of Hebei Agricultural University, 2020, 43(6): 51-59. (in Chinese)
Analysis of Chloroplast Genome Characteristics of
WANG Fei1,2, ZHAO Wenzhi1,2, DONG Zhanghong2, MA Luyao1,2, LI Weiying1,2, XIA Maotian1,2, WANG Zhengde1,2, XIN Peiyao2*
1. Southwest Research Center for Landscape Architecture Engineering, State Forestry and Grassland Administration, Southwest Forestry University, Kunming, Yunnan 650224, China; 2. Key Laboratory of National Forestry and Grassland Administration on Biodiversity Conservation in Southwest China, Southwest Forestry University, Kunming, Yunnan 650224, China
There are four species ofRoyle in China, which have high edible and medicinal value. In order to elucidate the chloroplast genome characteristics of, we analyzed the chloroplast genome structure, simple sequence repeats (SSR) loci, the preference of the codon, and sequence variation using bioinformatics methods based on the published chloroplast genome sequences of, and constructed a phylogenetic tree in. The results showed that the chloroplast genome sizes ofwere ranged from 159 179 bp to 168 206 bp, and the average GC content was 37.3%. In terms of the number of coding genes, only two tRNAs were different, while the number of protein-coding genes and rRNA were all consistent, showing a high level of conservation between species. A total of 49 dispersed repeats were detected in the chloroplast genomes ofand, including mainly forward and palindromic repeats, accounting for 73% to 82%, while the number of tandem repeats was 49 and 58, respectively. By the simple repetitive sequence (SSR) analysis, 100 and 84 SSRs loci were detected respectively in the chloroplast genome sequence ofand, and most of SSRs were single nucleotide repeats with A/T base. The codon bias analysis of chloroplast genome offound that the base content of GC3 was significantly lower than that of GC1 and GC2, indicating that the codon preference ended with A and U, and the effective number of codon (ENC) values was all greater than 48%, indicating that the codon bias was weak. Analysis of Neutral-plot and PR2-plot showed that natural selection was the main factor affecting the codon preference ofBy establishing high and low gene expression libraries and using RSCU values as reference, six optimal codons ofwere identified. Three highly variable regions-GUG-,UCCCAUandwere screened by the chloroplast genome sequence variation analysis with nucleotide polymorphism index Pi>0.015. Taking the chloroplast genome ofas a reference, a large number of insertions, deletions and SNP mutations were found in the coding region of chloroplast genome in, and several unique genes ofchloroplast genome were found. Based on the phylogenetic trees byspacers in the chloroplast genomes of, there were two groups in the four species of, one was southern (), and the other was northern (). The present study would provide a theoretical basis for study of the phylogeny, taxonomic identification and resource exploitation of the genus in.
Royle; chloroplast genome; characteristics analysis; phylogeny
Q732
A
10.3969/j.issn.1000-2561.2022.09.002
2022-02-15;
2022-03-09
云南省科技廳科技計劃重點研發項目(No. 2018BB005).
王 飛(1996—),男,碩士研究生,研究方向:林木分子生物學與遺傳改良。*通信作者(Corresponding author):辛培堯(XIN Peiyao),E-mail:xpytgyx@163.com。