999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于轉(zhuǎn)錄組數(shù)據(jù)分析藥用大黃的密碼子使用偏好性

2021-10-25 06:29:16高夢琦鄒建珍霍小位李依民張明英劉蒙蒙
中草藥 2021年20期
關(guān)鍵詞:分析研究

高夢琦,鄒建珍,霍小位,李依民,張明英,高 靜,張 崗*,劉蒙蒙*

1.河北大學(xué)中醫(yī)學(xué)院,河北 保定 071002

2.河北大學(xué)藥學(xué)院,河北 保定 071002

3.陜西中醫(yī)藥大學(xué)藥學(xué)院 陜西省秦嶺中草藥應(yīng)用開發(fā)工程技術(shù)研究中心,陜西 西安 712046

藥用大黃Rheum officinaleBaill.屬于蓼科大黃屬多年生草本植物,為《中國藥典》2020年版收錄的大黃3種基原植物之一,具有瀉下攻積、清熱瀉火、涼血解毒、逐瘀通經(jīng)、利濕退黃等功效[1]。現(xiàn)代中藥化學(xué)研究表明大黃中主要含有蒽醌類、酚類等物質(zhì),其中蒽醌類化合物是主要的活性物質(zhì),具有抗炎、抗腫瘤作用[2-3]。目前藥用大黃的資源主要來源于人工種植,隨著過度采挖,野生資源已經(jīng)瀕臨滅絕。因此,開展蒽醌類化合物生物合成機制研究,探索蒽醌類化合物生物合成路徑,是解決藥用大黃野生資源瀕危的思路之一。

遺傳密碼子是生物體DNA與蛋白之間信息傳遞的信息載體。大多數(shù)氨基酸不僅由一種密碼子編碼,而是可以同時由2~3種密碼子編碼,生物對于不同的密碼子的使用具有一定偏好性[4]。研究發(fā)現(xiàn),密碼子使用偏好性受到GC含量(鳥嘌呤和胞嘧啶含量)[5]、基因表達(dá)水平[6]、環(huán)境壓力[7]、突變壓力[8]、基因長度[9]、蛋白結(jié)構(gòu)[10]及tRNA豐度[11]的影響。隨著高通量測序技術(shù)的發(fā)展,藥用植物的密碼子使用偏好性研究有了顯著的成果[12-13],但是目前還沒有關(guān)于藥用大黃密碼子偏好性的研究。生物體選擇最優(yōu)密碼子可以體高基因的翻譯效率及蛋白的表達(dá)量。因此,研究密碼子的使用偏好性,有利于基因工程研究中密碼子優(yōu)化、最適外源宿主選擇,并對生物的系統(tǒng)進化研究具有重要意義。

本研究利用藥用大黃的轉(zhuǎn)錄組數(shù)據(jù)對其編碼序列進行密碼子偏好性分析,揭示藥用大黃基因密碼子使用偏好性的特征,為藥用大黃基因基因工程研究中進行密碼子優(yōu)化及選擇最佳的外源載體提供理論基礎(chǔ)。

1 數(shù)據(jù)

藥用大黃轉(zhuǎn)錄組(SRR10838870)來源于本課題組前期選取藥用大黃種苗根、根莖、樣品,利用Illumina HiSeq 2500 測序平臺進行轉(zhuǎn)錄組測序并拼接獲得Uingenes序列,利用BLASTx及ESTScan軟件對上述Uingenes序列進行編碼序列(coding sequence,CDS)分析。使用perl程序篩選編碼序列中長度大于300 bp并且同時具有起始密碼子及終止密碼的序列,用于藥用大黃密碼子使用偏好性分析,最后共得到4 733條CDS進行分析。

2 方法

2.1 編碼序列中堿基含量及中性繪圖分析

使用Codon W軟件分析藥用大黃編碼序列中的有效密碼子數(shù)(effective number of codons,ENc)、密碼子適應(yīng)指數(shù)(codon adaptation index,CAI)及同義密碼子相對使用度(relative synonymous codon usage,RSCU),計算序列中的GC含量,利用編寫的perl程序計算GC1、GC2及GC3的含量,即密碼子第1、2、3位的GC含量。GC12為GC1、GC2的平均值。

中性繪圖分析主要用于分析GC12與GC3之間的相關(guān)性,以GC12為縱坐標(biāo),以GC3為橫坐標(biāo)制作散點圖,并進行線性擬合回歸分析。可用于評價自然選擇壓力及突變對密碼子使用偏好性造成的影響。

2.2 GC3關(guān)聯(lián)及奇偶偏好性分析

ENc-GC3關(guān)聯(lián)分析主要用于分析密碼子使用偏好性與堿基組成之間的關(guān)聯(lián)。以ENc為縱坐標(biāo)、GC3s為橫坐標(biāo)繪制二維散點圖,并進行非線性擬合回歸分析。如果基因的點分布在擬合曲線附近,則表明密碼子的使用偏好性主要是受到突變作用的影響;如果基因點分布在擬合曲線下方,則表明密碼子的使用偏好性主要是受到選擇壓力的影響。奇偶偏好性分析以A3/(A3+T3)為縱坐標(biāo),以G3/(G3+C3)為橫坐標(biāo)制作二維散點圖,以(0.5,0.5)坐標(biāo)為中心點,從這個中心點制作的失量表示了奇偶偏倚的程度和方向[14]。

2.3 最優(yōu)密碼子分析

對于最優(yōu)密碼子的篩選,本研究利用藥用大黃編碼書寫的CAI值進行由高到低排列,然后取前后各5%的編碼序列,分別代表高表達(dá)與低表達(dá)的基因序列。之后分析各個密碼子的平均RSCU值。當(dāng)密碼子在高低表達(dá)基因中RSCU值的差異>0.3,且在高表達(dá)基因中RSCU≥1、在低表達(dá)基因中的RSCU≤1,即可被確定為最優(yōu)密碼子[15-16]。

2.4 對應(yīng)分析

對應(yīng)分析是指利用多元統(tǒng)計分析的方法研究不同編碼序列密碼子的變異趨勢。利用Codon W軟件中對應(yīng)分析功能,將所有編碼序列分布到59維向量空間,進而獲得密碼子使用偏好性的特點。通過分析基因位置研究基因向量及基因間值的變異程度,預(yù)測使密碼子使用發(fā)生偏好性的原因[17]。

3 結(jié)果

3.1 密碼子GC含量組成分析

利用Codon W軟件計算藥用大黃編碼序列中GC含量,將藥用大黃編碼序列作為一個整體進行計算。結(jié)果如圖1所示,GC含量范圍分布在28.6%~71.9%,主要分布在40%~50%,GC的平均含量為45.6%。GC1、GC2、GC3的平均含量分別為48.63%、40.89%、44.37%。對比發(fā)現(xiàn),GC2的含量最小,GC1與GC3的值相對比較接近,說明藥用大黃編碼序列更傾向于使用鳥嘌呤(G)和胞嘧啶(C)這2種堿基。

圖1 藥用大黃編碼序列中GC含量組成Fig.1 Distribution of GC content ofcoding sequences(CDS) in R.officinale

3.2 中性繪圖分析

藥用大黃編碼序列的中性圖分析如圖2所示,其中GC12的數(shù)值范圍為0.15~0.87,GC3的數(shù)值范圍為0.09~0.87。GC12與GC3的相關(guān)性系數(shù)為0.155,表明這兩者之間的相關(guān)性比較弱,說明選擇壓力在藥用大黃密碼子使用偏好性的選擇具有一定影響。

圖2 中性圖分析Fig.2 Neutrality plot

3.3 ENc-plot繪圖分析

ENc的取值范圍為20~61,平均值為47.58,其中ENc≤35的基因有386個(8.15%),ENC=61的基因有251個(5.30%),說明藥用大黃的編碼序列除了少數(shù)密碼子具有較強的偏好性,其整體的密碼子使用偏好性較弱。以ENc為縱坐標(biāo)、GC3s為橫坐標(biāo)繪制散點圖(圖3),圖中各點代表基因分布情況。圖3顯示大部分基因遠(yuǎn)離期望曲線,說明密碼子的偏好性主要來源于選擇壓力的影響,少部分基因均勻的分布在期望曲線兩側(cè),說明部分基因收到突變壓力的影響。

圖3 藥用大黃轉(zhuǎn)錄組編碼序列ENC-GC3s相關(guān)性分析Fig.3 Neutrality plot (ENC vs GC3)

利用(ENCexp-ENCobs)/ENCexp統(tǒng)計分析期望ENc與觀測ENc之間的區(qū)別[18]。如圖4所示,(ENCexp-ENCobs)/ENCexp的取值主要分布在0~0.2,說明期望ENc與觀測ENc兩者之間的存在很小差異。進而說明在藥用大黃編碼序列密碼子使用偏好性形成過程中,突變壓力不是唯一的影響因素,但卻是一個重要的影響因素。

圖4 ENc比值頻率分布Fig.4 Frequency distribution of ENc ratio

3.4 對應(yīng)性分析

對應(yīng)性分析結(jié)果見圖5,GC含量不同的基因被標(biāo)記上不同的顏色,編碼序列中GC含量大于60%的被標(biāo)記為紅色,GC含量在45%~60%的被標(biāo)記為藍(lán)色,GC含量小于45%的被標(biāo)記為綠色。其中,GC含量大于60%的編碼序列分散的分布在坐標(biāo)系中,而GC含量小于60%的編碼序列則在坐標(biāo)系中分布比較集中。

圖5 對應(yīng)性分析Fig.5 Correspondence analysis

此外,選取6個編碼序列相關(guān)的參數(shù)(GC12、GC3、GCall、ENC、CAI以及Axis 1)進行相關(guān)性分析,結(jié)果如表1所示,Axis 1與GC12、GC3這2個重要參數(shù)存在顯著的負(fù)相關(guān)性(r=-0.418,r=-0.728,P<0.01)。結(jié)合圖5與表1,可以說明GC含量與GC3含量高的編碼序列取向于分布在Axis 1左側(cè)。因此,推測以G/C結(jié)尾的密碼子應(yīng)集中分布在Axis 1負(fù)軸而以A/U結(jié)尾的密碼子集中分布在Axis 1正軸。

表1 藥用大黃編碼序列對應(yīng)參數(shù)的相關(guān)性分析Table 1 Correlation analysis of R.officinale gene-related parameters

3.5 偏倚性分析

偏倚性分析結(jié)果如圖6所示,大部分藥用大黃轉(zhuǎn)錄組編碼序列樣本點分布于中心點附近,說明其堿基中嘌呤與嘧啶出現(xiàn)的頻率相對一致,少部分編碼序列偏離中心點較遠(yuǎn),進一步說明藥用大黃密碼子使用偏好性形成過程中主要受到突變壓力的影響。

圖6 編碼序列偏倚性分析Fig.6 Parity rule 2 (PR2 ) -bias plot

3.6 基因表達(dá)水平對密碼子使用偏好性的影響

藥用大黃編碼序列的CAI的范圍為0.261~0.835,表明藥用大黃的基因表達(dá)水平比較高。同時,對CAI與其他幾個重要的參數(shù)進行了相關(guān)性分析,包括ENc、GC3、GC。結(jié)果如表1及圖7所示,CAI與ENc及GC之間都存在顯著的正相關(guān)性(r=0.07,P<0.01;r=0.695,P<0.01)。因此,基因表達(dá)水平在藥用大黃密碼子使用偏好性形成過程中起到關(guān)鍵作用,基因表達(dá)水平高并且基因中GC含量高,密碼子使用偏好性程度越高。

圖7 中性圖分析Fig.7 Neutrality plot

3.7 最優(yōu)密碼子分析

藥用大黃編碼序列高、低表達(dá)序列的RSCU值如表2所示。從中篩選到29個密碼子作為藥用大黃編碼序列的最優(yōu)密碼子,在這些最優(yōu)密碼子中,以U(15個)及A(13個)結(jié)尾的較多,表明藥用大黃轉(zhuǎn)錄組編碼序列的最優(yōu)密碼子偏好以U或A結(jié)尾。

表2 藥用大黃轉(zhuǎn)錄組高、低表達(dá)基因的RSCU比較分析Table 2 Optimal codons of R.officinale genes based on the RSCU values

4 討論

在生物長期的進化過程中,形成了對密碼子的使用的固定模式。今年來,隨著二代測序技術(shù)的發(fā)展,探索天然產(chǎn)物合成路徑并進行異源合成,成為了研究熱點。因此,探索藥用大黃基因密碼子使用偏好性,可為研究其密碼子使用特點,篩選最佳蛋白異源表達(dá)載體及密碼子優(yōu)化奠定理論基礎(chǔ)。

本研究對藥用大黃轉(zhuǎn)錄組數(shù)據(jù)中4733條完整編碼序列的密碼子使用偏好性進行分析,結(jié)果顯示,藥用大黃轉(zhuǎn)錄組編碼序列的GC、GC3平均含量分別為45.6%、44.73%,表明藥用大黃轉(zhuǎn)錄組中的編碼序列偏好使用富含A、U且以A/U結(jié)尾的密碼子,這與小麥Triticum aestivumL.[19]、水稻Oryza sativaL.[20]、玉米Zea maysL.[21]密碼子使用模式不一致,這些植物的密碼子富含GC堿基,并且大多數(shù)密碼子以G/C結(jié)尾,藥用植物川貝母轉(zhuǎn)錄組中的編碼序列的GC和GC3平均含量都接近于50%,并沒有表現(xiàn)出密碼子使用偏好性[15],表明堿基組成在藥用大黃響密碼子偏好性形成過程中起到重要作用。

此外,堿基突變和遺傳選擇也影響著密碼子使用偏好性形成的重要因素。本研究中,藥用大黃轉(zhuǎn)錄組GC12與GC3含量具有顯著相關(guān)性,ENc-plot繪圖及偏倚性分析分析結(jié)果表明,大部分基因遠(yuǎn)離于標(biāo)準(zhǔn)曲線及坐標(biāo)軸中心點,基因的期望ENc值與觀測ENc值具有較大差異,說明這部分基因密碼子偏好性的形成是以遺傳選擇為主導(dǎo)因素;少數(shù)的基因分布于標(biāo)準(zhǔn)曲線附近及坐標(biāo)軸中心點,基因的期望ENc值與觀測ENc值基本保持一致,說明這部分基因密碼子形成偏好性的形成是以突變?yōu)橹鲗?dǎo)因素。

在構(gòu)建蛋白表達(dá)載體時,不同的基因密碼子使用偏好性差異很大,因此分析藥用大黃的密碼子使用特點對于載體的密碼子優(yōu)化具有重要意義。本研究篩選得到藥用大黃29個最優(yōu)密碼子,大多數(shù)密碼子以A/U結(jié)尾,從藥用大黃編碼序列中的GC含量可以看出, 其偏好使用A或U堿基結(jié)尾的密碼子。由此推斷藥用大黃基因的密碼子偏好性的產(chǎn)生與其基因進化過程中AU到GC突變壓力要比GC到AU突變壓力高有關(guān)。

本研究對藥用大黃轉(zhuǎn)錄組數(shù)據(jù)中編碼序列的密碼子使用特點進行了研究,探討了影響其密碼子使用偏好性形成的影響因素,并篩選出藥用大黃基因的29個最優(yōu)密碼子,可為蒽醌類化合物的異源合成及其合成路徑研究提供理論依據(jù)。

利益沖突所有作者均聲明不存在利益沖突

猜你喜歡
分析研究
FMS與YBT相關(guān)性的實證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
新版C-NCAP側(cè)面碰撞假人損傷研究
電力系統(tǒng)及其自動化發(fā)展趨勢分析
中西醫(yī)結(jié)合治療抑郁癥100例分析
主站蜘蛛池模板: 国产原创自拍不卡第一页| 国产欧美一区二区三区视频在线观看| 欧美亚洲综合免费精品高清在线观看| 丁香五月激情图片| 亚洲全网成人资源在线观看| 亚洲精品日产AⅤ| 国产激情无码一区二区三区免费| 一级毛片免费观看不卡视频| 国产在线视频二区| 日日噜噜夜夜狠狠视频| 岛国精品一区免费视频在线观看| 国产精品中文免费福利| 午夜无码一区二区三区| 久久中文字幕不卡一二区| 香蕉蕉亚亚洲aav综合| 91精品国产91欠久久久久| 国产精品主播| 国产精品v欧美| 国产精品主播| 香蕉视频在线观看www| JIZZ亚洲国产| 91原创视频在线| 九色91在线视频| 国产精品亚洲专区一区| 亚洲精品自产拍在线观看APP| 国产91av在线| 国产打屁股免费区网站| 福利视频一区| 久久永久视频| 欧美www在线观看| 成人一级黄色毛片| 亚洲性影院| 亚洲精品图区| 精品国产自在现线看久久| 国产99视频精品免费观看9e| 国产一级视频久久| 99在线国产| 亚洲精品综合一二三区在线| 天堂在线亚洲| 国产一区免费在线观看| 国内熟女少妇一线天| 国产麻豆另类AV| 一区二区三区四区在线| 91网址在线播放| 一本色道久久88| 国产一区二区网站| 四虎国产永久在线观看| 东京热av无码电影一区二区| 狼友视频一区二区三区| 婷婷六月综合| 亚洲视屏在线观看| 日韩中文无码av超清| 国内精品免费| 亚洲综合中文字幕国产精品欧美 | 免费国产好深啊好涨好硬视频| 国产精品刺激对白在线| 国产经典在线观看一区| www亚洲精品| 一级成人a做片免费| 无码福利视频| 曰AV在线无码| 亚洲视频a| 欧美亚洲一二三区| 国产小视频a在线观看| Aⅴ无码专区在线观看| 国产真实乱子伦精品视手机观看| 狠狠做深爱婷婷久久一区| 色网站免费在线观看| 亚洲欧洲日产国产无码AV| 日韩久草视频| 国产亚洲欧美日韩在线一区| 精品国产污污免费网站| 91无码人妻精品一区| 伊人婷婷色香五月综合缴缴情| 71pao成人国产永久免费视频| 手机在线看片不卡中文字幕| 日本午夜精品一本在线观看| 国产成人精品免费av| 国产精品自在在线午夜| 午夜在线不卡| 久久国产拍爱| 国产网友愉拍精品|