999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人類組成型和可變外顯子的密碼子偏性及聚類分析

2014-09-10 18:06:07張占軍邢永強(qiáng)王成愛
湖北農(nóng)業(yè)科學(xué) 2014年11期

張占軍+邢永強(qiáng)+王成愛

摘要:通過計(jì)算人類組成型外顯子和可變外顯子的RSCU值,對兩種外顯子的RSCU值進(jìn)行了比較?結(jié)果表明,除了UAG?UGA?UAA 3個(gè)終止密碼子外,兩種外顯子的密碼子偏性都是相同的?對30條可變外顯子和30條組成型外顯子序列的RSCU值進(jìn)行聚類分析,聚類結(jié)果不能把兩種外顯子區(qū)別開,證明兩種外顯子之間的密碼子偏性是相同的?對這60條序列的HI進(jìn)行了聚類分析,聚類結(jié)果沒有把兩種外顯子分開?所以外顯子序列中沒有組成型剪接和可變剪接的信息?

關(guān)鍵字:人類;組成型外顯子;可變外顯子;密碼子偏性;聚類

中圖分類號:Q52文獻(xiàn)標(biāo)識碼:A文章編號:0439-8114(2014)11-2675-04

Codon Bias and Cluster Analysis of the Constitutive Exons and

the Alternative Exons of Human

ZHANG Zhan-jun,XING Yong-qiang,WANG Cheng-ai

(School of Mathematics, Physics and Biological Engineering,Inner Mogolia University of Science &

Technology,Baotou 014010, Inner Mogolia,China)

Abstract: RSCU of the constitutive exons and alternative exons of human were calculated. Two kinds of exons RSCU values were compared. The results showed that every codon bias was the same in two kinds of exons, except three stop codons(UAG,UGA,UAA). 30 constitutive exon sequences and 30 alternative exon sequences were selected to calculate RSCU values of them. The cluster analysis did not distinguish two kinds of exons, proving that the codon biases were the same between the two kinds of exons. HI of the 60 sequences were calculated and used to cluster analysis. It was not able to separate the two kinds of exons. It is indicated that there is no constitutive splicing and alternative splicing information in the exon sequences.

Key words: human;constitutive exons;alternative exons;codon bias;clustering

基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(61271448)

可變剪接是多細(xì)胞真核生物蛋白質(zhì)多樣性的主要來源,且由于可變剪接的存在使得剪接機(jī)制變得異常復(fù)雜[1]?基于深度測序技術(shù),估計(jì)超過95%的人類多外顯子基因存在可變剪接現(xiàn)象?可變剪接主要包括5種類型:可變5剪接(Alternative 5 splicing)?可變3剪接(Alternative 3 splicing)?外顯子跳躍(Exon skipping)?內(nèi)含子保留(Intron retention)?互斥外顯子(Mutually exclusive exons)?如果把外顯子分為兩類,可以分為組成型外顯子(Constitution exons)和可變外顯子(Variable exons)?上述5種外顯子均屬于可變外顯子?

密碼子具有簡并性,即組成蛋白質(zhì)的每個(gè)氨基酸可能由一個(gè)到多個(gè)密碼子編碼?在基因中, 同義密碼子的使用并不是完全均勻的?在不同物種?不同生物體中,密碼子的使用存在很大的差異[2]?在一些單細(xì)胞生物中,如在大腸桿菌和酵母中,高表達(dá)的基因密碼子使用的偏性一般比較大,主要是由于基因的堿基組成和mRNA翻譯時(shí)tRNA的選擇造成的?

目前,對于組成型和可變外顯子的研究主要集中在用IDQD?SVM以及自由能等進(jìn)行分類?有些研究認(rèn)為密碼子偏性與諸多因素有關(guān), 如氨基酸組分[3]?mRNA的二級結(jié)構(gòu)[4]?翻譯起始效應(yīng)?G+C含量?基因長度[5,6]?tRNA的豐度[7]?蛋白質(zhì)的結(jié)構(gòu)[8]等?

鑒于此,筆者研究了組成型外顯子和可變外顯子的密碼子偏向性?非均勻性及其聚類?研究組成型外顯子和可變外顯子的密碼子偏向性,以及通過RSCU值和HI值聚類檢驗(yàn)其是否可以聚成兩類,有助于分析發(fā)生可變剪接的序列信息是在外顯子中還是在內(nèi)含子中,以及分析剪接的具體機(jī)制?

1材料與方法

所用的可變剪接的數(shù)據(jù)來源于ASTD數(shù)據(jù)庫(Release3)(ftp://ftp.ebi.edu.au/pub/databases/astd/altsplice /human/release3_36.35i/)[9,10],人類基因CDS序列數(shù)據(jù)來源于Ensembl(http://asia.ensembl.org/biomart/martview/04fb71801495bc0713760267933b

b8c3)?

1.1組成型外顯子和可變外顯子的來源

由ASTD庫的AltSplice-rel3.exon.txt庫?AltSplice-rel3.events.txt庫以及AltSplice-rel3.genes.txt庫得到4 624條人類的組成型外顯子序列;由Ensembl下載得到人類基因的CDS序列211 776條?對以上兩組序列進(jìn)行比對,確定出具有三周期讀碼框的人類組成型外顯子3 847條?

由ASTD庫的AltSplice-rel3.events.txt庫和AltSplice-rel3.genes.txt庫分別得到盒式外顯子序列8 049條?內(nèi)含子保留序列5 926條?互斥外顯子序列1 509對?可變3′外顯子序列6 320對?可變5′外顯子序列3 391對?這5種序列都是可變外顯子序列?由上述5種可變外顯子序列庫和人類基因的CDS庫比對得到具有三周期讀碼框的可變外顯子9 738條?在組成型和可變外顯子密碼子偏向性分析時(shí),確定了兩類外顯子的三周期讀碼框?

1.2密碼子偏向性計(jì)算

1.2.1密碼子使用的相對概率計(jì)算密碼子偏性常用的指標(biāo)有密碼子使用的相對概率?密碼子有效數(shù)?密碼子偏好參數(shù)?GC3s值等?其中密碼子使用的相對概率(Relative synonymous codon usage,RSCU) 是指對于某一特定的密碼子在編碼對應(yīng)氨基酸的同義密碼子間的相對概率[11]?密碼子使用的相對概率RSCUij的計(jì)算公式為:

RSCUij=(1)

式中,RSCUij表示第i個(gè)外顯子序列?第j個(gè)密碼子的相對使用概率,obsij表示密碼子j在外顯子i中出現(xiàn)的次數(shù),aaij表示密碼子j編碼的氨基酸在外顯子i編碼的氨基酸序列中出現(xiàn)的次數(shù),k表示與密碼子j同義的密碼子個(gè)數(shù)?

RSCU值等于1,表示這個(gè)密碼子沒有偏向性,大于1表示這個(gè)密碼子是使用較多的密碼子,小于1表示這個(gè)密碼子使用較少?RSCU值越大表示密碼子的偏向性越大?

1.2.2組成型外顯子和可變外顯子的RSCU值計(jì)算把“1.1”得到的組成型外顯子和可變外顯子分別連接起來,用CodonW軟件分別計(jì)算其RSCU值?

1.3用RSCU值進(jìn)行聚類分析

1.3.1聚類分析使用的數(shù)據(jù)從“1.1”所述的具有三周期讀碼框的人類組成型外顯子3 847條,隨機(jī)選取超過大小500 bp的組成型外顯子30條,作為正集;隨機(jī)選取盒式外顯子6條?互斥外顯子6條?可變5′外顯子6條?可變3′外顯子6條?內(nèi)含子保留序列6條,序列長度都超過500 bp,共30條,把這些作為可變外顯子,作為負(fù)集?分別將上述組成型外顯子序列編號為1-30,可變外顯子序列編號為31-60?

1.3.2聚類方法對外顯子密碼子使用概率進(jìn)行聚類分析,將每個(gè)外顯子序列作為研究對象,將密碼子的相對使用概率統(tǒng)計(jì)值作為變量?由于AUG(編碼蛋氨酸的密碼子)?UGG(編碼色氨酸的密碼子)的RSCU值始終為1,所以除去這兩個(gè)密碼子,同時(shí)除去3個(gè)終止密碼子,剩下59個(gè)密碼子,用這59個(gè)密碼子的RSCU值進(jìn)行聚類分析?

這里外顯子間的距離規(guī)定為密碼子使用相對概率的歐拉平方距離?歐拉平方距離dij的計(jì)算公式為:

dij=(RSCUik-RSCUjk)2 (2)

式中,dij表示外顯子i與外顯子j之間的距離?RSCUik表示第i個(gè)外顯子的第k個(gè)密碼子的RSCU值,RSCUjk表示第j個(gè)外顯子的第k個(gè)密碼子的RSCU值?

1.3.3聚類分析用CodonW軟件分別計(jì)算這60條序列的RSCU值,并用公式(2)計(jì)算出其距離矩陣?用SPSS 13.0軟件進(jìn)行聚類分析?

1.4用非均勻指數(shù)(HI)進(jìn)行聚類

1.4.1非均勻指數(shù)(HI)非均勻指數(shù)(HI)定義為:

HI=(3)

式中,N?琢(α=1?2?3?4)表示序列的4種堿基A?G?T?C;N=N?琢為序列長度;N(l)(l=1?2?3)為3個(gè)子序列的長度;N(l)=N/3;Nα(l)為第l個(gè)子序列中第α種堿基數(shù)[12]?利用該參數(shù)研究堿基的非均勻分布?

1.4.2用非均勻指數(shù)聚類所使用的距離用非均勻指數(shù)聚類所使用的距離定義為:

dij=HIi-HIj(4)

式中,dij表示第i條外顯子和第j條外顯子的距離,HIi表示第i條外顯子序列的非均勻指數(shù),HIj表示第j條外顯子序列的非均勻指數(shù)?

1.4.3聚類分析用公式(3)計(jì)算“1.3.1”中所述的60條序列的HI值,然后用公式(4)計(jì)算其距離矩陣,最后用SPSS 13.0軟件進(jìn)行聚類分析?

2結(jié)果與分析

2.1組成型和可變外顯子密碼子偏性結(jié)果

將找到的所有符合條件的組成型外顯子連成一條序列,計(jì)算其RSCU值,同時(shí)把找到的所有符合條件的可變外顯子連接成一條序列,計(jì)算其RSCU值?在計(jì)算結(jié)果中,剔除了UAA?UAG?UGA 3個(gè)終止密碼子,繪制折線圖,如圖1所示?從圖1中可以看出,組成型外顯子和可變外顯子之間偏性是相同的?每個(gè)外顯子的RSCU值稍有差異,可能是統(tǒng)計(jì)誤差的原因?

2.2用RSCU值對組成型外顯子和可變外顯子聚類的結(jié)果

1-30號序列為組成型外顯子,31-60號序列是可變外顯子,利用這60條序列的RSCU值,采用SPSS 13.0軟件進(jìn)行聚類分析(通過計(jì)算距離矩陣),結(jié)果如圖2所示?由圖2可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,進(jìn)一步確認(rèn)了組成型和可變外顯子的密碼子偏性是相同的?

2.3用HI指數(shù)對組成型外顯子和可變外顯子聚類的結(jié)果

計(jì)算了1-30號組成型外顯子和31-60號可變外顯子序列的HI指數(shù),并用HI指數(shù)對它們進(jìn)行聚類分析,聚類結(jié)果如圖3所示?由圖3可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,說明組成型外顯子和可變外顯子之間序列的不均勻性是相同的?

3結(jié)論與討論

本研究結(jié)果表明,組成型外顯子和可變外顯子的密碼子偏性是相同的?組成型外顯子和可變外顯子的非均勻性是相同的?可以推斷,組成型剪接和可變剪接與外顯子序列的特異性關(guān)系不大,或者組成型外顯子和可變外顯子在密碼子偏性或不均勻性上不存在特異性?

組成型外顯子和可變外顯子在密碼子的使用上沒有偏性,可以得出在剪接的時(shí)候外顯子一端是否發(fā)生剪接的信息不在外顯子里?為什么某個(gè)位點(diǎn)發(fā)生的是組成型剪接,而不是可變剪接,而另一個(gè)位點(diǎn)發(fā)生的是可變剪接,而不是組成型剪接,可能是大量的剪接信息是在內(nèi)含子序列?剪接因子?pre-mRNA?DNA大分子?非編碼RNA等的互相作用中產(chǎn)生的?

結(jié)合組成型外顯子和可變外顯子之間的密碼子偏性相同的信息進(jìn)一步猜測,有可能由于進(jìn)化的選擇,外顯子中的堿基序列是用來編碼蛋白質(zhì)的,這些序列已經(jīng)有了編碼蛋白質(zhì)的功能,不適合有太多的剪接信息;而就平均長度來說,內(nèi)含子比外顯子長得多,而且不需要編碼蛋白質(zhì),適宜于放置可變剪接的調(diào)控模體——剪接信息?

參考文獻(xiàn):

[1] SMITH C W, VALCARCEL J. Alternative pre-mRNA splicing: The logic of combinatorial control[J].Trends Biochem Sci,2000,25(8):381-388.

[2] GRANTHAM R, GAUTIER C, GOUY M, et al.Codon catalog usage and the genome hypothesis[J]. Nucleic Acids Research,1980,8(1):49-62.

[3] ONOFRIO G D, MOUCHIROUD D, AISSANIi B ,et al. Correlations between the compositional properties of human genes, codon usage, and amino acid composition of proteins[J].J Mol Evol,1991,32(6):504-510.

[4] ZAMA M. Codon usage and secondary structure of mRNA[J]. Nucleic Acids Symp Ser,1990,22(3):93-94.

[5] EYRE-WALKER A. Synonymous codon bias is related to gene length in Escherichia coli:Selection for translational accuracy?[J]. Mol Biol Evol,1996,13(6):864-872.

[6] MORIYAMA E N, POWELL J R. Gene length and codon usage bias inDrosophila melanogaster, Saccharomyces cervisiae and Escherichia coli[J].Nucleic Acids Res,1998,26(13):3188-3193.

[7] BUCHAN J R, AUCOTT L S, STANSFIELD I. tRNA properties help shape codon pair preferences in open reading frames[J]. Nucleic Acids Res,2006,34(3):1015-1027.

[8] GUPTA S K, MAJUMDAR S K, BHATTACHARYA T, et al. Studies on the relationships between the synonymous codon usage and protein secondary structural units[J].Biochem Biophys Res Commun, 2000,269(3): 692-696.

[9] THANARAJ T A, STAMM S, CLARK F, et al. ASD: The alternative splicing database[J]. Nucleic Acids Res, 2004,32(1):64-69.

[10] STAMM S, RIETHOVEN J J, LE TEXIER V, et al. ASD: A bioinformatics resource on alternative splicing[J]. Nucleic Acids Res, 2006,34(S1):46-55.

[11] COMERON J, AGUADE M. An evaluation of measure of synonymous codon usage bias[J]. Journal of Molecular Evolution, 1998, 47(2): 268-274.

[12] 晉宏?duì)I,李 宏. 核酸序列非均勻指數(shù)(HI)的約化[J].內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,33(3):283-287.

RSCUij=(1)

式中,RSCUij表示第i個(gè)外顯子序列?第j個(gè)密碼子的相對使用概率,obsij表示密碼子j在外顯子i中出現(xiàn)的次數(shù),aaij表示密碼子j編碼的氨基酸在外顯子i編碼的氨基酸序列中出現(xiàn)的次數(shù),k表示與密碼子j同義的密碼子個(gè)數(shù)?

RSCU值等于1,表示這個(gè)密碼子沒有偏向性,大于1表示這個(gè)密碼子是使用較多的密碼子,小于1表示這個(gè)密碼子使用較少?RSCU值越大表示密碼子的偏向性越大?

1.2.2組成型外顯子和可變外顯子的RSCU值計(jì)算把“1.1”得到的組成型外顯子和可變外顯子分別連接起來,用CodonW軟件分別計(jì)算其RSCU值?

1.3用RSCU值進(jìn)行聚類分析

1.3.1聚類分析使用的數(shù)據(jù)從“1.1”所述的具有三周期讀碼框的人類組成型外顯子3 847條,隨機(jī)選取超過大小500 bp的組成型外顯子30條,作為正集;隨機(jī)選取盒式外顯子6條?互斥外顯子6條?可變5′外顯子6條?可變3′外顯子6條?內(nèi)含子保留序列6條,序列長度都超過500 bp,共30條,把這些作為可變外顯子,作為負(fù)集?分別將上述組成型外顯子序列編號為1-30,可變外顯子序列編號為31-60?

1.3.2聚類方法對外顯子密碼子使用概率進(jìn)行聚類分析,將每個(gè)外顯子序列作為研究對象,將密碼子的相對使用概率統(tǒng)計(jì)值作為變量?由于AUG(編碼蛋氨酸的密碼子)?UGG(編碼色氨酸的密碼子)的RSCU值始終為1,所以除去這兩個(gè)密碼子,同時(shí)除去3個(gè)終止密碼子,剩下59個(gè)密碼子,用這59個(gè)密碼子的RSCU值進(jìn)行聚類分析?

這里外顯子間的距離規(guī)定為密碼子使用相對概率的歐拉平方距離?歐拉平方距離dij的計(jì)算公式為:

dij=(RSCUik-RSCUjk)2 (2)

式中,dij表示外顯子i與外顯子j之間的距離?RSCUik表示第i個(gè)外顯子的第k個(gè)密碼子的RSCU值,RSCUjk表示第j個(gè)外顯子的第k個(gè)密碼子的RSCU值?

1.3.3聚類分析用CodonW軟件分別計(jì)算這60條序列的RSCU值,并用公式(2)計(jì)算出其距離矩陣?用SPSS 13.0軟件進(jìn)行聚類分析?

1.4用非均勻指數(shù)(HI)進(jìn)行聚類

1.4.1非均勻指數(shù)(HI)非均勻指數(shù)(HI)定義為:

HI=(3)

式中,N?琢(α=1?2?3?4)表示序列的4種堿基A?G?T?C;N=N?琢為序列長度;N(l)(l=1?2?3)為3個(gè)子序列的長度;N(l)=N/3;Nα(l)為第l個(gè)子序列中第α種堿基數(shù)[12]?利用該參數(shù)研究堿基的非均勻分布?

1.4.2用非均勻指數(shù)聚類所使用的距離用非均勻指數(shù)聚類所使用的距離定義為:

dij=HIi-HIj(4)

式中,dij表示第i條外顯子和第j條外顯子的距離,HIi表示第i條外顯子序列的非均勻指數(shù),HIj表示第j條外顯子序列的非均勻指數(shù)?

1.4.3聚類分析用公式(3)計(jì)算“1.3.1”中所述的60條序列的HI值,然后用公式(4)計(jì)算其距離矩陣,最后用SPSS 13.0軟件進(jìn)行聚類分析?

2結(jié)果與分析

2.1組成型和可變外顯子密碼子偏性結(jié)果

將找到的所有符合條件的組成型外顯子連成一條序列,計(jì)算其RSCU值,同時(shí)把找到的所有符合條件的可變外顯子連接成一條序列,計(jì)算其RSCU值?在計(jì)算結(jié)果中,剔除了UAA?UAG?UGA 3個(gè)終止密碼子,繪制折線圖,如圖1所示?從圖1中可以看出,組成型外顯子和可變外顯子之間偏性是相同的?每個(gè)外顯子的RSCU值稍有差異,可能是統(tǒng)計(jì)誤差的原因?

2.2用RSCU值對組成型外顯子和可變外顯子聚類的結(jié)果

1-30號序列為組成型外顯子,31-60號序列是可變外顯子,利用這60條序列的RSCU值,采用SPSS 13.0軟件進(jìn)行聚類分析(通過計(jì)算距離矩陣),結(jié)果如圖2所示?由圖2可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,進(jìn)一步確認(rèn)了組成型和可變外顯子的密碼子偏性是相同的?

2.3用HI指數(shù)對組成型外顯子和可變外顯子聚類的結(jié)果

計(jì)算了1-30號組成型外顯子和31-60號可變外顯子序列的HI指數(shù),并用HI指數(shù)對它們進(jìn)行聚類分析,聚類結(jié)果如圖3所示?由圖3可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,說明組成型外顯子和可變外顯子之間序列的不均勻性是相同的?

3結(jié)論與討論

本研究結(jié)果表明,組成型外顯子和可變外顯子的密碼子偏性是相同的?組成型外顯子和可變外顯子的非均勻性是相同的?可以推斷,組成型剪接和可變剪接與外顯子序列的特異性關(guān)系不大,或者組成型外顯子和可變外顯子在密碼子偏性或不均勻性上不存在特異性?

組成型外顯子和可變外顯子在密碼子的使用上沒有偏性,可以得出在剪接的時(shí)候外顯子一端是否發(fā)生剪接的信息不在外顯子里?為什么某個(gè)位點(diǎn)發(fā)生的是組成型剪接,而不是可變剪接,而另一個(gè)位點(diǎn)發(fā)生的是可變剪接,而不是組成型剪接,可能是大量的剪接信息是在內(nèi)含子序列?剪接因子?pre-mRNA?DNA大分子?非編碼RNA等的互相作用中產(chǎn)生的?

結(jié)合組成型外顯子和可變外顯子之間的密碼子偏性相同的信息進(jìn)一步猜測,有可能由于進(jìn)化的選擇,外顯子中的堿基序列是用來編碼蛋白質(zhì)的,這些序列已經(jīng)有了編碼蛋白質(zhì)的功能,不適合有太多的剪接信息;而就平均長度來說,內(nèi)含子比外顯子長得多,而且不需要編碼蛋白質(zhì),適宜于放置可變剪接的調(diào)控模體——剪接信息?

參考文獻(xiàn):

[1] SMITH C W, VALCARCEL J. Alternative pre-mRNA splicing: The logic of combinatorial control[J].Trends Biochem Sci,2000,25(8):381-388.

[2] GRANTHAM R, GAUTIER C, GOUY M, et al.Codon catalog usage and the genome hypothesis[J]. Nucleic Acids Research,1980,8(1):49-62.

[3] ONOFRIO G D, MOUCHIROUD D, AISSANIi B ,et al. Correlations between the compositional properties of human genes, codon usage, and amino acid composition of proteins[J].J Mol Evol,1991,32(6):504-510.

[4] ZAMA M. Codon usage and secondary structure of mRNA[J]. Nucleic Acids Symp Ser,1990,22(3):93-94.

[5] EYRE-WALKER A. Synonymous codon bias is related to gene length in Escherichia coli:Selection for translational accuracy?[J]. Mol Biol Evol,1996,13(6):864-872.

[6] MORIYAMA E N, POWELL J R. Gene length and codon usage bias inDrosophila melanogaster, Saccharomyces cervisiae and Escherichia coli[J].Nucleic Acids Res,1998,26(13):3188-3193.

[7] BUCHAN J R, AUCOTT L S, STANSFIELD I. tRNA properties help shape codon pair preferences in open reading frames[J]. Nucleic Acids Res,2006,34(3):1015-1027.

[8] GUPTA S K, MAJUMDAR S K, BHATTACHARYA T, et al. Studies on the relationships between the synonymous codon usage and protein secondary structural units[J].Biochem Biophys Res Commun, 2000,269(3): 692-696.

[9] THANARAJ T A, STAMM S, CLARK F, et al. ASD: The alternative splicing database[J]. Nucleic Acids Res, 2004,32(1):64-69.

[10] STAMM S, RIETHOVEN J J, LE TEXIER V, et al. ASD: A bioinformatics resource on alternative splicing[J]. Nucleic Acids Res, 2006,34(S1):46-55.

[11] COMERON J, AGUADE M. An evaluation of measure of synonymous codon usage bias[J]. Journal of Molecular Evolution, 1998, 47(2): 268-274.

[12] 晉宏?duì)I,李 宏. 核酸序列非均勻指數(shù)(HI)的約化[J].內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,33(3):283-287.

RSCUij=(1)

式中,RSCUij表示第i個(gè)外顯子序列?第j個(gè)密碼子的相對使用概率,obsij表示密碼子j在外顯子i中出現(xiàn)的次數(shù),aaij表示密碼子j編碼的氨基酸在外顯子i編碼的氨基酸序列中出現(xiàn)的次數(shù),k表示與密碼子j同義的密碼子個(gè)數(shù)?

RSCU值等于1,表示這個(gè)密碼子沒有偏向性,大于1表示這個(gè)密碼子是使用較多的密碼子,小于1表示這個(gè)密碼子使用較少?RSCU值越大表示密碼子的偏向性越大?

1.2.2組成型外顯子和可變外顯子的RSCU值計(jì)算把“1.1”得到的組成型外顯子和可變外顯子分別連接起來,用CodonW軟件分別計(jì)算其RSCU值?

1.3用RSCU值進(jìn)行聚類分析

1.3.1聚類分析使用的數(shù)據(jù)從“1.1”所述的具有三周期讀碼框的人類組成型外顯子3 847條,隨機(jī)選取超過大小500 bp的組成型外顯子30條,作為正集;隨機(jī)選取盒式外顯子6條?互斥外顯子6條?可變5′外顯子6條?可變3′外顯子6條?內(nèi)含子保留序列6條,序列長度都超過500 bp,共30條,把這些作為可變外顯子,作為負(fù)集?分別將上述組成型外顯子序列編號為1-30,可變外顯子序列編號為31-60?

1.3.2聚類方法對外顯子密碼子使用概率進(jìn)行聚類分析,將每個(gè)外顯子序列作為研究對象,將密碼子的相對使用概率統(tǒng)計(jì)值作為變量?由于AUG(編碼蛋氨酸的密碼子)?UGG(編碼色氨酸的密碼子)的RSCU值始終為1,所以除去這兩個(gè)密碼子,同時(shí)除去3個(gè)終止密碼子,剩下59個(gè)密碼子,用這59個(gè)密碼子的RSCU值進(jìn)行聚類分析?

這里外顯子間的距離規(guī)定為密碼子使用相對概率的歐拉平方距離?歐拉平方距離dij的計(jì)算公式為:

dij=(RSCUik-RSCUjk)2 (2)

式中,dij表示外顯子i與外顯子j之間的距離?RSCUik表示第i個(gè)外顯子的第k個(gè)密碼子的RSCU值,RSCUjk表示第j個(gè)外顯子的第k個(gè)密碼子的RSCU值?

1.3.3聚類分析用CodonW軟件分別計(jì)算這60條序列的RSCU值,并用公式(2)計(jì)算出其距離矩陣?用SPSS 13.0軟件進(jìn)行聚類分析?

1.4用非均勻指數(shù)(HI)進(jìn)行聚類

1.4.1非均勻指數(shù)(HI)非均勻指數(shù)(HI)定義為:

HI=(3)

式中,N?琢(α=1?2?3?4)表示序列的4種堿基A?G?T?C;N=N?琢為序列長度;N(l)(l=1?2?3)為3個(gè)子序列的長度;N(l)=N/3;Nα(l)為第l個(gè)子序列中第α種堿基數(shù)[12]?利用該參數(shù)研究堿基的非均勻分布?

1.4.2用非均勻指數(shù)聚類所使用的距離用非均勻指數(shù)聚類所使用的距離定義為:

dij=HIi-HIj(4)

式中,dij表示第i條外顯子和第j條外顯子的距離,HIi表示第i條外顯子序列的非均勻指數(shù),HIj表示第j條外顯子序列的非均勻指數(shù)?

1.4.3聚類分析用公式(3)計(jì)算“1.3.1”中所述的60條序列的HI值,然后用公式(4)計(jì)算其距離矩陣,最后用SPSS 13.0軟件進(jìn)行聚類分析?

2結(jié)果與分析

2.1組成型和可變外顯子密碼子偏性結(jié)果

將找到的所有符合條件的組成型外顯子連成一條序列,計(jì)算其RSCU值,同時(shí)把找到的所有符合條件的可變外顯子連接成一條序列,計(jì)算其RSCU值?在計(jì)算結(jié)果中,剔除了UAA?UAG?UGA 3個(gè)終止密碼子,繪制折線圖,如圖1所示?從圖1中可以看出,組成型外顯子和可變外顯子之間偏性是相同的?每個(gè)外顯子的RSCU值稍有差異,可能是統(tǒng)計(jì)誤差的原因?

2.2用RSCU值對組成型外顯子和可變外顯子聚類的結(jié)果

1-30號序列為組成型外顯子,31-60號序列是可變外顯子,利用這60條序列的RSCU值,采用SPSS 13.0軟件進(jìn)行聚類分析(通過計(jì)算距離矩陣),結(jié)果如圖2所示?由圖2可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,進(jìn)一步確認(rèn)了組成型和可變外顯子的密碼子偏性是相同的?

2.3用HI指數(shù)對組成型外顯子和可變外顯子聚類的結(jié)果

計(jì)算了1-30號組成型外顯子和31-60號可變外顯子序列的HI指數(shù),并用HI指數(shù)對它們進(jìn)行聚類分析,聚類結(jié)果如圖3所示?由圖3可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,說明組成型外顯子和可變外顯子之間序列的不均勻性是相同的?

3結(jié)論與討論

本研究結(jié)果表明,組成型外顯子和可變外顯子的密碼子偏性是相同的?組成型外顯子和可變外顯子的非均勻性是相同的?可以推斷,組成型剪接和可變剪接與外顯子序列的特異性關(guān)系不大,或者組成型外顯子和可變外顯子在密碼子偏性或不均勻性上不存在特異性?

組成型外顯子和可變外顯子在密碼子的使用上沒有偏性,可以得出在剪接的時(shí)候外顯子一端是否發(fā)生剪接的信息不在外顯子里?為什么某個(gè)位點(diǎn)發(fā)生的是組成型剪接,而不是可變剪接,而另一個(gè)位點(diǎn)發(fā)生的是可變剪接,而不是組成型剪接,可能是大量的剪接信息是在內(nèi)含子序列?剪接因子?pre-mRNA?DNA大分子?非編碼RNA等的互相作用中產(chǎn)生的?

結(jié)合組成型外顯子和可變外顯子之間的密碼子偏性相同的信息進(jìn)一步猜測,有可能由于進(jìn)化的選擇,外顯子中的堿基序列是用來編碼蛋白質(zhì)的,這些序列已經(jīng)有了編碼蛋白質(zhì)的功能,不適合有太多的剪接信息;而就平均長度來說,內(nèi)含子比外顯子長得多,而且不需要編碼蛋白質(zhì),適宜于放置可變剪接的調(diào)控模體——剪接信息?

參考文獻(xiàn):

[1] SMITH C W, VALCARCEL J. Alternative pre-mRNA splicing: The logic of combinatorial control[J].Trends Biochem Sci,2000,25(8):381-388.

[2] GRANTHAM R, GAUTIER C, GOUY M, et al.Codon catalog usage and the genome hypothesis[J]. Nucleic Acids Research,1980,8(1):49-62.

[3] ONOFRIO G D, MOUCHIROUD D, AISSANIi B ,et al. Correlations between the compositional properties of human genes, codon usage, and amino acid composition of proteins[J].J Mol Evol,1991,32(6):504-510.

[4] ZAMA M. Codon usage and secondary structure of mRNA[J]. Nucleic Acids Symp Ser,1990,22(3):93-94.

[5] EYRE-WALKER A. Synonymous codon bias is related to gene length in Escherichia coli:Selection for translational accuracy?[J]. Mol Biol Evol,1996,13(6):864-872.

[6] MORIYAMA E N, POWELL J R. Gene length and codon usage bias inDrosophila melanogaster, Saccharomyces cervisiae and Escherichia coli[J].Nucleic Acids Res,1998,26(13):3188-3193.

[7] BUCHAN J R, AUCOTT L S, STANSFIELD I. tRNA properties help shape codon pair preferences in open reading frames[J]. Nucleic Acids Res,2006,34(3):1015-1027.

[8] GUPTA S K, MAJUMDAR S K, BHATTACHARYA T, et al. Studies on the relationships between the synonymous codon usage and protein secondary structural units[J].Biochem Biophys Res Commun, 2000,269(3): 692-696.

[9] THANARAJ T A, STAMM S, CLARK F, et al. ASD: The alternative splicing database[J]. Nucleic Acids Res, 2004,32(1):64-69.

[10] STAMM S, RIETHOVEN J J, LE TEXIER V, et al. ASD: A bioinformatics resource on alternative splicing[J]. Nucleic Acids Res, 2006,34(S1):46-55.

[11] COMERON J, AGUADE M. An evaluation of measure of synonymous codon usage bias[J]. Journal of Molecular Evolution, 1998, 47(2): 268-274.

[12] 晉宏?duì)I,李 宏. 核酸序列非均勻指數(shù)(HI)的約化[J].內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,33(3):283-287.

主站蜘蛛池模板: 亚洲欧美极品| av色爱 天堂网| 免费人成网站在线高清| 国产国产人免费视频成18| 少妇露出福利视频| 91精品专区国产盗摄| 国产精品污污在线观看网站| 丁香亚洲综合五月天婷婷| 久久久无码人妻精品无码| 国产福利小视频在线播放观看| 色亚洲激情综合精品无码视频| 无码AV动漫| 美女毛片在线| 爆乳熟妇一区二区三区| 四虎在线观看视频高清无码| 日韩精品成人在线| 国产91特黄特色A级毛片| 国产日韩欧美黄色片免费观看| 国产成人艳妇AA视频在线| 久久亚洲国产最新网站| a色毛片免费视频| 亚洲天堂.com| 国产成人凹凸视频在线| 欧美精品影院| 草逼视频国产| 日韩精品无码免费专网站| 国产黄视频网站| 网久久综合| 久久99国产综合精品1| 久久精品91麻豆| 亚洲精品欧美重口| 欧美性天天| 亚洲一区二区三区香蕉| 精品视频一区二区三区在线播| 久久性视频| 国产香蕉97碰碰视频VA碰碰看 | 97视频免费看| 欧美成在线视频| 99国产在线视频| 又猛又黄又爽无遮挡的视频网站| 一级一级特黄女人精品毛片| 国产成熟女人性满足视频| 热思思久久免费视频| 亚洲天堂成人在线观看| 日韩成人高清无码| 国产精品无码作爱| 中文字幕2区| 欧美第一页在线| 91久久偷偷做嫩草影院精品| 在线人成精品免费视频| 综合色在线| 久久99这里精品8国产| 国精品91人妻无码一区二区三区| AV无码一区二区三区四区| 国产成人亚洲毛片| 秋霞午夜国产精品成人片| 亚洲国产高清精品线久久| 日韩a级毛片| 无码视频国产精品一区二区| 国产尹人香蕉综合在线电影 | 91视频区| 欧美国产日韩一区二区三区精品影视| 欧美中文字幕无线码视频| 91在线无码精品秘九色APP | 久久国产精品嫖妓| 日本手机在线视频| 最新亚洲人成网站在线观看| 色偷偷av男人的天堂不卡| 超碰色了色| 久久情精品国产品免费| 国产精鲁鲁网在线视频| 99久久精品国产精品亚洲| 丁香婷婷激情综合激情| 欧美成人第一页| 91精品专区国产盗摄| 国产99在线观看| 91小视频在线播放| 国产亚洲欧美日韩在线一区| 日韩精品一区二区三区中文无码| 黄色网址手机国内免费在线观看| 亚洲五月激情网| 国产成人亚洲毛片|