999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于氨基酸約化和統計特征的蛋白質亞細胞定位預測

2016-01-15 02:06:16楊紅,徐慧敏,嚴壽江
生物信息學 2015年2期

基于氨基酸約化和統計特征的蛋白質亞細胞定位預測

楊紅1,2,徐慧敏2,嚴壽江2,陳靜2,耿麗麗2,姚玉華2*

(1.青島濱海學院,青島 266555;

2.浙江理工大學生命科學學院,杭州 310018)

摘要:蛋白質亞細胞定位預測對蛋白質的功能、相互作用及調控機制的研究具有重要意義。本文基于物化性質和結構性質對氨基酸的約化,描述序列局部和全局信息的“組成”、“轉換”和“分布”特征,并利用氨基酸親疏水性的數值統計特征,提出了一種新的蛋白質特征表示方法(NSBH)。分別使用三種分類器KNN、SVM及BP神經網絡進行蛋白質亞細胞定位預測,比較了幾種方法和特征融合方法的預測結果,顯示融合特征表示及結合SVM分類器時能夠達到更好的預測準確率。同時,還詳細討論了不同參數對實驗結果的影響,具體的實驗及比較結果顯示了該方法的有效性。

關鍵詞:蛋白質亞細胞定位;氨基酸物化性質;支持向量機

中圖分類號:Q811文獻標志碼:A

收稿日期:2015-03-05;修回日期:2015-04-08.

基金項目:生物信息學數據庫技術課程教學改革,福建農林大學研究生教學改革項目(No.112501234)。

作者簡介:鄭珂暉,男,講師,博士研究生,研究方向:生物信息學;E-mail:zhkehui@tom.com.

doi:10.3969/j.issn.1672-5565.2015.02.06

Protein subcellular localization prediction based on reduced representation of

amino acid and statistical characteristic

YANG Hong1,2,XU Huimin2,YAN Shoujiang2,CHEN Jing2,GENG Lili2,YAO Yuhua2*

(1.QingdaoBinhaiUniversity,Qingdao266555,China;

2.CollegeofLifeSciences,ZhejiangSci-TechUniversity,Hangzhou310018,China)

Abstract:The protein subcellular localization prediction is important to study the protein function, protein interaction and their regulation mechanism. In this paper, based on four amino acids physicochemical properties and structural properties,We describe the local and global information of sequence by ‘component’, ‘transition’ and ‘distribution’. Using the numerical statistical characteristic of hydrophobic/hydrophilic amino acid, we proposed a new protein feature representation. We compare the prediction results between the proposed methods and fusion method with the classification algorithm KNN, SVM and BP. The results show that fusion method with SVM can get better prediction accuracies. Meantime, we also discuss the effects of different parameters on the experimental results. The detailed experimental and comparison results show the effectiveness of the proposed method.

Keywords:Subcellular localization; Physicochemical properties; Support vector machine (SVM)

蛋白質是生命的物質基礎,是構成細胞的基本有機物,是生命活動的主要承擔者。然而,蛋白質只有在特定的亞細胞位置中才能行使其特定的功能。隨著高通量技術的發展,很大數量的蛋白質序列正日益增長并被整理和存入到公共的生物數據庫。根據2014年2月發布的統計表明,UniProtKB/Swiss-Prot包含542 258條序列,然而在1986年僅僅是3 939條[1]。采用實驗方法確定蛋白質的亞細胞定位需要耗費大量的人力、物力、財力,已經無法滿足數據庫中蛋白質序列爆炸性增長的現實需要,從已積累的知識和數據出發,開發蛋白質亞細胞定位預測的計算機方法就成為了當前的重要研究任務。

在使用計算方法來確定蛋白質亞細胞位置的研究方面,人們已經做出了很多的嘗試[2-7],近年來這方面已經做的更加完善。在最近幾年的文章中,這方面的大部分貢獻是由Chou和Shen做出的。其他相關的作者也提供了一些在線的服務平臺來幫助解決蛋白質亞細胞定位的相關問題[8-18]。最初Nakashima和Nishikawa提出氨基酸組成信息用于判別細胞內和細胞外的蛋白質[19]。隨后基于序列的方法,人們又提出二肽組成,間隔氨基酸對組成和偽氨基酸組成[20-22]。為了研究序列的進化信息,隨后人們又提出序列的位置特異性得分矩陣(PSSM)[23-24]。近幾年隨著基因本體論(GO)數據庫的不斷更新,人們提出基于基因本體論的計算方法來預測蛋白質亞細胞定位等問題[25-27]。不僅是蛋白質序列信息,分類算法也能夠影響蛋白質亞細胞定位預測。到目前為止許多計算技術如隱馬氏模型(HMM)[28],神經網絡[29],K-近鄰(KNN)[27, 30]和支持向量機(SVM)被用于分類預測[31-33]。

本文提出了四種氨基酸物化性質和結構性質并提出新的蛋白質特征表示方法——基于氨基酸親疏水性的數值統計特征(NSBH)。特征信息的融合與支持向量機的結合達到了較好的實驗結果。

1數據和方法

1.1數據集

本文使用了兩組數據集,兩組數據集在同一個亞細胞位置子集中蛋白質之間的序列一致性≤25%。第一組數據集是NNPSL數據集,這個數據集最先是由Reinhardt和Hubbar建立的[34]。它包含997條原核蛋白,分為三個亞細胞位點和2 427條真核蛋白,分為四個亞細胞位點。數據集里的所有蛋白質都是從SWISS-PROT 33.0中提取的,并且沒有跨膜蛋白。在每一個亞細胞位置中,沒有一條序列與其他任何一條序列的相似度大于90%。第二組數據集是Cell-PLoc 2.0包其包含下列六個子數據集:Euk-mPLoc、Hum-mPLoc、Plant-mPLoc、Gpos-mPLoc、Gneg-mPLoc和Virus-mPLoc[12]。它們適用于真核、人類、植物、革蘭氏陽性菌、革蘭氏陰性菌和病毒蛋白質。另外,Cell-PLoc 2.0中基準數據集的構建是基于SWISS-PROT 55.3。數據集涵蓋22個亞細胞位點,在同一個亞細胞位置子集中蛋白質序列之間的一致性≤25%。Cell-PLoc 2.0包可以從http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/中免費得到。

1.2方法

蛋白質亞細胞定位預測的關鍵步驟是有效的數學表達式把蛋白質符號特征轉換為與預測任務相關的特征向量以及分類算法辨別特征向量。因此,我們將重點介紹這兩部分。

1.2.1序列特征信息提取

本文使用了關于氨基酸序列的局部和全局信息。主要包括四種常用的氨基酸物化性質,氨基酸組分信息(Amino acid composition)以及我們提出的一種基于氨基酸親疏水性的數值統計特征(NSBH)。

(1)常用的氨基酸物化性質和結構性質

在文中,我們用到了四種常見的氨基酸物化性質和結構性質分別為疏水性(Hydrophobicity)、歸一化范德華體積(Normalized van der Waals volume)、極性(Polarity)和極化性(Polarizability)。

一條蛋白質序列由基于不同物化性質和結構性質的參數向量所表示,這些參數向量包含“組成”(Composition),“轉換”(Transition)和“分布”(Distribution)三種描述符[35],具體見表1。他們分別用來描述一條蛋白質中一個給定氨基酸性質的全局組成,沿著整條蛋白質的性質改變的頻率,以及沿著序列的性質的模式分布。

表1 氨基酸屬性和每一種性質的特征維數

(2)氨基酸組份

氨基酸組份與蛋白質亞細胞定位有一定的關聯。不同類型的蛋白質通常需要不同的氨基酸組成對應于特定的生理功能。因此,對于細胞核的定位,組氨酸的豐富含量可以看作是一個特征。

給定一條蛋白質序列P,序列可以表示為

(1)

其中,fi(i=1,2,…,20)是蛋白質P中20種氨基酸的歸一化的發生頻率,T是轉置運算符。許多預測蛋白質亞細胞定位的方法是基于氨基酸組份信息。

(3)NSBH特征方法

這里我們考慮一個與蛋白質結構有重要關系的物化性質:氨基酸的疏水性。首先,每一個氨基酸被它自己的物化性質所特征化。20種氨基酸被約化為兩種類型:疏水氨基酸H={F,L,I,Y,M,W,V,A,P,C};親水氨基酸:P={S,N,K,D,R,T,H,Q,E,G}。然后20種氨基酸進一步約化為四種類型:強疏水氨基酸:SH={F,L,I,Y,W};弱疏水氨基酸:WH={M,V,A,P,C};強親水氨基酸:SP={S,N,K,D,R};弱親水氨基酸:WP={T,H,Q,E,G}。

(2)

對于一條數值序列,我們計算u個連續數值的和,這些和被看作振幅。為了得到蛋白質序列的數值表示,我們計算振幅的頻率。因此,一條蛋白質序列可以被一個向量特征化。例如當u=2時,振幅是-4,-3,-2,-1,0,1,2,3,4。通過計算振幅的頻率,一條蛋白質序列可以被一個9維的向量特征化。

最后,基于以上六種特征信息,我們構建其融合模型。在融合模型中,每一條蛋白序列被表示為113維的向量。

1.2.2預測方案

本文使用了三種分類器:支持向量機(SVM),K近鄰(KNN),BP神經網絡。下面將一一詳細介紹。

(1)本文首先采用了Vapnik的支持向量機來預測亞細胞定位[40]。然而蛋白質亞細胞定位預測是一個多分類問題。因此,我們采用了多類預測方法。支持向量機采用“one-versus-rest”策略,給定一條未知測試蛋白序列,提取其特征向量之后輸入SVM。SVM首先把輸入向量映射到一個特征空間,然后SVM尋找一個最優線性決策來解決特征空間中兩類或多類問題,最后,一個預測標簽被分配給測試蛋白。在我們的研究中,我們使用LIBSVM來實行SVM分類,選擇徑向基函數(RBF)作為核函數。

對于SVM,我們選擇徑向基函數作為核函數是因為相比于其他核函數它優越于解決非線性問題[41]。這里,為了盡可能的得到最高的預測準確率,我們選擇了參數。對于每一個數據集,基于10倍交叉驗證,我們使用網格搜索策略選擇參數c和g的值。則c與g值的范圍是2-5到25。

(2)K近鄰(K-Nearest Neighbor,KNN)分類算法是一個比較成熟的算法,該算法的方法原理也十分簡單。KNN分類算法的思路是:假如一個樣本在特征空間中的K個最相似的樣本中的大多數屬于同一個類別,那么這個樣本也屬于此類別。這里我們將使用的KNN準則用于分類預測[42-43]。

(3)目前,研究人員構建了許多不同的神經網絡模型,本文應用的是反向傳播神經網絡(Back Propagation Neural Network,即BP神經網絡)[29]。在人工神經網絡之中,反向傳播神經網絡是一種穩定性和魯棒性較強的人工神經網絡,另外。它也屬于有監督學習的網絡模型。本文構建的BP網絡,隱層節點參數值為9,隱層和輸出層皆采用Sigmoid傳輸函數,輸出維數由各數據集所含亞細胞位點數決定,其它參數采用默認值。

1.2.3評價方法

本文中,我們使用留一法驗證來評估我們方法的預測結果。留一法是指僅選擇原樣本中的一項作為測試樣本,而剩余的留作訓練樣本。這個樣本一直持續到每個樣本都被作為一次測試樣本。我們使用Overall accuracy作為本文的預測結果評價指標:

(3)

2結果與分析

2.1NSBH方法中不同u值結果比較

從圖1中可以看出,當u從1變化到10時,除了病毒數據集的預測結果準確率變化幅度大一點外,其他數據集的結果都處于一個平緩狀態。RH997,RH2427,革蘭氏陽性菌和革蘭氏陰性菌的結果相對較好;病毒,人類,真核和植物的預測結果相對就差一點。

圖1 每個數據集上不同 u值SVM分類器結果比較

從圖1中明顯看出,隨著u值在1~10范圍內的變化,除了病毒數據集外其他各數據集的總體準確率呈平穩狀態。病毒數據集隨著u值的變化呈現波浪式變化,但總的趨勢還是隨著u值的增大而下降。可能是由于較其他數據集病毒數據集數據個數較少,而蛋白質位點個數相對偏多,從而導致預測結果不是很穩定。考慮到病毒數據集在u=2時準確率較其他k值要高出許多,且向量的維數偏低,降低實驗運行的時間,因此,我們可認為u=2時總體達到較好的結果。此時,病毒數據集的準確率為46.43%。

2.2不同特征信息提取方法的比較

表2列出了八個數據集中不同的特征信息提取方法的結果比較。基于上述分析,在NSBH方法中,當u=2時總體預測結果較好,所以在此部分只需考慮u=2時與其他方法的比較。從表中可以明顯看出融合后的信息準確率明顯高于單個性質的預測準確率,該現象可能是由于融合信息包比單個特征信息含了更多蛋白質序列的核心特征。

從總體數據集的單個特征信息預測結果來看,AAC結果相對較好,其次是疏水性、極性。而極化性和歸一化范德華體積的預測結果就相對差點。本文新提出的方法NSBH,其預測結果相比于傳統的氨基酸組成來說不是很理想,但這也是蛋白質序列特征表示的一種新穎的方法。

表2 每一個數據集中不同特征提取方法SVM分類器結果比較(%)

2.3KNN分類器中不同k值結果比較

對兩組數據集中的每一條序列進行本文使用的5種氨基酸的物化性質信息以及氨基酸組份信息進行融合,最后得到113維的向量。由表5分析得到,融合后的特征表示比單個特征表示預測結果要好,在此,我們分析了基于融合特征表示的不同類型的KNN分類器對預測結果的影響如圖2所示。

圖2 基于融合特征表示的不同類型的KNN分類器比較

從圖2可以得出與圖1相一致的結論:RH997,RH2427,革蘭氏陽性菌和革蘭氏陰性菌的結果相對較好;病毒,人類,真核和植物的預測結果相對差一點。對于RH997和RH2427,隨著k值的增加,預測結果有下降的趨勢并趨于平緩。對于其他六個數據集的結果,隨著k值的增加,預測結果有上升的趨勢并趨于平緩。對于每個數據集,從整體預測結果及實驗運行耗時來看,當k=7時總體預測結果較好。

2.4不同分類器預測結果比較

表3給出的是每個數據集在相應的k值下取得的最好預測結果與SVM預測結果的比較。括號中的k值是相應的數據集在KNN分類器中取得最好預測結果時的值。

表3 基于融合特征下的KNN, SVM和BP預測結果比較

從表3可以明顯得出,對于病毒數據集,BP的預測結果是最高的,KNN的最好預測結果稍微高于SVM預測結果。而其他數據集中,SVM的預測結果都比KNN中的最好預測結果和BP的預測結果要高,高出值范圍分別為5~6.4個百分點和4.2~9.9個百分點。因此,總體來說,SVM分類器的表現更加的優異。

2.5結果比較分析

為了論證本文提出的方法的可靠性,對于RH997和RH2427這兩個數據集,我們的方法與其他方法結果進行了比較。這里給出的是SVM預測結果與其他方法通過留一法檢驗對NNPSL數據集的預測結果比較。

從表格4中明顯看出本文方法的預測總體準確率除了比Chou and Cai的結果低3.1%和比Niu等人略低外,比其他方法高了2.5~5.1個百分點。

表4 RH997上不同預測模型的預測結果

同樣的,從表格5中可以得到除了Chou and Cai方法的結果高于本文結果外,其他研究者方法的結果均低于本文方法結果的3.6~11.4個百分點。

以上兩個表格的結果比較得出基于本文提出的新方法NSBH與其他方法的融合再結合常用的SVM分類器能夠得到較好的分類效果。因此,本文的方法也可用于蛋白質等其他方面的應用。

表5 RH2427上不同預測模型的預測結果

3討論

到目前為止,有許多信息提取算法都是基于氨基酸殘基的物化性質,然而單純的使用這些物化性質進行序列的特征信息提取難免會丟失許多序列的核心特征,所以通常情況下我們都是結合其他特征一起使用。本文嘗試使用常見氨基酸的物化性質和結構性質的結合進行蛋白質亞細胞定位預測研究。當然,本文提出的方法也可以應用到其他方面,比如蛋白質結構類預測,蛋白質功能預測方面等。

在K近鄰算法中,關鍵問題主要有確定距離函數和決定k的取值。然而距離函數的確定比較困難且分類的結果與參數有關,在進行訓練時,K近鄰還需要大量的訓練數據,這些都導致K近鄰算法在實際應用中存在許多問題。BP神經網絡可變參數太多,訓練時間需求很大,對固定訓練樣本的過度擬合會使得預測性能降低。而支持向量機屬于一般化線性分類器,SVM的特點是可以同時最小化經驗誤差和最大化幾何邊緣。因此與K近鄰和BP神經網絡相比,SVM分類器更能達到精確值。

參考文獻(References)

[1]LI L, YU S, XIAO W, et al. Prediction of bacterial protein subcellular localization by incorporating various features into Chou′s PseAAC and a backward feature selection approach[J]. Biochimie, 2014, 104: 100-107.

[2]CHOU G, WU Z, XIAO X i.Loc-Euk: a multi-label classifier for predicting the subcellular localization of singleplex and multiplex eukaryotic proteins[J]. PLoS One, 2011, 6(3):e18258.

[3]LI L, ZHANG Y, ZOU L, et al. An ensemble classifier for eukaryotic protein subcellular location prediction using gene ontology categories and amino acid hydrophobicity[J]. PLoS One, 2012, 7(1): e31057.

[4]CAI Y, HE J, LI X, et al. Prediction of Protein Subcellular Locations with Feature Seclection and Analysis[J]. Protein &Peptide Letters, 2010, 17(4): 464-472.

[5]WAN S, MAK M, KUNG S. HybridGO-Loc: mining hybrid features on gene ontology for predicting subcellular localization of multi-location proteins[J]. PLoS One, 2014, 9(3): e89545.

[6]MEI S. Predicting plant protein subcellular multi-localization by Chou′s PseAAC formulation based multi-label homolog knowledge transfer learning[J]. Journal of Theoretical Biology, 2012, 310: 80-87.

[7]DEHZANQI A, HEFFERNAN R, SHARMA A, et al. Gram-positive and Gram-negative protein subcellular localization by incorporating evolutionary-based descriptors into Chou's general PseAAC[J]. Journal of Theoretical Biology, 2015, 364: 284-294.

[8]EMANUELSSON O, NIELSEN H, BRUNAK S. Predicting sub-cellular localization of proteins based on their N-terminal amino acid sequence[J]. Journal of Molecular Biology, 2000, 300(4): 1016.

[9]CHOU K, CAI Y. A new hybrid approach to predict subcellular localization of proteins by incorporating gene ontology[J]. Biochemical and Biophysical Research Communications, 2003, 311: 743-747.

[10]YU C, LIN C, HWANG J. Predicting subcellular localization of protein for Gram-negative bacteria by support vector machines based on n-peptide compositions[J]. Protein Science, 2004, 13(5): 1402-1406.

[11]HORTON P, OBAYASHI T. WoLF PSORT:protein subcellulur localization predictor[J]. Nucleic Acids Research, 2007, 35: W587.

[12]CHOU K, SHEN H. Cell-PLoc 2.0: An improved package of web-servers for predicting subcellular localization of proteins in various organisms[J]. Natural Science, 2010, 2: 1090.

[13]BRIESEMEISTER S, RAHNENFUHRER J, KOHLBACHER O. Going from where to why-interpretable prediction of protein subcellular localization[J]. Bioinformatics, 2010, 26(9): 1232-1238.

[14]YUN N, WAQNER J, LAIRD M, et al. PSORTB 3.0: improved protein subcellular localization prediction with refined localization sub-categories and predictive capabilities for all prokaryotes[J]. Bioinformatics, 2010, 26(13): 1608-1615.

[15]PIERIEONI A, MARTELLI P, CASADIO R. MemLoci: predicting subcellular localization of membrance proteins in eukaryotes[J]. Bioinformatics, 2011, 27(9): 1224-1230.

[16]WAN S, MAK M, KUNG S. mGOASVM:multi-label protein subcellular localization based on gene ontology and support vector machines[J]. BMC Bioinformatics, 2012, 13(11): 290.

[17]CHANG T, WU L, LEE T, et al. EuLoc: a Web-server for accurately predict protein subcellular localization in enkaryotes by incorporating various features of sequence segments into the general form of Chou's PseAAC[J]. Journal of Computer-Aided Molecular Design, 2013, 27(1): 91-103.

[18]WANG X, LI G, LU W. Virus-ECC-mPLoc: a multi-label predictor for predicting the subcellular localization of virus proteins with both single and multiple sites based on a general form of Chou′s pseudo amino acid composition [J]. Protein and Peptide Letters, 2013, 20(3): 309-317.

[19]NAKASHIMA H, NISHIKAWA K. Discrimination of intracellular and extracellular proteins using amino acid composition and residue-pair frequencies[J]. Journal of Molecular Biology, 1994, 238: 54-61.

[20]ZUO Y, PENG Y, LIU L, et al. Predicting peroxidase subcellular location by hybridizing different descriptors of Chou’ pseudo amino acid patterns[J]. Analytical Biochemistry, 2014, 458: 14-19.

[21]DU P, GU S, JIAO Y. PseAAC-General: Fast Building Various Modes of GeneralForm of Chou’s Pseudo-Amino Acid Composition forLarge-Scale Protein Datasets[J]. International Journal of Molecular Sciences, 2014, 15: 3495-3506.

[22]MANDAL M, MUKHOPADHYAY A, MAULIK U. Prediction of protein subcellular localization by incorporating multiobjective PSO-based feature subset selection into the general form of Chou’s PseAAC[J]. Medical & Biological Engineering & Computing, 2015, 53: 331-344.

[23]JEONG J, LIN X, CHEN X. On Position-Specific Scoring Matrix for Protein Function Prediction[J]. IEEE Transactions on Computational Biology and Bioinformatics, 2011, 8: 308-315.

[24]HUANG C, YUAN J. Using radial basis function on the general form of Chou’s pseudoamino acid composition and PSSM to predict subcellular locations ofproteins with both single and multiple sites[J]. BioSystems, 2013, 113: 50-57.

[25]WAN S, MAK M, KUNG S. GOASVM: A subcellular location predictor by incorporating term-frequencygene ontology into the general form of Chou’s pseudo-aminoacid composition[J]. Journal of Theoretical Biology, 2013, 323: 40-48.

[26]MAZANDU G, MULDER N. The use of semantic similarity measures for optimally integrating heterogeneous Gene Ontology data from large scale annotation pipelines[J]. Frontiers in Genetics, 2014, 5: 264.

[27]XIAO X, WU Z, CHOU K. iLoc-Virus: A multi-label learning classifier for identifying the subcellular localization of virus proteins with both single and multiple sites[J]. Journal of Theoretical Biology, 2011, 284: 42-51.

[28]LIN T, MURPHY R, BAR-JOSEPH Z. Discriminative motif finding forpredicting protein subcellular localization[J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2011, 8(2): 441-451.

[29]ZOU L, WANG Z, HUANG J. Prediction of subcellular localization ofeukaryotic proteins using position-specific profiles and neural network withweighted inputs[J]. Journal of Genetics and Genomics, 2007, 34(12): 1080-1087.

[30]XIAO X, WU Z, CHOU K. A Multi-Label Classifier for Predicting the Subcellular Localization of Gram-Negative Bacterial Proteins with Both Single and Multiple Sites[J]. PLoS One, 2011, 6: e20592.

[31]CAI Y, LIU X, XU X, et al. Support vector machines for prediction of protein subcellular location by incorporating quasi-sequence-order effect[J]. Journal of Cellular Biochemistry, 2002, 84: 343-348.

[32]LIANG R, HUANG S, SHI S, et al. A novel algorithm combining support vector machine with the discretewavelet transform for the predict ion of protein subcellular localization[J]. Computers in Biology and Medicine, 2012, 42: 180-187.

[33]LIU T, TAO P, LI X, et al. Prediction of subcellular location of apoptosis proteins combing trigram encoding based on PSSM and recursive feature elimination[J]. Journal of Theoretical Biology, 2015, 366: 8-12.

[34]REINHARDT A, HUBBARD T. Using neural networks for prediction of the subcellular location of proteins[J]. Nucleic Acids Research, 1998, 26: 2230-2236.

[35]DUBCHAK I, MUCHNIK I, HOLBROOK S, et al. Prediction of protein folding class using global description of amino acid sequence[J]. Proceedings of the National Academy of Sciences, 1995, 92: 8700-8704.

[36]CHOTHIA C, FINKELSTEIN A. The classification and origins of protein folding patterns[J]. Annual Review of Biochemistry, 1990, 59: 1007-1035.

[37]FAUCHERE J, CHARTON M, KIER L, et al. Amino acid side chain parameters for correlation studies in biology and pharmacology[J]. International Journal of Peptide and Protein Research, 1988, 32: 269-278.

[38]GRANTHAM R. Amino acid difference formula to help explain protein evolution[J]. Science, 1974, 185: 862-864.

[39]CHARTON M, CHARTON B. The structural dependence of amino acid hydrophobicity parameters[J]. Journal of Theoretical Biology, 1982, 99: 629-644.

[40]CORTES C, VAPNIK V. Support-Vector Networks[J]. Machine Learning, 1995, 20(3):273-297.

[41]YUAN Z. Better prediction of protein contact number using a support vector regression analysis of amino acid sequence[J]. BMC Bioinformatics, 2005, 6: 248.

[42]COVER T, HART P. Nearest neighbour pattern classification[J]. IEEE Transactionon Information Theory, 1967, 13: 21-27.

[43]DENOEUX T. A k-nearest neighbor classification rule based onDempster-Shafer theory[J]. IEEE Transactions on Systems Man and Cybernetics, 1995, 25: 804-813.

[44]NIU N, JIN Y, FENG K, et al. Using AdaBoost for the predicting of subcellular location of prokaryotic and eukaryotic proteins[J]. Molecular Diversity, 2008, 12: 41-45.

[45]HUA S, SUN Z. Support vector machine approach for protein subcellularlocalization prediction[J]. Bioinformatics, 2001, 17: 721-728.

[46]YUAN Z. Prediction of protein subcellular locations using Markov chainmodels[J]. FEBS Letters, 1999, 451: 23-26.

[47]CHOU K, ELROD D. Using discriminant function for prediction of subcellular location of prokaryotic proteins[J]. Biochemistry and Biological Physics Research Communications, 1998, 252: 63-68.

[48]CHOU K, CAI Y. A new hybrid approach to predict subcellular localizationof proteins by incorporating gene ontology[J]. Biochemistry and Biological Physics Research Communications, 2003, 311: 743-747.

*通信作者:溫永仙,女,教授,博士生導師,研究方向:生物信息學;E-mail:wen9681@sina.com.

主站蜘蛛池模板: 丰满少妇αⅴ无码区| 成人福利在线视频| 97精品国产高清久久久久蜜芽| 操美女免费网站| 亚洲免费人成影院| 五月天在线网站| 99久久无色码中文字幕| 精品撒尿视频一区二区三区| 久久人搡人人玩人妻精品一| 国产色婷婷| 伊人大杳蕉中文无码| 毛片一区二区在线看| 99精品一区二区免费视频| 成人福利一区二区视频在线| 国产精品开放后亚洲| 中国一级特黄视频| 国产国拍精品视频免费看 | 高清免费毛片| 制服丝袜国产精品| 一级香蕉人体视频| 91偷拍一区| 99视频在线看| 成人在线不卡视频| 欧美日韩国产一级| 亚洲V日韩V无码一区二区| 欧美成人h精品网站| 四虎永久在线| 毛片免费在线| 亚洲香蕉久久| 日韩欧美中文字幕在线精品| 亚洲经典在线中文字幕| 国产精品偷伦视频免费观看国产 | 91网址在线播放| 五月激情婷婷综合| 亚洲一级毛片在线播放| 黄片一区二区三区| 91探花国产综合在线精品| 99久久人妻精品免费二区| 五月六月伊人狠狠丁香网| 国产9191精品免费观看| 中国毛片网| 欧美国产综合色视频| 色综合久久综合网| av天堂最新版在线| 国产剧情无码视频在线观看| 免费毛片视频| 亚洲欧美日韩中文字幕在线一区| 亚洲精品桃花岛av在线| 国产丝袜无码一区二区视频| 国产手机在线ΑⅤ片无码观看| 手机成人午夜在线视频| 99r在线精品视频在线播放| 国产综合无码一区二区色蜜蜜| 亚洲成a∧人片在线观看无码| 人妻91无码色偷偷色噜噜噜| 欧美区国产区| 伊人色在线视频| 另类专区亚洲| 狂欢视频在线观看不卡| 国产精品一区不卡| 日韩无码视频网站| 狠狠操夜夜爽| 无码一区18禁| 欧美日本一区二区三区免费| 国产亚洲精久久久久久无码AV| 一区二区欧美日韩高清免费| 亚洲欧美综合另类图片小说区| 真实国产乱子伦高清| 在线毛片网站| 国产精品白浆无码流出在线看| 波多野结衣第一页| 亚洲乱码在线播放| 2021亚洲精品不卡a| 欧美日本在线| 日韩久久精品无码aV| 精品久久久久无码| 成人中文在线| 亚洲精品国产自在现线最新| 女人18毛片一级毛片在线| 日韩a级毛片| 日本免费精品| 视频二区欧美|