999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于組合向量的支持向量機算法預測酶的類型

2021-10-22 03:24:56
天津科技 2021年10期
關鍵詞:方法

王 婷

(長治職業技術學院 山西長治046000)

0 引 言

酶是具有高效催化作用的蛋白質,生物體內幾乎所有的代謝反應都需要酶的參與,而且對于物質代謝的控制也大多通過酶的活性來實現[1]。已經證實,人類的許多疾病如蠶豆病、白化病、苯丙酮尿病等,均是由于某種酶的變異、減少甚至缺失造成的[2]。酶的類型與其功能和催化性能關系密切,因此對于新發現的酶,可以通過確定它的類型來表明其生物功能。傳統的研究酶功能的生化實驗方法不僅費時、耗資,而且可能會碰到許多目前無法解決的實際困難。因此,使用機器學習算法來預測酶類型的理論方法應用越來越廣泛[3]。

本文從酶的氨基酸序列出發,在特征參數的提取上有創新:采用矩陣打分和離散增量的方法提取,再將這些參數構成的組合向量輸入支持向量機。首次使用支持向量機算法對6類酶的類型進行預測,取得了較好的預測結果。

1 材料與方法

1.1 數據庫

本文使用的是由 Shen和 Chou等[4]創建的酶家族類數據庫。選取酶序列數據遵循以下標準:①序列長度不小于 50個殘基;②不存在一個酶同時隸屬于多種類型的情況;③酶序列的同源性小于 40%。基于以上標準,最終獲得 9832條酶序列,分為以下 6個類型:①氧化還原酶1618條;②轉移酶3450條;③水解酶2791條;④裂合酶679條;⑤異構酶518條;⑥合成酶776條。

1.2 計算方法

1.2.1 矩陣打分方法

矩陣打分(S)方法已經在轉錄因子結合位點和蛋白質折疊子的預測等方面得到成功應用[5~7]。此方法通過以下3個步驟實現:

①引入偽計數pij,位點位置概率作為矩陣元:

②建立位置權重矩陣,即標準打分矩陣:

③對給定的序列片段進行打分,將打分函數定義為:

式中:Ni表示全部氨基酸在第i個位置出現的個數;nij表示第 j種氨基酸在第i個位置上出現的個數;P0j表示第j種氨基酸出現的背景概率。

1.2.2 離散增量方法

離散增量(ID)方法已經在蛋白質結構和超家族的預測[8-9]等工作中獲得廣泛使用。

兩個 S維離散源 X(n1,n2,…,ni,…,ns)和Y(m1,m2,…mi…,ms),其中 ni和 mi分別表示酶的信息參數,定義X和Y的離散量為:

定義混合離散源 X+Y(n1+m1,n2+m2,…,ni+mi,…,ns+ ms)的離散量為:

兩個離散源X與Y之間的離散增量為:

氨基酸的化學特性親疏水性質,主要由其側鏈基團決定。根據單個氨基酸的親疏水分布,將 20種氨基酸劃分為 6 類[9]:①強親水類(R,D,E,N,Q,K,H);②強疏水類(L,I,V,A,M,F);③弱親水或弱疏水類(S,T,Y,W);④脯氨酸(P);⑤甘氨酸(G);⑥半胱氨酸(C)。

1.2.3 支持向量機算法

支持向量機(SVM)算法是在統計學習理論的基礎上發展起來的一種新的機器學習方法,它根據有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折中,以期獲得最好的推廣能力。由于具有強有力的非線性建模能力和良好的泛化性能,它能夠解決小樣本、非線性和高維數等實際問題[10]。本文使用的是Chang和Lin[11]聯合開發的Libsvm程序包。

2 結果與討論

從酶序列的N端與C端分別選取80個氨基酸殘基作為保守位點,使用矩陣打分方法得到 12個打分值;再分別將氨基酸的次鄰二聯體和親疏水三聯體出現的個數作為信息參數,使用離散增量方法得到12個離散增量值;最后將這 12個打分值和 12個離散增量值構成的組合向量,輸入支持向量機中,采用Jackknife檢驗方法進行分類預測,其預測成功率見表 1。為了比較計算結果,這里還分別采用矩陣打分方法和離散增量方法對單參數進行預測,同時也把運用相同數據庫 Chou[4]的 Jackknife檢驗結果列在了表1中。

表1 Jackknife檢驗下6類酶的預測結果(%)Tab.1 Prediction results of 6 enzymes by jackknife test(%)

從表1的計算結果可以看出,分別將氨基酸的次鄰二聯體和親疏水三聯體出現的個數作為信息參數,使用離散增量方法對酶的類型預測效果不是很好,預測成功率較低。選取酶序列的N端與C端的殘基片段打分方法的預測效果明顯好于離散增量方法,說明酶序列的N端與C端均具有較強的氨基酸位點保守性。把打分值與離散增量值進行組合,共同輸入支持向量機中進行預測,獲得了非常好的結果。Jackknife檢驗總體的預測成功率為88.86%,氧化還原酶、轉移酶、水解酶、裂合酶、異構酶和合成酶的預測成功率分別為 92.34%、86.69%、83.30%、97.20%、98.26%和97.68%,結果表明此算法對于酶的分類預測非常有效。裂合酶和異構酶的預測成功率比 Chou[4]的方法分別提高了 12.1%和 14.66%,但轉移酶和水解酶的預測成功率比Chou[4]的結果差。

本文對酶的類型進行預測,當使用組合向量作為特征參數時獲得了較好的預測結果,其主要原因是:①由于不同類型酶的N端與C端所包含的特征信號具有很強的差異性,從酶序列兩端的殘基片段提取的打分值,其包含的信息更加全面;②支持向量機算法具有很強的融合性能,可以將打分值與離散增量值恰當的融合,共同作為支持向量機的特征參數,取得了更優的預測結果。

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 色噜噜在线观看| 国产日本欧美亚洲精品视| 日韩在线播放欧美字幕| 国产欧美专区在线观看| 国产91视频观看| 国产男人天堂| 亚洲一区二区三区在线视频| 四虎成人免费毛片| 亚洲国产精品日韩av专区| 久青草免费视频| 色偷偷男人的天堂亚洲av| 中文国产成人久久精品小说| 91香蕉视频下载网站| 精品国产aⅴ一区二区三区| 好吊色妇女免费视频免费| 尤物亚洲最大AV无码网站| 日韩 欧美 小说 综合网 另类| 亚洲国产成人无码AV在线影院L| 国产在线一区二区视频| 午夜毛片免费观看视频 | 亚洲天堂视频网站| 久久久91人妻无码精品蜜桃HD| 婷婷亚洲天堂| 久久一日本道色综合久久| 国内精品91| 久草青青在线视频| 69免费在线视频| 亚洲av无码专区久久蜜芽| 国产不卡一级毛片视频| 国产杨幂丝袜av在线播放| 国产原创第一页在线观看| 99re经典视频在线| 久久大香伊蕉在人线观看热2| 国产精品亚洲精品爽爽| 91精品国产91欠久久久久| 亚洲高清免费在线观看| 国产毛片不卡| 亚洲精品自在线拍| 精品黑人一区二区三区| 日韩无码白| 久久精品无码国产一区二区三区| 国产网站一区二区三区| 久久久亚洲国产美女国产盗摄| 在线亚洲精品福利网址导航| 免费精品一区二区h| 精品国产成人三级在线观看| 亚洲精品中文字幕无乱码| 午夜精品一区二区蜜桃| 国产毛片片精品天天看视频| 成人午夜精品一级毛片| 久久狠狠色噜噜狠狠狠狠97视色| 园内精品自拍视频在线播放| 99色亚洲国产精品11p| 老司国产精品视频91| 精品久久久久成人码免费动漫| 日本a∨在线观看| 日本人妻丰满熟妇区| 国产成人禁片在线观看| 国产亚洲高清在线精品99| 亚洲va精品中文字幕| a级免费视频| 凹凸国产熟女精品视频| 欧美精品1区2区| 久久亚洲美女精品国产精品| 欧美精品成人| 国产欧美日韩18| 国产精品福利社| 浮力影院国产第一页| 中文天堂在线视频| 日本黄色a视频| 青青操视频免费观看| 欧美不卡视频一区发布| 国产91精品调教在线播放| 9966国产精品视频| 熟女视频91| 亚洲人成影院午夜网站| 五月天丁香婷婷综合久久| 日韩黄色精品| 国产特一级毛片| 国产一级做美女做受视频| 亚洲欧美激情另类| 波多野结衣久久高清免费|