999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

沼澤紅假單胞菌相似菌株間差異功能模體的篩選和分析

2022-03-03 13:25:54楊艷北馬荊鄂馮育林
江蘇農(nóng)業(yè)科學(xué) 2022年3期
關(guān)鍵詞:差異功能

楊艷北, 許 晶, 馬荊鄂, 馮育林, 孫 勇

(1.江西中醫(yī)藥大學(xué)博士后流動(dòng)站/正邦集團(tuán)有限公司博士后工作站,江西南昌 330000;2.南昌師范學(xué)院生物技術(shù)研究院/江西省地方雞種遺傳改良重點(diǎn)實(shí)驗(yàn)室,江西南昌 330000; 3.南昌師范學(xué)院生命科學(xué)學(xué)院,江西南昌 330000)

沼澤紅假單胞菌是光合細(xì)菌的代表菌株之一,屬于益生菌的一種,廣泛作為動(dòng)物飼料添加劑和水質(zhì)凈化劑使用。在實(shí)際應(yīng)用過程中,沼澤紅假單胞菌菌株種類雜,效果不穩(wěn)定,相似菌株間凈水功能差異大。因此,從功能模體水平上,探索沼澤紅假單胞菌相似菌株間功能差異的機(jī)理,對(duì)于沼澤紅假單胞菌相似菌株的實(shí)際應(yīng)用具有重要的參考價(jià)值。模體也譯為基序,是DNA或蛋白質(zhì)具有的局部保守序列區(qū)域,一般也被稱為功能模體或結(jié)構(gòu)模體,相當(dāng)于超二級(jí)結(jié)構(gòu),它是蛋白質(zhì)的基本結(jié)構(gòu)單位和功能單位,決定著蛋白質(zhì)的主要功能。蛋白質(zhì)具有結(jié)構(gòu)域和生物功能位點(diǎn),功能相近的蛋白質(zhì)或同類蛋白質(zhì)家族成員表現(xiàn)出該功能所必需的模體,這個(gè)模體不僅反映蛋白質(zhì)的功能位點(diǎn),而且也作為蛋白質(zhì)家族的識(shí)別信號(hào)。Prosite(https://prosite.expasy.org/)是蛋白質(zhì)家族和結(jié)構(gòu)域的數(shù)據(jù)庫,在Prosite數(shù)據(jù)庫中,一些有重要生物學(xué)意義的氨基酸序列可以被概括成規(guī)則的表達(dá)式,稱作模式,被用于模體的識(shí)別,這些模式均具有實(shí)驗(yàn)上證實(shí)的結(jié)構(gòu)或功能。

Python是一種功能強(qiáng)大的多用途編程語言,可用于生物信息學(xué)分析,尤其Biopython為各式各樣的生物信息學(xué)問題提供Python庫。Python有一套自身的語法,使它成為一套可以自行編譯、開發(fā)的完美語言。Python是一種強(qiáng)大的編程語言,適合腳本編寫。本研究以Prosite數(shù)據(jù)庫中下載的用于識(shí)別蛋白質(zhì)組序列模體的模式文件為基礎(chǔ),利用循環(huán)遍歷算法和Python特有的字典數(shù)據(jù)格式,編寫腳本test.py和difference analysis.py,篩選和分析沼澤紅假單胞菌CGA009和YSC3差異功能模體,探索沼澤紅假單胞菌相似菌株間功能差異的機(jī)理。

1 材料與方法

試驗(yàn)于2021年在南昌師范學(xué)院生物技術(shù)研究院實(shí)驗(yàn)室完成。

1.1 數(shù)據(jù)來源

試驗(yàn)中沼澤紅假單胞菌CGA009和YSC3蛋白質(zhì)組序列來自于美國(guó)國(guó)家生物信息中心(NCBI)中已登錄的序列,下載文件分別為GCF_000195775.1_ASM19577v1_protein.faa、GCF_013415845.1_ASM1341584v1_protein.faa。試驗(yàn)中用于識(shí)別蛋白質(zhì)組序列模體的模式文件來自于Prosite數(shù)據(jù)庫(https://prosite.expasy.org/),下載文件為prosite. dat。

1.2 研究方法

第1步:在Windows操作系統(tǒng)下安裝Python 3.7.0編程軟件和geany-1.33文本編輯器。

第2步:打開蛋白質(zhì)組序列文件GCF_000195775.1_ASM19577v1_protein.faa,內(nèi)容復(fù)制到新的文本文件protein.txt,儲(chǔ)存格式為fasta。打開模體文件prosite.dat,內(nèi)容復(fù)制到新的文本文件prosite.txt。將上述3個(gè)文件置于同一個(gè)文件夾內(nèi)。創(chuàng)建Python運(yùn)行腳本,命名為test.py。

第3步:打開蛋白質(zhì)組序列文件GCF_013415845.1_ASM1341584v1_protein.faa,內(nèi)容復(fù)制到新的文本文件protein.txt,儲(chǔ)存格式為fasta。打開模體文件prosite.dat,內(nèi)容復(fù)制到新的文本文件prosite.txt。將上述3個(gè)文件置于同一個(gè)文件夾內(nèi)。創(chuàng)建Python運(yùn)行腳本,命名為test.py。

第4步:Python運(yùn)行腳本test.py具體代碼如下(注意代碼縮進(jìn),“#”代表代碼的注釋)。

#導(dǎo)入re模塊

import re

#讀取功能模體,選取PATTERN模式,存儲(chǔ)到新文件中

f = open("prosite_new.txt","a+")

prosite = open("prosite.txt").read()

separator_1 = re.compile(′∥′)

prosite_group = separator_1.split(prosite)

for group in prosite_group:

if "PATTERN" in group:

f.write(str(group))

#讀取新文件中模體的登錄(AC)號(hào),蛋白名稱和序列,存儲(chǔ)到字典prosite_dict

prosite_seq = []

name_motif = []

AC = []

with open(′prosite_new.txt′) as file_object:

for line in file_object:

if line.startswith(′DE′):

name_motif.append(line[5:-2])

if line.startswith(′AC′):

AC.append(line[5:-2])

if line.startswith(′PA′):

prosite_seq.append(line[5:-1])

prosite_seq_str = "".join(prosite_seq)

prosite_seq_motif = prosite_seq_str.split(".")

prosite_seq_motif.pop()

prosite_key_list = [(i, j) for i, j in zip(AC, name_motif)]

prosite_dict = {i : j for i, j in zip(prosite_key_list, prosite_seq_motif)}

#讀取蛋白質(zhì)序列,儲(chǔ)存到字典protein_dict

protein = open("protein.txt").read()

separator = re.compile(′>′)

protein_group = separator.split(protein)

protein_seq = []

name_protein = []

for group in protein_group:

group_new = group.split(" ")

name_protein.append(group_new[0])

protein_seq.append(group_new[1:])

for i in name_protein:

if i == "":

name_protein.remove(i)

protein_seq_new = []

for i in protein_seq:

j = "".join(i)

protein_seq_new.append(j)

protein_seq_new.pop(0)

protein_dict = {i : j for i, j in zip(name_protein, protein_seq_new)}

f1 = open("檢測(cè)結(jié)果.txt", "a+")

for prosite_dict_key, pattern in prosite_dict.items():

#將Prosite正則表達(dá)式轉(zhuǎn)換為Python正則表達(dá)式

pattern = pattern.replace(′{′, ′[^′)

pattern = pattern.replace(′}′, ′]′)

pattern = pattern.replace(′(′, ′{′)

pattern = pattern.replace(′)′, ′}′)

pattern = pattern.replace(′-′, '')

pattern = pattern.replace(′x′, ′.′)

pattern = pattern.replace(′>′, ′$′)

pattern = pattern.replace(′<′, ′^′)

pattern_motif = re.compile(pattern)

for protein_dict_key, protein_seq_group in protein_dict.items():

match_all = pattern_motif.findall(str(protein_seq_group))

match_iter = pattern_motif.finditer(str(protein_seq_group))

if match_all:

f1.write(" " + "**************************" + " " )

f1.write("Prosite的AC號(hào)和功能模體名稱: " +

str(prosite_dict_key) + " ")

f1.write("匹配模式: " + str(pattern) + " ")

f1.write("蛋白質(zhì)ID號(hào)和名稱: " + str(protein_dict_key) + " ")

f1.write("蛋白質(zhì)序列: " + str(protein_seq_group) + " ")

f1.write(" ")

for t in match_iter:

f1.write("蛋白質(zhì)中的匹配序列:" + str(t.group()) + " ")

f1.write("蛋白質(zhì)中的起始位置: " + str(t.start()) + " ")

f1.write("蛋白質(zhì)中的終止位置: " + str(t.end())+ " ")

f1.write(" " + "**************************" + " ")

第5步:將上述軟件運(yùn)行后,獲得的2個(gè)"檢查結(jié)果.txt"文件,分別命名為analysis _1.txt、analysis _2.txt。將上述2個(gè)文件置于同一個(gè)文件夾內(nèi)。創(chuàng)建Python運(yùn)行腳本,命名為difference analysis.py。

第6步:Python運(yùn)行腳本difference analysis.py具體代碼如下(注意代碼縮進(jìn),"#"代表代碼的注釋)。

#創(chuàng)建文件

f_0_1 = open("1相同2結(jié)果.txt","a+")

f_0_2 = open("2相同1結(jié)果.txt","a+")

f_1_1 = open("1差異2結(jié)果.txt","a+")

f_1_2 = open("2差異1結(jié)果.txt","a+")

#讀取文件內(nèi)容

f_2 = open("analysis_1.txt").readlines()

f_3 = open("analysis_2.txt").readlines()

#篩選差異功能模體并儲(chǔ)存在新文件中

for line in f_2:

if "Prosite的AC號(hào)和功能模體名稱:" in line:

if line in f_3:

f_0_1.write(line)

else:

f_1_1.write(line)

for line in f_3:

if "Prosite的AC號(hào)和功能模體名稱:" in line:

if line in f_2:

f_0_2.write(line)

else:

f_1_2.write(line)

2 結(jié)果與分析

2.1 Python腳本運(yùn)行結(jié)果

Python運(yùn)行腳本test.py后,在2個(gè)不同的文件夾內(nèi)分別自動(dòng)創(chuàng)建“檢測(cè)結(jié)果.txt”文本文件,運(yùn)行結(jié)果見圖1(文件過大,只顯示部分運(yùn)行結(jié)果)。輸出結(jié)果包括:(1)Prosite的AC號(hào)和模體名稱;(2)匹配模式(Python正則表達(dá)式);(3)蛋白質(zhì)ID號(hào)(NCBI)和名稱;(4)蛋白質(zhì)序列;(5)蛋白質(zhì)中的匹配序列;(6)蛋白質(zhì)中的起始位置;(7)蛋白質(zhì)中的終止位置。Python運(yùn)行腳本difference analysis.py后,自動(dòng)創(chuàng)建含有分析結(jié)果的新文件(1相同2結(jié)果.txt、2相同1結(jié)果.txt、1差異2結(jié)果.txt、2差異1結(jié)果.txt),見圖2。輸出結(jié)果包括 Prosite的AC號(hào)和模體名稱。

2.2 沼澤紅假單胞菌CGA009和YSC3差異功能模體分析

沼澤紅假單胞菌CGA009與YSC3比較,獨(dú)有14種功能模體。沼澤紅假單胞菌YSC3與CGA009比較,獨(dú)有5種功能模體見表1。

表1 沼澤紅假單胞菌CGA009和YSC3差異功能模體

3 討論與結(jié)論

本研究編寫的Python腳本不僅適用于沼澤紅假單胞菌的研究,也廣泛適用于細(xì)菌、真菌、動(dòng)物、植物等所有物種,用于篩選相似物種間的差異功能模體,探索相似物種間功能差異的機(jī)理。

沼澤紅假單胞菌CGA009與YSC3比較,獨(dú)有14種功能模體。核糖核苷酸還原酶是DNA 合成和修復(fù)的關(guān)鍵酶和限速酶,對(duì)細(xì)胞的增殖和分化起著調(diào)控作用,在幾乎所有生物生長(zhǎng)和繁殖的生命活動(dòng)中起著非常重要的作用。DNA聚合酶是催化DNA精確復(fù)制的關(guān)鍵酶。異檸檬酸裂解酶是乙醛酸支路代謝中的關(guān)鍵酶,催化異檸檬酸轉(zhuǎn)化為琥珀酸和乙醛酸,乙醛酸支路是三羧酸循環(huán)的替代支路。跨膜通道蛋白是橫跨質(zhì)膜的親水性通道,允許適當(dāng)大小的離子順濃度梯度通過,包括離子通道、孔蛋白、水孔蛋白等。胰蛋白酶抑制劑是對(duì)胰蛋白酶具有抑制作用的一類物質(zhì),在動(dòng)物、植物和微生物中都有發(fā)現(xiàn),在微生物中,胰蛋白酶抑制劑主要來源于酵母菌、鏈霉菌屬等。胰蛋白酶抑制劑屬于絲氨酸蛋白酶抑制劑家族,其分子的活性部位是賴氨酸,主要與胰蛋白酶等酶的絲氨酸結(jié)合,使其失活,起到抑制作用。SASP蛋白與雙鏈DNA結(jié)合后,導(dǎo)致DNA構(gòu)象變化,保護(hù)DNA骨架結(jié)構(gòu)免受化學(xué)試劑或酶的裂解,使DNA對(duì)紫外線具有高抗性。位點(diǎn)特異性重組在原核生物DNA重排中起著重要作用。位點(diǎn)特異性重組中,DNA節(jié)段的相對(duì)位置發(fā)生移動(dòng),從而使DNA序列發(fā)生重排。脯氨酰內(nèi)肽酶廣泛存在于動(dòng)物、植物和微生物體內(nèi)。脯氨酸內(nèi)肽酶是一類能夠特異性水解多肽鏈中脯氨酸殘基羧基端的內(nèi)切酶,是絲氨酸蛋白酶家族成員之一,其能有效降解小于30個(gè)含有脯氨酸殘基的多肽鏈,脯氨酸內(nèi)肽酶能特異性地水解許多含脯氨酸的多肽類神經(jīng)遞質(zhì)和激素。甘氨酰自由基酶共享以甘氨酸為中心的保守區(qū)域,參與多種功能,例如核苷酸、丙酮酸和甲苯的代謝等。乙二醛酶Ⅰ(又稱乳酰谷胱甘肽裂解酶)催化乙二醛途徑的第一步,即催化甲基乙二醛和谷胱甘肽轉(zhuǎn)化為- 乳酰谷胱甘肽,然后再由乙二醛酶Ⅱ?qū)⒌孜? 乳酰谷胱甘肽轉(zhuǎn)化為乳酸。乙二醛酶Ⅰ是普遍存在的一種酶,序列很保守。甲基乙二醛破壞細(xì)胞平衡,具有毒性,乙二醛酶系統(tǒng)能夠清除過量的甲基乙二醛,維持細(xì)胞內(nèi)的動(dòng)態(tài)平衡。核糖體蛋白參與細(xì)胞內(nèi)蛋白質(zhì)合成。NADH脫氫酶參與呼吸鏈反應(yīng)。吡咯烷酮羧酸肽酶(又稱焦谷氨酰胺基肽酶)是從蛋白質(zhì)的-末端去除焦谷胺酸的酶,存在于細(xì)菌和古細(xì)菌中。沼澤紅假單胞菌CGA009獨(dú)有的14種功能模體,功能主要集中在:(1)DNA 復(fù)制、合成、修復(fù)、重排和保護(hù);(2)蛋白質(zhì)合成;(3)呼吸鏈的電子轉(zhuǎn)移;(4)細(xì)胞的增殖和分化;(5)生長(zhǎng)和繁殖;(6)代謝途徑的補(bǔ)充;(7)離子運(yùn)輸;(8)清除毒性物質(zhì)甲基乙二醛。

沼澤紅假單胞菌YSC3與CGA009比較,獨(dú)有5種功能模體。內(nèi)質(zhì)網(wǎng)靶向序列是存在于內(nèi)質(zhì)網(wǎng)蛋白上的非常保守的靶向序列。類血紅素結(jié)構(gòu)域能與多種分子和蛋白質(zhì)結(jié)合。多銅氧化酶含有多個(gè)銅結(jié)合中心,催化有機(jī)底物使其氧化,參與微生物對(duì)重金屬銅的抗性,降解多種生物胺的活性。DNA甲基化酶識(shí)別DNA的特定序列,并使該序列中的胞嘧啶甲基化,保護(hù)細(xì)胞自身的DNA不被限制性內(nèi)切酶破壞。視蛋白是一種膜蛋白,有7個(gè)跨膜區(qū),屬于G蛋白偶聯(lián)受體超家族。視蛋白廣泛分布于動(dòng)物和微生物中,是一種重要的感光物質(zhì),具有調(diào)節(jié)生物節(jié)律和光周期等多種功能。沼澤紅假單胞菌YSC3獨(dú)有的5種功能模體,功能主要集中在:(1)對(duì)重金屬銅的抗性;(2)降解生物胺;(3)調(diào)節(jié)生物節(jié)律和光周期。

沼澤紅假單胞菌CGA009對(duì)紫外線和化學(xué)試劑具有抵抗能力,DNA骨架結(jié)構(gòu)更穩(wěn)定,生長(zhǎng)和繁殖性能更強(qiáng)。沼澤紅假單胞菌YSC3,對(duì)光照反應(yīng)更加敏感,對(duì)重金屬銅具有抵抗能力,能夠降解生物胺,生存能力更強(qiáng)。本研究編寫的Python腳本,用于篩選相似物種間差異功能模體,探索相似物種間功能差異的機(jī)理,該腳本適用于所有物種。

猜你喜歡
差異功能
也談詩的“功能”
中華詩詞(2022年6期)2022-12-31 06:41:24
相似與差異
音樂探索(2022年2期)2022-05-30 21:01:37
找句子差異
DL/T 868—2014與NB/T 47014—2011主要差異比較與分析
生物為什么會(huì)有差異?
關(guān)于非首都功能疏解的幾點(diǎn)思考
懷孕了,凝血功能怎么變?
媽媽寶寶(2017年2期)2017-02-21 01:21:24
“簡(jiǎn)直”和“幾乎”的表達(dá)功能
M1型、M2型巨噬細(xì)胞及腫瘤相關(guān)巨噬細(xì)胞中miR-146a表達(dá)的差異
中西醫(yī)結(jié)合治療甲狀腺功能亢進(jìn)癥31例
主站蜘蛛池模板: 91福利免费| 精品无码一区二区三区在线视频| 九九热精品视频在线| 女人一级毛片| 欧亚日韩Av| 91无码人妻精品一区二区蜜桃| 国产玖玖视频| 欧美不卡视频在线| 久久国产黑丝袜视频| 一级高清毛片免费a级高清毛片| 看国产毛片| 四虎在线观看视频高清无码 | 97久久超碰极品视觉盛宴| 欧美人在线一区二区三区| 露脸国产精品自产在线播| 欧美怡红院视频一区二区三区| 香蕉久久国产超碰青草| 国产欧美日韩综合一区在线播放| 在线国产欧美| 亚洲首页国产精品丝袜| a级毛片视频免费观看| 久久国产精品77777| 国产一国产一有一级毛片视频| 国产好痛疼轻点好爽的视频| 最新国产高清在线| 日韩福利视频导航| 乱系列中文字幕在线视频| 成人韩免费网站| 久久久久久久久久国产精品| 国产精品自在在线午夜区app| 国产成人啪视频一区二区三区| 成人在线视频一区| 草草影院国产第一页| 欧美国产综合色视频| 99视频在线精品免费观看6| 香蕉视频在线观看www| 国产在线观看一区二区三区| 欧美一区二区三区香蕉视| 久久婷婷六月| 爆乳熟妇一区二区三区| 国产福利免费在线观看| 美女一区二区在线观看| 国产91精品最新在线播放| 亚洲国产系列| 青青操国产视频| 在线观看国产黄色| 日韩成人在线网站| 91热爆在线| 中文字幕丝袜一区二区| 欧美国产日韩另类| 香蕉久人久人青草青草| 午夜日韩久久影院| 四虎影院国产| 欧美五月婷婷| 91精品啪在线观看国产60岁| 伊人色综合久久天天| 亚洲中文字幕国产av| 一本一道波多野结衣一区二区 | 久草美女视频| 99热这里都是国产精品| 丁香婷婷综合激情| 97精品国产高清久久久久蜜芽| 日韩毛片免费视频| 丁香六月激情综合| 国产精品成人观看视频国产| 国产精品夜夜嗨视频免费视频| a级毛片免费播放| 怡红院美国分院一区二区| 精品视频91| 欧美另类第一页| a级免费视频| 丁香五月亚洲综合在线| 亚洲系列中文字幕一区二区| 91破解版在线亚洲| 国产无码精品在线播放| 欧美三级日韩三级| 亚洲高清资源| av大片在线无码免费| 亚洲日韩每日更新| 国产美女视频黄a视频全免费网站| 国产极品美女在线| 国产91小视频|