999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利普斯他汀高產菌株毒三素鏈霉菌AP617-N12CA的全基因組測序與分析

2022-02-19 08:46:26李輝方志鍇郭霞凌
中國抗生素雜志 2022年1期
關鍵詞:生物

李輝 方志鍇 郭霞凌,*

(1 大邦(湖南)生物制藥有限公司,長沙 410221;2 福建省微生物研究所,福州 350007)

利普斯他汀(lipstatin)是由毒三素鏈霉菌(Streptomyces toxytricini)產生的一種具有良好抑制脂肪酶活性的天然產物,其氫化還原產物奧利司他(orlistat)化學性質更加穩(wěn)定,是目前全球唯一的OTC減肥藥和非中樞神經減肥藥[1-2]。以lipstatin為關鍵前體的發(fā)酵半合成技術是目前制備orlistat的主要方法,有關lipstatin的生物合成途徑解析與菌種選育一直是該領域的研究熱點[3-4]。由于lipstatin生物合成途徑復雜且產生多種副產物和結構類似物,導致發(fā)酵單位產量較低且下游提取精制十分繁瑣[5-6]。因此,構建高產低雜的生產菌株,提高工業(yè)化生產水平,是目前亟待解決的關鍵問題。然而lipstatin完整的生物合成途徑與調控機制至今未全面闡明,從而無法找到合適的靶基因對其產生菌進行代謝工程定向改造[7-8]。通過對S.toxytricini進行全基因組測序,有助于從分子水平上了解其遺傳變異規(guī)律、重要代謝途徑和調控機制,可為高效基因工程菌株的構建提供豐富、可靠的遺傳信息。

隨著基因測序技術的不斷迭代更新,越來越多的微生物基因組序列被破譯[9]。然而,由于二代測序技術讀長較短、高重復序列無法跨越、高GC區(qū)域無法準確測定等原因,很多已完成測序的微生物基因組中往往含有數目不等的空缺區(qū)域(gap)[10]。基因組空缺區(qū)域中可能存在重要的遺傳信息,如果不能補齊所有的gap,不僅無法獲得完整的基因組圖譜,還會給后續(xù)關鍵信息解讀(基因調控、SNP分析、比較基因組分析等)造成很大困難[11]。三代測序技術由于其超長的測序讀長和無GC偏好性,不僅可以克服以上部分難題,還可以得到零gap基因組完成圖,但目前三代測序在堿基讀取準確度上較二代測序差。三代聯合二代測序技術可克服兩者的缺點,從而獲得更準確、更深入的基因組數據挖掘結果。

本研究采用三代單分子測序長讀長與二代測序糾錯相結合的方式,對liptatin工業(yè)生產菌株毒三素鏈霉菌AP617-N12CA(S.toxytriciniAP617-N12CA )進行全基因組序列測定,不僅獲得了AP617-N12CA的染色體全基因序列信息,還首次發(fā)現了一個長約0.61Mbp線型質粒。通過對染色體基因組和線型質粒進行基因功能注釋和次級代謝產物合成基因簇預測,從線型質粒上定位了lipstatin生物合成基因簇,為AP617-N12CA的功能基因組學研究和代謝調控提供了理論依據。

1 材料與方法

1.1 菌株與培養(yǎng)基

本研究所采用的菌株S.toxytriciniAP617-N12CA為lipstatin工業(yè)化生產菌株,由大邦(湖南)生物制藥有限公司保藏。搖瓶種子培養(yǎng)基:甘油2.0%,酵母提取物0.6%,黃豆餅粉2.0%,蒸餾水配置,pH6.5。YEME培養(yǎng)基:蛋白胨0.5%,酵母提取物0.3%,麥芽提取物0.3%,葡萄糖1.0%,蒸餾水配置,pH7.5。

1.2 基因組DNA提取

取少量AP617-N12CA孢子懸液接種于搖瓶種子培養(yǎng)基,28℃恒溫培養(yǎng)36 h,然后以1%的接種量接種于YEME培養(yǎng)基,37℃恒溫培養(yǎng)48 h。離心收集菌絲體,提取AP617-N12CA基因組DNA[12],使用Thermo NanoDrop 2000微量紫外分光光度計對提取的基因組DNA進行濃度測定,然后進行0.5%瓊脂糖凝膠電泳檢測DNA質量。

1.3 基因組測序與拼接

對質量和濃度測定合格樣品進行基因組測序,由北京百邁克生物技術有限公司同時進行Illumina二代測序和ONT三代測序。三代原始數據經去除測序數據中的接頭序列和低質量序列后,得到總的數據集。使用Canu v1.5 (http://github.com/marbl/canu) 軟件[13]對過濾后的subreads進行從頭組裝,通過Racon v3.4.3軟件利用三代subreads對組裝結果進行矯正。通過Circlator v1.5.5軟件進行環(huán)化和調整起始位點,采用Pilon v1.22軟件利用二代數據進一步進行糾錯,最終獲得準確度更高且不存在gap的完成圖序列進行后續(xù)分析。

1.4 基因預測與注釋

通過軟件Prodigal v2.6.3 (https://github.com/hyattpd/Prodigal/) 進行基因預測[14]。根據預測得到的 CDS 位置信息提取氨基酸序列,與COG/KOG數據庫[15]、KEGG數據庫[16]、Swiss-Prot蛋白質序列數據庫、Pfam蛋白質家族數據庫、NCBI-Nr數據庫和CAZy碳水化合物活性酶數據庫等進行蛋白質同源序列比對,完成基因注釋。

1.5 次級代謝產物合成基因簇分析

利用次級代謝產物編碼基因成簇存在的特點,采用在線軟件AntiSMASH[17]和NRPSpredictor[18]預測AP617-N12CA中的次級代謝產物生物合成基因簇,并分析可能合成的代謝產物。

2 結果與分析

2.1 S.toxytricini AP617-N12CA基因組提取

對提取得到總量為200 μL的基因組進行凝膠電泳檢測(圖1),樣品主條帶清晰,存在輕度降解,DNA 樣品濃度測定經NanoDrop定量檢測,樣品濃度為48.9 ng/ μL,符合測序要求。

2.2 S.toxytricini AP617-N12CA基因組特征

采用ONT測序與Illumina測序相結合的方式對AP617-N12CA進行全基因組測序,最終組裝得到完整的零gap基因組序列,包含兩個大小不等的線型復制子。其中一條可以確定為染色體,而另一條可能為游離質粒,暫將其命名為復制子2。AP617-N12CA基因組總長6985682 bp,GC含量為73.76%,預測含6134個基因,預測基因序列總長度6119307 bp,預測基因平均長度997 bp,長度最長的基因長度為18252 bp。其中染色體大小為6375543 bp,占基因組全長的91.3%,預測含5680個蛋白編碼基因。與其他已測序的鏈霉菌染色體大小(8.5~9.0 Mb)相比,S.toxytricini的染色體相對較小,僅約6.38 Mb。復制子2長610139 bp,占基因組全長的8.7%,預測出454個蛋白編碼基因。

根據Bentley等[19-20]提出的關于區(qū)分染色體和巨型質粒的理論依據并非根據它們攜帶的復制相關基因,而是判斷它們是否是宿主生長所必需的以及是否攜帶rRNA操縱子。本研究通過對這條6.1 Mb的線型復制子中的編碼基因進行預測來判斷它是否為AP617-N12CA的生長所必需的元件。結果表明,主代謝過程必需的rRNA及tRNA編碼基因無一例外地全部存在于染色體中(RNA預測結果顯示該菌染色體上含有72個tRNA基因和21個rRNA基因)。此外,通過對復制子2上的基因組序列進行預測分析,預測結果顯示的編碼基因都不是AP617-N12CA初級代謝必需的遺傳因子,說明復制子2并不是AP617-N12CA細胞正常生命活動所必需的。基于上述結果,本研究推斷AP617-N12CA中的兩個線型復制子,較大的為染色體,較小的為線型質粒,將其命名為pDBSW178,AP617-N12CA基因組完成圖如圖2所示。

2.3 S.toxytricini AP617-N12CA基因組功能注釋

采用本地Blastp的方法對AP617-N12CA進行COG,KEGG,Swiss-Prot數據庫比對注釋。COG數據庫共注釋到6134開放閱讀框編碼可能具有一定功能的蛋白質,分為A~Z類,各基因數量和比例見圖3。在這些進行COG分類的CDS中,除一般功能(general function prediction only)基因516個和未知功能(function unknown)基因1119個外,主要集中在能量代謝與轉換(energy production and conversion)基因264個、氨基酸轉運和代謝(amino acid transport and metabolism)基因337個、碳水化合物運輸和代謝(carbohydrate transport and metabolism)基因263個、轉錄(transcription)基因395個。其中次級代謝產物的生物合成、運輸和分解代謝(secondary metabolites biosynthesis, transport and catabolism)基因132個,這些將是研究lipstatin生物合成與代謝調控的重點。KEGG富集分析顯示如圖4,對應到KEGG pathway的2109個基因,富集在123條代謝通路中,其中涉及基因最多的通路主要有:氨基酸生物合成代謝途徑(biosynthsis of amino acids,158個基因)、碳源代謝途徑(carbon metabolism,144個基因)和ABC轉運系統(tǒng)(ABC transporters, 108個基因)。可能與lipstatin及其結構類似物有關的通路有:支鏈氨基酸降解途徑(valine, leucine and isoleucine degradation, 38個基因)、脂肪酸合成途徑(fatty acid biosynthesis,30個基因)、脂肪酸降解途徑(fatty acid degradation,29個基因)等,這些基因也是研究lipstatin生物合成與代謝調控的重點。Swiss-Prot是含有詳細注釋內容的蛋白質序列數據庫,經注釋基因準確度高。AP617-N12CA中共2847條蛋白序列得到Swiss-Prot注釋,這些為后續(xù)該菌的功能基因組學研究提供了極大的便利。

2.4 次級代謝產物生物合成基因簇分析

通過次級代謝產物生物合成基因簇的在線預測工具antiSMASH對AP617-N12CA基因組中可能編碼的次級代謝產物合成有關的基因簇進行了預測。共識別出22個可能的基因簇,其中18個位于染色體中,4個位于線型質粒中(表1)。在22個基因簇中,其中8個包含PKS、NPRS或雜合的PKS -NPRS,剩余的基因簇中,6個可能與萜類(terpene)分子生物合成有關,3個可能與鐵載體(siderophore)生物合成有關。AP617-N12CA染色體中識別出的次級代謝產物合成基因簇總長度為534381 bp,只占染色體基因組的8.38%;而線型質粒識別出的次級代謝產物合成基因簇總長度為215998 bp,在線型質粒基因組中占比高達35.4%,說明在線型質粒上包含了高密度的次級代謝產物合成基因。

表1 S.toxytricini AP617-N12CA基因組中預測的生物合成基因簇Tab.1 Predicted biosynthesis clusters in S.toxytricini AP617-N12CA

另外,在antiSMASH預測結果分析時筆者意外發(fā)現,由lstA、lstB、lstC、lstD、lstE和lstF等呈簇分布的基因組成的lipstatin生物合成基因簇(cluster 22)并不位于染色體基因組中,而是分布在線型質粒的右臂區(qū)域。對AP617-N12CA中l(wèi)ipstatin生物合成基因簇通過GenBank數據庫比對分析,發(fā)現AP617-N12CA中l(wèi)ipstatin生物合成基因簇與S.globosusstarin LHZ-48中相應序列在基因組成和排列順序上均具有高度同源性(基因簇同源性高達94.39%),暗示lipstatin生物合成基因簇具備在不同菌株間穿梭或水平轉移的可能性。

3 討論

三代單分子實時測序測序讀長可達到20 kb,測序過程不需要PCR擴增,是目前高比例重復序列、高雜合度、極端GC含量基因組測序的理想平臺,三代和二代測序技術聯合應用解析微生物全基因序列將成為主流。本研究運用ONT三代測序和Illumina二代測序兩種測序技術相結合的方法對AP617-N12CA進行了全基因組的測序,首次獲得了S.toxytricini基因組完成圖。AP617-N12CA全基因組長度為6985682 bp,GC含量73.76%,包含6134個預測編碼蛋白。同時對組裝的基因組進行了基因預測、功能注釋和聚類分析,進一步預測了次級謝產物生物合成基因簇。最終獲得的這些基礎數據有益于從分子水平上認識AP617-N12CA的生理功能、代謝特性和高產機理,同時對lipstatin的生物合成途徑與調控機制的研究具有一定的參考價值。

鏈霉菌作為一類重要的工業(yè)微生物,能夠產生大量結構復雜多樣的活性天然產物,如抗生素、抗腫瘤藥物和免疫抑制劑等,廣泛應用于醫(yī)藥、農業(yè)和畜牧業(yè)等[21]。多數鏈霉菌的菌株中帶有質粒[22],目前已報道的大多數鏈霉菌抗生素生物合成基因簇定位于染色體上,只有極少數抗生素的生物合成基因簇存在于游離狀態(tài)的質粒上[23],如天藍色鏈霉菌S.coelicolorA3(2)菌株中的次甲霉素A 生物合成基因簇位于長度350 kb的巨型線型質粒SCP1質粒上[24],婁徹鏈霉菌S.rochei中的卡殺菌素類抗生素(lankacidins)生物成合成基因簇位于長度200 kb的線型質粒pSLA2-L上[25]。本研究在對重要工業(yè)微生物S.toxytriciniAP617-N12CA進行全基因組測序時,首次發(fā)現和描述了一個長為610139 bp的線型質粒pDBSW178,質粒上匯聚了多個合成編碼次級代謝產物的基因簇,AP617-N12CA主要次級代謝產物lipstatin生物合成基因簇也定位于pDBSW178上。后續(xù)進一步對線型質粒pDBSW178的檢測與分離、復制機理和端粒結構等進行深入系統(tǒng)研究,不僅有助于開發(fā)出新型的鏈霉菌線型載體系統(tǒng),還可為lipstatin優(yōu)質高產菌株的構建與應用提供理論基礎,并為lipstatin的高效異源生物合成提供研究思路。

猜你喜歡
生物
生物多樣性
天天愛科學(2022年9期)2022-09-15 01:12:54
生物多樣性
天天愛科學(2022年4期)2022-05-23 12:41:48
上上生物
當代水產(2022年3期)2022-04-26 14:26:56
發(fā)現不明生物
科學大眾(2021年9期)2021-07-16 07:02:54
史上“最黑暗”的生物
軍事文摘(2020年20期)2020-11-28 11:42:50
第12話 完美生物
航空世界(2020年10期)2020-01-19 14:36:20
最初的生物
自然生物被直銷
清晨生物初歷直銷
生物的多樣性
主站蜘蛛池模板: 中文天堂在线视频| 亚洲爱婷婷色69堂| 日本精品一在线观看视频| 国产精品2| 婷婷成人综合| 欧美中出一区二区| 亚洲精品波多野结衣| 91在线日韩在线播放| 国禁国产you女视频网站| 欧美日韩一区二区在线播放| 国产精品三级av及在线观看| 色偷偷一区| 欧美成人综合视频| 亚洲国产看片基地久久1024| 在线a视频免费观看| 97久久人人超碰国产精品| 中国国产A一级毛片| 国产av剧情无码精品色午夜| 国产欧美日韩另类精彩视频| 91九色最新地址| 日韩精品一区二区三区大桥未久 | 久久精品无码一区二区日韩免费| 美女高潮全身流白浆福利区| 波多野结衣在线一区二区| 黄色不卡视频| 国产69精品久久久久孕妇大杂乱| 精品国产免费观看| 伊人91在线| 在线看片国产| 色综合天天娱乐综合网| 精品久久久久久中文字幕女| 色综合天天娱乐综合网| 狠狠色香婷婷久久亚洲精品| 精品国产香蕉在线播出| 亚洲最大情网站在线观看| 日韩在线永久免费播放| 亚洲精品老司机| 久久久久亚洲精品成人网| 国产日韩av在线播放| 91精品国产丝袜| 97超碰精品成人国产| 中文字幕乱妇无码AV在线| 亚洲区视频在线观看| 毛片网站观看| 中文字幕啪啪| 国产精品太粉嫩高中在线观看| 日本成人精品视频| 亚洲精品无码人妻无码| 91小视频在线观看免费版高清| 久久国产精品麻豆系列| 欧美一道本| 高清色本在线www| 亚洲日本精品一区二区| 一级毛片基地| 精品久久久久久久久久久| 国产aⅴ无码专区亚洲av综合网| 熟女日韩精品2区| 中文字幕av无码不卡免费| 久久情精品国产品免费| 亚洲中文字幕在线观看| 亚洲嫩模喷白浆| 国产乱子伦一区二区=| 亚洲性影院| 欧美日韩久久综合| 亚洲色大成网站www国产| 亚洲一区国色天香| 亚洲日韩国产精品综合在线观看| 美女被操91视频| 九九久久精品国产av片囯产区| 久久福利片| 亚洲日韩在线满18点击进入| 大香网伊人久久综合网2020| 波多野结衣一二三| 国产精品极品美女自在线看免费一区二区| 91外围女在线观看| 国产精品视频久| 亚洲精品国产自在现线最新| 欧美亚洲国产精品久久蜜芽| 高清视频一区| 91精品视频播放| 毛片网站在线看| 久久国产精品嫖妓|