人、動物和植物的共生微生物組中存在的編碼多肽和小蛋白,被認為是微生物中數量巨大的一類“暗物質”,其蘊含的功能多樣性有著非常大的想象空間。
例如抗菌肽就是這樣一種“暗物質”。先前的研究得出,抗菌肽可以作為非常有潛力的治療耐藥菌的藥物或者前體分子,并且不容易產生極強的耐藥性,有助于應對當下愈演愈烈的耐藥菌感染問題。
因此,挖掘和研究共生微生物組中海量的多肽具有十分重要的意義。
近日,來自中國科學院微生物研究所的團隊結合LSTM、Attention和BERT等多種自然語言處理神經網絡模型,建立了一個用于從人類腸道微生物組數據中識別候選腺苷一磷酸的統一管道。在被確定為候選腺苷一磷酸的2349個多肽序列中,有216個是化學合成的,其中顯示出抗菌活性的有181個;并且,在這些多肽中,大多數與訓練集中腺苷一磷酸的序列同源性低于40%。
相關論文以《利用深度學習法從人體腸道微生物群中鑒定抗菌肽》為題發表在《自然生物技術》上,中國科學院微生物研究所研究員、博士生導師王軍擔任最后通訊作者。
審稿人評價該研究道,“從計算預測到結果非常好的動物模型,這項研究總結了一系列令人印象深刻的工作,包括一些用于進一步研究的候選肽。使用機器學習發現新的腺苷-磷酸后,再對其功效進行詳細的微生物學驗證,非常有趣,這也許會對該領域產生積極影響。”
在微生物以及其他生物體內發揮功能的分子,不僅包括各種代謝途徑和通路所產生的小分子,還有一系列的生物大分子。……