
在上海天鶩科技有限公司的一間實驗室里,65攝氏度的恒溫罐中,一種經過特殊設計的酶正在快速分解塑料瓶碎片。短短數小時后,這些塑料將被徹底“消化”。
這款耐高溫的塑料降解酶,并非源自自然界篩選,而是由人工智能大模型挖掘、優化而成。
“過去,想要改造一個蛋白質,好比大海撈針?!碧禚F科技首席技術官劉灝告訴記者,“舉例來說,一個由361個氨基酸組成的蛋白質,僅替換1個氨基酸就有近7000種可能;替換2個便增至2300多萬種;若替換3個,可能性更是高達約533億種?!?/p>
如今,這一困局正被人工智能技術打破。
8月,工業和信息化部公布了第一批人工智能在生物制造領域典型應用案例,天鶩科技的“蛋白質工程大模型AIACCLBIO?”入選優秀案例。
這個由上海交通大學孵化出的科創企業,正在“向AI要蛋白質”——依托其自主研發的AI蛋白質設計大模型AIACCLBIO?,實現更精準、更高效的蛋白質設計與改造。
蛋白質是生命活動的主要承擔者,也是工業與醫療領域不可或缺的重要原料。日常生活中,從洗衣液中高效去漬的酶,到生長激素、抗體藥物,再到面膜中的膠原蛋白、診斷試劑中的檢測酶,蛋白質產品早已廣泛應用于眾多領域。
然而,天然蛋白質往往難以滿足工業化生產的需求。例如,人體內的蛋白質在37攝氏度、中性環境下活性最佳,但工業生產過程可能需要蛋白質在高溫、強酸或強堿條件下仍然保持穩定活性。因此,對蛋白質進行設計與改造,以適應多樣化應用場景,成為提升其工業適用性的關鍵。
“傳統蛋白質改造主要依賴專家經驗與大量試錯,例如我的一位同學花了整整5年才成功改造了一個蛋白質?!眲f,“培養一位合格的蛋白質工程師需要5年,完成一次成功改造可能又需要5年,可以說是周期長、成本高、成功率低?!?/p>
人工智能技術的介入改變了這一現狀。2024年,憑借人工智能模型AlphaFold2在蛋白質結構預測領域作出的貢獻,AlphaFold2的開發者戴米斯·哈薩比斯和約翰·江珀獲得諾貝爾化學獎。該模型解決了一個已有50年歷史的難題,能夠預測大約2億種已知蛋白質的復雜結構。
“功能是一個蛋白質成為產品的關鍵,也是企業真正關心的核心。”劉灝說,天鶩團隊選擇了一條更直接的路徑——訓練AI大模型跳過結構模擬,從序列預測和設計蛋白質功能入手,“找出真正對企業生產有用的蛋白質”。
團隊構建了包含近90億條序列的蛋白質數據集。這些數據不僅涵蓋常規生物蛋白質序列,更依托溟淵計劃采集了從火山、深海海溝等極端環境中采集的耐高溫、耐酸堿的蛋白質序列。其中,近5億條帶有功能標簽,標注了蛋白質在特定溫度、酸堿度、壓力下的性能表現。
基于這些數據的訓練,AI模型逐漸掌握了蛋白質序列與功能之間的映射關系,能夠快速高效地優化改造蛋白質。
“它知道耐堿的蛋白質‘長什么樣’,耐熱的又有什么特征。當一個普通蛋白質缺乏這些特征時,AI可以為它‘添加’相應功能?!眲扔鞯?,“就像我們不需要知道一個機器的每個零件長什么樣,只要知道輸入什么、能輸出什么,就能有效利用它工作。”
這一技術突破,使得設計能夠適應各種極端工業環境的高穩定性蛋白質成為可能。
在AI助力之下,生物制造過程正在變得“多快好省”。天鶩科技與國內生長激素龍頭企業金賽藥業合作,成功破解了生產工藝中的一項純化難題。
生長激素是一種蛋白質藥物,在生產純化過程中需要借助一種特殊的蛋白質作為“抓手”,將目標分子從混合液中精準分離。這個過程需要在極強的堿性條件下進行,pH值高達13~14。
“在極強的堿性環境下,大多數蛋白質會迅速失活。把一只蝦放進這種溶液,15分鐘后就會變紅,像是被煮熟了一樣?!眲f,企業原來使用的蛋白材料在這種條件極易變性,需頻繁更換,成本高昂。
利用AI大模型,天鶩科技僅用4個月就完成了該蛋白質的改造,使其耐堿性提升了4倍,使用壽命延長一倍。
隨后,該“耐堿”蛋白成功完成5000升規模的放大生產,成為全球首個實現工業化生產的大模型設計蛋白質。這一突破每年為合作企業節省成本超千萬元。
劉灝介紹,在另一項酶改造項目中,一位物理學背景的博士憑借AI大模型的輔助,成功完成了設計任務——他沒有傳統的生物學經驗,而是直接利用AI大模型對目標蛋白序列進行優化。
在極少的實驗數量內,團隊便獲得了性能優異的蛋白質變體,大幅縮短了研發周期與成本。這在傳統實驗模式下難以想象。
自2021年9月成立至今,天鶩科技已經成功交付30余個蛋白質設計項目,覆蓋創新藥、體外診斷、工業酶制劑、合成生物學等多個領域,取得不少成果。例如,天鶩科技與瀚海新酶合作開發的胰腺炎檢測原料酶,成本降至進口產品的十分之一……
目前,天鶩科技還有40余個在研項目,致力于運用AI技術幫助更多實體企業在產量和質量方面實現突破。
從實驗室到生產線,在生物制造領域,“人工智能+科學技術”不再是抽象概念,而是實實在在的產業變革。
“人工智能正在改變生物制造的研發范式,”劉灝說,“AI自動設計+
少量實驗驗證”的新模式,能夠將蛋白質設計周期從2~5年縮短至2~6個月,實驗樣本數量從成千上萬個減少到100個左右,項目成本從千萬元級別降至百萬元以內。與此同時,研發成功率也實現跨越式提升——傳統方法僅0.1%~1%,而AI精準設計可達30%。
在劉灝看來,人工智能帶來的不僅是技術迭代,更是科研范式的轉變。它通過處理人類難以駕馭的海量數據,發現其中隱藏的規律,極大提升了研發的確定性和效率。
人工智能和科技研發結合所帶來的巨大潛能,正持續為生物制造及其他眾多領域創造前所未有的新機遇。
編輯:孫曉萌sunxiaomeng@ceweekly.cn
美編:孟凡婷