

地面以下近千米的山東能源李樓煤業礦井工作面,只有零星幾個礦工的身影,每隔一段距離就有幾臺攝像儀和無線基站,采煤機等設備也安裝了傳感器等信息控制單元。靠著這些裝置,地面調度指揮中心能清晰觀察、動態監管施工過程。防沖卸壓施工孔深監管流程,從原本的3天縮短到現在的600秒,人工審核的工作量降低了82%。這背后,AI大模型功不可沒。
近段時間以來,大模型已經從寫詩、作畫、編論文,開始向能源、汽車、鋼鐵等工業領域挺進,在設計、研發、管理等環節嶄露頭角。由于工業領域本身門類多,企業間的數據壁壘明顯,尤其在核心制造環節,大模型并非“萬能”。而對于用戶而言,大模型的實際效果如何以及是否能夠支持快速迭代最為重要。有專家認為,未來十年,工業領域或將呈現大模型和小模型共存的局面。
01工業大模型是怎樣煉成的?
采煤過程中,在卸壓鉆孔施工時,人員操作不當,比如深度不夠、角度有誤等,都會導致安全隱患甚至事故。
最近,山東能源集團、華為、云鼎科技聯合發布的全球首個能源行業商用AI大模型——盤古礦山大模型,解決了原先卸壓工程規范性驗證需要工人下井逐個檢查的難題。引入大模型后,工人坐在辦公室就能完成這項工作。
工業大模型是工業企業數字化、智能化“進化”到一定階段的產物。山東能源集團啟動數字轉型之初,日均處理數據已達到2億條。2022年年初,其在智能化煤礦基礎上,逐漸實現經營管理與智能生產分離、數據不出園區、支持規模復制、學習分析小樣本等能力,并搭建起中心訓練、邊緣推理、邊用邊學的人工智能運行體系和管理體系。
今年開始,山東能源集團瞄準效率提升和安全生產,讓一線生產工人深度參與大模型的應用工作,將分散在數十座煤礦的一線經驗和能力集中到平臺,并沉淀在大模型上,半年之內訓練出了覆蓋煤礦生產皮帶運輸、立井提升、輔助運輸等數十種場景的模型算法,助力企業提高安全生產效率。
在能源行業的油氣勘探環節,“給地球做一次三維CT”需要處理PB級的地質數據。如何更好理解、分析、利用海量數據,實現全鏈路的提質增效,成為行業性挑戰。
今年4月,阿里云宣布與中國石油集團數字化轉型專業化公司昆侖數智共建油氣大模型。昆侖數智相關負責人表示,公司正在結合油氣專業數據、油氣專業知識和業務智能化需求,基于阿里基礎大模型開展深入預訓練、調優等工作,打造油氣大模型。油氣大模型打造完成后,將在勘探開發、煉油化工、油氣銷售等業務領域廣泛開展油氣地質工程模型化協同研究、油氣田開發方案智能決策和優化、油氣生產設備預測性維護等系列智能應用合作研究。
由于工業大模型還處于應用早期,如何落地,會產生哪些顛覆性應用仍有待明確。大模型企業也正與行業客戶摸索合作的場景和切入點。
據百度智能云智慧工業事業部解決方案總經理吳學義介紹,在化工行業,目前的客戶主要分兩類,一類是行業研究咨詢機構,希望與百度合作做大模型的研發,把行業里安全生產、管理等各類標準,通過大模型知識固化,形成共性的服務平臺;另一類希望提升工藝設計。例如一家頭部化工企業,生產過程中需要多輪質檢來保障產品質量。他們希望結合此前的數據積累,和大模型廠商共同打造一個質檢降頻的大模型,降低成本,提升生產效率。
02在設計研發管理環節率先落地
某工業企業的負責人在用大模型設計散熱葉片時表示。“研發人員認為,弧形葉片的散熱效果最好,但大模型最終給出的設計方案不是弧形,而是不規則形。試驗效果顯示,這種不規則葉片散熱效果更好,打破了所有研發人員的固化認知。”
“大模型因具有強大的表征、泛化和自適應能力,在處理復雜的自然語言、圖像、時間序列等任務上表現優異。在經過充分訓練后,無需針對特定問題進行定制化,能夠自動學習新的模式和規律,具備—定自己的認知和推理能力,且能適應不斷變化的數據和環境。”用友智能制造事業部高級技術架構師葉琳表示。
用友通過對海量廢鋼圖片訓練,構建了用友BIP(商業創新平臺)智能制造廢鋼判級大模型,在鞍鋼等20余家鋼鐵企業上線應用,廢鋼判級準確率達95%以上。值得一提的是,由于該大模型具有很好的泛化能力和自適應能力,面對企業的不同需求,技術人員幾乎不用對原本模型做過多調整,而其他小模型卻不具備這些特點。
葉琳提及的這類大模型,屬于視覺類大模型。依托視覺識別能力,可以廣泛用于圖像識別或缺陷檢測。
另一類工業大模型便是自然語言處理類大模型,能夠基于內容生成和自然語言交互能力,帶來產品研發工具和研發手段創新,成為一些企業級應用的AI助手,提高工作效率。
隨著發展,工業領域也逐步涌現出了多模態大模型。日前,華為推出了盤古大模型3.0,包含了基礎大模型、行業大模型、場景大模型三層架構、多個模型,采用了“完全的分層解耦設計”。華為常務董事、華為云CEO張平安解釋,為了更好地適配行業不同場景,必須要做到完全解耦。有些企業只需要圖像分析,不需要文案生成,基礎大模型和能力集解耦后,他們就可以按需調用;甚至還有數據解耦,模型升級時,數據就可以復用;這個解耦架構,也實現了模型的并行迭代。
從上述已經落地或正在開發中的大模型趨勢來看,工業大模型率先落地的場景基本集中在企業的設計、研發、管理等環節,提升人機交互性能及業務系統之間的互通效率。
比如,在企業跨系統數據分析方面,過去可能需要在多個系統中查詢數據,再動用一些工具進行數據分析,生成式AI則可以通過一句話,自動完成以上動作并給出分析結果;在設計草圖生成方面,設計師輸入一些關鍵參數,AI自動生成相應的產品設計草圖,供設計師進一步修改或確認;在故障預測與維護方面,通過對大量傳感器時序數據的分析,大模型可以預測機器設備的故障風險,從而實現智能化的設備維護,降低停機時間和維修成本。
大模型并非“萬能”
ChatGPT類生成式AI在實際使用過程中經常會出現一些“驚喜”。但是工業生產不需要“驚喜”,最害怕“意外”,一個小小的故障或停機就可能帶來成百上千萬元的損失。
要想讓大模型生成可靠、可信的結果,需要一系列嚴苛的前提。
數據是大模型的營養,大模型靠不斷地“吃數據”“消化數據”維持良好的性能。相比許多領域大模型,蛋白質序列大模型發展較為迅速,已經能夠解決蛋白類新藥研發過程中普遍存在的耗時長、耗費高等難題。之江實驗室智能計算軟件研究中心主任潘愛民表示,這是因為蛋白質基因序列的數據非常豐富,往往有上億規模的數據量,為大模型的訓練、使用和迭代帶來極大的幫助。
數據還要足夠標準化和規范化。以開發礦山大模型為例,山東能源集團啟動數字轉型之初,日均處理數據已達到2億條,隨著智能化建設深入,開始以標準的信息架構和數據規范,全面打通OT(運營技術)、IT(信息技術)、CT(通信技術)三大系統數據,逐漸形成海量多源數據統一接入、匯聚和處理,為推動大模型持續優化升級帶來便利。
要想不斷提升大模型的專業水平,GPU/TPU加速器、基礎軟件、外掛插件、搜索引擎、相關數據庫等一系列IT軟硬件設施都要足夠完備和先進,這也將帶來巨大的使用成本。同時,訓練和微調行業模型所需的高質量的行業數據的獲取和整理,也需要消耗大量的人力和時間。
大模型并不是“萬金油”。“適合的場景可以基于大模型來提升競爭力,但目前工業場景中沒有哪個場景和應用是‘非大模型不可’的,特別是大模型對生產排程等核心制造環節的用處還不是很大。”潘愛民說。工業領域本身門類多,各個企業間的數據壁壘非常明顯,尤其在某些核心制造環節,難以收集到足夠的標注數據來訓練這些模型,這類環節往往不適用大模型。
“工業大模型并不能替代工業系統,短時間內也無法成為企業智能化的‘底座’。”業內專家表示,從其底層技術看,大模型對各種AI模型的綜合應用更加接近人類大腦的工作機理,尤其擅長自然語言和文本處理等領域的融合,但它依舊與工業系統的智能具有不同的機理構成。
04大小模型要互補發展
目前來看,足夠智能、能夠覆蓋所有場景的大模型時代還遠遠沒有到來。業內專家一致認為,包括工業行業在內的產業智能化發展過程中,未來十年將是大模型和小模型共存的局面。
“一場景一模型”的小模型方案有定制化能力,場景貼合度好,解決某一具體問題尤其特異性問題的效果較好。比如,在精準科學計算和符號推理方面,大模型并不比小模型可靠。目前,小模型已經幫助天文、新材料、生物醫藥等諸多領域攻克了不少“卡脖子”難題。
然而,小模型在應用于新任務或領域時,可能需要進行重新設計和訓練,不如大模型具備較強的泛化性。葉琳表示,用友原本有30多個廢鋼智能判級小模型,雖然每個小模型準確率比較高,但當新的客戶帶著新的需求過來,不少小模型都需要重新訓練、標注、迭代,否則準確率會降低。
實際上,在工業制造智能化應用中,大模型和小模型兩者不是相互對立的,兩者可以協作——廠商可以根據任務的復雜程度、數據量、實時性需求和計算資源等因素來選擇合適的大模型或小模型。
某些情況下,大模型和小模型還可以相互轉換。“大模型基于對通用知識的理解變得更廣泛,能夠補足小模型的學習能力、交互能力和生成能力,可以通過壓縮或者知識蒸餾,部署到小模型環境中去替代一部分能力。也可以采用模型壓縮技術,將大模型壓縮成小模型,以平衡性能和資源消耗之間的權衡。”北京九章云極科技有限公司副總裁于建崗表示。
“大和小是一個相對的變化。”于建崗說,當前大模型的參數標準并不統一,相對于參數級,模型的效果且是否能夠支持快速迭代對于用戶實際應用來說更為重要。用戶能夠在一個白盒大模型基礎上快速地、低成本地微調和迭代出客制化的小模型,才能高效地實現豐富場景的大模型應用。
目前,很多場景的應用已有初步效果,但是否能夠形成投入產出比清晰的可持續的商業模式,從而實現規模化的復制和推廣,則還有待觀察。基于這層考慮,有觀點認為,大模型更適合專業供應商和部分頭部企業開展應用,更多企業更適合優先從特定場景角度,開展“領域大模型+專用小模型”的應用試點。
摘自微信公眾號“中國電子報”