“算力是數字經濟時代的核心生產力,正在不斷催生新技術、新模式、新業態,助力各行業加快數字化智能化轉型。”在青云科技舉辦的2024 AI算力發布會上,中關村朝陽園黨工委副書記、管委會主任婁毅翔說,需要通過搭建產業的共性技術平臺、打造標桿示范應用場景等方式,促成充分應用算力,進一步助力人工智能技術落地產業。
與會專家普遍認為,當前亟須實現算力供需匹配,打破算力流通壁壘,從而提升算力利用效率。
在青云科技智算產品經理苗慧看來,不同行業需要的算力具有不同特點,應為不同行業“量體裁衣”,實現算力需求與算力資源的高效匹配。
她舉例說,自動駕駛系統每天面對海量圖片數據,但這些數據并非全部都需要計算。根據這一特點,青云智算建設了多地區多中心的數據存儲區域,并將其用于自動駕駛行業數據的內部流轉。流轉計算后,再將不必要的數據備份刪除,以提升圖形處理器(GPU)使用效率。
此外,科研單位對算力的需求存在波峰波谷。“高校院所并不是要生成一個大模型產品,更多的是用行業數據來調試其研發的算法。”苗慧認為,根據這種情況,可通過GPU切分技術,在算力需求波谷時匹配更低的算力,在算力需求波峰時重新整合GPU資源,提供足夠的算力,實現降本增效。
青云科技首席執行官林源認為,從當前的產業發展趨勢看,算力使用門檻亟待進一步降低。
目前,提供算力的“引擎”架構變得越來越復雜,提高了算力使用門檻。林源解釋,從CPU(中央處理器)到GPU,再到不同GPU的調度和使用優化,芯片架構的變化對芯片的管理提出了新挑戰,也影響著服務器的架構。此外,隨著網絡速度從千兆發展到數百GB,數據存儲從分布式存儲發展到圍繞模型開發需求進行存儲,人工智能落地所依托的底層基礎設施變得更加復雜。只有具備高效調度能力,才能讓算力“引擎”合力發動,提高算力利用效率。
如何更有效管理新的算力架構?“我們在實踐中發現,打通不同底層邏輯的芯片系統,通過統一調度、智能管理,能為AI技術研發提供恰到好處的算力。”苗慧說,青云科技推出的AI智算平臺,通過底層打通,能對曙光、昇騰、英偉達等提供的異構算力實現統一管理與調度。同時,通過開放的架構,平臺能縱向融合多種AI技術。
林源介紹,基于不同芯片廠商、算力供應商、存儲設備企業之間的協同合作,算力的底層基礎設施壁壘被不斷打破。當前,從青海到北京、從廣東到內蒙古,都可以實現迅捷的算力調度和使用。
據介紹,包括青云科技在內的200余家行業上下游企業緊密合作,通過算力共贏、算力加速等計劃,完成了百余項生態適配項目,以資源共享與優勢互補推動智算產業整體發展。