在大模型與ChatGPT等技術崛起后, AI算力成為產業圈甚至是老百姓津津樂道的話題。英偉達和臺積電等企業被大眾熟知,華夏大地也開始了如火如荼的算力基建,廣東、江蘇、上海等省市在集算力、存力、運力于一體的綜合算力方面下足了功夫。
以往的新聞報道,往往聚焦于先進算力相關的半導體制造技術,也就是大家常說的7納米或5納米技術,對AI芯片的上下游鏈條少有提及。但對AI算力芯片產業而言,制造和上下游生態是產業發展的兩條腿,缺一不可。
這里的生態,主要指的是AI算力芯片產業上下游的算力IP核(知識產權核心電路模塊)和軟件編譯體系。制造首先解決“有沒有”的問題,生態則要解決“生存和發展”的問題。這兩者的自主技術發展壯大,才能讓國內AI算力芯片“用得好、用得多”。在制造瓶頸逐漸解決之后,生態建設,特別是開源生態建設,就成了國產AI算力芯片發展的關鍵。
目前,國產AI算力芯片生態發展上遇到兩個關鍵瓶頸。
一方面,國產自主可控的先進算力IP核仍需進一步發展。目前國內算力芯片廠商為降低產品量產風險,多采購國外第三方的IP核,類似于采用國外CPU和主板來組裝國產電腦。這可能導致大量資源投入國外IP核的“包裝”“升級”,反而抑制國產算力核心架構和IP核的發展。特別是傳統GPGPU 95%以上的核心專利都在國外廠商手中,持續使用國外IP核,追著老外后面走,很可能為“外人”做了嫁衣。
另一方面,是需要市場認可的算力芯片開源編譯體系。目前市場上普遍接受的算力芯片編譯體系,是英偉達的CUDA商用(閉源)生態。而國產算力芯片采用的編譯體系,具有非常明顯的碎片化分布,各家都不一樣,存在大量的重復建設。但建編譯生態的工作量巨大且燒錢,例如英偉達歷時10年斥巨資,以先發優勢才打造出CUDA生態。即便AMD這樣的老牌CPU/GPU廠商,面對英偉達的GPU生態都力不從心。如果國內AI算力芯片繼續如梁山好漢一般單打獨斗,忽視中小企業的創新貢獻能力,不形成足夠的合力,恐難以打破國外廠商的生態壟斷。
就筆者看來,目前國產算力芯片需要借鑒Linux在Windows之后的開源崛起經驗,重視中小企業貢獻,匯聚更多的聯合力量,形成生態的更大合力。
從先進技術的發展歷程看,原始創新很多來自廣大中小創新組織或企業,典型的如Linux、OpenAI、d-Matrix、Jim Keller(原AMD架構師)創建的Tenstorrent等。
在算力芯片領域,占多數的也是中小企業或機構。如果對廣大算力芯片企業和上下游生態通過開源普惠方式進行支持,調動中小企業和機構的創新力,一個好漢三個幫,與大企業一起形成生態合力,對算力生態的發展會起到更大的促進作用。
類似的成功案例也發生在新能源車領域。例如特斯拉2013年開始,逐漸開放和免費授權與新能源汽車相關的專利,甚至是開放源代碼。這些舉措事實上促進了其他車企的技術跟進,降低了整個產業的研發成本。與之類似,可以鼓勵2家或以上的機構/企業研發AI算力IP核或編譯器,進行良性競爭,并對外完全實時開源,以開源開放帶動行業內的中小企業合力貢獻。同時,鼓勵國外的開源社區參與生態建設,形成國際化共建,以四兩撥千斤的方式帶動生態建設。這樣一方面可以避免碎片化的重復建設,另一方面也可以使有限的投入倍增形成更大影響力。