英偉達2023年的營業收入為609.22億美元,同比增長125.85%;凈利潤為297.60億美元,同比增長581.32%,業績創出歷史新高。為了不失去中國市場與業績持續增長的需要,英偉達為中國市場定制了三款“特供”芯片,分別為H20、L20、L2,且于近期開始接受預定。
國內方面,以景嘉微、海光信息、龍芯中科等為代表的GPU廠商業績并不樂觀,2023年僅有海光信息業績實現顯著的正向增長。不過,在此輪GPU全球競爭中,國內廠商似乎并沒有過于落后,從數據來看,華為昇騰910B與H20性能大體相當,在某些關鍵領域的FP32性能表現略優于后者,海光信息深算二號性能相比上一代產品提升了近一倍,昆侖芯、摩爾線程等公司產品也在持續迭代中。
據業績預告,2023年,海光信息營業收入為60.12億元,同比增長17.30%;歸屬母公司所有者凈利潤為12.62億元,同比增長57.11%,其業績增長遠超國內其他競爭對手。
CPU是海光信息主要的收入與利潤來源,因此,海光信息業績增長的核心原因在于下游服務器需求旺盛。
據IDC數據,中國服務器市場快速增長。2022年,中國服務器市場規模為288億美元,2018-2022年CARG高達20.20%,而隨著東數西算項目的推進以及國產AI大模型應用的爆發,國內服務器需求將穩步上升,預計2027年將達到454億美元。
需要指出的是,X86仍為全球服務器主流架構。據IDC數據,2022年,全球X86服務器市場規模達1109.55億美元,占服務器總市場的比重為87.50%。從中國市場來看,2023年第一季度出貨量中,X86架構服務器出貨量占比高達92.40%。
而且,根據Mercury Research數據,2021年第四季度,X86 CPU市場幾乎被海外巨頭壟斷,Intel占74%、AMD占比為26%,在中國市場亦是如此,X86 CPU芯片國產化率較低。
海光信息CPU產品可以實現上層應用無縫切換,減少遷移成本,相對于ARM服務器遷移風險小,但在2020年,其產品出貨量僅占國內總體市場份額的3.75%。
幸運的是,國內信創產業的發展推動了海光信息CPU產品出貨量的增長。2022年9月,政府下發79號文,要求到2027年,央企、國企全面完成國產替代。
據東吳證券數據,2022年,部分央企、國企服務器招標國產化比例已經超過了30%;而且,2023年,銀行、運營商等央企、國企還放出純國產服務器招標,其中海光信息和華為是行業信創服務器兩大主要供應商。
除了國產替代的影響,規模效應使得自研無形資產攤銷金額占營業收入的比重下降也是促進海光信息業績增長的重要因素。
據財報數據,海光信息一直保持高強度的研發投入。2021-2022年,公司研發支出資本化金額分別為8.40億元、6.54億元,占當期研發投入的比重分別為53.02%、31.61%。
截至2023年上半年,海光信息賬面無形資產非專利技術期末余額為33.15億元,按照3-10的期限進行攤銷,當期計提金額3.27億元,而隨著出貨量的增加,規模效應顯現,公司毛利率逐步上升,由2019年的37.31%增至2023年前三季度的60.63%。
根據中國通信院發布的《中國算力發展指數白皮書》數據,2022年,全球智能算力約451E Flops(基于FP32計算),預計到2030年,全球智能算力規模將達到52.5Z Flops,全球智能算力快速增長。
對于中國市場,根據IDC和浪潮信息發布的《2023-2024人工智能計算力發展評估報告》,2022年,中國智能算力規模為259.9E Flops(基于FP16計算),預計到2027年達到1117.4E Flops,2022-2027年CAGR約為33.90%。
具體至數值層面,Gartner研究顯示,2022年,全球AI芯片市場規模為442.20億美元,預計2027年將增至1149億美元。而在中國市場,頭豹研究院數據顯示,2022年,中國AI芯片市場規模為954億元,預計到2025年達到1979億元。
需要指出的是,AI芯片可以分為GPU、FPGA、Asic,其中GPU是較為成熟的通用型人工智能芯片,FPGA、Asic則是針對人工智能需求特征的半定制和全定制芯片。根據TrendForce發布的數據,英偉達GPU為AI服務器主流芯片,其市場占有率約為60%-70%;其次為云端廠商自主研發的Asic芯片,市場占有率約為20%左右。
另外,全球GPU市場呈現“一超一強”的競爭格局。根據IDC數據,2021年,英偉達在企業級GPU市場份額為91.40%,AMD市場占有率為8.50%。
更為重要的是,由于美國對于中國的制裁加劇,國內企業很難獲得先進的AI芯片,2023年10月17日,美國商務部宣布計劃限制向中國出售更先進的A芯片,除了H100、A100、L40等產品外,新的政策還將將限制英偉達A800、H800芯片的出口。
為了不失去中國市場以及遵守美國的禁令,英偉達針對中國區開發出改良版AI芯片,包括H20、L20以及L2,其中H20性能最強,其采用中國臺灣地區的臺積電的CoWos封裝,理論上等于H100的20%綜合算力性能,另據路透社消息,英偉達對H20中國渠道定價設定在1.20萬-1.50萬美元。
那么,英偉達真的可以憑借“閹割版”的H100在中國GPU市場實現降維打擊嗎?
答案是否定的,近年來,中國頒布了一系列支持采用國產AI芯片的政策,例如北京頒布政策明確推動國產人工智能芯片實現突破,上海市提出拓展國產芯片應用,推廣國產算法框架。
與此同時,以華為、海光信息、摩爾線程等為代表的GPU廠商也先后投入大量研發資金,其產品性能也持續迭代,甚至在部分領域已不弱于H20。
據國海證券研報,在FP16精度下,H20算力為148 TFLOPS,FP32精度算力為44 TFLOPS,FP64精度算力為1 TFLOPS;華為昇騰910在FP16精度下算力為320 TFLOPS,昇騰910B算力為376 TFLOPS。更為重要的是,據IT之家消息,在某些關鍵領域的FP32精度下算力,英偉達H20表現不如華為昇騰910B,而且昇騰910B市場價格約為12萬元左右。綜合來看,與華為昇騰910B相比,H20并沒有明顯的競爭優勢。
海光信息深算二號性能同樣表現不俗,其性能相比深算一號提升了一倍。
公開信息顯示,深算一號FP16精度下算力為24.5 TFLOPS,FP32精度算力為11.5 TFLOPS,FP64精度算力為10.1 TFLOPS;三類精度下,深算二號的算力分別為49 TFLOPS、23 TFLOPS、10.2 TFLOPS。通過對比,海光深算二號在FP16與FP32精度下算力低于英偉達H20,但在高精度FP64的算力優于H20。
值得一提的是,據招股說明書,海光深算一號售價為1.93萬元,低于英偉達A100的5萬元,依次推算,海光深算二號售價大概率低于英偉達的H20,主打高性價比。
對于GPU來說,產品性能是一個門檻,另一個重要門檻是易用性,這涉及到生態問題,國外大廠經過多年的發展,已經形成了比較強的生態。
相對樂觀的是,國內科技企業正在積極適配國產芯片。據路透社消息,百度為200臺服務器訂購1600顆華為昇騰910B芯片。2023年11月8日,在世界互聯網大會烏鎮峰會上,360集團創始人周鴻祎表示,360將采購華為1000片左右AI芯片,并與華為合作將AI框架移植到昇騰910B上。
2023年11月6日,寒武紀也對外表示,思元系列云端智能加速卡與百川智能旗下大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面適配,昆侖芯、摩爾線程等公司新品也持續迭代,國產GPU進入高速發展階段。
當然,國內AI芯片廠商在發展的過程中也存在一些問題,例如國產AI芯片多采用NPU架構,例如華為昇騰、寒武紀等,NPU架構的優點在于體積小、功耗低、平均性能強,但其問題在于前期投入成本高、不可編輯,且技術風險較大。