倪光南
計算、存儲、網絡技術都是信息領域的關鍵核心技術,是建設科技強國的戰略支撐.當前,隨著人工智能、物聯網等新一代信息技術在新一輪科技革命和產業變革中蓬勃興起,數據已成為數字經濟時代的核心資源和生產要素,算力開始成為科技強國重要的基礎設施,成為人工智能時代科技發展和全球數字經濟競爭的高地.
算力主要體現為數據的處理能力.這里我們提出廣義算力的概念,廣義算力是由算力、存力和運力(即信息計算力、數據存儲力和網絡運載力)三者融合而成,構成了支撐數字經濟發展的引擎.
根據國際權威數據分析研究機構IDC預測,從2018年到2025年,全球數據量將從33ZB增至175ZB,其中,我國的數據量將從7.6ZB增至48.6ZB,躍居為全球第一.正是在這種大背景下,我們在建設信息技術基礎設施中,要高度重視未來算力、存力和運力為支撐的數據基礎設施底座建設.
所謂存力,是以數據存儲為核心,包含性能表現、安全可靠、綠色低碳在內的綜合數據存儲服務能力,是激活數據要素的核心動能.存儲歷來是一個高度壟斷性的行業.從全球市場份額來看,DRAM市場是三星、美光、海力士的三分天下,閃存(NAND Flash)市場被三星、鎧俠、西部數據、美光、海力士5家所瓜分.由此可見,今后中國數據存儲產業必須打破外國跨國公司的壟斷,才能爭得自己的一席之地.
近日,工信部、中央網信辦、教育部、國家衛健委、中國人民銀行、國務院國資委6部門發表《算力基礎設施高質量發展行動計劃》(以下簡稱《計劃》).《計劃》認為:算力基礎設施是新型信息基礎設施的重要組成部分,呈現多元泛在、智能敏捷、安全可靠、綠色低碳等特征,對于助推產業轉型升級、賦能科技創新進步、滿足人民美好生活需要和實現社會高效能治理具有重要意義.
《計劃》要求加強計算、網絡、存儲和應用協同創新,推進算力基礎設施高質量發展,充分發揮算力對數字經濟的驅動作用.本文著重分析廣義算力(算力、運力、存力)中,存力的高質量發展問題,這正是當前中國半導體產業發展的一個重大機遇和挑戰.
AI大模型現正走向千行萬業,據估計未來2年將落地50%+的行業場景.當前,生成式AI正在從基礎大模型發展到行業模型,并將深入到無數應用場景.顯然,在不同層面上對算力的要求是不同的,例如AI在行業和應用場景層面上,更多的需求是推理,如何提升推理效率至關重要.
實際上,目前大模型的發展已使算力供不應求.如按目前生成式AI對算力和內存的需求推算,算力和內存的增長倍數將需要分別達到750倍/2年和450倍/2年的巨大數目,這顯然是難以達到的,應當另辟蹊徑.
近期有研究發現,知識庫加持大模型可以顯著提升模型參數的效果,例如采用60億參數的GPT模型+知識檢索后,其準確性可超過1750億參數的GPT3模型.人們看到,AI行業巨頭如微軟、AWS、Google等等都紛紛推出了RAG(知識檢索增強生成)方案,減輕了生成式AI對算力和內存的壓力.
采用這種方案,用戶向AI提出的問題將首先轉為問題查詢(有一個“小模型”就可支持),如果搜索命中,問題就解決返回了,如果未命中則繼續查詢,針對模型構建提示并通過推理返回答案(這可能需有較大模型的支持).上述基于小模型+知識庫,運用RAG輔助的AI生成技術,可望大幅降低AI在行業和場景推理應用方面的算力消耗,是值得關注的動向.
綜上所述,根據中國數據存儲產業的現狀及發展趨勢,特提出以下建議供參考:
第一,均衡配置“算力”與“存力”,克服當前算力建設中“重算力輕存力”的傾向.
當前隨著人工智能的發展突飛猛進,我國各地興起了AI算力中心建設熱潮,旨在為AIGC提供強大算力.不過人們往往將算力簡單地理解為“計算力”,而實際上真正的算力或稱之為“廣義算力”,應由3部分組成:即算力、存力和運力.為取得最大的經濟社會效益,三者應當均衡配置,不能偏廢失調.
第二,提高“存力”中先進存力的比重,適時啟動以固態硬盤SSD取代機械硬盤HDD的存儲革命.
我國數據存儲產業存在對新興先進數據存儲技術支持不足.迄今為止,機械硬盤HDD占據了我國存儲領域近80%的存量市場,可是我國HDD產業卻接近空白,早期沒有布局,該市場一直被美國希捷/西部數據、日本東芝3家廠商所壟斷,這意味著我們存在著嚴重的“卡脖子”風險.鑒于我國HDD產業基礎差,再加上目前HDD技術本身已經落后,并逐步走向衰弱的事實,我國應盡快轉向先進的半導體存儲技術,盡快從國家戰略層面在半導體存儲領域啟動以“固態硬盤SSD全面取代機械硬盤HDD的計劃”.目前SSD在性能、效率、節能、可靠性等方面已全面超越HDD,即使在價格方面,預計到2026年左右,SSD也將優于HDD.為避免科技強國建設中存儲技術再次受制于人的風險,應當急起直追.
第三,我國數據存儲產業已基本具備國際競爭力,通過雙循環拉動有望成為中國的又一出海新名片.
在多年自主創新的基礎上,我國新型半導體存儲產業取得了重大發展,基本上達到了自立自強的要求.這一產業鏈的上游包含NAND Flash(SSD顆粒)、SSD主控芯片和DRAM(內存),中游包含存儲整機和存儲系統,下游為應用與服務.
在產業鏈上游,長江存儲的NAND Flash和長鑫存儲的DRAM芯片已經達到全球主流的水平和生產能力;在SSD主控芯片方面,國內已經有十幾家廠商的產品得到商用,產品能力與國外主流廠商持平.應當指出,生產NAND Flash存儲芯片的核心設備是刻蝕機,中微公司的刻蝕機已經突破5nm工藝,達到國際領先水平.生產SSD主控芯片和DRAM的光刻機工藝為12~28nm,都不需要用到EUV光刻機,所以其芯片生產和裝備基本上不會被卡脖子.
在產業鏈中游,我國存儲整機的核心能力和競爭力構筑在自主的核心存儲芯片、系統架構和軟件之上,也已具備國際領先技術水平.例如華為數據存儲在2022年全球存儲市場排名第二(僅次于DellEMC)并進入國外金融等關鍵行業市場,成為國際頭部存儲整機廠商.由此可見,我國新型存儲技術和產業在實現國產化的情況下已經具備了國際競爭力,今后如能通過國家政策引導、政府扶持,雙循環拉動,能將產業迅速擴展規模,提升性價比和營銷服務能力,有望成為IT領域的新型“5G”產業,成為中國出海的又一新名片.
為了不失時機地推進中國存儲產業的發展,茲提出以下幾點意見供參考:
1) 產業發展,標準先行.切實貫徹落實《計劃》,為推進算力中心的高質量發展,確立“算力”與“存力”的適當比率,在“存力”中采用SSD先進存力的適當比率,達到算力、存力、運力的均衡部署,均衡發展.
2) 政策引導,力推SSD取代HDD.在算力中心等的存儲設備采購、招標等中,應優先支持SSD,不得以單一價格指標作為評標依據;重要基礎設施的存儲設備應引導或指定采用國產SSD,促進國產SSD替代進口HDD的存儲技術變革.
3) 安全測評,公平公正.美光未通過中國政府對其的安全審查,為國產數據存儲產業發展提供發展窗口期.存儲領域應以此為契機,重視對存儲產品的安全審查,包括供應鏈安全、信息安全、數據安全等等.尤其是對于存儲整機、主控芯片、存儲文件系統等關鍵核心技術,建議參照信創工作經驗,實施“自主可控測評”,根據第三方測評機構給出的自主可控測評分值作為選擇依據.
4) 千秋大業,人才為先.重視高校存儲產業人才培養.存儲產業為技術密集型產業,產品研發需要大量具有存儲技術研發能力的人才,目前國內僅有10+高校開展存儲領域研究,領軍教授10+,博士隊伍100+,碩士不足300人.這與中國整個存儲產業和應用市場顯然是不匹配的,急需在高校增設存儲專業、課程、實驗室等,擴大存儲人才培養規模,并從收入、激勵機制、基本公共服務等多角度訂立新的人才政策,吸引并聚集國內外優秀人才.
5) 集聚產業,協同攻關.建議在國家科技攻關計劃和相關產業鏈中設立存儲專項,組織國內產學研用各界聯合攻關,實現全產業鏈風險可控;成立存儲國家實驗室、國家級科創平臺等,開展前沿技術研究,形成原創性成果,提升國產存儲全球技術競爭力.
綜上所述,鑒于數據存儲在現代科技中的重要地位,我國應抓住中國數據存儲業面臨的重大機遇和挑戰,盡快實現關鍵核心技術攻關,用好國內超大規模市場優勢,迅速形成產業規模,為數字中國建設保駕護航.