施然
第三方研究機構OpenAI近期發布的研究顯示,僅2012年以來,人們對于算力的需求增長六年就超過30萬倍,平均每年增長10倍,遠超摩爾定律的發展速度。
面對AI算力需求的爆發式增長,華為作為AI的后入局者,大膽提出要為業界提供“易獲取、用得起、方便用”的算力。如今,距離AI戰略提出一年,華為是否已經找到算力破局的入口?
這也是今年9月舉行的2019華為全聯接大會備受矚目的重要原因。
17世紀后期,英國采礦業,特別是煤礦,已發展到相當的規模,單靠人力、畜力已難以滿足排除礦井地下水的要求,現場又有豐富而廉價的煤作為燃料。現實的需要促使人們致力于“以火力排水”的探索。1769年英國人詹姆斯·瓦特制造了蒸汽機,引起了18世紀的第一次工業革命。
100年后,美國人發明和實現了電力的廣泛使用,引領了19世紀的第二次工業革命。1946年,世界第一臺二進制計算機的發明,人類在20世紀進入了第三次工業革命,信息技術的發展尤其是移動互聯網的普及極大地改變了人類的生活。
進入21世紀,人類正在迎來以智能技術為代表的第四次工業革命,人工智能、物聯網、5G以及生物工程等新技術融入到人類社會方方面面;驅動全球宏觀趨勢的變化,如社會可持續發展、經濟增長的新動能、智慧城市、產業數字化轉型、消費體驗等。
人工智能是一系列新的通用目的技術(GPT),包括自然語言處理、圖片識別、視頻分析等。人工智能是信息化進程的新高度,信息技術帶來了效率的提升,人工智能則帶來生產成本的變化。行業+AI,人工智能將會改變每個行業、職業、組織、家庭和個人。

搭載了麒麟990芯片的華為Mate30手機
時代又仿佛回到了對采礦行業非生物動力需求極大的17世紀。進入21世紀,人工智能也對算力提出了強勁的增長需求,按照OpenAI最新的分析,從2012年到2018年,最大的人工智能訓練運行中使用的算力增長了30多萬倍,每3.5個月就會翻倍,遠超摩爾定律的增長速度(每18個月芯片的性能翻一倍)。AI算力需求的急劇增長與傳統CPU算力緩慢提升(每年10%)之間存在巨大矛盾,全球掀起造芯運動,加速算力成本降低和AI應用普及。
人工智能是時代潮流,潮流不可逆。但從2018年開始,全球包括中國在內,人工智能研究和產業的發展短暫地束了高速奔跑的節奏,進入一個相對平穩的周期。算力的稀缺和昂貴在一定程度上制約了當前的人工智能發展,易獲取、用得起、方便用的算力,是AI產業發展的關鍵。
此時回顧過去的5年到10年間人工智能產業化的經驗可以得知,技術快速商業化的一個重要原因來自芯片處理能力提升、云服務普及以及硬件價格下降的并行使得計算力大幅提升。
過去5年到10年間,算力投資最大的行業集中在互聯網、政府、金融制造業和電信業。更多的行業受制于算力提升而難以使用上人工智能為代表的新技術。
只有解決了這個問題,才能推動人工智能產業進入下一個快速發展周期。
在中國,基于人口規模和經濟的發展程度,在數據和行業應用都在全球處于領先地位。但AI算力資源卻稀缺且昂貴,快速發展的應用和不斷增多的數據量,需要越來越強勁的AI算力。但算力價格貴、使用難和資源難獲取,已經形成了人工智能發展的三大瓶頸。
其一是價格貴:目前人工智能整個訓練的過程,譬如訓練人臉識別、交通綜合治理、自動駕駛,模型的訓練成本非常高昂。
其二是使用難:缺乏一個統一的開發框架,無法適配從訓練到推理,從公有云到私有云、邊緣、終端的多種應用場景,開發、調優、部署的工作量巨大。
其三是難獲取:業界用于AI計算的GPU供貨周期長、限量供應等,導致硬件資源不易獲取。
為了解決這一問題,行業巨頭目前都在著力開發大規模AI訓練芯片,英偉達、Google和華為都推出了自己的AI訓練芯片。英偉達Tesla V100 GPU最高提供125 TeraFLOPS深度學習性能,最大功耗為300瓦特。Google I/O 2018開發者大會上,Google推出了第三代TPU 3.0,最高提供90 TeraFLOPS深度學習性能。華為在2018年10月的全聯接大會上發布了針對AI訓練場景的華為昇騰910AI處理器。昇騰910 AI處理器,是當前計算密度最大的單芯片,適用于AI訓練,可提供256 TeraFLOPS的算力,最大功耗為310瓦特。
華為數十年長期聚焦在ICT基礎設施研發和建設領域,這也令華為可以深刻理解運營商和企業用戶的使用場景,以此為基因,華為的打法是以“高起點”和“全棧全場景”入局AI領域,真正提供普惠的、強大的算力。
芯片領域,需要強調的是華為昇騰系列AI處理器,采用了面向張量計算的達芬奇3DCube架構,該架構面向AI的全新突破性設計,為昇騰AI處理器提供了超強的AI算力,使得芯片具有高算力、高能效、可擴展的優點。
基于統一的達芬奇架構,華為可以支持Ascend-Nano、Ascend-Tiny、Ascend-Lite、Ascend-Mini、Ascend-Max等芯片規格,具備從幾十毫IP到幾百瓦芯片的平滑擴展,天然覆蓋了端、邊、云的全場景部署的能力。
華為輪值董事長徐直軍認為,“達芬奇架構可大可小,從Nano一直到Max、從穿戴設備一直到云,可以全場景覆蓋;我們推出MindSpore的目的就是協同達芬奇架構來面向全場景的。也就是說,在端、邊緣、云都可以訓練和推理,還可以進行相互協同,這是現在其他計算框架所做不到的。”
AI訓練的耗時跟模型的復雜度、數據集和硬件資源的配置是強相關的,在天文研究、自動駕駛訓練、氣象預測、石油勘探等大規模訓練時,硬件資源顯得尤其重要,人工智能的快速發展,得益于硬件和云計算技術的提升,更得益于各個行業數字化帶來的大量的數據來訓練模型。開發平臺要求從原始數據到標注數據、訓練數據、算法、模型、推理服務,實現千萬級模型、數據集以及服務對象的全生命周期管理。
云端計算領域,無智能不成云,全棧發展走向縱深,AI已經成為云的基礎業務,實現云端訓練和推理。在云上部署,支持在線和批量的推理,滿足大規模并發的復雜場景需求。
云、AI、IoT協調使能藍海市場,在智慧家庭、物聯網和車聯網等場景,構建云+AI+IoT的綜合解決方案,開新的人工智能市場。
華為的AI戰略包括投入基礎研究,在計算視覺、自然語言處理、決策推理等領域構筑數據高效(更少的數據需求)、能耗高效(更低的算力和能耗),安全可信、自動自治的機器學習基礎能力;打造全棧方案,面向云、邊緣和端等全場景的、獨立的以及協同的、全棧解決方案,提供充裕的、經濟的算力資源,簡單易用、高效率、全流程的AI平臺。
華為全球產業展望(GIV)報告顯示,全球數據量將從2018年32.5ZB快速增長到2025年的180ZB。對于企業,AI算力需求每三個月增長一倍,AI應用率到2025年將達80%。
此時,華為在算力領域已取得突破,站在了時代風口之上。