文/王 剛
2017年,百度董事長兼CEO 李彥宏乘坐無人車開上五環,收到無人車歷史上第一張罰單。4個月后,北京自動駕駛新規出臺。這一幕非常具有戲劇性,但我們也看到百度成為AI 之路上的一個“狠角色”。如果說,從2000年的那個元旦開始,最初的10年,百度依靠著李彥宏的搜索引擎專利技術,在中國互聯網版圖上打下了一片江山;那么后10年,可謂是百度悄悄屯兵AI,逐漸讓“行業氣候”變化的10年,并且在語音、視覺、語言等領域提前占據最好的跑道。到今天,AI 經歷過三起三落,成為顯學,乃至催生“第四次工業革命”,勢能強大,而百度則給了AI 落地足夠多的場景,在產業智能中檢驗AI 的實用性,可謂是互相促進的典例。這些,都收錄在百度官方曬出的2019年AI“成績單”中。正如李彥宏所說:“數字經濟在經歷了PC的發明與普及、PC 互聯網、移動互聯網這3個階段后,正在進化到以人工智能為核心驅動力的智能經濟新階段,智能經濟將給全球經濟帶來新的活力,是拉動全球經濟重新向上的核心引擎?!?/p>
有人曾在這個新時代來臨之前,就喊出了“技術!技術!技術!”這樣的口號。技術會改變所有生意的模式,改變著社會的歷史進程。于是,技術由內向外、技術由底座到平臺的升維、技術由表面進入核心地帶,幾乎成為所有商業領袖一致瞄準的“靶心”,誰能射中?大環境不太妙的2019年,AI 這支箭是否可以逆風而上?百度,在AI 上似乎給了一個很好的答案,鋪陳到今天風起云涌的商業版圖上一看,既新鮮到讓你驚訝,又硬核到讓你不得不服。百度CTO 王海峰說,2019年,百度探索了AI進入工業大生產的真實路徑,推動AI 邁入自動化、標準化和模塊化的新階段,并與百度業務以及各行各業的生產實踐深入結合,加速了產業智能化的進程。于是,我們試著回首這300多天百度AI 的成績,發現了很多不偏不倚、滿滿十環的例子。比如:百度大腦的算法、算力取得突破,成為“軟硬一體AI 大生產平臺”;AI 進入百度核心業務,百度智能云承載了“云+AI”的野心;推動了AI 倫理建設等。2019年,中國人工智能專利申請量排名中,百度以5712件位列第一,并包攬了深度學習技術、語音識別、自然語言處理、智能駕駛等多個人工智能核心領域第一。在百度2019年舉辦的AI 開發者大會上,百度大腦全面升級為5.0,成為軟硬件一體的AI 大生產平臺。在算法突破和計算架構升級的基礎上,百度大腦5.0進行算法、計算架構與應用場景的重構。

有哪些最頂尖的技術冒了出來?語音識別方面,百度提出流式多級的截斷注意力模型 SMLTA,在國際上首次實現流式注意力建模超越整句注意力模型的性能,也是國際上首次實現在線語音識別大規模使用注意力模型。語音合成方面,針對風格遷移、音色模擬和情感擬人的三大挑戰,百度推出語音合成技術Meitron,將聲音中的音色、風格、情感等要素映射到不同的子空間里,在使用時,不同的要素任意組合,靈活控制合成語音的風格。“百雀靈計劃”就是百度地圖推出的全球首個地圖語音定制功能。視覺技術方面,百度已經形成了包括圖像、視頻、AR/VR、重要垂類、軟硬一體化五大方向的特色視覺技術矩陣。OCR、物體檢測、視頻理解、目標跟蹤等業界領先的圖像與視頻技術多次在國內外頂級賽事中取得佳績,例如在“CVPR 2019”就取得了10項冠軍,并已在機械制造、金融、醫療、教育等領域得到了廣泛的應用。NLP(自然語言處理)方面,百度打造了知識增強語義理解框架ERNIE,通過建模海量數據中的實體、概念等先驗知識,學習真實世界的語義關系。融合知識的語義建模大幅增強模型的語義表示能力,在共計16個中英文任務上超越BERT、XLNET,取得SOTA 效果。2019年12月,ERNIE 在自然語言處理領域權威數據集GLUE 中榮登榜首。
據了解,基于百度飛槳研發的AI 控制系統,百度在建的云計算中心將擁有超大型神經網絡、超大規模高性能計算集群,設計年均PUE1.15,基礎設施能耗降低70%,每個可用區每年節電超過2億度,相當于10萬戶居民一年的用電量。作為百度AI to B 的重要承載者和輸出者,百度智能云基于百度自主研發的中國首款云端全功能AI 芯片“昆侖”的云服務器正式上線。這個云服務器在150瓦功耗下能帶來260萬億次定數的AI 運算,并且提供一套圖編譯框架XTCL,在支持百度飛槳等主流深度學習框架上表現優異。在國內云廠商中,百度智能云單季度營收突破10億用時最短,穩居中國公有云市場前列,并在互聯網、金融、智能城市、工業制造等行業已經擁有標桿性落地案例。此外,2019年7月,專為遠場語音交互打造的百度鴻鵠芯片流片量產。鴻鵠芯片采用雙核HiFi4架構,2.8M 大內存,臺積電 40nm 工藝,在此硬件規格上,100mW 左右平均工作功耗,即可支持遠場語音交互核心的陣列信號處理和語音喚醒能力,為車載語音交互以及智能家居等場景帶來不少想象力。
AI 技術之于百度,是邊界擴充的利器,也是其完整生態里最核心的樞紐。2019年,小度助手5.0的對話能力迎來了重大技術革新——全雙工免喚醒能力,實現了“一次喚醒,多輪交互”免喚醒詞連續對話。在7月的百度AI 開發者大會上,李彥宏親自做了演示。2019年,百度合成虛擬形象技術結合多模態識別與理解、面部、肢體和嘴型生成、GAN、TTS 等技術,實現了業界首個可以量產視頻的真人形象虛擬主播。此外,浦發銀行還與百度合作打造了業內首個“金融數字人”,擁有顏值、情感和專業的銀行知識。2019年,利用百度3D 視覺技術,機器人可以對茶杯的位置進行檢測和追蹤。通過機器人運動規劃和控制,機械臂可以對工作空間進行碰撞檢測,避開障礙物。機器人更接近于人了。在CVPR 2019上,百度Apollo 公開了國內唯一的純視覺L4級自動駕駛解決方案——百度Apollo Lite,能夠支持對10路攝像頭、200幀/秒數據量的并行處理,單視覺鏈路最高丟幀率能夠控制在5‰以下,實現全方位360°實時環境感知,前向障礙物的穩定檢測視距達到240米。截至目前,百度L4級別自動駕駛城市道路測試里程已經突破300萬公里,已在23個城市進行測試,智能汽車專利1237項,位列全國第一。此外,百度自動駕駛路測牌照總數達到150張,占中國全部獲批自動駕駛路測牌照一半以上。當然,百度搜索、百度地圖、百度輸入法、百度智能小程序都是AI 加持的不同場景。

令百度驕傲的幾個數據是:自2016年以來,百度至今已經開放了228項領先AI 能力,開發者數量超過150萬,日均調用量突破1萬億次,語音、人臉、NLP、OCR 調用量中國第一。另外,百度的代表作“飛槳”在2019年徹底火了。據IDC 報告顯示,百度飛槳與谷歌、Facebook 名列前三,領銜中國深度學習平臺市場,也是市場份額前五名中唯一的國貨。據了解,從2012年起,百度就開始研究和應用深度學習,后來經過開源,飛槳平臺才在滿足開發者和產業界越來越復雜的需求方面發揮重要作用。目前,百度AI 落地最領先的Apollo 自動駕駛,也有很多開源項目。截至目前,百度Apollo 平臺已經匯聚了全球177家生態合作伙伴。在全球,有97個國家超過3.6萬名開發者使用Apollo 開源代碼,開源代碼數量超過56萬,Apollo 自動駕駛平臺已成為全球最強大、最開放、最活躍的自動駕駛平臺。過去一年中,小度技能開放平臺上的技能開發者數量已經超過3.7萬人,包含了游戲、效率工具、網絡電臺、直播、兒童教育、智能家居等3500多種技能支持。到今天,小度助手可以控制的IoT 智能家居設備已經超過了7000萬。除此之外,百度宣布將百度智能邊緣計算框架BAETYL 捐贈給社區,BAETYL 成為中國首個開源的邊緣計算框架,還宣布將國人自研的底層區塊鏈技術XuperChain 正式開源。
在強調科技倫理、科技向善的2019年,我們也看到AI 已經走到了最大眾化的層面。在“百度AI 尋人”平臺,用戶發起照片比對接近40萬次,9000多個走失者與家庭重新團聚。百度APP 全面上線“百度AI 垃圾分類”智能小程序,基于百度AI 視覺和語音能力,通過語音搜索或識圖搜索,就可以幫助用戶方便快捷地對垃圾進行分類。此外,AI 手語翻譯、AI 臺風路徑查詢、瀕危土家語保護、AI 改造視障者按摩院都是一個個接地氣的技術產品,最終將完全融入社會整體的脈絡之中。這依然是一個技術主導的世界,我們追索,我們暢想,并期冀用科技讓復雜的世界更簡單。這也是一個技術轉型的大時代,時代叢林里的飛禽走獸、花草植被都在迎接新的太陽。而AI,沒有身體,沒有聲音,沒有相貌,卻無處不在,以AI 技術為核心驅動力的第四次工業革命的大幕正在拉開。