鄭子亨
2019年6月4日,谷歌公司發(fā)布了用于執(zhí)行張量網(wǎng)絡計算的開源庫Tensor Network。Tensor Network使用谷歌開源機器學習框架Tensor Flow作為其底層工具,提高了張量網(wǎng)絡計算的可行性和計算效率,使張量網(wǎng)絡計算在GPU上的計算效率提高了100倍。張量網(wǎng)絡計算最早被應用于量子物理、量子化學中,此次谷歌Tensor Network 開源庫的發(fā)布不僅為量子領域?qū)W科研究者提供了強大的計算機工具,也給張量網(wǎng)絡在機器學習中應用提供了可行性和硬件加速方法。
背景
現(xiàn)有計算模式無法滿足量子計算模擬需求。隨著量子理論的不斷發(fā)展,量子計算邊界條件越來越復雜,現(xiàn)有的密度泛函計算只能處理相互作用比較弱的系統(tǒng),如半導體系統(tǒng)和簡單金屬系統(tǒng)。張量網(wǎng)絡計算能夠?qū)α孔訝顟B(tài)進行更好的模擬,對高量子糾纏系統(tǒng)進行準確計算,越來越廣泛地被應用于高溫超導體、凝聚態(tài)物理學、量子化學、統(tǒng)計力學等學科中。在機器學習領域,計算硬件設備不斷迭代更新,想要充分開發(fā)利用處理器的計算性能,計算模式需要更加抽象來超越現(xiàn)有的二維矩陣運算,張量網(wǎng)絡計算可以突破該瓶頸。近幾年,針對張量網(wǎng)絡在機器學習領域應用的研究成果大量涌現(xiàn),已經(jīng)證明張量網(wǎng)絡與卷積神經(jīng)網(wǎng)絡之間存在極大的關聯(lián),張量網(wǎng)絡計算未來有望與卷積神經(jīng)網(wǎng)絡并駕齊驅(qū)。
Tensor Flow為Tensor Network奠定技術基礎。Tensor Flow是谷歌公司推出的一個使用數(shù)據(jù)流圖進行數(shù)值計算的開源人工智能軟件庫,于2015年10月宣布開源。Tensor Flow提供了豐富的構建和訓練機器學習模型的API 庫,支持卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡、長短期記憶網(wǎng)絡等深度神經(jīng)網(wǎng)絡模型。在Tensor Flow中,張量的概念以多維數(shù)組的形式首次被引入機器學習領域,隨著谷歌對Tensor Flow的不斷完善改進,Tensor Flow成為機器學習領域最受歡迎的基礎框架,給人工智能企業(yè)及研究機構提供了開源工具庫,對于谷歌公司人工智能生態(tài)構建及其產(chǎn)品化加速起到了推進作用。
開源成為全球IT行業(yè)公認的重要創(chuàng)新方式。開源可以大大節(jié)省軟件開發(fā)的時間、人力成本,并有利于技術的推廣和發(fā)展。谷歌開源戰(zhàn)略布局已久,在開源平臺、開源軟件、開源語言等方面進行了深入的建設,其中Android、Tensor Flow、Spark等都在各自領域占有統(tǒng)治地位,此次Tensor Network開源庫的發(fā)布使谷歌在張量網(wǎng)絡計算方面搶得先機。在谷歌的帶領下,許多抵制開源的軟件巨頭也逐漸接受并進行開源戰(zhàn)略布局。微軟于2018年10月26日宣布對開源代碼托管平臺GitHub的交易正式完成,交易額為75億美元。IBM于2019年6月29日獲得歐盟無條件批準,以340億美元收購開源解決方案提供商紅帽(Red Hat)。開源平臺使企業(yè)得以圍繞自身產(chǎn)品快速構建應用開發(fā)者生態(tài),同時引導產(chǎn)業(yè)和技術演進路徑及方向,從而把控標準、專利等產(chǎn)業(yè)核心話語權。
案例介紹
事件描述。2019年6月4日,谷歌公司發(fā)布了以Tensor Flow為底層框架的開源庫Tensor Network,該產(chǎn)品是為了提高張量網(wǎng)絡計算的可行性和計算效率,并且最大化GPU的運行速度。在發(fā)布Tensor Network的同時,谷歌公司發(fā)表了一系列的論文對其功能以及在其他領域的可應用性進行了介紹和解釋。在Tensor Network中,張量的概念可以簡單的理解為高階數(shù)組或高階矩陣,其運算方式與普通矩陣相同,這大大降低了沒有量子理論學習經(jīng)歷的開發(fā)者的使用難度。谷歌表示,由于其高階特性,張量很難用普通計數(shù)法進行表示,使用圖解記數(shù)法是非常有用的,更容易表示張量的收縮。
后續(xù)發(fā)展。谷歌表示,有論文對Tensor Network進行了簡單的介紹并給出了實際物理應用案例。后續(xù)的論文中,將講述Tensor Network在機器學習中的應用, 如在MNIST和Fashion-MNIST圖像庫上執(zhí)行圖像分類算法,在其他領域延伸上還將包括時序分析、量子電路仿真等。谷歌研究人員希望Tensor Network能真正成為物理學家和機器學習從業(yè)者的寶貴工具。
簡評
Tensor Network開源庫給張量網(wǎng)絡計算的大規(guī)模應用注入新動力。在量子領域,張量網(wǎng)絡計算被提出用于處理高量子糾纏系統(tǒng),但在被提出的很長一段時間中處于瓶頸期,目前已有的用于加速硬件的生產(chǎn)級張量網(wǎng)絡庫還不能用于大規(guī)模運行張量網(wǎng)絡算法,而谷歌Tensor Network有望突破張量網(wǎng)絡計算應用的瓶頸,將張量網(wǎng)絡計算大規(guī)模應用于凝聚態(tài)物理、量子化學、量子引力等量子領域。在機器學習方面,Tensor Network的出現(xiàn)顛覆了原有的基于線性代數(shù)的神經(jīng)網(wǎng)絡計算體系,并且實現(xiàn)了張量網(wǎng)絡計算在GPU上的加速,張量網(wǎng)絡計算在機器學習方面的大規(guī)模推廣和應用指日可待。
開源生態(tài)建設對我國信息技術發(fā)展意義重大。開源平臺已經(jīng)成為數(shù)字時代的重要基礎設施。發(fā)達國家科技巨頭借助開源力量能夠?qū)ζ渥陨懋a(chǎn)品進行完善,提升與下游公司及開發(fā)者的合作黏性,構建更為完整的產(chǎn)業(yè)生態(tài),強化自身話語權。我國企業(yè)近幾年逐步重視開源布局,涌現(xiàn)了一批開源平臺、開源庫等,但因?qū)τ诤诵募夹g、開源規(guī)則掌握不足,響應者較少,發(fā)展較為緩慢。目前國內(nèi)公司及開發(fā)者習慣于使用國外開源平臺,一旦國外公司對開源平臺進行管控,我國將面臨由于平臺遷移帶來的巨額成本,并存在產(chǎn)業(yè)供應鏈安全的巨大隱患。建議加快營造國內(nèi)開源氛圍,鼓勵企業(yè)發(fā)展開源平臺、開源社區(qū)等開發(fā)模式,提升我國企業(yè)在全球主流開源生態(tài)中的貢獻度及話語權,實現(xiàn)由參與者向貢獻者再到構建者的升級。