楊 惠 李 韜 劉汝霖 呂高鋒 孫志剛
(國防科技大學計算機學院 長沙 410073)
(huihui19870124@126.com)
隨著裝備智能化、信息化的發展,衛星、艦船等移動高端裝備亟需具備高算力的集中式計算平臺[1]為數據采集、計算、處理、分發提供統一的基礎支撐[2-3].然而,移動高端裝備在體積、重量和功耗等方面受到諸多限制.
在受限條件下,移動高端裝備集中式計算平臺要求承載異構資源互連的交換網絡具有3方面的敏捷交換能力:1)高能效、低功耗交換,以滿足平臺部署在空間、散熱等方面的要求;2)端到端的系統級解決方案,降低平臺開發部署復雜度,實現網絡透明化;3)卸載加速能力,有效減輕計算資源的負載,提升系統整體算力.現有商用網絡交換芯片,如Broadcom、盛科[4]等,主要面向數據中心、園區網、企業網等大規模固定網絡,出于市場與成本考慮,更強調實現豐富的功能協議集合,支持大規模、高性能的網絡交換,難以滿足高能效、低功耗等敏捷連接需求.最重要的是,基于商用網絡交換/網卡芯片構建集中式計算平臺,需集成多芯片廠商的驅動、交換及網卡芯片,定義網絡管理軟件、網管代理通信接口和協議,驅動適配和調試工作繁瑣復雜,用戶開發難度大.
國防科技大學計算機學院針對上述問題,提出了基于以太網的低功耗、端到端敏捷交換解決方案,主要包括系列化敏捷交換芯片、端適配器和網絡控制器.作為系列化敏捷交換芯片中的一款多萬兆數據交換芯片,HX-DS40針對集中式計算平臺異構資源的敏捷互連需求,在架構、功能上進行了深入優化,實現了協議無關轉發架構和基于應用標記的交換功能,從而支持應用層精細交換和異構資源統一連接,可為打造下一代移動高端裝備的高能效、低功耗、高算力集中式計算平臺提供有力支撐.
國產銀河衡芯敏捷交換芯片HX-DS40如圖1所示,于2020年7月流片成功,采用324引腳塑封BGA封裝,尺寸15 mm×15 mm,焊球節距0.8 mm,典型功耗1.6 W.HX-DS40提供4個萬兆以太網接口和4個千兆以太網接口,支持全端口線速轉發交換處理.支持基于10 GBASE-R/KR背板傳輸協議的板間高速互連.此外,HX-DS40具備多種應用模式,包括獨立應用模式、協處理模式以及堆疊擴展模式等.

Fig.1 HX-DS40 chip圖1 HX-DS40芯片
HX-DS40支持基于L2-L7協議以及用戶自定義協議的分組交換、應用層交換與卸載加速、輕量化管理控制功能.
1)協議無關轉發.HX-DS40采用協議無關網絡轉發處理技術,支持基于L2-L7協議的分組交換和自定義轉發,可有效支撐通專結合網絡協議的高性能轉發處理.
2)應用層交換與卸載加速.HX-DS40提供超寬位搜索匹配引擎,支持寬度超600 b的關鍵字搜索,從而可實現基于應用層信息的交換;此外,基于元數據的分組交換結構,可以有效實現網絡查表搜索功能的卸載與加速,減輕CPU網絡處理負載.
3)輕量化管理控制.HX-DS40提供以太網、SPI和I2C輕量化管理配置接口,支持通過外置EPLD,EEPROM等方式的管理配置,從而避免集成復雜CPU配置系統.
商用以太網交換芯片,通常面向數據中心等大規模固定網絡交換需求,強調匹配引擎的表項數目、功能及協議的豐富程度[5],支持百萬級流量的轉發、交換管理.敏捷交換芯片更多針對移動高端裝備集中式計算平臺的設計需求,強調高能效、低功耗,以提供空間、散熱受限條件下的高效敏捷連接;強調匹配引擎的表項寬度,以提供上層的精細化流量識別和交換管理;強調平臺異構資源的統一連接和卸載加速,為上層業務應用提供統一的數據交互,支撐業務優化.
1)高能效與低功耗
與數據中心等固定平臺信息處理裝備不同,機載、車載、艦載等移動裝備平臺通常采用小型VPX、CPCI單板或多槽機箱形式集成計算、加速等資源,在供電、散熱等方面要求高,高能效、低功耗的敏捷交換芯片具有更廣泛的應用.HX-DS40采用高效能、低功耗的體系結構優化等設計方法,44 Gbps(單向)吞吐率下功耗為1.6 W.與應用廣泛的某國產120 Gbps以太網交換芯片相比,性能功耗比提升3倍以上(27.5 Gbps/W與7.5 Gbps/W).
2)應用層交換
商用以太網交換芯片(如BCM53346,CTC5160等)通常支持L2~L3端到端的交換,缺乏根據目的主機應用需求動態交換數據的能力.部分以太網交換芯片提供L4交換功能,允許用基于目的地址、目的端口號(應用服務)的組合進行流量管理.然而,對于流量負載均衡,感知到端口業務數據是流媒體還是XML等數據對象請求,對規劃系統處理資源非常關鍵.移動高端裝備集中式計算平臺主要承載Web服務以及分布式計算業務,因此,實現基于HTTP請求、Cookie等的應用層交換,對保證不同類型內容的流量差別及策略服務,以及實現對傳輸流和內容的精細控制極為重要.應用層交換可為負載均衡、內容緩存等優化技術提供基礎支撐.
3)統一連接與卸載加速
算力提供是面向移動國產高端裝備中集中式計算平臺構建的核心目標.集中式計算平臺在有限集成度限制內,提供高算力的方法主要依賴于異構計算資源集成以及卸載加速.敏捷交換芯片通過定義和支持基于統一元數據格式的連接,可以實現異構資源的統一連接,為上層業務應用提供統一的數據交互與計算處理接口和模型.此外,協議無關的模塊化深度流水交換架構可以有效卸載網絡分組的解析、查表、動作等耗費CPU的功能及操作,從而避免網絡處理對CPU算力的占用.
敏捷交換芯片HX-DS40采用基于集中緩存的模塊化深度流水交換架構,如圖2所示.作為I/O密集型芯片,采用集中緩存結構可以有效降低分組數據搬移造成的動態功耗.模塊化深度流水架構能夠有效提升芯片的處理性能和可擴展性,為形成高中低端系列化敏捷交換芯片提供架構支撐.

Fig.2 The architecture of HX-DS40圖2 HX-DS40架構示意圖
作為敏捷交換芯片的核心引擎,通配及精確匹配引擎設計采用了相關的優化設計技術,以滿足移動高端裝備平臺的特殊要求.
1)基于通用存儲的超寬通配匹配引擎.采用基于SRAM+寄存器混合的通配匹配實現技術,相對于傳統基于TCAM器件實現方式而言,在能耗、搜索寬度、可擴展性方面更具優勢,可有效支撐應用層交換和卸載加速需求.
2)基于Bucket的改進精確匹配引擎.基于并行Cukoo Hash解決匹配沖突問題.此外,通過增加基于Bucket的通配匹配能力,擴展了精確匹配引擎對通配規則的支撐能力,有效提升了精確匹配引擎的靈活性.在資源受限情況下,實現了敏捷交換芯片對于通配匹配能力的擴展需求.
基于銀河衡芯敏捷交換芯片HX-DS40構建了面向移動裝備的嵌入式超算原型系統,如圖3所示.嵌入式超算原型系統中,HX-DS40實現了通用多核CPU、高性能FPGA等異構計算及加速資源的統一連接,形成了面向應用的卸載加速能力.基于該原型系統,對敏捷交換芯片的線速轉發、功能卸載等能力進行驗證,測試HX-DS40吞吐率和加速卸載處理延遲.由100 Gbps網絡測試儀構建長度為64~1 518 B的以太網報文,接口線速連接HX-DS40的4個萬兆接口與4個千兆接口,原型系統中配置匹配表項進行接口轉發,并進行報文收發數量統計.如圖4所示,針對不同大小的報文的吞吐率測試結果表明,HX-DS40可滿足報文線速處理需求.另外,配置嵌入式超算原型系統中HX-DS40的加速卸載路徑,由網絡測試儀構建長度不同的以太網報文,報文經由HX-DS40的一個萬兆接口,進入加速卸載路徑從另一個萬兆接口轉發至網絡測試儀,測試儀測算路徑延時,獲取HX-DS40的加速卸載延時.查表加速卸載延遲實驗表明,隨著報文尺寸的增大,加速卸載延遲有所增加,最大不超過3.275μs.然而,由于查表加速應用中關鍵字通常不超過76 B(即64 B+12 B),查表結果不超過64 B,分組頭部開銷34 B,因此報文長度一般不超過174 B.根據延遲測試結果,查表加速延遲通常可控制在1μs延遲內.

Fig.3 Embedded supercomputing prototype system based on HX-DS40圖3 基于HX-DS40構建的嵌入式超算原型系統

Fig.4 Performance analysis based on prototype system圖4 基于原型系統的性能分析