趙 然 常軼松 劉 波 劉超偉 陳明宇 張 科
(*中國科學院計算技術研究所 北京 100190) (**中國科學院大學 北京 100049) (***北京控制工程研究所 北京 100190)
隨著云計算、大數據、物聯網等概念的興起,在特定應用場景下(如深度神經網絡處理等),基于圖形處理器(Graphics processinG unit,GPU)、定制專用集成電路(application specific inteGrated circuit,ASIC)、現場可編程門陣列(field-proGrammable Gate array,FPGA)等芯片的異構計算系統相比于單一的中央處理器(central processinG unit,CPU)系統通常能夠達到幾十倍的性能提升[1],異構計算已成為行業發展的重要趨勢之一。然而對于普通用戶來講,開發與部署一個異構計算系統往往需要高成本和長周期的投入。因此,為了追求經濟與效益的最優化,由大型互聯網公司搭建異構計算云平臺并對普通用戶提供云資源的服務應運而生[2]。FPGA云平臺就是常見的異構計算云平臺之一[3,4]。
目前商業FPGA云平臺大多由若干臺x86服務器組成,x86處理器與FPGA節點板卡通過PCIe(peripheral component interconnect express)接口進行管理和數據交互[5]。受限于接口形式,FPGA節點板卡需部署在x86服務器機箱內,而由于單臺x86服務器機箱尺寸及主板PCIe接口數量的限制,單臺服務器內可部署的FPGA節點數量通常不會超過8個,如亞馬遜的FPGA EC2實例F1[6]。因此在現有框架下,FPGA節點很難進行更高密度的部署(即較低的縱向可擴展性);如果需要更大規模的橫向可擴展性,則需要大量x86服務器組成并行集群結構,這將導致更高的部署成本和占用更多的機架物理空間。
此外,普通用戶使用FPGA云平臺的目的通常僅使用FPGA可編程邏輯資源進行相關的邏輯設計和驗證,而對x86服務器的運算能力并無過多需求?!?br>