我們高興地向讀者推出本刊“計算機體系結構前沿技術”專題!本專題收錄的6篇文章既包含不同技術領域和方向的綜述,也包含了具體技術的發明和介紹.
自旋轉移力矩隨機存儲器(STT-RAM)是一種新型非易失性隨機存儲器.STT-RAM與傳統的靜態隨機存儲器(SRAM)分別在寫入速度、集成密度、制造成本、功耗、使用壽命等方面各有優勢和劣勢,而綜合這2種隨機存儲器件而形成的SRAM和STT-RAM混合緩沖存儲器是一種重要的緩存結構.然而在具有不同特性的緩存器件的同一個緩存結構中如何分配它們的使用比例是一個對性能、功耗、使用壽命均具有影響的重要問題.范浩等作者的文章“一種基于強化學習的混合緩存能耗優化與評價”提出一種基于強化學習的技術,解決待緩存的數據在這2種緩存器件中的分配問題.文章提出緩存訪問請求的寫入強度的概念,并提出利用強化學習的方法根據寫入強度及數據復用信息獲得不同分配下的能耗信息,從而給出數據在SRAM和STT-RAM之間的分配策略.實驗結果證明了作者所提出的技術的有效性.
卷積神經網絡是深度學習中的一類重要工具,已經在計算機圖形、圖像、計算機視覺、語言處理與機器翻譯等獲得廣泛的應用,而Winograd快速卷積算法因能有效降低卷積神經網絡中卷積操作的計算復雜度而受到廣泛關注;另一方面,多核處理器是一類重要的體系結構,以多核處理器構造的計算平臺承載著大量的卷積神經網絡相關的應用任務.因此面向多核處理器系統的Winograd快速卷積算法的高效率實現是有重要價值的研究課題.王慶林等作者的“面向飛騰多核處理器的Winograd快速卷積算法優化”介紹了面向我國自行研制的飛騰多核處理器的Winograd快速卷積算法的優化實現技術.文章提出了一種高性能并行Winograd快速卷積算法,作者把Winograd算法分解為不同的計算部分,設計了相應部分的數據操作及與之相應的數據布局,以并行的方式實現Winograd快速卷積計算.文章對所提出的技術進行了實驗測試,實驗結果表明了文章所提出的技術可以有效地提高算法訪存和計算速度.
圖計算廣泛地應用于社會計算、網絡計算、智能信息處理等各種領域中,而廣度優先搜索是圖計算中的一個重要的算法,也是考察計算系統性能的典型算法之一.優化圖的廣度優先搜索算法是提高計算性能的重要研究問題.張承龍等作者的“面向高通量計算機的圖算法優化技術”探討高通量計算機中圖廣度優先搜索算法的優化技術.文章綜合介紹了圖廣度優先搜索中算法優化的各種技術,并針對圖廣度優先搜索算法執行中的訪存效率問題,提出了基于高效的位圖訪問的冗余訪存消除技術,以及通過算法執行過程的優化提高訪存局部性的技術,從而減少了緩存訪問頻次,提高緩存的訪問效率.文章對所提出技術在計算性能、功耗方面進行了實驗,實驗結果表明了文章所提出的技術的有效性.
針對圖計算開展定制硬件結構設計也是當前的一個研究前沿技術方向.現場可編程門陣列(FPGA)圖計算加速器是一種重要的圖計算加速方向.然而,FPGA的硬件編程是一項耗時費力的困難任務.高效的FPGA編程與開發環境是幫助底層編程人員提高FPGA開發與應用效率的重要工具.郭進陽等作者的文章“FPGA 圖計算的編程與開發環境:綜述和探索”介紹FPGA編程環境技術與系統的研究現狀及重要問題.文章從編程模型、高層次綜合、編程語言以及程序接口等方面介紹了構造良好的FPGA圖計算編程環境的關鍵技術及發展狀況,并結合應用領域的特征,分析了該領域存在的挑戰性問題和未來的研究方向.
大數據計算獲得日益廣泛的應用,成為當代計算系統的主要應用,而基于Spark計算框架的系統成為重要的大數據計算平臺.由于Spark是一種基于內存計算的框架,應用程序訪存行為特征的信息對于程序的優化實現有重要的價值.鑒于當前Spark訪存行為分析工具大多從同一層次上獲取程序訪存行為信息,許丹亞等作者的“基于Spark的大數據訪存行為跨層分析工具”貫穿Spark層、JVM層和OS層多個層次,建立應用程序語義和底層物理內存信息之間的聯系,構造了Spark訪存行為跨層分析工具SMTT.文章介紹了SMTT的結構、內存追蹤方案、不同層次之間語義關聯的實現方式以及系統的訪存行為分析方法.作者進行了分析工具SMTT的應用實例的實驗,結果表明SMTT可以為獲取Spark程序訪存行為信息提供有效的工具,從而為Spark系統優化提供有力的手段.
通用圖形處理器(GPGPU)以能夠支持并發線程的執行而提供高性能的處理能力而獲得了日益廣泛的應用.然而,GPGPU在支持不規則訪存程序的執行中會因為緩存爭用而降低其并發執行的效率.GPGPU緩存子系統的優化問題是提高GPGPU性能的關鍵技術問題.張軍等作者的“通用圖形處理器緩存子系統性能優化方法綜述”綜合介紹了GPGPU訪存子系統優化的技術途徑.文章從線程級并行性(TLP)調節、訪存順序調整、數據通量增強、末級緩存(LLC)優化以及基于非易失存儲器(NVM)的緩存結構等方面介紹了GPGPU緩存子系統優化方法,分析了優化技術的發展現狀,并討論了值得研究的挑戰性問題和技術發展方向.
本專題征文發出后得到研究人員的積極響應,踴躍投稿.我們感謝廣大作者對本刊的大力支持!我們感謝審稿專家對于稿件的認真審查以及中肯的意見和建議!希望本專題的出版對計算機領域的研究、工程開發人員、教育工作者和研究生產生有益的啟發和參考作用!我們感謝本刊編委會和編輯部開辟這樣一個介紹體系結構前沿技術的專題,促進體系結構前沿技術的研究和知識傳播,感謝他們對本專題的支持和和辛勤的工作!