特約通訊員 黃俏丹

當前,存儲器發展的一個方向是朝著“利用新的物理規律,研發新的存儲器結構”邁進,如相變存儲器,電熔斷存儲器,阻抗存儲器,磁性隨機存儲器MRAM等等,這一方向極大地豐富了現有存儲器的種類,展現了繁多的存儲器特色,但有兩個缺陷是致命的:與CMOS工藝兼容性,生產效率。最近有一個新的趨勢漸漸浮出水面,那就是算法存儲器(Algorithmic Memory)。這是一種新的思路,這種思路源自對微處理器(CPU/MCU)體系結構的發展與現有存儲器通訊時的瓶頸這一問題的思考得出的。處理器經過多年發展無論在速度、性能、數據吞吐量等方面有了很大的提升,但存儲器在這方面似乎沒有跟上CPU的發展。舉例說明一下,4核的CPU+2G內存的機器上跑一個多線程軟件,在8核的機器上可以提速到2倍,但在16核的機器上就只能獲得將近2.5倍的提速,而不是期望的4倍,這就是CPU與內存之間通訊帶寬的限制。
這種Algorithmic MemoryTM源自一家初創公司Memoir Systems的專利技術,他們在存儲器芯片內部采用了緩存(caching)、虛擬機制(virtualization)、管道 (pipelining),以及數據編碼等技術,然后將它們“編織成數據流”進行無縫地操作,這種存儲器還提供了多個接口支持數據并發訪問,極大地提升了訪問性能。
Memoir Systems公司于2009年3月由Sundar Iyer(CTO)and Da Chuang(COO)共同發起成立,由光速創投公司投資支持。Adam Kablanian是Memoir的首席執行官(CEO)。公司總部設在美國加州硅谷,Memoir Systems是全球領先的提供存儲器性能解決方案的半導體供應商,入選2012 Red Herring北美100強科技公司。Memoir關于存儲器設計方面的革命技術——Algorithmic Memory,大大縮短了設計開發時間,提高了每秒存儲操作(MOPS)訪問性能。該公司的Renaissance系列產品為多接口嵌入式存儲器模塊提供了即插即用的一種替代。在不犧牲性能的情況下,也能減少芯片面積和降低功耗。此項技術的特點是線程、節點、Foundry之間相互獨立,并且能無縫集成到各種SoC片上系統。
因為它是進程獨立的,所以Memoir此項技術對先后進程結點同樣適用,并且可以集成到各種SoC系統 , 包 括 ASICs,ASSPs,GPPs and FPGAs。這些設備要求具有很高的MOPS才可以使存儲性能得到提升改善。
公司創始人兼首席技術官Sundar Iyer表示:“Algorithmic MemoryTM技術在半導體行業是獨一無二的。我們的設計方法是引入一個新的概念‘chisel’,這不同于在存儲器集成電路上使用的傳統方法‘hamma’,我們從一個更高的抽象層面來解決這個性能瓶頸。新方法在集成電路技術上得到了補充,并且填補了processor-memory之間的鴻溝。”
Memoir技術總概
Algorithmic Memory技術對存儲器模塊的性能提升表現在以下5個方面:
·10X每秒存儲操作(MOPS):Algorithmic Memory通過“在存儲器芯片內部采用了緩存,虛擬機制,管道,以及數據編碼等技術,然后編織成數據流進行無縫地操作”提升現有嵌入式存儲器模塊的性能。
·100X縮短設計開發時間:存儲器模塊開發通常需要6到12個月的時間,但是Memoir技術可以把開發時間縮短到以天計算。
·1000X加快存儲器架構分析時間:分析一個自定制的存儲器模塊通常要花費一周時間,但是利用Memoir可以在10秒內搭建和分析一個存儲器模塊。
·低芯片面積,低功耗:Memoir可以把一塊面積功率比較低、性能較差的內存合成為具有較高性能的存儲器模塊。Algorithmic Memory通過改變集成電路使存儲器模塊具有較高性能,還降低了芯片面積和功率消耗。
·方便地與現有的各種存儲器相兼容配置:通過簡單配置,可以快速地集成到不同的系統中去。
由于Algorithmic Memory技術可以為嵌入式存儲性能提供一個數量級的增加,該公司的初始產品應用主要專注于各種SoC系統設計 (例如,ASICs,ASSPs,GPPs and FPGAs)和網絡交換器(Network Switches)、存儲局域網(SAN)交換器設計。
Memoir的CEO Adam Kablanian解釋說:“我們為嵌入式存儲世界開創了一個全新的篇章。如此通用和強大的技術可以為系統架構師和SoC設計工程師提供下一代卓越的存儲性能。我們相信,網絡和多核計算這兩個產品領域可以最初地從我們的解決方案中受益”。
嵌入式存儲性能已成為SoC設計中整個系統性能的限制因素。Memoir用它的專利技術解決了這個瓶頸,最大化了算法效率。Algorithmic Memory以軟RTL IP的形式提供,可以快速地集成到不同的系統中去。它還提出多個接口并發訪問,提供10倍快的每秒內存操作。
光速創投 (Lightspeed Venture Partners),一家全球領先的風險投資公司,是Memoir Systems的一個主要投資者。光速創投的總經理Barry Eggers說道:“我們投資Memoir Systems主要有兩個關鍵原因:首先,Memoir團隊在存儲算法領域擁有世界一流的專業知識;其次,它獨特的專利技術可以跨越當前和未來的存儲應用技術。我們相信,這種團隊和技術的實力組合將來能把Memoir推向一個更重要的地位,在某些市場領域占有更大的份額。”

Memoir公司創始人兼首席技術官Sundar Iyer指出:“通過Memoir的Algorithmic Memory技術,存儲器訪問性能可以被視為一個可配置資源實體。系統架構師和設計師只需要通過一個簡單的按鈕接口就能配置他們所需的存儲模塊性能,例如,設定讀寫接口的數目,時間操作頻率,以及其他關于芯片面積和功耗優化方面的特制需求。”公司創始人和首席運營官Da Chuang解釋說:“Memoir的綜合方法平臺可以從存儲IP庫中自動選擇合適的模塊,并將我們的存儲算法綜合到新定制的目標應用程序中。”
嵌入式存儲器模塊性能在網絡SoC設計應用中是一個主要的限制性因素。隨著網絡傳輸速度日益增加,交換機的架構師發現越來越難跟上數據報文處理速度以避免緩沖區溢出。例如,在一張4*100 Gb/s的線卡上,新數據包每1.6納秒到達一次系統,此外,數據包處理系統支持廣泛的報文頭分析——比如,查找技術、網絡即時流量統計、計數器、流量管理等等,和支持有效載荷處理應用程序——比如,指令檢測、基于內容的負載平衡、病毒掃描,這些導致對于每次數據包的到來都要產生數次的存儲訪問。僅是加快處理器的速度是不能提高網絡性能的,除非增加總的每秒存儲操作(MOPS)。這里,Memoir的 Algorithmic Memory技術能為系統架構提供更快的MOPS,并且能自定義存儲容量、提供多個讀寫接口。
高速多核處理器改變了桌面、服務器應用和嵌入式計算世界的游戲規則。然而,因為爭用共享存儲資源(比如,二級緩存或三級緩存),SoC系統的整體性能也會有所拖延。如果可以避免這些存儲方面瓶頸,系統架構可以發揮更好的性能。
Renaissance 4X是Memoir Systems公司繼Renaissance 2X推出的第二代商業產品。基于Memoir的Algorithmic Memory技術,Renaissance 4X相對于傳統多端口系統,它引進了一項革命性的技術,不僅提升了存儲器性能,也節省了功耗和芯片面積,縮短了產品上市時間,而且不要求進行Silicon Validation(硅片物理驗證)。如同所有的Memoir產品,Renaissance 4X利用“把算法綜合到固件”方法來提升現有嵌入式存儲器模塊的性能。它以軟RTL IP的形式交付,能快速地集成到不同的系統中去,并且線程、節點、Foundry之間相互獨立。Memoir提供的就像是一個標準的嵌入式存儲器模塊,并且可以方便地集成到現有的標準SoC設計流程。Renaissance 4X提供6個獨立的內存生成器:一個3端口的2R1W,一個3端口的1R2W,一個4端口的3R1W,一個4端口的2R2W,還有專門設計的3Ror1W、4Ror1W內存生成器。
IBM Microelectronics是Memoir的首批客戶之一,IBM高級工程師Robert Busch說:“一系列創新技術(例如,IBM的嵌入式DRAM技術)正在推動著片上系統設計性能的發展。通過與Memoir合作,我們能給芯片設計師設計SoC系統提供一種很高效的存儲子系統,可以改進系統吞吐量并且加快復雜產品上市時間。”

Renaissance 4X可以緩解存儲解決方案定制的需求,并且它可以創建一個能提供6個多端口內存生成器的通用存儲組合,這樣的通用組合能滿足不同的存儲和應用需求。Memoir的產品使用標準6T BIST(內建自修復)和DFT(診斷功能測試)測試方法,它包含的RTL級已使用正式方法詳盡驗證過,不再需要硅片物理驗證。通過上述各種優勢的組合,Renaissance 4X提供了一個重要的投放市場的時間優勢,降低了產品開發成本和減少了風險。有了Renaissance 4X,顧客的選擇靈活多種,不用再拘泥于自定制的解決方案。例如,內存復制,它的工作方式是以大功耗去換取較高的讀性能。再者,定制多接口芯片會造成更高的成本和風險,并且產品投放市場的時間也比較長。這意味著一般不能通過第三方IP核供應商提供通用接口IP核。
“所有傳統的多接口設計都有一些很大的缺點,”Adam Kablanian解釋說,“它們都有成本高、風險高、開發時間被硅片驗證拖延等缺點,但是有了Renaissance 4X,我們就能交付一個高性能、實惠、方便、通用多端口存儲器解決方案,可以解決整個行業的大部分需求。”
從應用程序的角度看,Renaissance 4X滿足下一代應用于網絡和通信子系統的SoC系統設計的數據處理要求,這種數據要求傳輸聚合速度超過400 Gb/s。這意味著,Renaissance 4X可以為存儲器在一個周期內多次訪問提供廣泛的適用性,例如,包緩沖區、計數器、即時流量、鏈表、調度器、表查找等等。另外,Renaissance 4X為多端口存儲器提供二級、三級緩存共享結構,為多核SoC設計提供高訪問性能。
參考資料:www.memoir-systems.com