999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ARM Cortex-M3核的SoC架構設計及性能分析

2012-03-15 07:50:10陶友龍趙安璞陳海波
電子技術應用 2012年8期
關鍵詞:設計

陶友龍,趙安璞,陳海波

(東南大學 國家ASIC系統工程技術研究中心(無錫),江蘇 無錫214135)

ARM Cortex系列是ARM公司推出的基于ARMv7架構、使用高性能的Thumb-2指令集的32位嵌入式微處理器核。主要有三種款式,分別是Cortex-A、Cortex-R和Cortex-M。其中Cortex-M系列主要用于低功耗、低成本的嵌入式應用。本文用于 SoC(System on Chip)設計的Cortex-M3核便屬于該系列。該處理器核憑借其高性能、低功耗、低成本和開發方便等特點,受到了各廠商的青睞。STMicroelectronics、NXP Semiconductors、ATMEL 等都競相推出各自基于Cortex-M3核的SoC。由于Cortex-M3核的結構與傳統ARM核有很大區別,因此基于Cortex-M3的SoC架構設計也有與以往不同的特點。不同的架構對芯片整體性能影響很大。本文使用CoreMark對實際芯片作了性能測試,其結果證明了SoC架構對芯片性能的影響。

1 Cortex-M3核SoC架構設計

1.1 總線接口

處理器核對SoC架構最大的影響是其總線接口。傳統的ARM處理器使用單一總線接口。如ARM7處理器采用馮諾依曼結構,指令和數據共用一條總線,從而核外部為單總線接口[1];ARM9雖然使用了哈佛結構,核內部指令總線和數據總線分開,但這兩條總線共用同一存儲空間,且在核外共用同一總線接口[2]。使用單一總線接口的弊端是取指和取數據無法并行執行,效率相對較低。

Cortex-M3的結構如圖1所示。Cortex-M3采用了多總線結構,在核外有 ICode、DCode、System三個總線接口[3]。其中,ICode和DCode總線接口使得在地址空間Code區中的取指和取數據分開并行執行,而System總線使得在地址空間SRAM區中的取指和取數據使用同一總線接口,無法并行執行。

1.2 SoC架構設計

由Cortex-M3的結構特點可以看出,Cortex-M3不適合像傳統ARM處理器那樣將代碼由Flash搬移到RAM來提高效率,那樣反而可能會降低效率(由于SRAM區中的取指和取數據使用同一總線接口)。而Cortex-M3是將代碼和只讀數據放在Flash中,程序執行時將可讀寫數據放在RAM中,從而獲得最高效率。

基于以上考慮,設計Cortex-M3核的SoC時,最好將片上Flash掛接在ICode和DCode總線上,即0x00000000~0x20000000地址空間,如圖2所示,將片上 SRAM掛接在 System總線上,即0x20000000~0x40000000地址空間。這樣從Flash中取指和取只讀數據可以分別通過ICode和DCode總線并行執行,提高了Flash的讀取效率。而對SRAM中的數據讀寫通過System總線進行。三條總線各自分工,使得SoC性能大大提高。

1.3 自主設計的Cortex-M3核SoC

實驗室自主設計了一款基于Cortex-M3核的SoC,并采用 0.18 μm CMOS工藝流片成功。如圖 3所示,芯片的片上Flash從0x20000000開始,共256 KB;片上SRAM從0x30000000開始,共96 KB。其架構特點是片上Flash和片上 SRAM均處于0x20000000~0x40000000地址空間,即掛接在System總線上,但兩者均可再映射Remap到0地址,即可掛接到ICode和DCode總線上。

默認情況下片上SRAM可Remap到0地址,這意味著SRAM默認擁有0x00000000和0x30000000兩個起始地址。因此,將代碼放在SRAM中時,若從0x00000000地址開始執行,則處理器通過ICode和DCode總線來訪問SRAM;若從0x30000000地址開始執行,則處理器通過System總線來訪問SRAM。下面將利用這特一點來進行性能分析。

2 性能測試及分析

2.1 CoreMark簡介

傳統的嵌入式微處理器性能測試普遍采用Dhrystone程序,WEICKER R P通過統計程序中常用的操作及其所占比例,構建了一個測試基準,并經過多次完善,才得到了 Dhrystone程序[4]。但Dhrystone程序本身過于簡單,并不能準確反映處理器運行實際應用程序時的性能。

EEMBC組織自成立之初就打算制定一種能夠代替Dhrystone并能更好地測量嵌入式微處理器性能的標準。但由于EEMBC的程序和認證一般都是收費的,所以其發布的測試程序一直沒能得到很好的普及。直到其發布了完全公開和免費的CoreMark程序,才逐漸改變這一局面,并有取代Dhrystone的趨勢。CoreMark是一個雖代碼量小但很復雜的測試程序,通過執行應用程序中常用的數據結構和算法來測試處理器性能,其內容包括鏈表操作、矩陣運算和CRC校驗等,可以更好地反映處理器運行實際應用程序時的性能。本文采用CoreMark來測試SoC的性能。

2.2 自主設計SoC的性能測試

使用Keil開發環境:將CoreMark程序放在芯片的片上SRAM中,分別設置從片上SRAM的兩個起始地址執行,其在72 MHz主頻時的測試結果如表1所示。

表1 自主設計的SoC測試結果

可見,對于同一片上SRAM存儲器,從0x00000000地址訪問執行比從0x30000000地址訪問執行時的處理器性能要高出約20%。因此,使用ICode和DCode總線取指和取只讀數據比使用System總線性能要高。在今后的設計中將取消Remap,直接將片上Flash放在從0x00000000開始的空間,將片上SRAM放在從0x30000000開始的空間,實現取指、取只讀數據、取可讀寫數據并行執行,從而達到最佳性能。

2.3 STM32F103性能測試

意法半導體的STM32系列MCU是目前市場上最常見的Cortex-M3核SoC之一,該系列中的STM32F103架構如圖4所示[5]。該芯片的片上 Flash掛接在 ICode和DCode總線上,片上SRAM掛接在System總線上。其中ICode總線直通 Flash,而 DCode總線和 System總線通過一個總線矩陣分別連接到片上Flash和片上SRAM及其余外設。此外,STM32采用了一個64 bit的Flash,并使用了一個2×64 bit的緩沖器,一次可緩存 128 bit數據,從而大大降低了Flash的訪問頻率,彌補了Flash速度較慢的缺陷,使得取指和取只讀數據的速度大大提高。該架構與前述分析基本一致,故可以保證最佳性能。

使用CoreMark對STM32F103進行性能測試。將代碼分別放在片上SRAM和片上Flash中執行,其在72 MHz主頻時的測試結果如表2所示。

表2 STM32F103測試結果

可見,STM32F103在片上Flash中執行代碼的性能超過了在片上SRAM中的性能。主要原因是在片上Flash中執行時,三條總線合作分工,加之Flash本身位寬較大(64 bit),且外部有 2×64 bit緩沖器,因此效率很高,代碼在片上Flash中執行的性能可以與在片上SRAM中執行時相當。

與實驗室自主設計的SoC相比,兩芯片在片上SRAM中執行代碼的性能幾乎相同。這是因為兩者均只使用System總線對SRAM進行訪問,且兩芯片的SRAM存取速度均跟得上Cortex-M3核對其訪問的速度。但如表1所示,自主設計的SoC在片上Flash中執行代碼的性能還不到STM32F103的一半,原因是所使用的Flash本身速度較低、位寬較低(2×16 bit),且沒有采用外部高位寬緩沖器等手段減少訪存頻率,再加上測試時Flash掛接在System總線上,因此Flash的性能成為了所設計SoC的性能瓶頸。

3 影響SoC性能因素

(1)芯片架構:由以上分析可見,芯片架構對SoC性能有很大的影響。要想獲得最佳性能,關鍵是要深入了解所用處理器核的結構特點,再據其采用合適的芯片架構。

(2)存儲器速度:存儲器速度尤其是Flash速度也是限制SoC性能的一個關鍵因素。存儲器速度越慢,CPU需要插入的等待周期就越多,效率就越低。這一點在上述自主設計的SoC中就不夠好,需要在Flash部分作大的改進。而STM32在這方面做得很好,通過加大存儲器位寬和增加緩沖器使Flash不會成為芯片性能的瓶頸。

(3)工藝:工藝對存儲器速度及芯片整體性能的影響是顯而易見的,更先進的工藝意味著更高的性能。但提升工藝同時意味著增加流片成本,故需根據實際情況考慮。

(4)主頻:主頻越高,意味著同一段時間內可以執行更多的指令,即測試結果CoreMark總分提升,但CoreMark/MHz沒變。此外,若 Flash速度跟不上,則會將最高性能限制住,提升主頻不但不會提高整體性能,反而還會降低效率,即測試結果CoreMark總分不變,Core-Mark/MHz反而降低。

本文主要研究了基于ARM Cortex-M3核的SoC架構設計,重點分析了處理器核的總線接口對芯片架構設計的影響。采用CoreMark程序,對實驗室自主設計的一款Cortex-M3核SoC以及意法半導體的STM32F103 MCU進行了性能測試及分析,說明了芯片架構對性能的影響。最后,對影響SoC性能的因素作了總結。對高性能的Cortex-M3核SoC設計有著指導作用,對一般的SoC設計也有借鑒意義。

[1]ARM Ltd..ARM7TDMI Technical Reference Manual Revision:r4p1,2004.

[2]ARM Ltd..ARM920T Technical Reference Manual Rev 1,2001.

[3]ARM Ltd..Cortex-M3 Technical Reference Manual Revision:r2p1,2010.

[4]WEICKER R P.Dhrystone:A synthetic systems programming benchmark[J].Communications of the ACM,1984,27(10):1013-1030.

[5]ST Microelectronics Ltd..STM32F101xx,STM32F102xx,STM32F103xx,STM32F105xx and STM32F107xx advanced ARM-based 32-bit MCUs Reference manual Rev 11,2010.

猜你喜歡
設計
二十四節氣在平面廣告設計中的應用
河北畫報(2020年8期)2020-10-27 02:54:06
何為設計的守護之道?
現代裝飾(2020年7期)2020-07-27 01:27:42
《豐收的喜悅展示設計》
流行色(2020年1期)2020-04-28 11:16:38
基于PWM的伺服控制系統設計
電子制作(2019年19期)2019-11-23 08:41:36
基于89C52的32只三色LED搖搖棒設計
電子制作(2019年15期)2019-08-27 01:11:50
基于ICL8038的波形發生器仿真設計
電子制作(2019年7期)2019-04-25 13:18:16
瞞天過?!律O計萌到家
藝術啟蒙(2018年7期)2018-08-23 09:14:18
設計秀
海峽姐妹(2017年7期)2017-07-31 19:08:17
有種設計叫而專
Coco薇(2017年5期)2017-06-05 08:53:16
從平面設計到“設計健康”
商周刊(2017年26期)2017-04-25 08:13:04
主站蜘蛛池模板: 狼友视频一区二区三区| 久久亚洲黄色视频| 91视频首页| 国产成人亚洲欧美激情| 成年人视频一区二区| 91在线播放免费不卡无毒| 91娇喘视频| a级毛片免费看| 9啪在线视频| 最新加勒比隔壁人妻| 国产成人精品视频一区视频二区| 国产成人91精品免费网址在线| 2022国产91精品久久久久久| 国产福利拍拍拍| 亚洲精品视频在线观看视频| 国产va欧美va在线观看| 女人18毛片久久| 一级香蕉人体视频| 性色一区| 亚洲品质国产精品无码| 操操操综合网| 国产一区二区影院| 欧美日韩久久综合| 亚洲成人网在线观看| 国产一区二区精品高清在线观看 | 免费人成网站在线观看欧美| 91午夜福利在线观看精品| 无码中文AⅤ在线观看| 97精品伊人久久大香线蕉| 青青草原国产| 欧美日本在线| 亚洲一级毛片| 91精品国产一区| 国产成人资源| 内射人妻无套中出无码| 久久五月视频| 国产另类乱子伦精品免费女| 久久久成年黄色视频| 国产精品亚洲欧美日韩久久| 亚洲综合九九| 精品国产一区二区三区在线观看| 爆乳熟妇一区二区三区| 欧美日韩午夜| 在线国产资源| 日韩中文无码av超清| 素人激情视频福利| 国产波多野结衣中文在线播放| 国产成人做受免费视频| 最新亚洲人成无码网站欣赏网 | 国产理论一区| 一级毛片免费不卡在线| 99激情网| 国产精品毛片一区视频播| 99在线视频免费| 三上悠亚一区二区| 亚洲欧美极品| 亚洲床戏一区| 国产手机在线小视频免费观看| 欧美性色综合网| 国产欧美精品午夜在线播放| 国模极品一区二区三区| 国产成人精品一区二区不卡| 国产jizz| 波多野结衣久久高清免费| 中文字幕伦视频| 热久久这里是精品6免费观看| 欧美日韩第三页| 亚洲精品色AV无码看| 久久国产亚洲偷自| 国产v欧美v日韩v综合精品| 精品一区二区三区视频免费观看| 免费一级毛片| 久久毛片网| 国产女同自拍视频| 久久亚洲日本不卡一区二区| 第一页亚洲| 精品亚洲国产成人AV| 午夜福利在线观看入口| 女人18一级毛片免费观看| 欧美精品色视频| 色综合久久综合网| 四虎国产永久在线观看|