過怡
(蘇州市職業大學 計算機工程系,蘇州 215104)
ARM處理器以其高性能、低功耗、低成本等優勢被廣泛應用于各種成功的32位嵌入式系統中。提高執行速度和減小代碼尺寸是嵌入式軟件設計的關鍵需求。盡管大多數的ARM編譯器和調試器都帶有性能優化工具,但是為了保證其正確性,編譯器必須是穩妥和安全的,而且它還受到處理器自身結構的限制。因此,編程人員必須在理解編譯器工作特點的基礎上來實現代碼優化。代碼的優化方法較多,本文針對函數優化方法進行闡述。
局部變量包括函數內局部變量、函數參數、函數返回值。由于ARM數據操作都是32位,即使數據本身只需要8位或16位,對于這三類局部變量也應盡可能使用32位的數據類型int或long,以提高代碼執行效率。下面以簡單求和函數為例進行分析。
函數add1計算包含10個字的數組array的累加和,add2與add1功能相同,只是將函數add1的參數array類型改為16位的short,函數內局部變量i類型改為8位的char,sum改為16位的 short。add1、add2的C源代碼如下:

add1經編譯產生的匯編代碼:


比較add1和add2兩個函數的匯編代碼,可以發現add2_loop循環比add1_loop循環增加了4條語句。
語句①:函數add2中變量 sum為 16位short類型,ARM指令中ldrh指令不支持移位地址偏移,因此增加add指令計算數組下標地址。
語句②:由于函數add2中循環變量i為8位的char類型,而ARM 處理器的寄存器為32位,此語句用于處理循環變量累加過程中引起的溢出問題。即:當i累加到255時,再加1應該為0,而不是256。
語句③、④:函數 add2中返回結果 sum為 short類型,在返回前需將32位寄存器的前16位用符號位填充,即轉換為16位short類型。
為了加快程序的執行速度,函數編譯時應盡可能將局部變量都分配在寄存器中。當局部變量多于可用的寄存器時,編譯器會將多余的變量壓入堆棧(即存入存儲器中),因此必須控制局部變量的個數。
ARM處理器采用RISC結構,帶有豐富的內部寄存器。在編譯器使用-apcs開關選項,即支持ATPCS(ARMThumb Procedure Call Standard)標準時,理論上有14個寄存器(R0~R12,R14)可以用來存放局部變量。但是實際上有些寄存器有自身特殊的用途,例如R9在與讀寫位置無關(RWPI)的編譯情況下作為靜態基址寄存器使用,R12作為子程序內部調用的臨時過渡寄存器使用。ATPCS規則中的寄存器名稱及說明如表1所列。

表1 ATPCS規則中寄存器說明
因此,應盡量限制局部變量的數目:
①對于函數的參數個數應控制在4個以內,只有R0~R3可用來保存參數,當參數多于4個時將被壓入堆棧。如果由于實際應用的需要,參數多于4個,也可以采用結構體來組織參數,傳遞結構體指針來實現。
②函數內部局部變量的個數應控制在12個以內(R0~R11),R12~R15都有特定用途。
循環的控制條件設為遞減到零的形式,可以減少指令條數。以求10個數的累加和為例進行分析。

比較代碼1和代碼2,兩者的功能是相同的,但是代碼2在循環中少了1條指令。該循環的執行次數為10次,即在執行時共減少了10條指令。
當函數體代碼較少(通常只有一兩條語句),且又被經常調用時,可將它設為內聯函數(inline)。對內聯函數的調用類似于宏定義的展開,因此沒有函數調用的開銷(即參數的傳遞和函數值的返回),只是增加了被調用函數的代碼量。
例如在嵌入式系統中,經常訪問的外設端口的讀寫代碼就可以設成內聯函數,以提高執行效率。外設寄存器的讀寫函數如下:

這兩個函數的共同特點是:函數體的代碼很少,只有1個語句;使用的局部變量很少,只有1~2個參數。由于定義為內聯函數,程序的可讀性較好;在執行時由于沒有調用開銷,執行效率較高;函數體很小,在被展開時空間開銷不大。
由于嵌入式系統對存儲空間的限制和實時性的需求,在編寫代碼時必須采用相應的方法和原則以減少代碼的空間開銷和時間開銷。代碼優化需要花費時間,并且代碼優化后將降低源代碼的可讀性。因此,只有對經常被調用且對性能影響較大的函數進行優化,才能最有效地優化系統。
[1]ARM Architecture Reference Manual[EB/OL],2005[2010-03].http://www.arm.com.
[2]Samsung Electronics Co.,Ltd.S3C2410X 32bit RISC Microprocessor User's Manual,2003.
[3]Furber S.A RM SoC體系結構[M].北京:北京航空航天大學出版社,2002.
[4]陳賾.ARM9嵌入式技術及Linux高級實踐教程[M].北京:北京航空航天大學出版社,2005.
[5]田澤.嵌入式系統開發與應用[M].北京:北京航空航天大學出版社,2005.
[6]Sloss Andrew,Symes Dominic,Wright Chris.ARM嵌入式系統開發:軟件設計與優化[M].沈建華,譯.北京:北京航空航天大學出版社,2005.