實(shí)時(shí)系統(tǒng)溫度功耗管理的優(yōu)化方法研究

2016-08-01 06:13:38李甜甜

計(jì)算機(jī)研究與發(fā)展 2016年7期

李甜甜　于　戈　宋　杰

1(東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院　沈陽　110819)2　　　(東北大學(xué)軟件學(xué)院　沈陽　110819)

李甜甜1于戈1宋杰2

1(東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院沈陽110819)2(東北大學(xué)軟件學(xué)院沈陽110819)

(litiantian_neu@163.com)

摘要實(shí)時(shí)系統(tǒng)的能量受限特性、峰值溫度約束以及實(shí)時(shí)任務(wù)的時(shí)間約束使其能耗問題備受學(xué)術(shù)界和工業(yè)界的關(guān)注，目前已有很多相關(guān)功耗管理研究.不考慮溫度因素的傳統(tǒng)功耗管理大多僅通過動(dòng)態(tài)電壓調(diào)節(jié)技術(shù)(dynamic voltage scaling, DVS)方法調(diào)度處理器的狀態(tài)實(shí)現(xiàn)，然而隨著芯片尺寸的不斷縮減，處理器的功耗密度越來越大，溫度與功耗之間的相互影響已不容忽視，由此在傳統(tǒng)管理研究的基礎(chǔ)上又衍生出了很多溫度感知的新方法.1)對(duì)實(shí)時(shí)系統(tǒng)溫度功耗管理依托的3個(gè)模型(任務(wù)模型、熱模型和功耗模型)進(jìn)行總結(jié)整理；2)根據(jù)是否考慮溫度因素將現(xiàn)有研究分為溫度無關(guān)的和溫度感知的2類進(jìn)行綜述，后者又按面向單任務(wù)?面向多任務(wù)進(jìn)行分類；3)從具體機(jī)制、優(yōu)化目標(biāo)、優(yōu)化效果以及調(diào)度時(shí)間等方面進(jìn)行比較，分析現(xiàn)有研究的優(yōu)缺點(diǎn)；4)指出未來研究方向.

關(guān)鍵詞實(shí)時(shí)系統(tǒng)；溫度感知；能量受限；功耗優(yōu)化；任務(wù)調(diào)度

實(shí)時(shí)系統(tǒng)在嵌入式系統(tǒng)中很常見，它不僅要求系統(tǒng)計(jì)算結(jié)果的正確性，還要求結(jié)果的產(chǎn)生時(shí)間滿足約束條件，現(xiàn)已被廣泛用于各行各業(yè).然而關(guān)于實(shí)時(shí)系統(tǒng)的性能、功耗以及溫度的管理優(yōu)化卻隨著芯片工藝的發(fā)展不斷發(fā)生變化，面臨前所未有的新挑戰(zhàn).

人類對(duì)高性能計(jì)算系統(tǒng)的追求驅(qū)動(dòng)半導(dǎo)體技術(shù)逐漸從微米到亞微米再到深亞微米的發(fā)展，晶體管尺寸的不斷縮減以及日益復(fù)雜的電路結(jié)構(gòu)導(dǎo)致芯片的功耗密度顯著增加.摩爾定律(Moore’s Law)[1]在集成電路(integrated circuit, IC)領(lǐng)域中廣為所知，它指出在計(jì)算硬件的發(fā)展歷程中，IC中晶體管數(shù)量將近每一年翻一番，后又在1975年基于處理器與存儲(chǔ)器密度不同以及IC的高混合度這一事實(shí)將預(yù)測(cè)結(jié)果修正為每2年翻一番.此外，根據(jù)另一個(gè)定律Dennard Scaling[2]，隨著晶體管尺寸的不斷縮減，芯片的電壓和電流將隨之降低.然而，該定律已在2005年左右失效，這是因?yàn)樾酒碾妷汉碗娏鞑豢赡軣o限降低，過低的電壓和電流無法保證處理器的可靠性；該定律的失效直接導(dǎo)致的后果就是，能耗降低將代替性能提高成為電路設(shè)計(jì)最重要的挑戰(zhàn)，如果忽略能耗問題，摩爾定律也將無法實(shí)現(xiàn)①.Dennard Scaling定律失效后，摩爾定律雖然又持續(xù)了幾年，但最終也因?yàn)闊o法持續(xù)降低保持處理器可靠運(yùn)轉(zhuǎn)的電壓和電流而使晶體管無法保持以以往的高速度運(yùn)轉(zhuǎn)，還因?yàn)殡S晶體管尺寸變小而顯著升高的靜態(tài)能耗而在性能上并未獲得提升②.Dennard Scaling的失效還使得人們轉(zhuǎn)向追求多核處理器，然而其受益卻比Dennard Scaling持續(xù)有效情況下的預(yù)測(cè)受益低.綜上所述，若要繼續(xù)追求高性能系統(tǒng)，首先要解決系統(tǒng)的功耗問題，這就需要在系統(tǒng)運(yùn)行時(shí)通過某些方法如合理的任務(wù)調(diào)度或芯片狀態(tài)調(diào)節(jié)來對(duì)功耗進(jìn)行管理，實(shí)時(shí)系統(tǒng)即使如此.

另外，晶體管尺寸縮減引起的量子反應(yīng)以及為處理更小尺寸晶體管對(duì)芯片化學(xué)成分進(jìn)行的改變最終導(dǎo)致靜態(tài)功耗增加，從而使得芯片溫度升高，升高的溫度反過來再次使靜態(tài)功耗增加，形成一個(gè)惡性循環(huán)③.文獻(xiàn)[3-5]也指出，晶體管尺寸的縮減導(dǎo)致功耗密度不斷升高，進(jìn)而導(dǎo)致處理器溫度快速升高，最終使得受溫度影響的漏電功耗(靜態(tài)功耗的主要成分)變得不可忽略，并逐漸成為處理器的主導(dǎo)功耗.溫度除了對(duì)功耗造成影響外，過高的溫度還會(huì)降低處理器的性能和可靠性，增大故障率.綜上所述，溫度和功耗密不可分，在對(duì)功耗進(jìn)行管理時(shí)還要考慮溫度因素.

基于上述分析，本文以實(shí)時(shí)系統(tǒng)為研究對(duì)象，探尋在滿足其時(shí)間約束的前提下優(yōu)化系統(tǒng)溫度功耗管理的方法.1)實(shí)時(shí)系統(tǒng)的溫度功耗管理方法均依托于3個(gè)基礎(chǔ)模型：①用于刻畫實(shí)時(shí)任務(wù)的任務(wù)模型；②用于描述溫度與功耗之間相互影響關(guān)系的熱模型；③用于度量實(shí)時(shí)系統(tǒng)功耗的功耗模型.本文首先總結(jié)這3個(gè)模型及其在各研究中的簡(jiǎn)化.2)實(shí)時(shí)系統(tǒng)的溫度功耗管理研究隨著芯片工藝的發(fā)展分為兩大類：不考慮溫度對(duì)功耗影響的優(yōu)化研究和考慮二者相互影響的溫度感知的優(yōu)化研究.其中，后者又可分為2層：?jiǎn)稳蝿?wù)優(yōu)化和多任務(wù)調(diào)度.本文按照上述分析對(duì)實(shí)時(shí)系統(tǒng)的溫度功耗管理方法進(jìn)行分類描述，并分析其中存在的不足.3)本文對(duì)實(shí)時(shí)系統(tǒng)的溫度功耗管理研究進(jìn)行總結(jié)，并指出進(jìn)一步研究方向.

1實(shí)時(shí)系統(tǒng)溫度功耗管理

1.1實(shí)時(shí)系統(tǒng)簡(jiǎn)介

實(shí)時(shí)系統(tǒng)除了要求系統(tǒng)功能正確執(zhí)行外，還對(duì)任務(wù)有一個(gè)額外的完成時(shí)間約束.時(shí)間約束是實(shí)時(shí)系統(tǒng)的一個(gè)重要特性，即使是微小的延時(shí)也可能造成嚴(yán)重的后果(如剎車的防抱死系統(tǒng)).時(shí)間約束在實(shí)時(shí)系統(tǒng)中通常被稱作截止期限，且根據(jù)是否強(qiáng)制滿足時(shí)間約束，系統(tǒng)又分為硬實(shí)時(shí)系統(tǒng)和軟實(shí)時(shí)系統(tǒng)2種；前者要求必須滿足時(shí)間約束；后者不作強(qiáng)制要求，但是延遲完成會(huì)降低運(yùn)行結(jié)果的意義.

實(shí)時(shí)系統(tǒng)上的應(yīng)用通常是一組簡(jiǎn)單的、高度重復(fù)的有限任務(wù)集合，也即任務(wù)是重復(fù)出現(xiàn)的.每個(gè)任務(wù)可以有很多實(shí)例，實(shí)例是最基本的工作單元，又稱為作業(yè).實(shí)時(shí)任務(wù)根據(jù)其作業(yè)發(fā)布頻率特性可以分為3類：周期任務(wù)(periodic tasks)、非周期任務(wù)(aperiodic tasks)和偶發(fā)任務(wù)(sporadic tasks)[6].

1) 周期任務(wù).任務(wù)每隔固定時(shí)間發(fā)布一次作業(yè)，該時(shí)間間隔稱為任務(wù)的周期.

2) 偶發(fā)任務(wù).任務(wù)隨機(jī)發(fā)布作業(yè)，但要求2個(gè)相鄰作業(yè)之間的時(shí)間間隔大于等于一個(gè)預(yù)先給定的值，該值稱為最小間隔到達(dá)時(shí)間.

3) 非周期任務(wù).任務(wù)隨機(jī)發(fā)布作業(yè)，無約束.

周期任務(wù)和偶發(fā)任務(wù)附加的截止期限又可根據(jù)其與周期或最小間隔到達(dá)時(shí)間之間的大小關(guān)系分為隱式截止期限(等于)、約束截止期限(小于)和任意截止期限(無關(guān)).此外，一個(gè)任務(wù)生成的所有實(shí)例之間是語義相關(guān)的，但其執(zhí)行時(shí)間卻是不同的，主要依賴于系統(tǒng)的軟硬件特性、輸入數(shù)據(jù)以及與該實(shí)例交互的環(huán)境行為[7].為確保滿足任務(wù)的時(shí)間約束，通常會(huì)指定任務(wù)的最壞執(zhí)行時(shí)間(worst-case execution time, WCET).WCET的精確估計(jì)與系統(tǒng)的正確執(zhí)行密切相關(guān)，目前已有很多相關(guān)方法和技術(shù)[8-9].

實(shí)時(shí)任務(wù)之間可能是獨(dú)立的，也可能存在某種依賴關(guān)系(一個(gè)任務(wù)的輸入是另一個(gè)或多個(gè)任務(wù)的輸出).現(xiàn)有研究大多針對(duì)的是硬實(shí)時(shí)系統(tǒng)上的獨(dú)立周期任務(wù)，且假設(shè)截止期限與任務(wù)的周期相等.

Fig. 1　Optimization research on thermal and power management for real-time systems.圖1　實(shí)時(shí)系統(tǒng)溫度功耗管理優(yōu)化研究

1.2溫度功耗管理

實(shí)時(shí)系統(tǒng)的優(yōu)化管理通常包括性能、功耗以及溫度3個(gè)方面，然而隨著芯片工藝的不斷發(fā)展，優(yōu)化的側(cè)重點(diǎn)也不斷發(fā)生變化.1)不斷縮減的晶體管尺寸使得芯片的功耗密度呈指數(shù)級(jí)增長(zhǎng)[10]，高性能芯片的功耗密度問題已經(jīng)導(dǎo)致芯片的頻率無法隨著工藝水平的提高而提高，也即實(shí)時(shí)系統(tǒng)的優(yōu)化目標(biāo)已經(jīng)逐漸從性能提升轉(zhuǎn)向能耗降低.2)功耗密度不斷上升的同時(shí)，受功耗影響的芯片溫度也隨之劇增，從而影響實(shí)時(shí)系統(tǒng)的性能和可靠性、降低系統(tǒng)的壽命[11].與此同時(shí)，受溫度影響的芯片漏電流也不斷增加，從而使得先前可以忽略的漏電功耗的比重逐漸增加 .文獻(xiàn)[12]中指出，65 nm工藝下，芯片溫度從65℃上升到110℃時(shí)，漏電能耗和總能耗各自增加38%和24%.綜上，不斷攀升的功耗密度，使得芯片溫度隨之升高，進(jìn)而導(dǎo)致漏電功耗不斷增加，反過來再次提升芯片溫度，最終形成一個(gè)惡性循環(huán).要解決該惡性循環(huán)，實(shí)時(shí)系統(tǒng)的優(yōu)化管理需要綜合考慮溫度和功耗二者之間的相互影響，對(duì)二者進(jìn)行協(xié)同管理.

實(shí)時(shí)系統(tǒng)溫度功耗管理的優(yōu)化研究首先需要為實(shí)時(shí)系統(tǒng)建模，包括用于刻畫任務(wù)特征的任務(wù)模型、描述溫度功耗關(guān)系的熱模型和刻畫系統(tǒng)功耗的功耗模型.這3個(gè)模型在具體的研究中會(huì)有所變化、有所簡(jiǎn)化，但本質(zhì)上是相同的.有了系統(tǒng)模型，便可以在此基礎(chǔ)上展開實(shí)時(shí)系統(tǒng)的溫度功耗管理研究.現(xiàn)有相關(guān)研究根據(jù)芯片制造工藝水平分為2個(gè)明顯的階段：1)工藝水平低時(shí)，功耗密度較低，不受溫度因素影響的動(dòng)態(tài)功耗占主導(dǎo)地位，系統(tǒng)溫度也較低，這一時(shí)期的大部分優(yōu)化研究不考慮溫度因素或?qū)⑵鋵?duì)功耗的影響看作常量，優(yōu)化目標(biāo)則通常為性能或能耗；2)工藝水平高時(shí)，功耗密度較高，芯片溫度升高，導(dǎo)致漏電功耗的比重不斷增加，最終超過動(dòng)態(tài)功耗成為主導(dǎo)功耗，這一時(shí)期的優(yōu)化研究多是溫度感知的功耗優(yōu)化，優(yōu)化目標(biāo)通常為性能(吞吐量)、能耗或能效.階段1中，人們主要研究降低系統(tǒng)動(dòng)態(tài)功耗的方法，主要通過動(dòng)態(tài)電壓調(diào)節(jié)技術(shù)(dynamic voltage scaling, DVS)[13-15]來實(shí)現(xiàn).考慮到動(dòng)態(tài)功耗與處理器電壓的3次方近似成正比，DVS方法主要通過控制處理器的電壓來提高性能或降低能耗.階段2中，人們不得不將溫度與功耗之間相互影響考慮在內(nèi)研究實(shí)時(shí)系統(tǒng)的功耗優(yōu)化方法[16-20]，相關(guān)研究可分為2層：?jiǎn)稳蝿?wù)優(yōu)化和多任務(wù)調(diào)度.對(duì)于前者，研究主要通過處理器狀態(tài)調(diào)節(jié)(processor state scaling, PSS)方法來控制處理器的峰值溫度，降低系統(tǒng)能耗.任務(wù)的執(zhí)行會(huì)產(chǎn)生動(dòng)態(tài)功耗并導(dǎo)致系統(tǒng)溫度上升，為了使系統(tǒng)的峰值溫度不超過既定閾值，需要在適當(dāng)時(shí)候調(diào)整處理器的狀態(tài)使其有時(shí)間冷卻，PSS方法即是致力于尋找合適的處理器運(yùn)行模式，使其既滿足任務(wù)的截止期限約束，又滿足系統(tǒng)的峰值溫度約束.對(duì)于后者，相關(guān)研究根據(jù)優(yōu)化目標(biāo)分為3類：性能優(yōu)化、能耗優(yōu)化和能效優(yōu)化.該類研究多是針對(duì)多核系統(tǒng)，在單任務(wù)優(yōu)化之上添加Task-to-Core映射機(jī)制，用于確定最佳的實(shí)時(shí)任務(wù)到核的分配計(jì)劃，以降低分配策略對(duì)系統(tǒng)溫度的影響.圖1給出了實(shí)時(shí)系統(tǒng)溫度功耗管理優(yōu)化研究的整體框架圖.

2溫度功耗模型

隨著晶體管尺寸的不斷縮減，使處理器的功耗密度越來越大，從而導(dǎo)致芯片溫度不斷升高，溫度對(duì)功耗的影響變得不容忽視，而功耗反過來進(jìn)一步影響溫度，因此實(shí)時(shí)系統(tǒng)中對(duì)溫度和功耗的共同管理勢(shì)在必行.溫度功耗管理通常依托3個(gè)模型：任務(wù)模型、熱模型和功耗模型.下面對(duì)這3個(gè)模型分別進(jìn)行描述.

2.1任務(wù)模型

現(xiàn)有相關(guān)研究針對(duì)的實(shí)時(shí)任務(wù)通常具有周期性質(zhì)，且都有截止期限約束.實(shí)時(shí)系統(tǒng)相關(guān)的能耗優(yōu)化研究中，通常用一個(gè)二元組〈P,C〉來表示任務(wù)；其中，P為任務(wù)的周期，C為任務(wù)的最壞執(zhí)行時(shí)間.至于任務(wù)的截止期限D(zhuǎn)，很多研究[5,10,13,16-19]都假設(shè)其與任務(wù)的周期相等，即D=P.另外，很多研究[5,10,16-19]還認(rèn)為實(shí)時(shí)任務(wù)的周期相同，因此只考慮實(shí)時(shí)系統(tǒng)下的單個(gè)周期任務(wù)的能耗優(yōu)化問題.

2.2熱模型

實(shí)時(shí)系統(tǒng)通常會(huì)有一個(gè)峰值溫度約束，這是因?yàn)樘幚砥鞯臏囟瘸^某個(gè)閾值后會(huì)對(duì)設(shè)備造成損壞，影響處理器的性能以及正常工作，因此我們需要對(duì)處理器的溫度進(jìn)行控制.考慮到溫度受功耗的影響，下面給出描述二者關(guān)系的熱模型.

鑒于熱傳導(dǎo)與電流現(xiàn)象之間的二象性(將處理器內(nèi)外看成是具有一定溫差以及熱阻的熱傳導(dǎo)體系，其中熱量與電流對(duì)應(yīng)、溫差與電壓對(duì)應(yīng)、熱阻與電阻對(duì)應(yīng)、熱容與電容對(duì)應(yīng))，我們通常采用式(1)中所示的微分方程[21]來描述處理器的溫度變化行為(又稱RC模型)，并由此推導(dǎo)出溫度的原函數(shù).RC模型不僅適用于描述實(shí)時(shí)系統(tǒng)處理器的溫度變化，還適用于描述數(shù)據(jù)中心中節(jié)點(diǎn)的溫度變化等，文獻(xiàn)[22]對(duì)此作了類似描述，并給出了RC模型的示意圖，如圖2所示.

(1)

其中，Cth為等效熱容(JK)，Rth為等效熱抗(KWatt)，T(t)和Tamb分別為處理器溫度和環(huán)境溫度(K)，P(t)為處理器在時(shí)刻t的功耗，單位為瓦特(Watt, W).上述熱模型中，Cth和Rth的值與具體的工藝技術(shù)有關(guān)，現(xiàn)有研究中大多采用65 nm技術(shù)對(duì)應(yīng)的參數(shù)值，分別為340 JK和0.8 KW[23]；Tamb則通常選擇常溫值25℃.該模型現(xiàn)已被很多研究工作[5,16-18,24-28]采用.

Fig. 2　RC model [22].圖2　RC模型圖[22]

上述熱模型是針對(duì)單核系統(tǒng)的，然而隨著人們對(duì)性能的不斷追求，單核已無法滿足需求，由此出現(xiàn)了多核系統(tǒng).多核系統(tǒng)的熱模型除了要考慮自身的溫度變化規(guī)律外，還要考慮不同核之間溫度的相互影響因素.文獻(xiàn)[29]給出多核系統(tǒng)的熱模型：

(2)

其中，Ci和Ri j分別表示處理器i的熱容以及其與處理器j之間的熱抗，Ri j受實(shí)時(shí)系統(tǒng)中核的布局策略影響.上述熱模型與文獻(xiàn)[30-31]給出的類似.

2.3功耗模型

實(shí)時(shí)系統(tǒng)的功耗來源有很多，包括動(dòng)態(tài)功耗、短路功耗、漏電功耗和固有功耗等.其中，動(dòng)態(tài)功耗是任務(wù)執(zhí)行時(shí)產(chǎn)生的；漏電功耗是由漏電流產(chǎn)生的，它是靜態(tài)功耗中的主導(dǎo)部分，部分研究直接將其稱作靜態(tài)功耗；固有功耗是處理器處于開啟狀態(tài)的固有代價(jià).特別地，短路功耗通常僅在信號(hào)轉(zhuǎn)換時(shí)產(chǎn)生，與動(dòng)態(tài)功耗相比完全可以忽略[7,32]，因此相關(guān)研究采用的功耗模型通常只考慮其余三者.也即實(shí)時(shí)系統(tǒng)的總功耗Ptotal可以表示為動(dòng)態(tài)功耗Pdyn、漏電功耗Plkg以及固有功耗Pon三者之和：Ptotal=Pdyn+Plkg+Pon.

2.3.1動(dòng)態(tài)功耗

動(dòng)態(tài)功耗源于器件上電情況下的電路反轉(zhuǎn)，受供電電壓和時(shí)鐘頻率影響，而時(shí)鐘頻率又可以近似為供電電壓的線性函數(shù)，因此動(dòng)態(tài)功耗最終可表示為供電電壓的3次方函數(shù)：

(3)

其中，C1為有效切換電容，Vdd為供電電壓，f為時(shí)鐘頻率[33-34],Vth為閾值電壓，Tmax為芯片可承受的最高溫度(過高的溫度會(huì)減慢處理器的計(jì)算速度)，μ和η為技術(shù)相關(guān)的經(jīng)驗(yàn)參數(shù).65 nm技術(shù)下Vth,μ和η的值分別為0.3 V,1.2和1.19[12].

上述模型雖已被廣泛應(yīng)用，然而事實(shí)上動(dòng)態(tài)功耗除了與處理器的頻率f有關(guān)外，還與具體的任務(wù)有關(guān)，任務(wù)主要是通過影響處理器的使用率來影響能耗的.文獻(xiàn)[35]考慮了這種特性，通過引進(jìn)一個(gè)稱作activityfactor的參數(shù)μi(取值區(qū)間為(0,1])提出一個(gè)更加合理的動(dòng)態(tài)功耗模型(見式(4))，并指出不同任務(wù)中該參數(shù)的測(cè)量方法[36].此外，文獻(xiàn)[37]在已有研究的基礎(chǔ)上給出了一個(gè)精確的動(dòng)態(tài)功耗模型(參見式(5)，考慮了處理器的頻率f和使用率ω)，并通過實(shí)驗(yàn)證明了所提模型的正確性和準(zhǔn)確性.動(dòng)態(tài)功耗是系統(tǒng)功耗的一個(gè)重要組成部分，因此更準(zhǔn)確的系統(tǒng)能耗優(yōu)化必須要有一個(gè)更加準(zhǔn)確合理的動(dòng)態(tài)功耗模型.

(4)

Pdyn=Af3+Bf3ω+Cω+D.

(5)

2.3.2漏電功耗

漏電功耗是由漏電流產(chǎn)生的，只要能量流過電路就會(huì)產(chǎn)生漏電流，因此漏電功耗是必然存在的.供電電壓和溫度是影響漏電流的2個(gè)主要因素，文獻(xiàn)[12]利用SPICE軟件模擬不同電路類型在多個(gè)溫度值下的電流特性，并通過功耗曲線擬合得出漏電功耗和漏電流的表示:

Plkg=NgVddIlkg,

(6)

其中，Ng為系統(tǒng)中晶體管的數(shù)量;T為處理器的溫度，I(V0,T0)為特定的參照溫度和電壓下的漏電流，A,B,α,β,γ和δ為調(diào)節(jié)方法、電路類型、技術(shù)以及設(shè)計(jì)相關(guān)的經(jīng)驗(yàn)參數(shù)，參數(shù)值詳見文獻(xiàn)[12,38].如式(6)所示，漏電流來源主要有2個(gè)，subthreshold leakage和gate leakage分別對(duì)應(yīng)于漏電流公式中的第1項(xiàng)和第2項(xiàng)；前者隨溫度升高而增高，后者與溫度無關(guān).

(7)

Ilkg(i,k)=C1(k)+C2(k)T.

(8)

式(6)給出的漏電流模型雖然精確，但其較大的計(jì)算復(fù)雜度嚴(yán)重影響了在實(shí)際調(diào)度中的應(yīng)用.對(duì)此，文獻(xiàn)[16,24]在計(jì)算復(fù)雜度和精確度之間進(jìn)行權(quán)衡以簡(jiǎn)化漏電流模型，降低其計(jì)算復(fù)雜度.文獻(xiàn)[16]認(rèn)為處理器在其常規(guī)運(yùn)行溫度范圍(303 K～373 K)內(nèi)，式(6)中e的變化較小，因此將漏電流函數(shù)簡(jiǎn)化為溫度的2次函數(shù)(見式(7)，TH和TL分別為給定電壓Vdd下的最高和最低參照溫度)；文獻(xiàn)[24]根據(jù)泰勒公式將式(6)分為溫度的線性函數(shù)部分和高階函數(shù)部分，并將后者作為誤差處理，隨后設(shè)計(jì)大量實(shí)驗(yàn)通過曲線擬合獲取線性部分中的參數(shù)值(與vk有關(guān))，并驗(yàn)證線性模型的精確性.此外，文獻(xiàn)[39]還對(duì)各種可能的線性簡(jiǎn)化模型進(jìn)行推測(cè)分析，通過實(shí)驗(yàn)給出各種模型的精確度對(duì)比.上述所有模型中，式(8)給出的線性簡(jiǎn)化模型因其簡(jiǎn)潔性和準(zhǔn)確性已被很多研究[4,17,35,40]采用.

2.3.3固有功耗

固有功耗是處理器處于開啟狀態(tài)的固有代價(jià)，與漏電功耗一樣，即使處理器處于空閑狀態(tài)也會(huì)產(chǎn)生這部分功耗.與動(dòng)態(tài)功耗和漏電功耗相比，固有功耗的值通常較低，但是當(dāng)任務(wù)的執(zhí)行時(shí)間較長(zhǎng)時(shí)，固有功耗便不可忽略.固有功耗有2個(gè)主要來源:PLL電路和IO子系統(tǒng)；PLL電路的電流高達(dá)200 mA，IO子系統(tǒng)的供電電壓在2.5 V和3.3 V之間，峰值電流高達(dá)400 mA.另外，不同技術(shù)以及體系結(jié)構(gòu)下的固有能耗值不同，文獻(xiàn)[13]將固有功耗的值設(shè)為常量0.1 W.

3優(yōu)化方法

實(shí)時(shí)系統(tǒng)的溫度功耗優(yōu)化管理是指在滿足一定約束條件(溫度、時(shí)間)下，尋找最優(yōu)解(單任務(wù)執(zhí)行優(yōu)化、多任務(wù)調(diào)度方案)的過程.不同應(yīng)用場(chǎng)景下，優(yōu)化目標(biāo)不同，對(duì)應(yīng)的優(yōu)化問題定義也不同.根據(jù)溫度約束條件的不同，實(shí)時(shí)系統(tǒng)優(yōu)化研究可分為2部分：溫度無關(guān)的優(yōu)化研究和溫度感知的優(yōu)化研究.

3.1溫度無關(guān)的優(yōu)化研究

溫度無關(guān)的優(yōu)化研究是指芯片技術(shù)還未發(fā)展到需要考慮溫度因素對(duì)能耗影響時(shí)的實(shí)時(shí)系統(tǒng)優(yōu)化研究.這類研究通常不考慮溫度因素[41]，或是將其當(dāng)作常量考慮[42]，優(yōu)化目標(biāo)也通常只是降低能耗.能耗優(yōu)化雖然也分單任務(wù)和多任務(wù)，但是在這類研究中，二者的區(qū)分并不大：多任務(wù)通常也是按照EDF(earliest deadline first),Priority-Based等方法確定任務(wù)的執(zhí)行順序后，再來優(yōu)化單個(gè)任務(wù)的能耗.考慮到這一時(shí)期，處理器的主導(dǎo)能耗是動(dòng)態(tài)能耗，且影響動(dòng)態(tài)能耗的主要因素是電壓，大多數(shù)優(yōu)化研究[13-15]采用DVS技術(shù)來降低系統(tǒng)能耗；文獻(xiàn)[43]針對(duì)實(shí)時(shí)系統(tǒng)給出了能量感知的動(dòng)態(tài)功耗管理(dynamic power management, DPM)方法，該方法也可與DVS方法聯(lián)合使用.

關(guān)于實(shí)時(shí)任務(wù)的時(shí)間約束，基于DVS的優(yōu)化方法本質(zhì)上均是通過控制處理器的運(yùn)行速度(與電壓呈正相關(guān)關(guān)系)來確保任務(wù)在最壞執(zhí)行時(shí)間下也能夠在截止期限前完成.然而，該類優(yōu)化方法的時(shí)間約束保障機(jī)制通常僅針對(duì)任務(wù)到達(dá)模式已知的實(shí)時(shí)系統(tǒng)，無法確保到達(dá)模式未知的時(shí)間約束.為了解決上述問題，文獻(xiàn)[44]研究負(fù)載的不確定性，并進(jìn)行特征描述；文獻(xiàn)[45]則提出一種歷史任務(wù)感知的在線DVFS方法為可能出現(xiàn)的負(fù)載高峰預(yù)留計(jì)算資源.

1) Na?ve方法

Na?ve方法將處理器的電壓設(shè)置為可能的最大值，也即以最快的速度執(zhí)行任務(wù)，任務(wù)完成后將處理器置于休眠狀態(tài)以節(jié)省能耗.采用Na?ve方法執(zhí)行的實(shí)時(shí)任務(wù)通常都能夠在截至期限前完成，否則該實(shí)時(shí)任務(wù)在該處理器的能力之內(nèi)是不可完成的，任何其他優(yōu)化方法也都不可能完成，因?yàn)镹a?ve方法采取的是最快的速度執(zhí)行任務(wù).然而，也正因?yàn)閳?zhí)行速度最快，性能最高的Na?ve方法的能耗也是最大的(因?yàn)閯?dòng)態(tài)功耗與電壓的3次方成正比).Na?ve方法是后續(xù)能耗優(yōu)化研究的基準(zhǔn)方法，優(yōu)化效果驗(yàn)證均以此為基準(zhǔn).

2) DVS方法

DVS方法將處理器電壓設(shè)置為可能的最小值Vmin(由任務(wù)的最壞執(zhí)行時(shí)間C和截止期限D(zhuǎn)確定)，也即正好在截止期限前完成任務(wù)，使得處理器全程均在工作.然而，電壓的降低會(huì)導(dǎo)致任務(wù)執(zhí)行時(shí)間的延長(zhǎng)，從而增加系統(tǒng)的漏電能耗和固有能耗.事實(shí)上，電壓降低導(dǎo)致的漏電能耗增加處于一個(gè)惡性循環(huán)中：電壓降低，導(dǎo)致Vth降低(為了保證低壓邏輯電路正常運(yùn)轉(zhuǎn))，進(jìn)而Ilkg升高(見式(9))，同時(shí)任務(wù)的執(zhí)行時(shí)間變長(zhǎng)，導(dǎo)致漏電功耗增加；漏電功耗增加，導(dǎo)致芯片溫度T升高，反過來又使得Ilkg增大，漏電功耗增加；這一惡性循環(huán)限制了DVS技術(shù)的應(yīng)用深度[34].

Vth=Vth1-K1Vdd-K2Vbs，

(9)

其中，q為單位電荷；k為普朗克常量；Vth為閾值電壓；T為絕對(duì)溫度；Vth1,K1,K2和Vbs分別為技術(shù)參數(shù)，其值參見文獻(xiàn)[33].

3) CS-DVS和CS-DVS-P方法

鑒于采取極端電壓的Na?ve方法和DVS方法的一些缺陷，文獻(xiàn)[13]提出了CS-DVS方法及其的一個(gè)改進(jìn)算法CS-DVS-P.CS-DVS方法認(rèn)為當(dāng)電壓降低到一定程度時(shí)，任務(wù)的執(zhí)行時(shí)間將會(huì)大幅度延長(zhǎng)，雖然動(dòng)態(tài)能耗持續(xù)降低，但是執(zhí)行時(shí)間的延長(zhǎng)導(dǎo)致漏電能耗不可再被忽略.因此，CS-DVS方法權(quán)衡動(dòng)態(tài)能耗和漏電能耗，將電壓設(shè)置為二者總能耗最低時(shí)的臨界值Vcri，任務(wù)完成后將處理器置于休眠狀態(tài).電壓高于該臨界值時(shí)，動(dòng)態(tài)能耗過高導(dǎo)致總能耗過高，電壓低于該臨界值時(shí)，漏電能耗過高導(dǎo)致總能耗過高.CS-DVS方法首先給出一個(gè)時(shí)鐘周期內(nèi)的能耗模型(參見式(10))，而后通過對(duì)能耗關(guān)于電壓進(jìn)行求導(dǎo)來獲得能耗最低時(shí)的臨界電壓值.該研究通過實(shí)驗(yàn)證明，CS-DVS方法相較于DVS能夠節(jié)省5%的能耗.

tcycle=f-1,f∝Vdd,

Elkg=Plkgtcycle=f-1·Lg·(IsubnVdd+|Vbs|Ij),

Eon=Pontcycle=f-1Pon,

Ecycle=Edyn+Elkg+Eon=αf2+βf-1.

(10)

CS-DVS-P方法則是在CS-DVS方法的基礎(chǔ)上進(jìn)一步考慮了喚醒代價(jià)和休眠代價(jià)之間的權(quán)衡，當(dāng)休眠代價(jià)高于喚醒代價(jià)時(shí)，選擇將處理器置于關(guān)閉狀態(tài)以降低系統(tǒng)的整體能耗.為此，CS-DVS-P方法還添加了一個(gè)任務(wù)延遲執(zhí)行機(jī)制，盡可能將任務(wù)集中起來運(yùn)行從而提高關(guān)閉處理器的概率.該研究通過實(shí)驗(yàn)證明，CS-DVS-P方法能夠節(jié)省18%的能耗.

關(guān)于時(shí)間約束，這類方法對(duì)比所求的臨界電壓值Vcri和可能的最小電壓值Vmin，若Vcri

然而，這類方法依然存在2個(gè)問題：1)未考慮任務(wù)特征對(duì)功率的影響；2)采用簡(jiǎn)單的執(zhí)行時(shí)間與頻率成反比的關(guān)系模型.對(duì)于問題1，處理器功率不僅受執(zhí)行電壓影響，還與其使用率有關(guān)，而該類方法普遍假設(shè)使用率不變，也即忽略了使用率對(duì)功率的影響.然而事實(shí)上，任務(wù)執(zhí)行期間處理器的使用率實(shí)時(shí)變化，且不同特征的任務(wù)具有不同的使用率變化情況，從而導(dǎo)致：①同一任務(wù)相同電壓下，不同時(shí)刻的功率也會(huì)因?yàn)槭褂寐什煌煌?；②同一任?wù)不同電壓下，使用率發(fā)生變化，功率也不同；③不同任務(wù)即使設(shè)置相同的執(zhí)行電壓，功率也會(huì)不同.對(duì)于問題2，實(shí)際執(zhí)行中時(shí)間并非簡(jiǎn)單地與頻率成反比，道理同上.由此可見，能耗即為功率在時(shí)間上的積分，如若功率和時(shí)間的計(jì)算不準(zhǔn)確，將會(huì)嚴(yán)重影響能耗的計(jì)算準(zhǔn)確性，進(jìn)而影響基于該模型的優(yōu)化效果.文獻(xiàn)[37]給出的功率模型雖然考慮了使用率的影響，但是一方面它針對(duì)的是PC機(jī)，未必適用于實(shí)時(shí)系統(tǒng)；另一方面該模型中的使用率只有在任務(wù)執(zhí)行時(shí)才能通過系統(tǒng)接口實(shí)時(shí)獲取使用率，并不滿足這里的預(yù)先計(jì)算需求.文獻(xiàn)[35]給出的功率模型也考慮了使用率的影響，但是粒度僅為較粗的任務(wù)級(jí)別，每個(gè)任務(wù)對(duì)應(yīng)一個(gè)使用率影響因子(原文中稱作activity factor)，并未考慮到該值在任務(wù)執(zhí)行期間的動(dòng)態(tài)變化.

Fig. 3　TALK approach.圖3　TALK方法示意圖

3.2溫度感知的優(yōu)化研究

溫度感知的優(yōu)化研究是隨著半導(dǎo)體技術(shù)的不斷發(fā)展而衍生出來的.越來越高的功率密度使得芯片的溫度也越來越高，一方面使得受溫度影響的漏電能耗無法再被忽略，另一方面過高的溫度還會(huì)嚴(yán)重影響處理器的性能、穩(wěn)定性和可靠性等.因此，在溫度無關(guān)的優(yōu)化研究的基礎(chǔ)上，研究工作者將峰值溫度約束考慮在內(nèi)進(jìn)一步提出了新的溫度感知的優(yōu)化研究.

通過詳細(xì)調(diào)研，我們發(fā)現(xiàn)溫度感知的相關(guān)研究可以分為單任務(wù)的優(yōu)化研究和多任務(wù)的調(diào)度研究2個(gè)層面，二者相輔相成，可以綜合應(yīng)用.對(duì)于單任務(wù)的優(yōu)化研究，現(xiàn)有工作[5,10,16-20]大多致力于發(fā)現(xiàn)更高效的PSS方法，其研究目標(biāo)也通常為降低峰值溫度以及系統(tǒng)能耗.處理器狀態(tài)包括工作、休眠以及關(guān)閉狀態(tài)，其中處于工作狀態(tài)時(shí)還要確定處理器的工作電壓，對(duì)此部分PSS方法融合了DVS技術(shù)，通過尋找較優(yōu)的系統(tǒng)電壓以降低系統(tǒng)總能耗.對(duì)于多任務(wù)的調(diào)度研究，可按照優(yōu)化目標(biāo)將其分為3類：以提高性能為目標(biāo)、以降低能耗為目標(biāo)和以提高能效為目標(biāo).

3.2.1單任務(wù)優(yōu)化

關(guān)于單任務(wù)優(yōu)化，本節(jié)主要介紹現(xiàn)有的典型的優(yōu)化方法中的4種：TALK(temperature aware leakage minimization)，PB(pattern based)，MO(m-oscillating)，VP-TALK(voltage prediction TALK).

關(guān)于實(shí)時(shí)任務(wù)的時(shí)間約束，這4種方法本質(zhì)上均通過以下方法來保障：將實(shí)時(shí)任務(wù)的最壞執(zhí)行時(shí)間C作為時(shí)間條件來求解滿足某種優(yōu)化目標(biāo)的最優(yōu)解.如果最優(yōu)解能夠使得任務(wù)在最壞情況下也滿足截止期限，那么就保證了實(shí)時(shí)任務(wù)的時(shí)間約束.

1) TALK方法

TALK及其改進(jìn)方法[19-20]將周期P等分n段，每段中根據(jù)當(dāng)前的負(fù)載Ci以及溫度Tcur來決定處理器是工作還是休眠，以此來控制處理器的峰值溫度.

TALK方法首先根據(jù)RC(thermal resistances, thermal capacitances)建模[28]給出芯片的溫度升降函數(shù)，而后給出每個(gè)段中處理器狀態(tài)的判定條件(成立時(shí)，判定結(jié)果為休眠，反之為工作)，詳見式(11).此處的溫度升降函數(shù)與2.2節(jié)中給出的系統(tǒng)熱模型本質(zhì)上是一樣的，其中芯片的當(dāng)前溫度可通過溫度傳感器或溫度評(píng)估方法獲取[11].TALK方法的示意圖如圖3所示.該研究通過實(shí)驗(yàn)證明，該方法相對(duì)于Na?ve以及CS-DVS方法分別能夠平均節(jié)省30%和11%的能耗.

(11)

判定條件:

其中，K1和K2為熱平衡狀態(tài)時(shí)的最高溫度和最低溫度;K3為熱容(Cth)和熱抗(Rth)的乘積;Ci為當(dāng)前還需執(zhí)行的負(fù)載，其值為最壞執(zhí)行時(shí)間C與已執(zhí)行時(shí)間t的差；Di為截止期限D(zhuǎn)與已執(zhí)行時(shí)間t的差.

TALK認(rèn)為漏電能耗為主導(dǎo)能耗，且主要考慮溫度因素對(duì)能耗的影響，因此忽略了不受溫度影響的動(dòng)態(tài)能耗；該方法通過考慮了溫度因素的判定條件來滿足峰值溫度約束，處理器狀態(tài)的切換時(shí)間和能耗代價(jià)也可以通過簡(jiǎn)單的修改添加在內(nèi).然而，TALK還存在以下缺點(diǎn)：①TALK方法中處理器的工作電壓為定值，但是文獻(xiàn)中并未給出該值的確定方法，只是在實(shí)驗(yàn)部分聲明采用CS-DVS方法中確定的臨界電壓值；②TALK方法中系統(tǒng)能耗與n密切相關(guān)，但是文獻(xiàn)中并未給出段數(shù)n的確定方法，只是通過實(shí)驗(yàn)結(jié)果得出了系統(tǒng)能耗隨n的增加而降低的結(jié)論，且這個(gè)降低是有限的，受喚醒時(shí)間和能耗代價(jià)的影響(當(dāng)n增到一定程度時(shí)，喚醒代價(jià)會(huì)抵消處理器置于休眠狀態(tài)帶來的能耗優(yōu)化).換句話說，本文并未明確給出依據(jù)什么來確定n值以降低系統(tǒng)能耗，這是否意味著我們只能通過經(jīng)驗(yàn)來設(shè)定n的值？

2) PB方法

PB[16]方法將任務(wù)周期P等分為n段，并在每段中控制處理器都以相同的模式運(yùn)行(工作- 休眠交叉進(jìn)行)，使得因執(zhí)行任務(wù)而溫度升高的處理器有時(shí)間來冷卻，以此來控制處理器的峰值溫度并降低漏電能耗，最后達(dá)到能耗優(yōu)化的目的.

Fig. 4　PB approach.圖4　PB方法示意圖

PB采用式(7)所示的漏電流簡(jiǎn)化模型計(jì)算調(diào)度算法的溫度效果以控制處理器的峰值溫度；其次，該方法認(rèn)為供電電壓為固定值，因此將動(dòng)態(tài)能耗看作常值，從而根據(jù)熱模型推導(dǎo)出溫度與時(shí)間之間的關(guān)系，并根據(jù)恒溫定理(恒溫狀態(tài)下的段的起止溫度相同)求解恒溫值以控制處理器的峰值溫度；最后將恒溫狀態(tài)下的系統(tǒng)能耗表示為段數(shù)n的函數(shù)，并通過求導(dǎo)獲取能耗最小時(shí)的n值，參見式(12).PB方法示意圖參見圖4.該研究設(shè)計(jì)實(shí)驗(yàn)驗(yàn)證該方法在11組不同〈P,C〉的測(cè)試基準(zhǔn)下的優(yōu)化效果，實(shí)驗(yàn)證明該方法與TALK方法相比能夠節(jié)省5%～8%的能耗.

(12)

基于模式的優(yōu)化方法PB能夠讓系統(tǒng)達(dá)到一個(gè)恒溫狀態(tài)，由此可以控制系統(tǒng)的峰值溫度.與TALK相比，本文不是局部地調(diào)度每個(gè)段內(nèi)的處理器狀態(tài)，而是綜合周期內(nèi)的整體情況進(jìn)行模式化調(diào)度，且明確給出能耗最小時(shí)段數(shù)n的確定方法.然而，PB方法還存在3個(gè)缺點(diǎn)：1)PB方法中處理器的工作電壓為定值，但是對(duì)應(yīng)文獻(xiàn)中并未給出該值的確定方法；2)PB方法中給出的系統(tǒng)能耗模型僅適用于恒溫狀態(tài)，而系統(tǒng)達(dá)到該狀態(tài)還需一段時(shí)間，本文并未對(duì)此進(jìn)行分析考慮；3)能耗模型只考慮了處理器狀態(tài)切換的能耗代價(jià)，卻忽略了相應(yīng)的時(shí)間代價(jià).事實(shí)上，PB方法既然針對(duì)的是恒溫狀態(tài)，那么就可以將工作電壓值設(shè)定為V0，V0為某個(gè)滿足峰值溫度約束條件的溫度下使得熱模型中溫度增長(zhǎng)率為零時(shí)對(duì)應(yīng)的電壓值.

3) MO方法

MO及其改進(jìn)方法[5,10,17]在PB方法的基礎(chǔ)上，將每個(gè)段中的處理器運(yùn)行模式改為工作(高速)-工作(低速)模式，以此來更好地控制峰值溫度并降低漏電能耗，最后達(dá)到能耗優(yōu)化的目的.該運(yùn)行模式已在其研究中得到證明，能夠最大限度降低處理器的溫度.

Fig. 5　MO approach.圖5　MO方法示意圖

① MO根據(jù)文獻(xiàn)[24]中關(guān)于漏電流隨溫度變化的研究結(jié)果，將漏電流模型簡(jiǎn)化為線性模型[4](參見式(8))，并根據(jù)熱模型推導(dǎo)出溫度隨時(shí)間變化的原函數(shù)(參見式(13))，進(jìn)而求得給定段的結(jié)束溫度；②根據(jù)熱模型利用簡(jiǎn)化函數(shù)以及每個(gè)段的結(jié)束溫度，通過積分的方法推導(dǎo)出能耗的計(jì)算公式(參見式(14))；③考慮電壓切換時(shí)間和能耗代價(jià)以及時(shí)間和峰值溫度約束，求解能耗最小時(shí)的段數(shù)m(參見式(15)).MO方法的示意圖見圖5所示.該研究通過實(shí)驗(yàn)證明，該方法相對(duì)于Na?ve方法以及PB方法能夠分別節(jié)省25.7%和11.2%的能耗，峰值溫度分別降低23℃和12℃.

P(k)=Plkg(k)+Pdyn(k)=vk(C1(k)+

T(t)=G(k)+(T0-G(k))e-B(k)(t-t0).

(13)

(T0-G(k))e-B(k)(t-t0)-T0+

T0)(e-B(k)(t-t0)-1)).

(14)

E(m)=m·(E(ta,tb)+E(tc,td))+2m·Esw,

Tpeak(m)≤Tthreshold.

(15)

MO方法中給出的能耗評(píng)估方法相對(duì)于文獻(xiàn)[46]中的方法，計(jì)算代價(jià)明顯降低，其精確度受簡(jiǎn)化后的漏電流線性模型的精度影響，且實(shí)驗(yàn)證明其誤差率在4.8%以內(nèi).另外，MO方法證明，相對(duì)于其他速度組合，采用2個(gè)最接近的速度組合完成分配給處理器的周期任務(wù)能夠最大限度降低處理器的溫度，這是因?yàn)殡妷呵袚Q跨度越大，切換的時(shí)間和能耗代價(jià)也越大.因此，MO方法中的2個(gè)工作速度分別為與最小速度Scon=CP鄰近的2個(gè)速度值.

4) VP-TALK方法

VP-TALK[18]在TALK的基礎(chǔ)上給出了處理器運(yùn)行電壓的確定方法以及最優(yōu)段數(shù)n的動(dòng)態(tài)確定方法，彌補(bǔ)了TALK中不考慮任務(wù)負(fù)載以及未給出段數(shù)確定方法的缺陷.對(duì)于前者，該方法通過負(fù)載量預(yù)測(cè)確定與其近似匹配的電壓，彌補(bǔ)了TALK中不考慮任務(wù)負(fù)載的缺陷：首先將復(fù)雜任務(wù)按頻譜長(zhǎng)短分為隨機(jī)、周期和趨勢(shì)3種成分，接著分別采用灰色模型、傅里葉模型和徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)模型對(duì)這3種成分進(jìn)行組合分析，最后獲得負(fù)載的精確預(yù)測(cè)值并確定匹配的電壓值.對(duì)于后者，該方法根據(jù)TALK[19]中獲取的段數(shù)n的上下限，窮舉所有值以確定能耗最小時(shí)對(duì)應(yīng)的n值.另外，該方法還以TALK,PB,MO以及VP-TALK四種源算法為候選算法，從中選取最佳的調(diào)度策略，并通過機(jī)器學(xué)習(xí)反饋指導(dǎo)調(diào)度策略的選擇.負(fù)載預(yù)測(cè)、調(diào)度策略選擇以及調(diào)度策略評(píng)價(jià)3個(gè)模塊共同構(gòu)成的DPTM系統(tǒng)的工作流程圖如圖6所示：

Fig. 6　Work flow of DPTM system [18].圖6　DPTM系統(tǒng)工作流程[18]

該研究通過實(shí)驗(yàn)證明，所提出的負(fù)載預(yù)測(cè)模型優(yōu)于現(xiàn)有大多數(shù)相關(guān)模型及算法，平均誤差僅為2.89%；所提出的VP-TALK算法在較高的工作負(fù)載率和共同的峰值溫度約束下，比PB，MO，TALK方法分別節(jié)能20.54%，11.04%，11.42%；所提出的綜合4種源算法基于機(jī)器學(xué)習(xí)的DPTM原型系統(tǒng)較為接近理想值，與其ETOTALEMAXTPAVGTPMAX參數(shù)相比，分別只產(chǎn)生了12.55%,13.93%，9.02℃，7.91℃的差距.

然而，VP-TALK中并未明確指出DPTM系統(tǒng)中負(fù)載預(yù)測(cè)的觸發(fā)時(shí)機(jī)，也沒有分析調(diào)度系統(tǒng)中負(fù)載預(yù)測(cè)、機(jī)器學(xué)習(xí)等占用的資源對(duì)任務(wù)執(zhí)行的影響以及整個(gè)系統(tǒng)的調(diào)度代價(jià)與調(diào)度粒度之間的權(quán)衡關(guān)系，也沒有給出預(yù)測(cè)偏差較大時(shí)的補(bǔ)救措施.

3.2.2多任務(wù)調(diào)度

多任務(wù)調(diào)度致力于為一組實(shí)時(shí)任務(wù)尋找一個(gè)合適的執(zhí)行計(jì)劃，從而使所有任務(wù)在滿足給定約束條件下達(dá)到某種優(yōu)化目標(biāo).

關(guān)于約束條件，首先實(shí)時(shí)任務(wù)均有截止期限，執(zhí)行計(jì)劃必須保證所有任務(wù)在截止期限內(nèi)完成；其次，實(shí)時(shí)系統(tǒng)還有一個(gè)溫度上限，執(zhí)行計(jì)劃必須保證任務(wù)執(zhí)行期間系統(tǒng)溫度不超過該值.針對(duì)上述約束條件，衍生出了實(shí)時(shí)任務(wù)的可行性分析研究.文獻(xiàn)[29,40]首先分析了多任務(wù)可行性分析研究在時(shí)間和溫度約束條件下存在的問題與挑戰(zhàn)，接著將漏電流與溫度之間的關(guān)聯(lián)關(guān)系考慮在內(nèi)提出了可行性調(diào)度的判定條件，并通過大量實(shí)驗(yàn)進(jìn)行驗(yàn)證.關(guān)于優(yōu)化目標(biāo)，多任務(wù)調(diào)度優(yōu)化研究主要分為性能、能耗以及能效3個(gè)優(yōu)化目標(biāo).其中，性能是指給定時(shí)間內(nèi)完成的任務(wù)數(shù)量；能耗是指完成給定任務(wù)所耗的能量；能效綜合考慮前2個(gè)優(yōu)化目標(biāo)，衡量單位能耗完成的任務(wù)量.這3個(gè)優(yōu)化目標(biāo)是隨著芯片工藝技術(shù)的不斷發(fā)展而逐漸出現(xiàn)的.多任務(wù)調(diào)度確定執(zhí)行計(jì)劃后，在任務(wù)具體執(zhí)行時(shí)有時(shí)也會(huì)采用3.2.1節(jié)中給出的單任務(wù)優(yōu)化方法.

執(zhí)行計(jì)劃的確定是多任務(wù)調(diào)度的核心任務(wù)，具體方法根據(jù)系統(tǒng)類型分為單核和多核2種.對(duì)于單核系統(tǒng)，多任務(wù)通常按照EDF，Priority-Based(包括固定優(yōu)先級(jí)[47]以及考慮任務(wù)的剩余價(jià)值密度和執(zhí)行緊迫性的動(dòng)態(tài)優(yōu)先級(jí)[48]2種)等方法來確定任務(wù)執(zhí)行計(jì)劃.而對(duì)于多核系統(tǒng)，首先需要根據(jù)核的資源特征以及溫度特性確定任務(wù)與核之間的映射關(guān)系，而后按照單核的方法來確定最終的執(zhí)行計(jì)劃.此外，考慮到即將要描述的3種不同優(yōu)化目標(biāo)的多任務(wù)調(diào)度研究均涉及到多核情況，本文將適當(dāng)省略部分介紹.

1) 性能優(yōu)化

多任務(wù)調(diào)度的性能優(yōu)化需要解決的關(guān)鍵問題是任務(wù)執(zhí)行計(jì)劃的確定.文獻(xiàn)[35]以表征性能的指標(biāo)吞吐量為優(yōu)化目標(biāo)，將不同任務(wù)特性對(duì)能耗的影響考慮在內(nèi)(引進(jìn)一個(gè)activity factor，參見2.3.1節(jié))，首先通過熱模型計(jì)算任務(wù)達(dá)到穩(wěn)定狀態(tài)時(shí)的溫度Tss，接著根據(jù)Tss與Tmax(最高約束溫度)之間的大小關(guān)系將任務(wù)分為Hot Task和Cool Task，最后根據(jù)任務(wù)場(chǎng)景采用PB或者“冷熱任務(wù)組”(task pair of a hot task and a cool task)方法尋找滿足溫度約束的任務(wù)延遲最小的執(zhí)行計(jì)劃.前面提出的Tss是指溫度與能耗之間相互影響而達(dá)到的最終收斂溫度，也即dT(t)dt=0時(shí)的溫度.“冷熱任務(wù)組”方法與MO方法類似，二者的區(qū)別是前者是在2個(gè)任務(wù)間切換以保證系統(tǒng)的峰值溫度不超過既定閾值，后者則是通過一個(gè)任務(wù)在2個(gè)執(zhí)行速度(與處理器頻率相關(guān))間切換來保證.然而，該文獻(xiàn)中關(guān)于任務(wù)執(zhí)行時(shí)間的計(jì)算，將其看作與處理器頻率成反比，該方法得到的計(jì)算結(jié)果并不準(zhǔn)確，執(zhí)行時(shí)間還受任務(wù)特性的影響，不同任務(wù)即便是在相同頻率設(shè)定下執(zhí)行時(shí)間也不同.

文獻(xiàn)[49]采用DVFS和任務(wù)遷移技術(shù)實(shí)時(shí)控制核的執(zhí)行速度以及任務(wù)到核的分配策略來降低運(yùn)行在多核系統(tǒng)上的任務(wù)集合的整體完成時(shí)間，從而提高系統(tǒng)的性能.該文獻(xiàn)為推導(dǎo)最優(yōu)策略提供了理論基礎(chǔ)，文中提出的Task-to-Core映射方法相較于基于功耗的線程遷移方法在性能上提高了20.2%.該文獻(xiàn)提出的方法技術(shù)已被整合到一個(gè)溫度感知的體系結(jié)構(gòu)級(jí)模擬器MAGMA；MAGMA能夠在合理的時(shí)間內(nèi)模擬數(shù)百個(gè)核，為相關(guān)研究人員挖掘更優(yōu)的溫度感知的管理方法提供便利，現(xiàn)已被很多研究用來模擬多核實(shí)時(shí)系統(tǒng).文獻(xiàn)[50]針對(duì)多核處理器提出了一種動(dòng)態(tài)溫度管理方法，致力于在降低處理器峰值溫度的同時(shí)盡可能減少對(duì)系統(tǒng)性能的影響.相比于已有工作，該文獻(xiàn)考慮了負(fù)載以及核的產(chǎn)熱行為，分析其對(duì)負(fù)載遷移決策的影響，并通過全局遷移特性來調(diào)控多核的工作頻率.事實(shí)上，所有優(yōu)化方法的挖掘均應(yīng)考慮隨之而來的代價(jià)以及對(duì)原有性能的影響，二者之間通常需要做個(gè)權(quán)衡.

2) 能耗優(yōu)化

多任務(wù)調(diào)度的能耗優(yōu)化研究又可以分為單核能耗優(yōu)化和多核能耗優(yōu)化.多任務(wù)單核能耗優(yōu)化主要也是確定系統(tǒng)能耗最小的任務(wù)執(zhí)行計(jì)劃，這與前面講的性能優(yōu)化方法有異曲同工之處，只是將優(yōu)化目標(biāo)變?yōu)槟芎模颂幉辉儋樖?多任務(wù)多核能耗優(yōu)化在單核能耗優(yōu)化基礎(chǔ)上還需考慮任務(wù)與核之間的映射關(guān)系.不同類型的任務(wù)在不同核上的執(zhí)行能耗不同，因此在多任務(wù)調(diào)度中，還需為任務(wù)集選取合適的核映射方案.

對(duì)此，文獻(xiàn)[51]提出一種粗粒度的宏觀方法，將Hot Task分配給對(duì)其他核的溫度影響較小的核，將Cool Task分配給對(duì)其他核的溫度影響相對(duì)較大的核，以此來降低系統(tǒng)溫度，進(jìn)而降低能耗.文獻(xiàn)[29]對(duì)其進(jìn)行細(xì)化，針對(duì)不同的核分布情況設(shè)計(jì)不同的溫度感知的Task-to-Core分配策略，所遵循的基本原則如下：按照熱度對(duì)Hot Task進(jìn)行排序，盡量將較熱的任務(wù)分配給對(duì)周邊核溫度影響較小的核.具體步驟如下，對(duì)于一個(gè)有N個(gè)核、N個(gè)任務(wù)(T1,T2,…,TN)的實(shí)時(shí)系統(tǒng)，首先計(jì)算能夠保證滿足實(shí)時(shí)任務(wù)截止期限約束的最小執(zhí)行速度，而后計(jì)算每個(gè)任務(wù)需要的功耗，并按照功耗對(duì)任務(wù)的熱度進(jìn)行排序，將熱度較高的任務(wù)分配給位置較偏遠(yuǎn)的核.例如，對(duì)于一個(gè)3×3平面布局的實(shí)時(shí)系統(tǒng)，假設(shè)9個(gè)實(shí)時(shí)任務(wù)的熱度排序?yàn)镻1>P2>…>P9，那么9個(gè)任務(wù)到9個(gè)核的分配圖如圖7所示.

Fig. 7　Task allocation in a system with 3×3 layout.圖7　3×3布局下的任務(wù)分配示意圖

然而，相關(guān)文獻(xiàn)[29,51-52]只是定性研究了任務(wù)到核的靜態(tài)映射方法，并未考慮系統(tǒng)運(yùn)行過程中溫度超出峰值時(shí)對(duì)實(shí)時(shí)任務(wù)的動(dòng)態(tài)管理方法，比如可以通過任務(wù)遷移均衡各核的溫度或通過DVFS等方法來達(dá)到在保障系統(tǒng)溫度約束的同時(shí)，降低系統(tǒng)能耗.

3) 能效優(yōu)化

“能效”一詞在近些年來已被廣泛關(guān)注，不僅涉及到個(gè)人計(jì)算機(jī)、數(shù)據(jù)中心服務(wù)器、超級(jí)計(jì)算機(jī)等，實(shí)時(shí)系統(tǒng)也不例外.文獻(xiàn)[53]就分布式集群的能效進(jìn)行分析，首先給出了能效定義，從理論上推導(dǎo)出能效最高的條件并通過實(shí)驗(yàn)進(jìn)行驗(yàn)證，同時(shí)還指出了提高能效的幾種途徑.然而，實(shí)時(shí)系統(tǒng)的能效優(yōu)化由于硬件等的差異與之有所相同.

文獻(xiàn)[54]在給定平均吞吐量的約束下，提出一個(gè)多層框架，通過多核整合、DVFS以及任務(wù)遷移等技術(shù)降低同構(gòu)多核系統(tǒng)的能耗.該研究隸屬于能效優(yōu)化，然而卻忽略了峰值溫度約束，也未考慮溫度與漏電功耗之間的關(guān)系.文獻(xiàn)[55]研究了單核實(shí)時(shí)系統(tǒng)下溫度感知的能效優(yōu)化方法，通過控制時(shí)鐘以及風(fēng)扇速度來提高能效.然而，該研究采用了一個(gè)簡(jiǎn)化的熱模型，未考慮溫度對(duì)時(shí)延(過高的溫度會(huì)降低處理器的計(jì)算速度，從而降低性能延長(zhǎng)任務(wù)執(zhí)行時(shí)間)的影響.文獻(xiàn)[56]研究了多核實(shí)時(shí)系統(tǒng)下溫度感知的能效優(yōu)化方法，首先將溫度對(duì)時(shí)延的影響考慮在內(nèi)分析了系統(tǒng)的能效特性，接著提出通過在線DVFS、任務(wù)遷移以及風(fēng)扇速度控制實(shí)現(xiàn)系統(tǒng)的高能效，尋找能效最高時(shí)的Task-to-Core映射.實(shí)驗(yàn)證明該方法與單純的性能優(yōu)化相比，系統(tǒng)能效提高了3.2倍；與現(xiàn)有應(yīng)用在PC上的能效優(yōu)化技術(shù)相比提高了37%.然而，該文獻(xiàn)中DVFS以及Task-to-Core的調(diào)度頻率過高，調(diào)度間隔分別為10 ms和100 ms，因此應(yīng)將調(diào)度代價(jià)(切換時(shí)間、能耗代價(jià))考慮在內(nèi).文獻(xiàn)[57]在采用運(yùn)行時(shí)DVFS和Task-to-Core映射技術(shù)外，還對(duì)DVFS進(jìn)行擴(kuò)展，使其涵蓋Near-Threshold Computing,Nominal和Turbo-Boost三種區(qū)間調(diào)度模式，以此解決深亞微米技術(shù)下受限的電壓調(diào)節(jié)問題，從而進(jìn)一步提高系統(tǒng)能效；此外，還將影響漏電能耗以及時(shí)延預(yù)測(cè)的過程變動(dòng)信息融合在內(nèi)，避免做出太過樂觀的決策.

3.3優(yōu)化方法對(duì)比分析

根據(jù)前2節(jié)的描述可以看出實(shí)時(shí)系統(tǒng)溫度功耗管理研究的發(fā)展歷程：由傳統(tǒng)的不考慮溫度對(duì)功耗影響的性能能耗優(yōu)化到溫度感知的單任務(wù)優(yōu)化，再到溫度感知的多核多任務(wù)優(yōu)化.本節(jié)對(duì)前面給出的優(yōu)化方法進(jìn)行總結(jié)，主要從研究分類、具體機(jī)制、優(yōu)化目標(biāo)、電壓是否恒定以及調(diào)度計(jì)劃制定的時(shí)間這5個(gè)方面進(jìn)行對(duì)比，如表1所示.通過對(duì)比，本文總結(jié)實(shí)時(shí)系統(tǒng)溫度優(yōu)化管理研究需要考慮的因素如下：

1) 優(yōu)化目標(biāo).實(shí)時(shí)系統(tǒng)溫度功耗管理的優(yōu)化目標(biāo)有很多，包括性能吞吐量、能耗和能效等.優(yōu)化目標(biāo)不同，具體優(yōu)化方法也不同.例如，性能優(yōu)化通常是站在任務(wù)的角度出發(fā)的，吞吐量和能效優(yōu)化則通常是站在系統(tǒng)的角度出發(fā)的，能耗則二者均可.從任務(wù)角度出發(fā)的最佳優(yōu)化在系統(tǒng)角度看未必最優(yōu).

2) 優(yōu)化對(duì)象.實(shí)時(shí)系統(tǒng)有單核也有多核，優(yōu)化方法有針對(duì)單任務(wù)的也有針對(duì)多任務(wù)的.不同的優(yōu)化對(duì)象，需要考慮的優(yōu)化層面不同：多核優(yōu)化通常還需要考慮Task-to-Core的映射優(yōu)化，而多任務(wù)優(yōu)化還需考慮任務(wù)組合運(yùn)行的優(yōu)化.任務(wù)組合運(yùn)行時(shí)，還涉及到任務(wù)的中斷與繼續(xù)，由此衍生出任務(wù)切換代價(jià).

3) 優(yōu)化粒度.優(yōu)化粒度越細(xì)，優(yōu)化效果越好，然而代價(jià)也越高.這里，代價(jià)不僅包括優(yōu)化算法的計(jì)算代價(jià)，還包括優(yōu)化調(diào)度時(shí)的切換代價(jià)(如DVFS時(shí)處理器狀態(tài)的切換代價(jià)和任務(wù)遷移時(shí)的遷移代價(jià)).因此，需要選取一個(gè)合適的優(yōu)化粒度.

4) 模型簡(jiǎn)化.在優(yōu)化過程中，往往會(huì)為了降低優(yōu)化算法的計(jì)算復(fù)雜度而對(duì)一些模型或影響因素進(jìn)行簡(jiǎn)化.漏電流函數(shù)是最常被簡(jiǎn)化的，簡(jiǎn)化方法有很多種，它們的適用條件、簡(jiǎn)化后的精度以及計(jì)算代價(jià)都不同.因此，有必要在精度與計(jì)算效率之間權(quán)衡，對(duì)模型做出恰當(dāng)?shù)暮?jiǎn)化.此外，優(yōu)化目標(biāo)函數(shù)中通常也會(huì)忽略一些諸如固有能耗、切換代價(jià)(包括能耗和時(shí)間)、不同任務(wù)對(duì)CPU使用率的影響以及溫度對(duì)處理器頻率的影響等因素，但這些因素分別在任務(wù)執(zhí)行時(shí)間較長(zhǎng)、切換較為頻繁、任務(wù)類型(包括CPU密集型、IO密集型、交互性等)相差較大以及溫度變化較大時(shí)是不可忽略的，否則會(huì)嚴(yán)重影響優(yōu)化效果.

5) 優(yōu)化時(shí)間.優(yōu)化方案的確定可以是靜態(tài)的也可以動(dòng)態(tài)的，二者各有優(yōu)劣.前者無需考慮任務(wù)執(zhí)行時(shí)的變動(dòng)因素，比后者簡(jiǎn)單，但優(yōu)化效果卻不如后者;動(dòng)態(tài)優(yōu)化中，可以動(dòng)態(tài)校準(zhǔn)諸如工作電壓、任務(wù)分配以及風(fēng)扇速度等因素，從而使優(yōu)化結(jié)果更準(zhǔn)確.

Table 1　Optimization Approaches Comparison of Thermal and Power Management for Real-time Systems

4總結(jié)與展望

本文綜述了實(shí)時(shí)系統(tǒng)中多約束條件下的溫度功耗管理優(yōu)化方法：首先介紹并分析了溫度功耗管理的相關(guān)知識(shí)及現(xiàn)有研究分類，而后從實(shí)時(shí)系統(tǒng)模型以及優(yōu)化方法2個(gè)方面對(duì)研究現(xiàn)狀進(jìn)行總結(jié).實(shí)時(shí)系統(tǒng)模型是溫度功耗管理優(yōu)化的基礎(chǔ)，包括任務(wù)模型、熱模型、功耗模型等.優(yōu)化方法則隨著半導(dǎo)體技術(shù)的發(fā)展根據(jù)是否考慮溫度分為2部分：溫度無關(guān)的優(yōu)化研究以及溫度感知的優(yōu)化研究.其中，后者又包含單任務(wù)優(yōu)化和多任務(wù)調(diào)度，這二者相輔相成，共同構(gòu)成實(shí)時(shí)系統(tǒng)的優(yōu)化機(jī)制.目前，實(shí)時(shí)系統(tǒng)中多約束條件下的溫度功耗管理研究已經(jīng)日趨成熟，然而仍存在一些問題需要進(jìn)一步研究完善，具體總結(jié)如下：

1) 考慮不同任務(wù)特性對(duì)動(dòng)態(tài)功耗以及任務(wù)執(zhí)行時(shí)間的影響，研究更精準(zhǔn)的能耗(功率在時(shí)間上的積分)模型.不同計(jì)算類型(可以是CPU密集型，也可以是IO密集型)的實(shí)時(shí)任務(wù)，即使采用完全相同的處理器調(diào)度方法，其執(zhí)行功耗也差別很大，因?yàn)椴煌?jì)算類型的任務(wù)對(duì)處理器的使用率影響很大，進(jìn)而影響能耗；此外，實(shí)時(shí)任務(wù)執(zhí)行過程中，不同處理器狀態(tài)(頻率和電壓)下執(zhí)行時(shí)間不同，現(xiàn)有研究采用簡(jiǎn)單的執(zhí)行時(shí)間與頻率的反比關(guān)系遠(yuǎn)遠(yuǎn)不夠精確，還需研究更準(zhǔn)確的時(shí)間模型以確保能耗的計(jì)算準(zhǔn)確性以及基于該模型的優(yōu)化效果.綜上，將不同任務(wù)特性對(duì)功耗以及執(zhí)行時(shí)間的影響考慮在內(nèi)的能耗計(jì)算模型亟待研究與發(fā)現(xiàn).

2) 考慮任務(wù)對(duì)資源的需求特性以及電壓調(diào)節(jié)代價(jià)，探究合適的動(dòng)態(tài)電壓調(diào)節(jié)粒度.現(xiàn)有的DVS及其衍生方法中所說的動(dòng)態(tài)電壓調(diào)節(jié)的粒度是任務(wù)，也即根據(jù)優(yōu)化目標(biāo)確定實(shí)時(shí)任務(wù)的最佳執(zhí)行電壓(整個(gè)執(zhí)行期間均以該電壓運(yùn)行)，而此處要強(qiáng)調(diào)的是應(yīng)該將這一粒度細(xì)化，在任務(wù)執(zhí)行期間可以設(shè)置固定的時(shí)間窗口定時(shí)選取最佳執(zhí)行電壓，這是因?yàn)槿蝿?wù)執(zhí)行的不同階段對(duì)資源的需求不同，若是僅籠統(tǒng)地為任務(wù)選取單一的執(zhí)行電壓或者固定的電壓模式勢(shì)必會(huì)削弱DVS的優(yōu)化效果.當(dāng)然，增大DVS的調(diào)節(jié)粒度是要增加額外代價(jià)的，這就需要根據(jù)實(shí)際情況探究合適的調(diào)節(jié)粒度，這也是未來研究的一個(gè)著眼點(diǎn).

3) 研究實(shí)時(shí)任務(wù)執(zhí)行期間處理器使用率的變化規(guī)律以及基于此的分類方法.1.1節(jié)中介紹的周期任務(wù)、偶發(fā)任務(wù)以及非周期任務(wù)是根據(jù)任務(wù)的實(shí)例發(fā)布規(guī)律來進(jìn)行分類的，而實(shí)例發(fā)布規(guī)律對(duì)實(shí)時(shí)系統(tǒng)的功耗以及受功耗影響的溫度并沒有直接的關(guān)聯(lián)關(guān)系.相反，任務(wù)執(zhí)行期間處理器使用率的變化情況卻對(duì)系統(tǒng)功耗有較大影響，不同變化規(guī)律對(duì)應(yīng)不同的優(yōu)化方法.因此，針對(duì)每種類型特性研究其對(duì)應(yīng)的溫度功耗優(yōu)化方法，進(jìn)而可以為每一種類型任務(wù)研發(fā)專用的實(shí)時(shí)系統(tǒng)，將會(huì)很大程度上降低優(yōu)化的復(fù)雜度.

參考文獻(xiàn)

[1]Moore G E. Cramming more components onto integrated circuits[J]. Electronics, 1965, 38(8): 114-117

[2]Dennard R H, Gaensslen F H, Rideout V L, et al. Design of ion-implanted MOSFET’s with very small physical dimensions[J]. IEEE Journal of Solid-State Circuits, 1974, 9(5): 256-268

[3]Skadron K, Stan M R, Huang Wei, et al. Temperature-aware computer systems: Opportunities and challenges[J]. IEEE Micro, 2003, 23(6): 52-61

[4]Quan Gang, Zhang Yan. Leakage aware feasibility analysis for temperature-constrained hard real-time periodic tasks[C]Proc of the 21st Euromicro Conf on Real-Time Systems. Piscataway, NJ: IEEE, 2009: 207-216

[5]Huang Huang, Quan Gang. Leakage aware energy minimization for real-time systems under the maximum temperature constraint[C]Proc of the Conf on Design, Automation and Test in Europe. Piscataway, NJ: IEEE, 2011: 479-484

[6]Isovic D, Fohler G. Efficient scheduling of sporadic, aperiodic, and periodic tasks with complex constraints[C]Proc of the 21st IEEE Real-Time Systems Symp. Piscataway, NJ: IEEE, 2000: 207-216

[7]Awan M A. Energy and temperature aware real-time systems[D]. Porto, Portugal: University of Porto, 2014[

8]Wilhelm R, Engblom J, Ermedahl A, et al. The worst-case execution-time problem overview of methods and survey of tools[J]. ACM Trans on Embedded Computing Systems, 2008, 7(3): Article number 36

[9]Puschner P, Burns A. A review of worst-case execution-time analysis[J]. Real-Time Systems, 2000, 18(2): 115-128

[10]Huang Huang, Chaturvedi V, Liu Guanglei, et al. Leakage aware scheduling on maximum temperature minimization for periodic hard real-time systems[J]. Journal of Low Power Electronics, 2012, 8(4): 378-393

[11]Skadron K, Stan M R, Sankaranarayanan K, et al. Temperature-aware microarchitecture: Modeling and implementation[J]. ACM Trans on Architecture and Code Optimization, 2004, 1(1): 94-125

[12]Liao Weiping, He Lei, Lepak K M. Temperature and supply voltage aware performance and power modeling at microarchitecture level[J]. IEEE Trans on Computer-Aided Design of Integrated Circuits and Systems, 2005, 24(7): 1042-1053

[13]Jejurikar R, Pereira C, Gupta R. Leakage aware dynamic voltage scaling for real-time embedded systems[C]Proc of the 41st Annual Design Automation Conf. New York: ACM, 2004: 275-280

[14]Zhai Bo, Blaauw D, Sylvester D, et al. Theoretical and practical limits of dynamic voltage scaling[C]Proc of the 41st Annual Design Automation Conf. New York: ACM, 2004: 868-873

[15]Aydin H, Melhem R, Mossé D, et al. Dynamic and aggressive scheduling techniques for power-aware real-time systems[C]Proc of the 22nd IEEE Real-Time Systems Symp. Piscataway, NJ: IEEE, 2001: 95-105

[16]Yang Chuanyue, Chen Jianjia, Thiele L, et al. Energy-efficient real-time task scheduling with temperature-dependent leakage[C]Proc of the Design, Automation and Test in Europe Conference and Exhibition. Leuven, Belgium: European Design and Automation Association, 2010: 9-14

[17]Chaturvedi V, Huang Huang, Quan Gang. Leakage aware scheduling on maximum temperature minimization for periodic hard real-time systems[C]Proc of the 10th IEEE Int Conf on Computer and Information Technology. Piscataway, NJ: IEEE, 2010: 1802-1809

[18]Zhao Guoxing, Yan Jiaqi, Luo Zuying. Dynamic power and temperature management based on accurate workload prediction[J]. Chinese Journal of Computers, 2014, 37(11): 2298-2308 (in Chinese)(趙國興, 閆佳琪, 駱祖瑩. 基于任務(wù)精確預(yù)測(cè)的實(shí)時(shí)功耗溫度管理[J]. 計(jì)算機(jī)學(xué)報(bào), 2014, 37(11): 2298-2308)

[19]Yuan Lin, Leventhal S, Qu Gang. Temperature-aware leakage minimization technique for real-time systems[C]Proc of the IEEEACM Int Conf on Computer-Aided Design. New York: ACM, 2006: 761-764

[20]Yuan Lin, Leventhal S R, Gu Junjun, et al. TALK: A temperature-aware leakage minimization technique for real-time systems[J]. IEEE Trans on Computer-Aided Design of Integrated Circuits and Systems, 2011, 30(10): 1564-1568

[21]Sergent J E, Krum A. Thermal Management Handbook: For Electronic Assemblies[M]. New York: McGraw-Hill Professional, 1998

[22]Li Xiang, Jiang Xiaohong, Wu Zhaohui, et al. Research on thermal management methods for green data centers[J]. Chinese Journal of Computers, 2015, 38(10): 1976-1996 (in Chinese)(李翔, 姜曉紅, 吳朝暉, 等. 綠色數(shù)據(jù)中心的熱量管理方法研究[J]. 計(jì)算機(jī)學(xué)報(bào), 2015, 38(10): 1976-1996)

[23]Skadron K, Stan M R, Huang W, et al. Temperature-aware microarchitecture[C]Proc of the 30th Annual Int Symp on Computer Architecture. New York: ACM, 2003: 2-13

[24]Liu Yongpan, Dick R P, Shang Li, et al. Accurate temperature-dependent integrated circuit leakage power estimation is easy[C]Proc of the Design, Automation and Test in Europe Conference and Exhibition. San Jose, CA: EDA Consortium, 2007: 1526-1531

[25]Cheng L, Huang K, Chen G, et al. Minimizing peak temperature for pipelined hard real-time systems[C]Proc of the Design, Automation and Test in Europe Conference and Exhibition. Piscataway, NJ: IEEE, 2016: 1090-1095

[26]Bao M, Andrei A, Eles P, et al. Temperature-aware voltage selection for energy optimization[C]Proc of the Conf on Design, Automation and Test in Europe. New York: ACM, 2008: 1083-1086

[27]Rai D, Yang H, Bacivarov I, et al. Worst-case temperature analysis for real-time systems[C]Proc of the Design, Automation and Test in Europe Conference and Exhibition. Piscataway, NJ: IEEE, 2011: 631-636

[28]Skadron K, Abdelzaher T, Stan M R. Control-theoretic techniques and thermal-RC modeling for accurate and localized dynamic thermal management[C]Proc of the 8th Int Symp on High-Performance Computer Architecture. Piscataway, NJ: IEEE, 2002: 17-28

[29]Chaturvedi V. Leakage temperature dependency aware real-time scheduling for power and thermal optimization[D]. Miami, Florida: Florida International University, 2013

[30]Sharifi S, Ayoub R, Rosing T S. TempoMP: Integrated prediction and management of temperature in heterogeneous MPSoCs[C]Proc of the Design, Automation and Test in Europe Conference and Exhibition. San Jose, CA: EDA Consortium, 2012: 593-598

[31]Ukhov I, Bao M, Eles P, et al. Steady-state dynamic temperature analysis and reliability optimization for embedded multiprocessor systems[C]Proc of the 49th Annual Design Automation Conf. New York: ACM, 2012: 197-204

[32]Veendrick H J. Short-circuit dissipation of static CMOS circuitry and its impact on the design of buffer circuits[J]. IEEE Journal of Solid-State Circuits, 1984, 19(4): 468-473

[33]Martin S M, Flautner K, Mudge T, et al. Combined dynamic voltage scaling and adaptive body biasing for lower power microprocessors under dynamic workloads[C]Proc of the IEEEACM Int Conf on Computer-Aided Design. New York: ACM, 2002: 721-725

[34]Mudge T. Power: A first-class architectural design constraint[J]. Computer, 2001, 34(4): 52-58

[35]Huang Huang, Chaturvedi V, Quan Gang, et al. Throughput maximization for periodic real-time systems under the maximal temperature constraint[J]. ACM Trans on Embedded Computing Systems, 2014, 13(2): Article number 70

[36]Brooks D, Tiwari V, Martonosi M. Wattch: A framework for architectural-level power analysis and optimizations[C]Proc of the 27th Annual Int Symp on Computer Architecture. New York: ACM, 2000: 83-94

[37]Song Jie, Li Tiantian, Wang Zhi, et al. Study on energy-consumption regularities of cloud computing systems by a novel evaluation model[J]. Computing, 2013, 95(4): 269-287

[38]He Lei, Liao Weiping, Stan M R. System level leakage reduction considering the interdependence of temperature and leakage[C]Proc of the 41st Annual Design Automation Conf. New York: ACM, 2004: 12-17

[39]Huang Huang, Quan Gang, Fan J. Leakage temperature dependency modeling in system level analysis[C]Proc of the 11th Int Symp on Quality Electronic Design. Piscataway, NJ: IEEE, 2010: 447-452

[40]Quan Gang, Chaturvedi V. Feasibility analysis for temperature-constraint hard real-time periodic tasks[J]. IEEE Trans on Industrial Informatics, 2010, 6(3): 329-339

[41]Lee C H, Shin K G. On-line dynamic voltage scaling for hard real-time systems using the EDF algorithm[C]Proc of the 25th IEEE Int Real-Time Systems Symp. Piscataway, NJ: IEEE, 2004: 319-335

[42]Jejurikar R, Gupta R. Dynamic slack reclamation with procrastination scheduling in real-time embedded systems[C]Proc of the 42nd Annual Design Automation Conf. New York: ACM, 2005: 111-116

[43]Bambagini M, Marinoni M, Aydin H, et al. Energy-aware scheduling for real-time systems: A survey[J]. ACM Trans on Embedded Computing Systems, 2016, 15(1): Article number 7

[44]Das A, Kumar A, Veeravalli B, et al. Workload uncertainty characterization and adaptive frequency scaling for energy minimization of embedded systems[C]Proc of the Design, Automation and Test in Europe Conference and Exhibition. San Jose, CA: EDA Consortium, 2015: 43-48

[45]Lampka K, Forsberg B. Keep it slow and in time: Online DVFS with hard real-time workloads[C]Proc of the Design, Automation & Test in Europe Conference & Exhibition. Piscataway, NJ: IEEE, 2016: 385-390

[46]Liu Yongpan, Yang Huazhong, Dick R P, et al. Thermal Vs energy optimization for DVFS-enabled processors in embedded systems[C]Proc of the 8th Int Symp on Quality Electronic Design. Piscataway, NJ: IEEE, 2007: 204-209

[47]Abdedda?m Y, Chandarli Y, Davis R I, et al. Response time analysis for fixed priority real-time systems with energy-harvesting[J]. Real-Time Systems, 2016, 52(2): 125-160

[48]Xia Jiali, Chen Hui, Yang Bing. A real-time task scheduling algorithm based on dynamic priority[J]. Chinese Journal of Computers, 2012, 35(12): 2685-2695 (in Chinese)(夏家莉, 陳輝, 楊兵. 一種動(dòng)態(tài)優(yōu)先級(jí)實(shí)時(shí)任務(wù)調(diào)度算法[J]. 計(jì)算機(jī)學(xué)報(bào), 2012, 35(12): 2685-2695)

[49]Hanumaiah V, Vrudhula S, Chatha K S. Performance optimal online DVFS and task migration techniques for thermally constrained multi-core processors[J]. IEEE Trans on Computer-Aided Design of Integrated Circuits and Systems, 2011, 30(11): 1677-1690

[50]Salami B, Noori H, Mehdipour F, et al. Physical-aware predictive dynamic thermal management of multi-core processors[JOL]. Journal of Parallel and Distributed Computing, 2016 [2016-03-01]. http:www.sciencedirect.comsciecearticlepii74373151600037X

[51]Fan M, Chaturvedi V, Sha S, et al. Thermal-aware energy minimization for real-time scheduling on multi-core systems[J]. ACM SIGBED Review, 2013, 10(2): 27

[52]Awan M A, Yomsi P M, Nelissen G, et al. Energy-aware task mapping onto heterogeneous platforms using DVFS and sleep states[J]. Real-Time Systems, 2016, 52(4): 450-485

[53]Song Jie, Li Tiantian, Yan Zhenxing, et al. Energy-efficiency model and measuring approach for cloud computing[J]. Journal of Software, 2012, 23(2): 200-214 (in Chinese)(宋杰, 李甜甜, 閆振興, 等. 一種云計(jì)算環(huán)境下的能效模型和度量方法[J]. 軟件學(xué)報(bào), 2012, 23(2): 200-214)

[54]Ghasemazar M, Pakbaznia E, Pedram M. Minimizing the power consumption of a chip multiprocessor under an average throughput constraint[C]Proc of the 11th Int Symp on Quality Electronic Design. Piscataway, NJ: IEEE, 2010: 362-371

[55]Shin D, Chung S W, Chung E Y, et al. Energy-optimal dynamic thermal management: Computation and cooling power co-optimization[J]. IEEE Trans on Industrial Informatics, 2010, 6(3): 340-351

[56]Hanumaiah V, Vrudhula S. Energy-efficient operation of multicore processors by DVFS, task migration, and active cooling[J]. IEEE Trans on Computers, 2014, 63(2): 349-360

[57]Maiti S, Kapadia N, Pasricha S. Process variation aware dynamic power management in multicore systems with extended range voltagefrequency scaling[C]Proc of the 58th IEEE Int Midwest Symp on Circuits and Systems. Piscataway, NJ: IEEE, 2015: 1-4

Li Tiantian, born in 1989. PhD candidate. Student member of China Computer Federation. Her main research interests include energy efficient computing, and data intensive computing.

Yu Ge, born in 1962. Professor and PhD supervisor in Northeastern University. His main research interests include database theory and data flow.

Song Jie, born in 1980. PhD and associate professor in Northeastern University. His main research interests include cloud computing, data intensive computing and big data.

收稿日期：2016-03-09；修回日期：2016-05-13

基金項(xiàng)目：國家自然科學(xué)基金項(xiàng)目(61433008,61502090)

通信作者：宋杰(songjie@mail.neu.edu.cn)

中圖法分類號(hào)TP393

Optimization Research on Thermal and Power Management for Real-Time Systems

Li Tiantian1, Yu Ge1, and Song Jie2

1(CollegeofComputerScienceandEngineering,NortheasternUniversity,Shenyang110819)2(SoftwareCollege,NortheasternUniversity,Shenyang110819)

AbstractPower consumption issue of real-time system has been paid much attention to by both academia and industry due to its constraints on energy, peak temperature and deadline of real-time task. Up to now, there have been many related researches. Temperature-unaware traditional researches usually adopt DVS to scale processor states for optimal power management. However, with the increasing power density of processors due to the continuous shrinking of chip size, the mutual effect between temperature and power has become unignorably. As a consequence, many new temperature-aware optimization approaches have derived based on the traditional methods. This paper firstly makes an overview of the three models (task, thermal and power) this research bases on; secondly, this paper divides existing researches into two categories: temperature-unaware traditional researches and temperature-aware optimization researches, and the latter one is further divided as single task optimization and multi-task scheduling; thirdly, this paper makes a comparison of the researches from mechanism, optimization goal and effect, and scheduling time etc., analyzing their advantages and disadvantages; finally, this paper points out the future research directions.

Key wordsreal-time system; temperature aware; energy constrained; power consumption optimization; task scheduling

This work was supported by the National Natural Science Foundation of China (61433008,61502090).

計(jì)算機(jī)研究與發(fā)展2016年7期

計(jì)算機(jī)研究與發(fā)展的其它文章: 2014年《計(jì)算機(jī)研究與發(fā)展》高被引論文TOP10; 面向軟件非功能需求的軟件過程建模方法; 截止時(shí)限為關(guān)鍵參數(shù)的混合關(guān)鍵級(jí)實(shí)時(shí)任務(wù)調(diào)度研究; 基于頂點(diǎn)加權(quán)的介度中心近似算法研究; 基于分布式低秩表示的子空間聚類算法; 結(jié)合互補(bǔ)度的基于擴(kuò)展規(guī)則#SAT問題求解方法