如今,多內(nèi)核處理器正日益成為解決蜂窩基站功率與性能難題的常用有效工具。
雖然無線領(lǐng)域中最受青睞的應(yīng)用仍然是語音,但是數(shù)據(jù)正緊隨其后,迅速成為熱門的3G應(yīng)用,而且隨著運(yùn)營(yíng)商對(duì)諸如移動(dòng)WiMAX(IEEE 802.16e)和長(zhǎng)期演進(jìn)(LTE)等4G技術(shù)的部署,數(shù)據(jù)的這種發(fā)展勢(shì)頭還將持續(xù)下去。在電子郵件、Web瀏覽、音樂下載以及機(jī)器對(duì)機(jī)器(M2M)的應(yīng)用中,所有數(shù)據(jù)流量都會(huì)增加每個(gè)收發(fā)器基站(BTS)或節(jié)點(diǎn)B(Node B)的工作量,在城市地區(qū)尤為如此。
在為BTS調(diào)制解調(diào)器應(yīng)用開發(fā)片上系統(tǒng)(SoC)的過程中,這些工作量會(huì)為芯片設(shè)計(jì)人員帶來新的挑戰(zhàn)。一個(gè)主要問題是基帶處理器平臺(tái),在該平臺(tái)上多內(nèi)核處理器正日益成為平衡功率與性能的高效率通用工具。
對(duì)于3G與4GBTS應(yīng)用而言,理想的解決方案應(yīng)采用具備片上加速器的多內(nèi)核數(shù)字信號(hào)處理器(DSP),從而避免采用FPGA或微處理器的麻煩。多內(nèi)核平臺(tái)能夠降低研發(fā)成本并同時(shí)加速開發(fā)與上市進(jìn)程,尤其在用于軟件可編程平臺(tái)時(shí)更為如此,因而可支持多種應(yīng)用并形成可擴(kuò)展解決方案以支持各種外形尺寸,進(jìn)而使BTS廠商直接受益。
此外,理想的解決方案還可包含高性能接口,如用于網(wǎng)絡(luò)連接的千兆位以太網(wǎng),片上開放式基站架構(gòu)項(xiàng)目(OBSAI),通用公共無線電廣播接口(CPRI)天線接口等,以支持通過底板與RF收發(fā)器卡或者遠(yuǎn)程無線電廣播前端(RRH)的連接,同時(shí)也能實(shí)現(xiàn)DSP間連接與RapidlO的直接連接。圖1對(duì)部分選擇進(jìn)行了說明。

電源問題是眾多移動(dòng)基礎(chǔ)局端廠商及其供應(yīng)商升級(jí)至多內(nèi)核設(shè)計(jì)的主要原因。隨著BTS工作負(fù)載的不斷增加,鑒于所需功率與散熱,僅僅簡(jiǎn)單地提高DSP頻率已不再是可行的解決方案。而取代更高性能DSP的首選方案將是采用多核設(shè)計(jì)。例如,如果系統(tǒng)需要DSP提供3GHz性能,那么最理想的選擇是采用三個(gè)運(yùn)行頻率均為1GHz,并采用單個(gè)DSP封裝的內(nèi)核。這種設(shè)計(jì)可以同時(shí)滿足電源與性能的要求。另一個(gè)針對(duì)高性能DSP的低功耗技術(shù)是TI的SmartReflex?技術(shù),其可以同時(shí)降低靜態(tài)與動(dòng)態(tài)功耗,并且可同時(shí)保持指定的器件性能。TI的Smart Reflex需要考慮眾多技術(shù)因素,如基于制造工藝的專用器件硅芯片特性以及熱參數(shù)等。這樣可有效降低DSP的功耗,同時(shí)保持性能目標(biāo)——當(dāng)前TC16488為1GHz,是集成了Smart Reflex技術(shù)的DSP之一。
新靈活性
由于DSP變得更為強(qiáng)大,因此它們能夠完成以前需要輔助元件(如通用處理器、RISC處理器以及FPGA等)才能完成的任務(wù)。如TI的TCl6488等最新的多內(nèi)核DSP具有足夠強(qiáng)大的能力來處理基帶卡中的所有任務(wù)。由于消除了不必要的組件并進(jìn)而降低了材料清單(BoM)成本,因而其可以直接改進(jìn)廠商的賬本底線并增強(qiáng)競(jìng)爭(zhēng)優(yōu)勢(shì)。此外,避免采用高功耗的FPGA還有助于系統(tǒng)設(shè)計(jì)人員充分滿足效率要求。
例如,在TCl6488等多內(nèi)核處理器中,系統(tǒng)設(shè)計(jì)人員可以安排單個(gè)DSP內(nèi)核來負(fù)責(zé)MAC處理(以前需要獨(dú)立的RISC處理器),而讓其他的DSP內(nèi)核來管理PHY處理與其他功能。通過同時(shí)支持同一平臺(tái)中的MAC與PHY層處理,TCl6488還可以優(yōu)化設(shè)計(jì)過程。根據(jù)各自的策略以及內(nèi)部能力,廠商可以采用TI提供的多功能庫,然后集成在一起創(chuàng)建其自己的獨(dú)特解決方案,也可以與TI的第三方合作伙伴攜手開發(fā)完整的交鑰匙解決方案。
可用的此類解決方案之一是完整的移動(dòng)WiMAXWave2PHY與MAC解決方案。無論采用哪種選擇,系統(tǒng)設(shè)計(jì)人員現(xiàn)在都可以在競(jìng)爭(zhēng)激烈的市場(chǎng)中(如已經(jīng)有超過300家廠商在拼殺的移動(dòng)WiMAX市場(chǎng))實(shí)現(xiàn)所需的高靈活性、低開發(fā)成本以及快速的上市時(shí)間。
此外,最新DSP還可以支持多種空中接口,使各廠商能夠靈活地利用相同平臺(tái)與知識(shí)庫來應(yīng)對(duì)多個(gè)市場(chǎng),從而不僅能夠降低開發(fā)成本,同時(shí)還能加速上市進(jìn)程。例如,TCl6488目前可支持LTE、WCDMA/HSPA/HSPA+、TD-SCDMA、WiMAX以及GSM/EDGE等。圖2對(duì)部分當(dāng)前配制選項(xiàng)進(jìn)行了說明。
這些技術(shù)選擇還可以說明TCl6488等基帶平臺(tái)如何通過提供每信道卡最高載波數(shù)量以及使其能夠在同一基帶硬件中支持新功能與新標(biāo)準(zhǔn),從而降低無線運(yùn)營(yíng)商的資本開支。
此外,TCl6488還可以證明多內(nèi)核DSP如何為廠商提供通過擴(kuò)展單個(gè)產(chǎn)品設(shè)計(jì)而支持各種應(yīng)用的靈活性。例如,系統(tǒng)設(shè)計(jì)人員可以將多個(gè)TCl6488鏈接在一起,以針對(duì)微微蜂窩與宏蜂窩應(yīng)用而縮小或擴(kuò)展平臺(tái)。此外,系統(tǒng)設(shè)計(jì)人員還可以選擇讓一個(gè)電路板處理發(fā)射功能,而讓另一塊電路板處理接收功能,或者讓單個(gè)電路板同時(shí)處理特定數(shù)量用戶的收發(fā)功能。圖3對(duì)部分定制選項(xiàng)進(jìn)行了說明。
優(yōu)先化與平衡
當(dāng)今的SoC一般是多內(nèi)核DSP,采用必須進(jìn)行互操作和同步化的獨(dú)立IP模塊,以實(shí)現(xiàn)單個(gè)完整的調(diào)制解調(diào)器功能。這種架構(gòu)需要采取某種方式對(duì)任務(wù)進(jìn)行優(yōu)先排序,然后將它們映射到多內(nèi)核環(huán)境。
最簡(jiǎn)便的選擇是在DSP內(nèi)核之間分配用戶,以使每個(gè)內(nèi)核都能維護(hù)其自己的隊(duì)列。但是這樣做存在兩個(gè)缺點(diǎn)。第一個(gè)缺點(diǎn)是,所有用戶可能需要共享某些功能,如過濾與解調(diào)等;第二個(gè)缺點(diǎn)是,某些功能可能需要共享協(xié)處理器或外設(shè),因而它們不具備完全的獨(dú)立性。因此,優(yōu)先隊(duì)列集合之間的交互會(huì)變得很復(fù)雜,從而很難保證實(shí)時(shí)性能。此外,協(xié)處理器與外設(shè)也變得更為復(fù)雜,因?yàn)樗鼈儽仨氈С侄鄠€(gè)內(nèi)核的訪問,從而必須決定哪個(gè)內(nèi)核的任務(wù)優(yōu)先。所有這些都會(huì)增加硬件與軟件驅(qū)動(dòng)程序的復(fù)雜性,并使最終系統(tǒng)的測(cè)試變得難度更大,也更耗時(shí)。
為了避免上述缺點(diǎn),TC16488采取了不同的方案:為單個(gè)內(nèi)核分配一個(gè)功能任務(wù),這樣每個(gè)內(nèi)核都負(fù)責(zé)唯一一組功能。一般情況下,每個(gè)負(fù)責(zé)加速特定功能類型的協(xié)處理器都與單個(gè)內(nèi)核相關(guān)聯(lián)。這種方案可以顯著簡(jiǎn)化協(xié)處理器執(zhí)行的任務(wù)排序。外設(shè)在許多情況下也與單個(gè)內(nèi)核通信,從而減少驗(yàn)證任務(wù)是否需要數(shù)據(jù)所做的測(cè)試。
由于DSP可用于實(shí)現(xiàn)各種功能,TCl6488SoC的設(shè)計(jì)在必要時(shí)均具有高度的對(duì)稱性。例如,TCl6488中的所有內(nèi)核都可以訪問接收機(jī)加速器協(xié)處理器(RAC)。這種設(shè)計(jì)允許在所有內(nèi)核中運(yùn)行相同的功能,同時(shí)在需要時(shí)仍然能為所有內(nèi)核提供對(duì)所有協(xié)處理器和外設(shè)資源的訪問。不過,建議系統(tǒng)設(shè)計(jì)人員讓一個(gè)內(nèi)核與TCl6488 DSP中的RAC交互,以便簡(jiǎn)化器件的操作。
通過在多個(gè)內(nèi)核之間實(shí)現(xiàn)資源負(fù)載平衡,根據(jù)適用于每個(gè)任務(wù)的代碼,單個(gè)內(nèi)核有可能先于其他內(nèi)核達(dá)到自己的最高容量。解決方法是進(jìn)行重新分組,這是一種需要完全改變軟件架構(gòu)的做法,同時(shí)也是完成DSP測(cè)試后系統(tǒng)設(shè)計(jì)人員極力避免的步驟。由于軟件無線電廣播(SDR)方法與工具的不斷發(fā)展,軟件分組工作可得到顯著簡(jiǎn)化。
TC16488等DSP已經(jīng)采用代碼周期估算、電子數(shù)據(jù)表和事務(wù)級(jí)模型為WCDMA SoC開發(fā)被推薦的軟件分組功能。TC16488 DSP實(shí)現(xiàn)了這種分組,而且這樣既可提供一個(gè)近乎完美的解決方案,又能實(shí)現(xiàn)簡(jiǎn)單性:一個(gè)DSP內(nèi)核控制RAC,另一個(gè)控制Turbo協(xié)處理器(TCP)與ViterBi協(xié)處理器,而由第三個(gè)執(zhí)行發(fā)射碼片速率加速以及與天線陣列接口的輸出通信。

對(duì)于其他標(biāo)準(zhǔn)(如不采用RAC的基于OFDM的標(biāo)準(zhǔn)),更易于開發(fā)對(duì)稱軟件架構(gòu)。在這些情況下將難題分組變得更為簡(jiǎn)單,因此FFT/IFFT和部分調(diào)制及解調(diào)由一個(gè)內(nèi)核執(zhí)行,其結(jié)果被發(fā)送到另一個(gè)內(nèi)核進(jìn)行符號(hào)率處理。這種方法可以簡(jiǎn)化天線接口或串行RapidIO(如果天線數(shù)據(jù)采用此類接口)與負(fù)責(zé)處理前端的其他DSP內(nèi)核之間的通信。另外,它還可以簡(jiǎn)化后端符號(hào)速率處理及其與以太網(wǎng)或串行RapidIO外設(shè)的通信。
事實(shí)上,OFDMA調(diào)制是針對(duì)所有用戶聯(lián)合執(zhí)行的,無法完全分配到不同DSP內(nèi)核。因此,作者認(rèn)為,軟件架構(gòu)的簡(jiǎn)單性以及眾多調(diào)制解調(diào)器算法的性質(zhì)是系統(tǒng)設(shè)計(jì)人員分組任務(wù)、進(jìn)而造成軟件在各種DSP內(nèi)核之間不對(duì)稱的部分主要原因。
在多個(gè)SoC之間實(shí)現(xiàn)資源平衡
另一個(gè)問題是每個(gè)SoC是否應(yīng)當(dāng)具有不同任務(wù),如一個(gè)SoC只執(zhí)行符號(hào)速率解碼,而另一個(gè)集中執(zhí)行碼片速率調(diào)制。難點(diǎn)是所有片上協(xié)處理器都無法得到有效利用。
例如,僅執(zhí)行符號(hào)速率處理的TC16488器件需要更為強(qiáng)大的功能,因此需要高功率、大尺寸的Turbo與Viterbi解碼器。但是此解碼器無法用于另一個(gè)只執(zhí)行碼片速率關(guān)聯(lián)的SoC,因此需要功能強(qiáng)大得多的接收加速器。除非每個(gè)電路板的功能都具有不同的SoC,否則協(xié)處理器就必須滿足每項(xiàng)功能的最差情況需求。為每組功能都構(gòu)建不同的SoC是一種資金浪費(fèi)。
專用于特定功能子集的SoC同樣也不利于可擴(kuò)展系統(tǒng)。顯然,如果希望提高電路板的通道密度,讓每個(gè)SoC執(zhí)行相同一組功能,我們只需在電路板中添加更多SoC。但TC16488只需極少的附加硬件即可實(shí)現(xiàn)上述目的。天線接口與串行RapidIO都能夠以菊花鏈方式連接,而以太網(wǎng)和RapidIO接口可以連接到交換機(jī)。
但是,如果不同的SoC提供不同的功能,為了實(shí)現(xiàn)系統(tǒng)的可擴(kuò)展性,用戶數(shù)量基本上必須加倍。如果所需用戶數(shù)量增加15%,再添加一個(gè)SoC可將負(fù)責(zé)符號(hào)速率處理的SoC的能力提高15%,但其利用率卻只有15%。其他SoC同樣如此,這使擴(kuò)展后的解決方案效率極低。
對(duì)于采用多內(nèi)核、協(xié)處理器加速SoC的系統(tǒng)設(shè)計(jì),在電路板級(jí)可擴(kuò)展性最高以及可實(shí)現(xiàn)最簡(jiǎn)單、最易于測(cè)試軟件的系統(tǒng)架構(gòu)中,SoC中的每個(gè)DSP內(nèi)核都執(zhí)行一個(gè)唯一的子集任務(wù),但是系統(tǒng)中的每個(gè)SoC都執(zhí)行與其他SoC相同的組任務(wù)。TC16488可專門適用于WCDMA/HSPA網(wǎng)絡(luò)中的這種情況,其側(cè)重采用相同方式高效靈活地支持其他調(diào)制解調(diào)器標(biāo)準(zhǔn)。
最終成果是在3G或4GBTS中采用多內(nèi)核DSP來提供獲得成功所需的性能與電源效率組合。但是,并非所有多內(nèi)核DSP生來相同,因此,對(duì)于系統(tǒng)設(shè)計(jì)人員來說,同樣重要的另一個(gè)選擇是由廣泛功能庫和其他工具提供支持的DSP,以確保降低開發(fā)成本并加速上市進(jìn)程。