在中國(guó)的春節(jié)還沒(méi)有到來(lái)時(shí),POWER7處理器就已經(jīng)迫不及待地在美國(guó)破殼而出了。日前,POWER7正式登陸中國(guó)。盡管之前智慧地球的理念在IBM帶動(dòng)下已經(jīng)深入人心,但I(xiàn)BM認(rèn)為,POWER7是其為推動(dòng)智慧地球而邁出的巨大一步,并將成為驅(qū)動(dòng)智慧地球理念邁向現(xiàn)實(shí)世界的強(qiáng)大引擎。POWER7各項(xiàng)技術(shù)指標(biāo)的測(cè)試結(jié)果向人們展示了其強(qiáng)健的肌肉,它的綜合性能在當(dāng)前的通用處理器領(lǐng)域的確所向無(wú)敵。
為智慧地球而生
IBM系統(tǒng)與科技部Power Systems總經(jīng)理Ross A.Mauri
智慧地球,意味著互聯(lián)網(wǎng)和物聯(lián)網(wǎng)智能終端設(shè)備的急劇膨脹,信息數(shù)據(jù)量以幾何級(jí)數(shù)增長(zhǎng)。目前,網(wǎng)絡(luò)終端的概念已經(jīng)超越了PC和手機(jī),家庭中的各種電器也都正在發(fā)展為網(wǎng)絡(luò)智能終端,甚至廉價(jià)的媒體播放器都開(kāi)始具備BT下載功能。IBM內(nèi)部分析表明,到2013年,全球?qū)⒂袛?shù)以萬(wàn)億個(gè)設(shè)備連接到互聯(lián)網(wǎng)上。而如此海量的設(shè)備和信息,必然需要極為強(qiáng)大的后臺(tái)計(jì)算機(jī)系統(tǒng)作為引擎。
在POWER7登陸中國(guó)時(shí),IBM系統(tǒng)與科技部Power Systems總經(jīng)理Ross A.Mauri 為中國(guó)用戶講述了一個(gè)美國(guó)智能化電網(wǎng)使信息處理量急劇增長(zhǎng)的案例,生動(dòng)地說(shuō)明了智慧地球帶來(lái)的變化。美國(guó)一家大型電力公司正在從傳統(tǒng)電網(wǎng)向智能電網(wǎng)遷移,這家公司目前要管理1000萬(wàn)個(gè)以上用戶,每月的交易量超過(guò)1.2億次。他們希望電表有智慧的功能,可以提供實(shí)時(shí)的電力使用狀況。過(guò)去,他們每天收集一次數(shù)據(jù),數(shù)據(jù)量就已經(jīng)很可觀了。通過(guò)智能化的電表可實(shí)時(shí)收集電能使用的狀況,從每天收集一次變成每15分鐘收集一次。如果想實(shí)現(xiàn)這種級(jí)別的智能化數(shù)據(jù)收集,每天的交易量將達(dá)到36.5億次。而未來(lái)要實(shí)現(xiàn)智能電網(wǎng)的最佳狀態(tài),每天的交易量可能要達(dá)到3500億次。
智能電網(wǎng)只是邁向智慧地球的一小步,智慧地球的發(fā)展必然使全社會(huì)信息量以幾何級(jí)數(shù)增長(zhǎng)。正是基于這種對(duì)市場(chǎng)需求的判斷,IBM對(duì)POWER7的發(fā)展路徑進(jìn)行了重大調(diào)整,從POWER6的雙核高主頻(5GHz)轉(zhuǎn)向了8核設(shè)計(jì),主頻維持在3GHz~4GHz,每核心的線程數(shù)從2個(gè)固定的SMT增加到最多4個(gè)SMT。依托POWER7設(shè)計(jì)的服務(wù)器,將從雙路4核產(chǎn)品一直延伸到32路256內(nèi)核1024個(gè)線程的巨無(wú)霸式高端服務(wù)器。很顯然,POWER7具備了驅(qū)動(dòng)智慧地球的海量信息處理能力。
POWER7互聯(lián)網(wǎng)
技術(shù)創(chuàng)新成就POWER7
1.工作負(fù)載動(dòng)態(tài)優(yōu)化
回顧POWER處理器發(fā)展的歷史,我們知道POWER7今天的輝煌不是一日鑄就的。POWER系列第一個(gè)偉大的設(shè)計(jì)誕生于2001年的POWER4,它是世界上第一款雙核通用處理器,集成了內(nèi)存控制器,并支持動(dòng)態(tài)邏輯分區(qū)技術(shù),成為未來(lái)處理器向多核和虛擬化方向發(fā)展的先驅(qū)。
IBM在研發(fā)POWER6時(shí)提出了工作負(fù)載動(dòng)態(tài)優(yōu)化(Workload Optimization)的概念。在這一思想的指導(dǎo)下,POWER6選擇了高主頻的發(fā)展方向,創(chuàng)造了性能高達(dá)5GHz的雙核處理器,并首創(chuàng)了10進(jìn)制浮點(diǎn)運(yùn)算單元。IBM當(dāng)時(shí)沒(méi)有發(fā)展更多內(nèi)核的處理器,主要考慮的是工作負(fù)載還不能很好地適應(yīng)多核多線程的環(huán)境,高主頻更能讓傳統(tǒng)應(yīng)用在性能提升方面受益。隨著云計(jì)算和虛擬化技術(shù)的發(fā)展,越來(lái)越多的應(yīng)用針對(duì)多核多線程做了優(yōu)化,同時(shí)半導(dǎo)體技術(shù)的進(jìn)步也為10億個(gè)以上晶體管的芯片產(chǎn)品打開(kāi)了大門(mén),這使得POWER7走向了8核時(shí)代。
現(xiàn)實(shí)世界的應(yīng)用負(fù)載仍然是多樣和復(fù)雜的,既有高度并行的大規(guī)模海量應(yīng)用,也有傳統(tǒng)的只能利用少量線程的應(yīng)用軟件。作為通用處理器,必須具有百變的功能,才能在應(yīng)付各種工作負(fù)載時(shí)得心應(yīng)手。POWER7為面向多種應(yīng)用負(fù)載,內(nèi)置了多種可以動(dòng)態(tài)改變的功能特性。
首先,POWER7具有TurboCore和MaxCore兩種內(nèi)核運(yùn)行模式,既可以讓8個(gè)內(nèi)核均衡地運(yùn)行提高并行性,也可以關(guān)閉其中部分內(nèi)核而讓其他內(nèi)核像5GHz的POWER6那樣瘋狂工作。事實(shí)上,新的POWER7在4GHz時(shí)單核性能就可以大幅超過(guò)5GHz的POWER6了。
IBM軟件集團(tuán)競(jìng)爭(zhēng)技術(shù)副總裁John J.Shedletsky博士
TurboCore模式可以對(duì)數(shù)據(jù)庫(kù)或其他以事務(wù)處理為導(dǎo)向的工作負(fù)載進(jìn)行高度優(yōu)化,同時(shí)采用4個(gè)內(nèi)核運(yùn)行,并把芯片中所有8個(gè)內(nèi)核大部分資源放到4個(gè)運(yùn)行的內(nèi)核中,以提供更大的緩存和內(nèi)存帶寬,大幅提升時(shí)鐘頻率,顯著提高單核性能。TurboCore模式可使那些按核進(jìn)行許可計(jì)費(fèi)的應(yīng)用將潛在的軟件成本減半,同時(shí)利用軟件提升單核性能,以此通過(guò)軟件實(shí)現(xiàn)最大限度的投資回報(bào)。
當(dāng)不采用TurboCore模式時(shí),所有POWER7處理器在MaxCore模式下,擁有多達(dá)每插槽8內(nèi)核共32線程,通過(guò)提高并發(fā)線程的數(shù)量來(lái)提升并行處理能力。MaxCore模式下的POWER7能夠很好地適用基于互聯(lián)網(wǎng)的大任務(wù)量并行工作負(fù)載。
第二,POWER7具有智能線程(Intelligent Threads)技術(shù),能根據(jù)工作負(fù)載需求進(jìn)行動(dòng)態(tài)調(diào)整。在擁有更多線程的情況下,POWER7可以并行處理更多任務(wù),提供更大的處理量,如運(yùn)用智慧電網(wǎng)以分鐘實(shí)時(shí)監(jiān)控千家萬(wàn)戶的能源用量。而在線程較少的情況下,如那些實(shí)施分析或數(shù)據(jù)庫(kù)交易處理等需要高速獨(dú)立處理的工作負(fù)載,也可以獲得其需要的性能,并確保最優(yōu)化收益。智能線程在所有POWER7處理器上可以運(yùn)行,并有效提升處理量和總體性能。
IBM POWER7模塊
第三,POWER7的三級(jí)緩存是共享式的,但是在緩存管理方面,三級(jí)緩存可以按很小的單位進(jìn)行劃分,動(dòng)態(tài)指定給各個(gè)內(nèi)核專用或共享,并稱之為智能緩存技術(shù)(Intelligent Cache)。這樣,不僅可以動(dòng)態(tài)適應(yīng)TurboCore和MaxCore兩種內(nèi)核運(yùn)行模式,也可以為運(yùn)行內(nèi)存密集型應(yīng)用的內(nèi)核分配更多專用的三級(jí)緩存空間,提高緩存利用率和命中率。
第四,動(dòng)態(tài)功耗優(yōu)化技術(shù)(Intelligent Energy Optimization),使得POWER7可以在熱功耗條件允許的情況下提升主頻,發(fā)揮最大性能,具體是否允許超頻則由熱功耗管理卡TPMD監(jiān)控并做出判斷。在發(fā)熱量較高和系統(tǒng)利用率較低的情況下,系統(tǒng)也可以自動(dòng)降低處理器的時(shí)鐘速率。
第五,主動(dòng)內(nèi)存擴(kuò)展技術(shù)(Active Memory Expansion),對(duì)需要大量?jī)?nèi)存的工作負(fù)載,或在虛擬環(huán)境中大量?jī)?nèi)存是非常有益的情況下,客戶可以使用這項(xiàng)POWER7的創(chuàng)新技術(shù)。該技術(shù)的獨(dú)特之處在于能夠運(yùn)用內(nèi)存壓縮技術(shù),使系統(tǒng)的物理內(nèi)存針對(duì)應(yīng)用程序時(shí)顯示出最多兩倍于實(shí)際的大小。主動(dòng)內(nèi)存擴(kuò)展技術(shù)可根據(jù)工作負(fù)載的內(nèi)存需求,動(dòng)態(tài)調(diào)整壓縮內(nèi)存量,透明壓縮更多的數(shù)據(jù)放入內(nèi)存,從而擴(kuò)大POWER7系統(tǒng)的內(nèi)存容量。例如,在沒(méi)有安裝任何更多物理內(nèi)存的情況下使用主動(dòng)內(nèi)存擴(kuò)展技術(shù),系統(tǒng)配置能使SAP應(yīng)用認(rèn)為系統(tǒng)中的物理內(nèi)存量比實(shí)際多出50%。據(jù)IBM估計(jì),該技術(shù)較之前受到內(nèi)存容量限制的同樣的服務(wù)器能多處理65%的交易或用戶量。
除了以上特點(diǎn),POWER7還有三種封裝形式,以適應(yīng)不同規(guī)模服務(wù)器平臺(tái)的特點(diǎn),其入門(mén)機(jī)型號(hào)面向1至4路處理器的刀片和機(jī)架式產(chǎn)品設(shè)計(jì),只集成一個(gè)內(nèi)存控制器;高端型號(hào)支持最多32個(gè)插槽的中高端服務(wù)器設(shè)計(jì),集成兩個(gè)內(nèi)存控制器;還有4芯片封裝模塊MCM(在單一模塊中封裝4個(gè)8核POWER7),可以構(gòu)建需要大規(guī)模擴(kuò)展或集群的超級(jí)計(jì)算機(jī),實(shí)現(xiàn)超過(guò)萬(wàn)億次計(jì)算能力。
2.多核的“瓶頸突圍”
處理器如果僅僅在芯片上增加內(nèi)核的數(shù)量,那么,獲得的性能肯定和內(nèi)核數(shù)量的增加不成比例,因?yàn)樘幚砥鲀?nèi)核越多,所需要的內(nèi)存和I/O帶寬需求越將呈現(xiàn)同比例增長(zhǎng)趨勢(shì),而且處理器內(nèi)核之間的通信開(kāi)銷(xiāo)也越來(lái)越大。更何況,內(nèi)核越強(qiáng)大,這種多內(nèi)核設(shè)計(jì)也就越困難。POWER7集成了8個(gè)高主頻的通用內(nèi)核,在突破外圍瓶頸方面做了很多創(chuàng)新。
高速大容量的處理器緩存對(duì)于減少處理器的內(nèi)存訪問(wèn)延遲至關(guān)重要。POWER7在片上集成了32MB三級(jí)緩存。在POWER7之前,通用處理器的緩存都是SRAM,SRAM每位需要6個(gè)晶體管,32MB有ECC功能的緩存就超過(guò)了17億個(gè)晶體管,這對(duì)半導(dǎo)體制造成本和良品率都是巨大的挑戰(zhàn)。8核POWER7總共只有12億個(gè)晶體管,那么該如何實(shí)現(xiàn)呢?IBM從2000年以來(lái)一直致力于eDRAM的研究,eDRAM速度比SRAM要慢一些,但是功耗也低于SRAM,因?yàn)閷?shí)現(xiàn)同樣容量需要的晶體管數(shù)量和空間都是SRAM的幾分之一,32MB eDRAM只需要不到3億個(gè)晶體管。因此,從POWER4開(kāi)始,IBM就一直使用片外的eDRAM作為三級(jí)緩存,而POWER7把三級(jí)緩存集成到片上,進(jìn)一步提高了緩存的速度。再加上前面提到的智能緩存技術(shù),使8核POWER7的內(nèi)存訪問(wèn)延遲問(wèn)題得到改善。
內(nèi)存帶寬問(wèn)題是另一大需要突破的瓶頸。每個(gè)內(nèi)核都需要配備8GB~32GB的內(nèi)存容量,也需要10GB/s以上的并發(fā)訪問(wèn)內(nèi)存帶寬。8核的POWER7如何增加內(nèi)存帶寬呢?在高端產(chǎn)品上,POWER7至少集成兩個(gè)內(nèi)存控制器,每個(gè)內(nèi)存控制器擁有4條6.4GHz的內(nèi)存通道,每個(gè)內(nèi)存通道都使用緩沖芯片并發(fā)訪問(wèn)6組DDR3內(nèi)存插槽。經(jīng)過(guò)如此多層次的強(qiáng)大內(nèi)存帶寬設(shè)計(jì),使每個(gè)POWER7插槽的可用內(nèi)存帶寬高達(dá)180GB/s。
8核不僅面臨內(nèi)存帶寬的瓶頸問(wèn)題,對(duì)I/O和處理器之間的互聯(lián)也帶來(lái)巨大挑戰(zhàn)。POWER7每個(gè)處理器設(shè)計(jì)提供50GB/s的I/O帶寬和360GB/s的處理器互聯(lián)帶寬。其實(shí),外圍帶寬的強(qiáng)大設(shè)計(jì)一直就是POWER處理器性能強(qiáng)大的秘訣,這一次POWER7把帶寬提升到了590GB/s。
對(duì)于一個(gè)32路的8核平臺(tái)而言,256個(gè)內(nèi)核的內(nèi)存一致性以及互相通信的問(wèn)題,必然是解決系統(tǒng)整體效率的關(guān)鍵環(huán)節(jié)。而這一問(wèn)題恰恰是IBM多年研發(fā)大型系統(tǒng)的經(jīng)驗(yàn)所在。新的POWER7系統(tǒng)以4顆POWER7為一個(gè)節(jié)點(diǎn),在節(jié)點(diǎn)內(nèi)實(shí)現(xiàn)全互聯(lián)。32路平臺(tái)共8個(gè)節(jié)點(diǎn),節(jié)點(diǎn)間也實(shí)現(xiàn)全互聯(lián)。這種無(wú)瓶頸、高可靠的內(nèi)部擴(kuò)展方式,也是由POWER7強(qiáng)大的兩個(gè)互聯(lián)控制器共360GB/s帶寬所保證的。
必不可少的軟硬兼施
如果沒(méi)有為POWER7優(yōu)化的軟件系統(tǒng),POWER7的系統(tǒng)性能也無(wú)從發(fā)揮。IBM作為一家軟硬件整合的公司,預(yù)先的軟件優(yōu)化為整個(gè)系統(tǒng)的性能發(fā)揮起到了極為重要的作用。IBM軟件集團(tuán)競(jìng)爭(zhēng)技術(shù)副總裁John J.Shedletsky博士指出,POWER7在單個(gè)32路服務(wù)器上能夠提供的線程數(shù)已經(jīng)達(dá)到1000多個(gè)(即32路×8核×4線程=1024),為智慧地球提供了足夠大的并行處理能力,同時(shí)也對(duì)軟件提出了巨大的挑戰(zhàn)。
如何讓軟件在不重寫(xiě)的情況下能最大程度地利用硬件所提供的超強(qiáng)并行處理能力?解決這個(gè)問(wèn)題就需要有強(qiáng)大的中間件。IBM對(duì)中間件技術(shù)進(jìn)行了大量?jī)?yōu)化工作,把這種并行能力在中間件層進(jìn)行處理并實(shí)現(xiàn),讓上層應(yīng)用軟件無(wú)需任何調(diào)整,直接發(fā)揮底層硬件的強(qiáng)大并行處理能力。這樣,用戶可以很簡(jiǎn)單地直接應(yīng)用硬件的科技創(chuàng)新所帶來(lái)的業(yè)務(wù)價(jià)值。
基于POWER7平臺(tái)的強(qiáng)大擴(kuò)展性,使IBM在數(shù)據(jù)庫(kù)技術(shù)方面有了重大突破,那就是IBM DB2 pure Scale技術(shù),可以使單一數(shù)據(jù)庫(kù)做到超過(guò)上百臺(tái)服務(wù)器的擴(kuò)展能力,相比較,Oracle RAC只擴(kuò)展到8臺(tái)服務(wù)器。過(guò)去用戶可能需要考慮在大型機(jī)上處理這種模式,現(xiàn)在用POWER7的服務(wù)器就可以直接做到如此高的擴(kuò)展能力。
另外一個(gè)軟件和POWER7硬件優(yōu)化的模式是軟件硬件預(yù)先打包。IBM Smart Analytic系統(tǒng)就是這樣一個(gè)例子,它可以非??焖俚貥?gòu)建數(shù)據(jù)倉(cāng)庫(kù),采用數(shù)據(jù)分析工具來(lái)分析業(yè)務(wù)數(shù)據(jù)。IBM把這個(gè)例子叫做創(chuàng)造新的智能。這種預(yù)先配置、預(yù)先打包的方式對(duì)用戶的好處是,用更少的時(shí)間運(yùn)行系統(tǒng),同時(shí)所需要的技能更少。
在POWER7的應(yīng)用開(kāi)發(fā)方面,IBM Rational提供了端到端專門(mén)針對(duì)POWER7的開(kāi)發(fā)體系,這一開(kāi)發(fā)體系首先是提供基于POWER上面的整個(gè)開(kāi)發(fā)工具,同樣的開(kāi)發(fā)工具可以支持軟件開(kāi)發(fā)人員在AIX、i系列和Linux上開(kāi)發(fā)應(yīng)用。這是IBM第一次提供單一工具來(lái)支持這三種POWER體系的應(yīng)用開(kāi)發(fā)。
鏈接
四款全新的Power Systems產(chǎn)品
隨著POWER7的推出,相應(yīng)的全線產(chǎn)品中有4款隨之亮相,而基于POWER7的32路系統(tǒng)旗艦何時(shí)亮相,這恐怕要等待AIX升級(jí)到7.1版,才能支持256個(gè)內(nèi)核的32路系統(tǒng),目前的AIX6.1只能支持64個(gè)內(nèi)核,因此,現(xiàn)在問(wèn)世還為時(shí)過(guò)早。
IBM Power 780是一款全新的可擴(kuò)展高端服務(wù)器,它最大的特色是采用了先進(jìn)的模塊化設(shè)計(jì),可支持高達(dá)64個(gè)POWER7“內(nèi)核”或CPU,并擁有新的TurboCore工作負(fù)載優(yōu)化模式。同基于POWER6處理器的系統(tǒng)相比,TurboCore能夠提供高達(dá)兩倍的單核性能。
IBM Power 770是一款模塊化企業(yè)級(jí)服務(wù)器,可支持高達(dá)48個(gè)POWER7內(nèi)核。Power 770每單核性能與POWER6相比有大幅提高。在與IBM Power 570內(nèi)核數(shù)量相同的條件下,新系統(tǒng)的能耗最多可以降低70%。
IBM Power 755可作為高性能計(jì)算集群節(jié)點(diǎn),擁有32個(gè)POWER7內(nèi)核。它的能源效率完全符合Energy Star能效標(biāo)準(zhǔn),同時(shí)為處理最復(fù)雜的分析工作負(fù)載而進(jìn)行了優(yōu)化。
IBM Power 750是一款符合Energy Star能效標(biāo)準(zhǔn)的商業(yè)服務(wù)器,它為中型企業(yè)客戶提供了4倍于上一代服務(wù)器的處理能力。
采訪后記
POWER之道
POWER擁有20年的歷史而長(zhǎng)盛不衰,在Unix市場(chǎng)中不斷成長(zhǎng),并發(fā)展成為如此強(qiáng)大的計(jì)算平臺(tái),確實(shí)值得人們贊嘆。同時(shí),也有很多人非常不解地問(wèn)我,POWER不是一個(gè)封閉的Unix系統(tǒng)嗎?Unix系統(tǒng)都在衰落,而為什么POWER卻在發(fā)展?
我想舉一個(gè)大家都熟悉的例子,那就是蘋(píng)果的iPhone。iPhone的硬件和操作系統(tǒng)也是封閉而自成一體的,正是因?yàn)槿绱?,蘋(píng)果才能把它設(shè)計(jì)得如此時(shí)尚和強(qiáng)大,不必受合作伙伴的左右。同時(shí),iPhone的應(yīng)用軟件接口是開(kāi)放的,并造就了龐大的軟件生態(tài)系統(tǒng)。因此,雖然iPhone價(jià)格不菲,卻仍然能贏得無(wú)數(shù)用戶的青睞。
POWER的成功模式和iPhone有異曲同工之妙,只不過(guò)它是發(fā)生在企業(yè)級(jí)市場(chǎng)而已。iPhone傳承的是蘋(píng)果電腦的設(shè)計(jì)理念,POWER傳承的是IBM大型機(jī)的成功之道,如此而已。(文/丁偉)