999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用FPGA加速實(shí)現(xiàn)高性能計(jì)算

2008-01-01 00:00:00
電子產(chǎn)品世界 2008年1期

引言

目前應(yīng)用軟件的需求已經(jīng)遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)處理器的能力所及。一種解決方法是通過(guò)硬件加速,采用專用協(xié)處理器來(lái)提升處理性能。FPGA作為協(xié)處理器設(shè)計(jì)的基礎(chǔ),在價(jià)格、性能、易用性以及功耗方面有明顯的優(yōu)勢(shì)。

微處理器有近40年的歷史,在這期間內(nèi)它的性能得到了大幅提高,根據(jù)摩爾定律每18個(gè)月翻倍。處理器在每一輪性能增長(zhǎng)過(guò)程中,都能支持更復(fù)雜和要求更高的應(yīng)用軟件,使用戶對(duì)未來(lái)處理器的性能有更高的期望。在過(guò)去幾年中情況發(fā)生了變化,處理器本身無(wú)法滿足高性能計(jì)算(HPC)應(yīng)用軟件的性能需求,導(dǎo)致需求和性能之間出現(xiàn)了缺口

應(yīng)用軟件的需求促進(jìn)性能的提高

新的應(yīng)用軟件在性能達(dá)到要求后,很快得到廣泛應(yīng)用。在處理性能達(dá)到一定水平后,超聲、計(jì)算機(jī)輔助斷層掃描(CAT)、磁共振成像(MRI)等醫(yī)療成像應(yīng)用需要更高的圖像分辨率。科學(xué)計(jì)算和建模也同樣出現(xiàn)類似的情況,使用的模型越來(lái)越復(fù)雜。

與此同時(shí)用戶還希望加快應(yīng)用軟件的運(yùn)行速度,盡快得出結(jié)果,他們不能忍受較慢的響應(yīng),這對(duì)應(yīng)用軟件提出了新的性能標(biāo)準(zhǔn)。而另一方面,計(jì)算速度帶來(lái)的競(jìng)爭(zhēng)優(yōu)勢(shì)也促使提高目前的處理能力。

雖然對(duì)性能需求的增長(zhǎng)已經(jīng)超越了摩爾定律,處理器的發(fā)展卻徘徊不前。過(guò)去40年中處理器性能的提高主要受益于半導(dǎo)體技術(shù),但是這種技術(shù)的改進(jìn)達(dá)到了極限。電路越來(lái)越復(fù)雜,每一個(gè)設(shè)計(jì)的開(kāi)發(fā)成本高達(dá)數(shù)百萬(wàn)美元,數(shù)十億美元才能形成新產(chǎn)品投產(chǎn)能力。時(shí)鐘速率的提高導(dǎo)致器件功耗增大,現(xiàn)在已經(jīng)到了不能迅速散熱的地步。

提高處理器性能并不是解決應(yīng)用需求的唯一方法。采用專用處理器來(lái)擴(kuò)展處理器一直是解決性能瓶頸可靠的途徑。這類協(xié)處理器可以結(jié)合使用調(diào)制解調(diào)器和以太網(wǎng)控制器等專用I/O處理功能,使用圖層著色引擎提高顯示能力,采用加密引擎來(lái)保證安全性。還出現(xiàn)了更通用的協(xié)處理器,例如處理乘法

和除法的數(shù)學(xué)加速器。數(shù)字信號(hào)處理器作為一種協(xié)處理器,采用了內(nèi)置數(shù)學(xué)硬件以及具有流水線和并行運(yùn)作的新體系結(jié)構(gòu),能夠處理復(fù)雜的數(shù)學(xué)運(yùn)算。然而,這些專用結(jié)構(gòu)還不足以填補(bǔ)目前的技術(shù)缺口,只是解決了一小部分問(wèn)題。而且,在設(shè)計(jì)中還要避免采用軟件實(shí)現(xiàn)某些功能,例如數(shù)字信號(hào)處理器等,因?yàn)檫@和主處理器一樣,在靈活性上受到限制。

專用協(xié)處理器

當(dāng)今理想的協(xié)處理器應(yīng)該具備三種基本能力。第一是能夠提供專門的硬件加速,實(shí)現(xiàn)各種應(yīng)用所需的關(guān)鍵處理功能。其次是協(xié)處理器設(shè)計(jì)在性能上非常靈活,使用流水線和并行結(jié)構(gòu),跟上性能的需求變化。最后,協(xié)處理器能夠?yàn)橹魈幚砥骱拖到y(tǒng)存儲(chǔ)器提供寬帶、低延遲接口。

除了硬件要求以外,理想的協(xié)處理器還應(yīng)該滿足HPC市場(chǎng)的“4P”要求:性能(performance)、效能(productivity)、功耗(power)和價(jià)格(price)。HPC市場(chǎng)對(duì)性能的最低要求是全面加速實(shí)現(xiàn)算法,而不僅僅是某一步驟,并能夠加速實(shí)現(xiàn)整個(gè)應(yīng)用軟件。效能需求來(lái)自最終用戶,協(xié)處理器必須安裝起來(lái)很方便,提供簡(jiǎn)單的方法來(lái)配置系統(tǒng),加速實(shí)現(xiàn)現(xiàn)有的應(yīng)用軟件。

HPC市場(chǎng)的功耗需求來(lái)自計(jì)算系統(tǒng)安裝和使用上的功耗限制。低功耗協(xié)處理器能夠?yàn)橛?jì)算系統(tǒng)提供更低的成本,還提高了計(jì)算系統(tǒng)的空間利用率。

價(jià)格因素在HPC市場(chǎng)上顯得越來(lái)越重要。十幾年前,某些應(yīng)用軟件對(duì)性能的需求超出了單個(gè)處理器能力范圍,這促使人們采用專用體系結(jié)構(gòu),例如密集并行處理(MPP)、對(duì)稱多處理(SMP)和單指令多數(shù)據(jù)(SIMD)等(見(jiàn)圖2)。然而,這類系統(tǒng)要求使用定制處理器單元和專用數(shù)據(jù)通路,開(kāi)發(fā)和編程都非常昂貴。

現(xiàn)在的HPC市場(chǎng)拋棄了這種昂貴的方法,采用性價(jià)比更高的集群計(jì)算方法。集群計(jì)算采用商用標(biāo)準(zhǔn)體系結(jié)構(gòu),例如Intel和AMD采用工業(yè)標(biāo)準(zhǔn)互聯(lián),例如千兆以太網(wǎng)和InfiniBand;采用標(biāo)準(zhǔn)程序語(yǔ)言,例如運(yùn)行在低成本Linux操作系統(tǒng)上的C語(yǔ)言等。當(dāng)今的協(xié)處理器設(shè)計(jì)必須能夠平滑集成到商用集群計(jì)算環(huán)境中,而成本大致與在集群中加入另一個(gè)節(jié)點(diǎn)相當(dāng)。

在這些市場(chǎng)條件下,設(shè)計(jì)協(xié)處理器來(lái)提供專用硬件加速功能是很大的挑戰(zhàn)。過(guò)去,開(kāi)發(fā)人員針對(duì)一些常見(jiàn)的應(yīng)用,例如圖像和以太網(wǎng)控制器等,設(shè)計(jì)不同的協(xié)處理器來(lái)滿足這些應(yīng)用需求。然而,出于開(kāi)發(fā)時(shí)間和成本考慮,并不能采用這一方法,因?yàn)閷?duì)于大部分應(yīng)用的回報(bào)太低,用戶不愿意等待太長(zhǎng)的時(shí)間。而且各種各樣的應(yīng)用軟件需要進(jìn)行加速,平滑集成到現(xiàn)有計(jì)算集群中,而傳統(tǒng)的方法在成本上做不到這一點(diǎn)。

理想FPGA功能的實(shí)現(xiàn)

采用替代方案可以針對(duì)每一應(yīng)用需求設(shè)計(jì)不同的協(xié)處理器,同樣的半導(dǎo)體技術(shù)既能把處理器的性能發(fā)揮到極限,也能使FPGA從簡(jiǎn)單的膠合邏輯控制器發(fā)展到性能很高的可編程架構(gòu)。FPGA完全能夠滿HPC市場(chǎng)的“4P”需求。

當(dāng)今的FPGA有很大的性能潛力。它們支持深度可變的流水線結(jié)構(gòu),提供大量的并行計(jì)算資源,一個(gè)時(shí)鐘周期內(nèi)就可以完成非常復(fù)雜的功能。FPGA的可編程能力保證了這種器件能夠滿足應(yīng)用軟件的特殊需求,不存在設(shè)計(jì)定制協(xié)處理器的成本或者延遲問(wèn)題。FPGA是可再編程的,它可以在一個(gè)芯片中為多種應(yīng)用提供非常靈活的定制協(xié)處理功能。

FPGA的內(nèi)置存儲(chǔ)器也有很大的性能優(yōu)勢(shì)。例如,片內(nèi)存儲(chǔ)器意味著協(xié)處理器邏輯的存儲(chǔ)器訪問(wèn)帶寬不會(huì)受到器件I/O引腳數(shù)量的限制。而且,存儲(chǔ)器和運(yùn)算邏輯緊密結(jié)合,不再需要采用外部高速存儲(chǔ)器緩沖。容量更大的FPGA和原先的器件有相同的電路板外形封裝,不用改變電路板就可以提高性能。

利用當(dāng)今高性能FPGA(例如,Altera的Stratix III系列FPGA)的結(jié)構(gòu)和資源優(yōu)勢(shì),大量的應(yīng)用軟件都可以采用硬件加速協(xié)處理器,大大提升性能,如表1所示。相對(duì)于只采用處理器的應(yīng)用,基于FPGA的協(xié)處理器在實(shí)際應(yīng)用中運(yùn)算執(zhí)行速度提高了10倍,速度提高100倍也是很常見(jiàn)的。

工具簡(jiǎn)化了定制實(shí)現(xiàn)

但是,如果需要很大的開(kāi)發(fā)投入才能顯著提升性能,其價(jià)值也是有限的。然而,F(xiàn)PGA支持很多成熟的開(kāi)發(fā)工具。

用戶利用這一完整的設(shè)計(jì)工具鏈,大大簡(jiǎn)化了應(yīng)用軟件的加速過(guò)程。工具鏈處理現(xiàn)有的代碼,自動(dòng)配置FPGA協(xié)處理器,顯著提高了性能。而且使用這些工具時(shí),用戶不需要非常了解FPGA硬件,也不需要重新編寫(xiě)源代碼來(lái)實(shí)現(xiàn)協(xié)處理。

對(duì)于第三個(gè)“P”的功耗,F(xiàn)PGA比處理器有明顯的優(yōu)勢(shì)。FPGA提供大量的并行資源,在硬件中只需要幾個(gè)時(shí)鐘周期就可以執(zhí)行完函數(shù)功能,而順序操作的處理器則需要成百上千的時(shí)鐘周期。由于只需要很少的時(shí)鐘周期,F(xiàn)PGA即使采用較慢的時(shí)鐘,也能夠提升性能。減小時(shí)鐘速率可以降低功耗,因此,F(xiàn)PGA協(xié)處理器的功耗效率遠(yuǎn)遠(yuǎn)大干處理器(見(jiàn)圖3)。

對(duì)于第四個(gè)“P”的價(jià)格,F(xiàn)PGA在這方面也解決了很多難題。FPGA協(xié)處理器的成本與性能類似的處理器相當(dāng),甚至還要低一些。結(jié)果,在標(biāo)準(zhǔn)群設(shè)計(jì)中,一個(gè)處理器和一個(gè)FPGA協(xié)處理器的成本不會(huì)高于兩個(gè)處理器。FPGA協(xié)處理器還為標(biāo)準(zhǔn)群設(shè)計(jì)提供大量的選項(xiàng),而成本不會(huì)增加。這些選項(xiàng)可在多處理器電路板設(shè)計(jì)中替代處理器,通過(guò)存儲(chǔ)器接口與處理器連接,作為高性能外設(shè)卡插入系統(tǒng)(見(jiàn)圖4)等。FPGA可以把合適的接口作為架構(gòu)的一部分來(lái)實(shí)現(xiàn)。

AItera的產(chǎn)品定位

Altera的Stratix III系列FPGA適合用作HPC協(xié)處理單元,比其他FPGA有更大的優(yōu)勢(shì)。優(yōu)勢(shì)之一是它的邏輯和DSP模塊比較均衡,因此,Stratix III FPGA是實(shí)現(xiàn)高性能函數(shù)的理想選擇,例如雙精度浮點(diǎn)等。此外,Stratix III FPGA可現(xiàn)場(chǎng)配置,系列協(xié)處理器設(shè)計(jì)能夠適應(yīng)用戶運(yùn)行的任何軟件,即使用戶需求變化了,也可以不斷提供加速功能。

Stratix III系列FPGA的另一優(yōu)勢(shì)是,其行列體系結(jié)構(gòu)與存儲(chǔ)器供應(yīng)商采用的結(jié)構(gòu)相似。利用這一體系結(jié)構(gòu),Altera在某些半導(dǎo)體工藝基礎(chǔ)上開(kāi)發(fā)了高密度型號(hào),不但有數(shù)量較多的邏輯門,而且還為實(shí)際應(yīng)用提供了豐富的片內(nèi)存儲(chǔ)器資源。

Stratix III系列FPGA在其資源矩陣中有分布合理的加法邏輯和乘法器,非常適合需要大量計(jì)算的應(yīng)用軟件,例如矩陣乘法和雙精度數(shù)學(xué)運(yùn)算等。代表性的例子是IEEE標(biāo)準(zhǔn)浮點(diǎn)乘法,最佳性能達(dá)到了每秒480億次運(yùn)算(GFLOP)。此外,Stratix III系列FPGA還受益于Avalon布線架構(gòu),這種通用互聯(lián)支持流水線結(jié)構(gòu)。

Altera還和Intel、AMD等主要的處理器供應(yīng)商密切合作,為他們的處理器系列提供高性能、低延遲接口。例如,Altera和Intel合作,為FPGA和Intel處理器的互聯(lián)開(kāi)發(fā)了前端總線(FSB)。與常用的北橋(NB)外設(shè)連接總線不同,F(xiàn)SB使FPGA在多處理器設(shè)計(jì)中起到了另一處理器的作用。因此,StratixIII系列FPGA可以在標(biāo)準(zhǔn)群設(shè)計(jì)中配置為置入式處理器,不用改動(dòng)硬件,在多處理器電路板上實(shí)現(xiàn)硬件加速。Altera和AMD合作,開(kāi)發(fā)了HyperTransport接口,在AMD設(shè)計(jì)中,提供類似的置入式替代方案。

強(qiáng)大的開(kāi)發(fā)工具

除了與半導(dǎo)體供應(yīng)商合作,Altera還在設(shè)計(jì)工具領(lǐng)域與其他供應(yīng)商密切合作。保證為Altera器件開(kāi)發(fā)專用協(xié)處理器提供豐富的工具。例如,公司與工具開(kāi)發(fā)商Impulse聯(lián)合開(kāi)發(fā)Impulse C,該設(shè)計(jì)工具編譯C代碼應(yīng)用程序,在FPGA邏輯中加速實(shí)現(xiàn)。因此,開(kāi)發(fā)人員能夠針對(duì)自己的應(yīng)用代碼迅速開(kāi)發(fā)協(xié)處理器。利用Altera工具的兼容性,在原型設(shè)計(jì)中開(kāi)發(fā)人員可節(jié)省數(shù)星期的開(kāi)發(fā)時(shí)間。

Altera還和產(chǎn)品開(kāi)發(fā)商合作,確保采用Stratix III系列FPGA開(kāi)發(fā)同類最佳的設(shè)計(jì)。例如,Xtreme數(shù)據(jù)公司開(kāi)發(fā)的置入式模塊可以替代母板上的AMD Opteron處理器,而且不需要改變電路板設(shè)計(jì)。用戶可以根據(jù)多處理器設(shè)計(jì)需要,合理地結(jié)合使用Opteron處理器和FPGA協(xié)處理器。

另一供應(yīng)商SRC公司與Altera開(kāi)發(fā)了MAP系列協(xié)處理器產(chǎn)品。這些模塊通過(guò)存儲(chǔ)器總線接口與AMD或者Intel處理器連接,數(shù)據(jù)帶寬高達(dá)14GB/秒。SRC還提供Carte工具鏈,轉(zhuǎn)換C語(yǔ)言或者FORTRAN程序,可在FPGA協(xié)處理器上更快地運(yùn)行。

結(jié)語(yǔ)

Xtreme數(shù)據(jù)公司和SRC公司的協(xié)處理器代表了HPC今后的發(fā)展方向。在處理器還不能滿足要求的時(shí)候,應(yīng)用軟件加速所帶來(lái)的競(jìng)爭(zhēng)優(yōu)勢(shì)使用戶能夠不斷提高軟件性能。基于Stratix III系列FPGA的協(xié)處理器提供了硬件加速需要的高速、低延遲接口,而Altera合作伙伴提供的工具鏈和其他支持大大簡(jiǎn)化了HPC用戶定制功能的加速開(kāi)發(fā)。現(xiàn)在,這些工具和產(chǎn)品已經(jīng)是成熟的高性能商用解決方案,Altera與其他供應(yīng)商的合作,保證了這些產(chǎn)品和工具能夠持續(xù)滿足今后HPC的發(fā)展需求。

主站蜘蛛池模板: 伊人久久大香线蕉成人综合网| 国内熟女少妇一线天| 久综合日韩| 人妻少妇久久久久久97人妻| 中文字幕人妻无码系列第三区| 亚洲福利视频一区二区| 91在线高清视频| 91美女视频在线| 亚洲精品天堂自在久久77| www.精品国产| 爱做久久久久久| 亚洲人成影院在线观看| 亚洲女同一区二区| 午夜啪啪福利| 国产91精品调教在线播放| 国产乱子精品一区二区在线观看| 免费在线播放毛片| 狠狠ⅴ日韩v欧美v天堂| 久久精品这里只有国产中文精品| 欧美精品二区| 久久精品中文无码资源站| 国产超碰在线观看| 97色伦色在线综合视频| 无码中文AⅤ在线观看| 欧美天堂久久| 真实国产乱子伦高清| 2021国产乱人伦在线播放| 欧美日韩导航| 国产精品美人久久久久久AV| 亚洲精品成人片在线播放| 高清无码手机在线观看| 中文字幕在线永久在线视频2020| 国产成人a在线观看视频| 中文字幕人成人乱码亚洲电影| www.精品国产| 久久semm亚洲国产| 亚洲AⅤ波多系列中文字幕| 亚洲高清免费在线观看| av天堂最新版在线| 国产精品视频a| 久久影院一区二区h| 久久男人视频| 国产91精品最新在线播放| 亚洲精品自拍区在线观看| 亚洲国产第一区二区香蕉| 亚洲美女操| 日韩毛片在线播放| 亚洲美女一级毛片| 天天爽免费视频| 中文字幕 日韩 欧美| 国内精品伊人久久久久7777人| 久久毛片基地| 91精品在线视频观看| 欧美翘臀一区二区三区| 日韩福利在线观看| 日本精品中文字幕在线不卡| 欧美激情综合| 在线a视频免费观看| 亚洲VA中文字幕| 在线毛片网站| 一级黄色欧美| 欧美日韩国产高清一区二区三区| 2021天堂在线亚洲精品专区| 欧美人人干| 婷婷亚洲天堂| 玖玖免费视频在线观看| …亚洲 欧洲 另类 春色| 99草精品视频| 天天摸夜夜操| 黄色网址免费在线| 午夜免费视频网站| 99久久免费精品特色大片| 国产欧美日韩综合在线第一| 国产精品自在在线午夜区app| 色亚洲激情综合精品无码视频 | 久久综合伊人77777| 国产精品无码翘臀在线看纯欲| 久久永久免费人妻精品| 无码专区国产精品一区| 夜夜爽免费视频| 欧美一级色视频| 婷婷色婷婷|