999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于海洋數(shù)值模式的高性能計算集群性能評價

2013-08-06 10:59:10韓林生宋雨澤
海洋技術學報 2013年2期
關鍵詞:系統(tǒng)

楊 寧,韓林生,李 彥,路 寬,宋雨澤

(國家海洋技術中心,天津 300112)

自1980年以來,在理論科學和實驗科學之后,國際上出現(xiàn)了“第三類科學”,即計算科學。隨著所處理問題的復雜程度不斷攀升以及計算模型從一維向多維發(fā)展等因素都導致了計算的數(shù)量級呈幾何級數(shù)增長,而計算機單機技術的局限性和科學需求的無限性之間的矛盾直接催生了計算機并行處理技術與高性能計算集群的產生。高性能計算集群的應用極大地推動了諸如海洋數(shù)值模式這類計算量大、精度要求高的模擬計算的快速發(fā)展,對與計算科學相關的交叉學科的發(fā)展起到了極大的促進作用[1]。

隨著我國海洋科技的快速發(fā)展,對建設功能齊全、服務于海洋科學技術及軍事海洋學研究的海上試驗場的需求顯得越發(fā)突出,通過對海上試驗場的設計和原型建設,初步形成科學合理、功能齊全、體系完備、服務公益、資源共享、軍民兼用的試驗場區(qū)。海上試驗場數(shù)值模擬與仿真系統(tǒng)(以下簡稱仿真系統(tǒng))作為海上試驗場設計和原型建設的重要組成部分,目標在于對試驗場區(qū)的海洋氣象要素(海面風、海面溫度、海面濕度和海面氣壓)和海洋水動力環(huán)境(海水溫度、鹽度、海流和海浪)進行連續(xù)周期性的數(shù)值模擬,將場區(qū)實測要素數(shù)據(jù)與數(shù)值模擬數(shù)據(jù)相結合,并依托數(shù)據(jù)可視化技術實現(xiàn)場區(qū)模擬數(shù)據(jù)的動態(tài)可視化分析,使得海上試驗場建立在一個可知的、可測的、可靠的透明海洋環(huán)境場區(qū)。高性能計算集群系統(tǒng)專門用于大氣數(shù)值模式和海洋數(shù)值模式的周期性運算,部署有大氣數(shù)值模擬子模塊和海洋數(shù)值模擬子模塊,集群系統(tǒng)目前已經投入海上試驗場仿真系統(tǒng)的準業(yè)務化運行中使用。

圖1 仿真系統(tǒng)硬件拓撲結構

1 高性能計算集群概述

1.1 高性能計算集群的定義

集群是一組相互獨立的服務器在網絡中表現(xiàn)為單一的系統(tǒng),并以單一系統(tǒng)的模式加以管理,而所謂的高性能計算集群就是采用集群技術來實現(xiàn)高性能計算[2]。簡單的說,集群實際上就是一組計算機,他們作為一個整體向用戶提供一組網絡資源。這些單個計算機系統(tǒng)就是集群的節(jié)點。集群能在同一時間內執(zhí)行多條指令或處理多個數(shù)據(jù),它是并行計算的載體。

1.2 集群系統(tǒng)的優(yōu)點

(1)良好的可擴展性:最初提高計算機性能主要依靠提升CPU的主頻和總線帶寬,但是基于這種方法對系統(tǒng)性能的提升十分有限。之后嘗試通過增加CPU個數(shù)和內存容量來提升性能,于是出現(xiàn)了向量機,對稱多處理機等,但是這種手段的瓶頸在于CPU訪問內存的帶寬并不能隨著CPU個數(shù)的增加而有效增長。與此相反,集群系統(tǒng)的性能隨著CPU個數(shù)的增加幾乎呈現(xiàn)線性變化;

(2)高可靠性:當集群中的一個節(jié)點失效,那么在該節(jié)點上運行的任務會轉移給其他節(jié)點,從而有效防止單點失效;

(3)高性能:平衡負載允許集群系統(tǒng)同時接入更多的用戶;

(4)高性價比:集群技術是使用特定的連接方式將價格相對較低并且符合工業(yè)標準的硬件設備結合起來,同時能夠提供高性能的任務處理能力[3]。

1.3 高性能計算集群系統(tǒng)的邏輯拓撲結構

高性能計算集群系統(tǒng)主要由兩類設備組成,分別是節(jié)點與交換網絡。

1.3.1 節(jié)點

本文所采用集群系統(tǒng)的邏輯拓撲結構主要由用戶節(jié)點、控制節(jié)點、管理節(jié)點、存儲節(jié)點和計算節(jié)點組成。

(1)用戶節(jié)點:用戶節(jié)點是外部系統(tǒng)或者用戶訪問集群系統(tǒng)強大計算或存儲能力的唯一入口。

(2)控制節(jié)點:控制節(jié)點在集群系統(tǒng)運轉中主要承擔兩部分任務。為計算節(jié)點提供基本的網絡服務,如DHCP、DNS和NFS;調度計算節(jié)點上的作業(yè),通常集群的作業(yè)調度程序(如PBS)應該運行在該節(jié)點上。

(3)管理節(jié)點:管理節(jié)點是集群系統(tǒng)各種管理措施的控制節(jié)點,監(jiān)控集群中各個節(jié)點和網絡的運行狀況。一般集群系統(tǒng)的管理軟件也運行在這個節(jié)點上。

(4)存儲節(jié)點:存儲節(jié)點就是集群系統(tǒng)的數(shù)據(jù)存儲器和數(shù)據(jù)服務器。

(5)計算節(jié)點:計算節(jié)點是整個集群系統(tǒng)的計算核心,它的功能就是執(zhí)行計算。

在小型集群系統(tǒng)中,往往由一臺計算機同時兼具用戶節(jié)點、控制節(jié)點、管理節(jié)點和存儲節(jié)點的功能,那么這臺計算機就被稱為主節(jié)點。在這種情況下,集群系統(tǒng)是由一個主節(jié)點和多個計算節(jié)點組成。

1.3.2 交換網絡

(1)管理交換網:管理交換網絡主要負責對整個系統(tǒng)進行管理和控制,通過各個節(jié)點之間交換管理信息報文通信,使主節(jié)點可以及時地了解到其他節(jié)點的狀態(tài),保證節(jié)點之間的協(xié)同運行,并且進行相關任務的分配,作業(yè)的調度,以及對各個節(jié)點進行控制。在本設計的集群系統(tǒng)中,選取千兆以太網來組建管理交換網,從而滿足主節(jié)點對各個節(jié)點的控制,以及各節(jié)點之間的管理信息和狀態(tài)信息的交互。

(2)計算交換網:計算交換網絡主要負責所有節(jié)點計算所需數(shù)據(jù)的交換,它能夠為主節(jié)點與計算節(jié)點以及計算節(jié)點之間的數(shù)據(jù)交換提供數(shù)據(jù)通路[4]。各并行分布任務之間通信量大,采用高速網絡,應用性能將會明顯提高,因此在本設計中,集群系統(tǒng)采用Infiniband網絡搭建計算交換網。Infiniband是當前國際上先進、開放的互連標準,具有低延遲和高帶寬的特點,能夠提供40 Gbps的帶寬和1 us級別的延遲,從而滿足各節(jié)點之間大量數(shù)據(jù)信息的交互。

本文所依托的高性能計算集群系統(tǒng)由1個管理節(jié)點(包含控制節(jié)點和用戶節(jié)點),1個存儲節(jié)點和24個計算節(jié)點組成。管理節(jié)點的中央處理器主要由2塊2.4 GHz Intel Xeon X5620四核64位CPU構成;存儲節(jié)點的中央處理器主要由2塊2.4 GHz Intel Xeon X5620六核64位CPU構成,具有6塊2 TB的磁盤存儲空間;計算節(jié)點的中央處理器主要由2塊2.4 GHz Intel Xeon X5620四核64位CPU構成。集群系統(tǒng)的網絡由Infiniband網絡和1 Gb以太網組成。

圖2 集群系統(tǒng)邏輯拓撲結構

2 基于高度并行計算基準測試HPL的性能評價

2.1 高度并行計算基準測試HPL

Linpack是目前國際上最流行的用于測試高性能計算機系統(tǒng)浮點計算性能的方法,Linpack測試主要包括三類:Linpack100、Linpack1000和HPL。 HPL即High Performance Linpack,它是基于對高性能計算機采用高斯消元法求解稠密線性代數(shù)方程組的測試。HPL是針對現(xiàn)代并行計算機提出的測試方法,能夠在對測試程序不做修改的基礎上,調整作業(yè)的規(guī)模(矩陣大小)、CPU數(shù)目和優(yōu)化策略等方法執(zhí)行該測試程序,從而獲得最佳的浮點性能,具有通用性好,效率高的特點,被認為是目前最好的Linpack性能測試程序。現(xiàn)今國際上每半年公布一次的世界最快500臺計算機排名的重要依據(jù)就是HPL性能測試。

2.2 HPL測試結果分析

浮點計算峰值或者計算峰值是評價計算機性能的一個重要指標,是指計算機每秒能完成浮點計算的最大次數(shù),常見的兩個指標包括理論浮點峰值和實測浮點峰值[5]。

并行效率=實測浮點峰值/CPU理論浮點峰值

(1)理論浮點峰值=系統(tǒng)中CPU個數(shù)×CPU主頻×每個時鐘周期執(zhí)行浮點運算的次數(shù)。

(2)實測浮點峰值是指Linpack數(shù)值,即HPL程序的測試結果。

本集群所有CPU理論峰值=CPU總核數(shù)×CPU主頻×4=24×(2×4×2.4)×4=1 843.2 Gflops,而我們通過HPL測試,得出實測浮點峰值為1 620 Gflops,因此可以得出高性能計算集群的并行效率為87.89%(主流中小型高性能計算集群的并行效率約為80%),表明集群的并行性能優(yōu)秀,可以滿足大部分海洋數(shù)值業(yè)務化運行要求。

3 基于海洋數(shù)值模式的加速比測試的性能評價

3.1 海洋數(shù)值模式簡介

高性能并行計算集群的發(fā)展,滿足了大氣和海洋數(shù)值模式逐漸向更高時空分辨率、更細微物理過程方向發(fā)展的需求,促進了數(shù)值模式更準確、更精細模擬的實現(xiàn)。本文即通過一個有限體積近岸海洋數(shù)值模型FVCOM(Finite Volume Coastal Ocean Model),對高性能計算機集群的并行計算效率進行了測試。

FVCOM海洋模型是采用無結構網格、有限體積的三維原始方程海洋模式。水平方向上采用是三角網格,而在垂向方向上采用隨地形變化的σ 坐標。有限體積的方法不但具備有限元方法幾何拓撲結構上的靈活性,而且包含有限差分方法在數(shù)值離散上的簡單的特點,更容易擬合復雜的陸地邊界和進行局部網格加密;模式還包含了干/濕網格處理模塊、地下水輸入模塊、拉格朗日示蹤模塊、物質輸運擴散模塊、生態(tài)模塊等,可以滿足多種用途的應用。該模式已在我國許多海域得到成功應用,并進行了業(yè)務化推廣。

FVCOM的并行運算通過SPMD(Single Processor Multiple Data)方法實現(xiàn)[6]。首先通過METIS庫對模式區(qū)域按照并行處理器的數(shù)量進行分塊,并保證各區(qū)塊的網格單元數(shù)目基本一致且各區(qū)塊的邊界總長度盡量最小,以達到平衡各處理器計算負載、減小MPI(Message Passing Interface)通訊數(shù)據(jù)量的目的;然后在各塊區(qū)域分別進行積分計算,并保持相互之間的數(shù)據(jù)信息交換,以保證總體質量守恒及邊界通量的正常;最后將各區(qū)塊的計算結果重新整合,實現(xiàn)整體的輸出和讀寫。

3.2 加速比測試簡介

加速比是同一個任務在單處理器系統(tǒng)和并行處理器系統(tǒng)中運行消耗的時間比率,常用來衡量并行系統(tǒng)或程序并行化的性能和效果。負載不平衡和通信開支是影響加速比的主要因素[7]。負載不平衡產生的直接后果就是導致各個計算節(jié)點上CPU使用效率的不平衡,從而降低集群的并行效率。并行方法按計算顆粒度可以分為粗顆粒并行處理和細顆粒并行處理,粗顆粒并行處理主要是針對多塊網格的處理;而細顆粒并行處理是面向在一塊網格計算程序的內部進行并行化處理。無論是粗顆粒并行處理還是細顆粒并行處理,都需要交換多塊網格虛擬層的物理信息,因此不同計算節(jié)點之間的通信開支就成為了提高集群并行效率的瓶頸[8]。

3.3 測試結果分析

本文選取的FVCOM模式算例,共43 646個三角網格,22 947個節(jié)點,網格最高分辨率100 m,垂向7個σ 分層;模式的時間步長設計為外模6 s,內模60 s,模式的計算時間設定為3 d。

根據(jù)加速比計算方法,可以計算出在最優(yōu)加速比與并行效率最高的情況下的計算節(jié)點數(shù)。

式中:T 是算例計算所需的時間;C1是計算量的大小;C2是計算機之間的通信因素;C3是網絡并行計算的初始化延時;Nopt是參與并行計算的最優(yōu)節(jié)點數(shù)。由于運算開始前,已經進行了相關初始化工作,因此此處設定C3為0。將FVCOM算例分配在4個節(jié)點所得計算時間為882 s,分配在8個節(jié)點上得出計算時間為510 s,然后將882 s和510 s分別帶入公式(1)可得C1=3 344 s,C2=11.5 s,最終通過公式(2)得到Nopt=17。根據(jù)加速比計算方法的理論估算,此FVCOM的算例分配在17個節(jié)點并行運算時效率最高。

將模式分別在集群的主節(jié)點(即管理節(jié)點)、不同數(shù)量的計算節(jié)點上進行計算,記錄其運行所需時間,并計算了加速比,其加速性能曲線如圖3所示。結果顯示,在當前算例的計算量下,并行運算的總時間在從1個節(jié)點增加到12個節(jié)點的過程中迅速減少,運算效率提升明顯,然后隨著計算節(jié)點數(shù)增加運算效率的提升能力有所下降,并在16節(jié)點時實現(xiàn)了并行運算的最大效率,之后隨著節(jié)點數(shù)的增加,運行時間反而增加,運算效率降低。這主要是由于隨著節(jié)點數(shù)的增加,雖然各區(qū)塊的計算時間縮短,但各區(qū)塊間MPI通訊阻塞所占用時間的比例卻明顯增加,且成為影響并行運算效率的主要因素[9]。

集群系統(tǒng)實測加速比性能的拐點出現(xiàn)在16節(jié)點,這與理論估算的將在17節(jié)點上達到最大加速比略有差異,可能是由于在集群系統(tǒng)上搭載的軟件平臺、運行的作業(yè)調度機制、外部的工作環(huán)境等因素的聯(lián)合作用下,影響了并行計算的效率,導致處理器的計算負載以及各區(qū)間MPI通訊阻塞所消耗的時間與理論估算值略有差異的原因。

圖3 不同計算節(jié)點下的加速比

4 總結

根據(jù)計算出的集群理論浮點峰值,以及HPL所測得的實測浮點峰值,可以估算本集群的并行效率為87.89%,該集群并行效率高于國內主流高性能計算集群的并行運算水平,并行性能優(yōu)秀,可以滿足大氣海洋數(shù)值模式等業(yè)務化運行的需求。

通過選用海洋數(shù)值模式FVCOM一個算例的應用,對集群系統(tǒng)進行了加速比測試,加速比并沒有像理論那樣隨著計算節(jié)點數(shù)的增加而成線性增長,超過16節(jié)點后反而出現(xiàn)了節(jié)點越多運算時間越長的情況。雖然隨著計算節(jié)點數(shù)的增加各區(qū)塊的計算時間會縮短,但是區(qū)塊之間MPI通訊阻塞消耗的時間在總時間中所占的比例卻明顯增加。相比計算縮短的時間,MPI阻塞消耗了更多的時間,從而影響了并行運算的效率,使集群加速比在16節(jié)點后出現(xiàn)拐點,加速性能呈下降趨勢。

集群系統(tǒng)的加速比測試結果表明,在數(shù)值模式的并行運算中,并不是使用的計算節(jié)點越多運行速度越快,合理的使用計算節(jié)點不但可以提高運行效率,還可以節(jié)省計算資源。本設計中的集群系統(tǒng)通過合理化配置計算資源,選取適當?shù)慕粨Q網絡,可以同時高速并行運算部署在該系統(tǒng)上的大氣和海洋數(shù)值模式,滿足大氣和海洋數(shù)值模式連續(xù)周期性運算的要求。經過一段時間的示范運行,集群系統(tǒng)運行穩(wěn)定、計算性能優(yōu)秀,完全能夠滿足仿真系統(tǒng)業(yè)務化運行的要求。

[1]陳顯堯,宋振亞,王永剛,等.并行計算在海洋環(huán)流數(shù)值模式中的應用[C]//2005高性能計算應用大會論文集,2005:264-269.

[2]田俊剛.高性能集群系統(tǒng)分析、設計與應用[M].西安:西北工業(yè)大學,2004.

[3]張磊,姜弘道,潘海琳.計算機集群的搭建、測試與應用[J].水利水電科技進展,2006:26(2):65-69.

[4]謝向輝,彭龍根,等.基于Infini Band的高性能計算機技術研究[J].計算機研究與發(fā)展,2005,42(6):905-912.

[5]余江洪,肖燕成,等.基于Linpack的高性能計算機集群的并行性能測試[J].船電技術,2009,29(1):56-60.

[6]Chen Changsheng,Robert C Beardsley,Geoffrey Cowles.An Unstructured Grid,Finite-Volume Coastal Ocean Model,FVCOM User Manual.SMAST/UMASSD,02:16-17.

[7]Guo QP,Paker Y.Concurrent Communication and Granularity Assessment for a Transputer-based Multiprocessor system[J].Journal of Computer Systems Science&Engineering,1990,5(1):18-20.

[8]溫小飛,朱宗柏.高性能計算機集群的性能評價[J].武漢理工大學學報(信息與管理工程版),2005,27(4):19-22.

[9]宋倩,胡松.海洋模式FVCOM2.6并行計算性能TAU分析[J].計算機工程與科學,2011,33(12):87-93.

猜你喜歡
系統(tǒng)
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機系統(tǒng)
ZC系列無人機遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統(tǒng)
基于UG的發(fā)射箱自動化虛擬裝配系統(tǒng)開發(fā)
半沸制皂系統(tǒng)(下)
FAO系統(tǒng)特有功能分析及互聯(lián)互通探討
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
一德系統(tǒng) 德行天下
PLC在多段調速系統(tǒng)中的應用
主站蜘蛛池模板: 国模沟沟一区二区三区| 尤物午夜福利视频| 在线五月婷婷| 91免费片| 久久精品日日躁夜夜躁欧美| 亚洲精品片911| 中文字幕啪啪| 久久中文字幕不卡一二区| 老色鬼欧美精品| 欧美日韩午夜| 中文字幕日韩视频欧美一区| 国产男人天堂| 激情无码字幕综合| 四虎永久免费地址| 天天综合网站| 亚洲精品欧美日韩在线| 成人91在线| 在线播放真实国产乱子伦| 日韩激情成人| 久久青草视频| 国产91九色在线播放| 99这里精品| 亚洲精品中文字幕午夜| 欧美日韩国产一级| 97影院午夜在线观看视频| 性69交片免费看| 精品无码一区二区在线观看| 国内精品91| 国产一区三区二区中文在线| 国产美女在线观看| 99草精品视频| 欧美成人a∨视频免费观看 | 日韩av无码DVD| 欧美激情视频一区| 无码有码中文字幕| 国产一区自拍视频| 19国产精品麻豆免费观看| 在线国产毛片手机小视频| 精品黑人一区二区三区| 2021国产在线视频| 日本欧美在线观看| 亚洲水蜜桃久久综合网站| 国产黑丝视频在线观看| 新SSS无码手机在线观看| 精品人妻AV区| 国产特一级毛片| 成人午夜视频网站| 天天做天天爱天天爽综合区| 波多野结衣无码视频在线观看| 国产成人精品一区二区秒拍1o| 拍国产真实乱人偷精品| 国产呦视频免费视频在线观看| 国产精品短篇二区| 91免费观看视频| 亚洲欧洲免费视频| 色综合五月婷婷| 日本a∨在线观看| 久久国产亚洲偷自| 一级毛片免费的| 97精品国产高清久久久久蜜芽| 亚洲综合二区| 午夜性刺激在线观看免费| 国产美女无遮挡免费视频网站| 国产成人乱无码视频| 色天堂无毒不卡| 久久熟女AV| 最新加勒比隔壁人妻| 久久国产精品麻豆系列| 欧美日韩精品一区二区在线线| 色综合天天综合中文网| 丁香综合在线| 2020国产精品视频| 99在线视频免费| 国产女人在线视频| 香蕉99国内自产自拍视频| a毛片在线播放| 在线亚洲精品福利网址导航| 色综合久久久久8天国| 日本精品影院| 999在线免费视频| 99999久久久久久亚洲| 欧美成人国产|