孫磊

摘 要 PC集群的高性能運算可提高地震資料的處理速度,而如何進一步優化,提升其應用性能,已經成為業界關注的焦點。本文是以應用軟件為載體,從數據處理、定位等方面提出優化方案,引入不同的技術,以優化系統的處理,加快處理速度,進而實現PC集群優化的目標。
關鍵詞 高性能運算;PC集群;系統優化
中圖分類號 TP3 文獻標識碼 A 文章編號 2095-6363(2017)16-0132-02
隨著計算機技術的發展,PC集群在多個領域多有應用,特別是在軍事、國防等領域的應用,可加快這些行業的發展。以石油勘探地震資料處理為例,是PC集群主要應用的領域,其使用量不斷增加,加快了PC集群的發展,并優化了各關鍵零部件的使用。
1 高性能運算PC集群綜合優化的技術方案
PC集群是為需要運用高性能運算行業提供服務,可以從中總結各行各業的特點,滿足其基礎所需,只是其側重于不同的方面,特別是對于石油勘探地震資料的處理,可以滿足大量數據快速運算的要求,但廠家在這方面的考慮還有待加強。其只是根據整合行業的選擇,或是自己以往的工作經驗,選擇使用的系統,而PC集群系統有多個技術原理,需使用不同設備,廠家選擇的系統很少可以直接與地震資料處理的軟件匹配,且需求并不一致。所以,系統應用后需要二次調試,優化性能,根據對應軟件提出的要求,從硬件平臺與系統入手,把硬件設備的特性作為前提,搜集運行數據,找到運行效率無法提升的限制,由此給出系統性能提升的方案,再根據方案內容,調整硬件,均衡配置,進一步開發程序,使地震資料的處理達到最優,提升PC集群的性能[1]。
根據PC集群應用的特點,以及硬件與系統性能的開發,其優化包括以下幾方面,有網絡交換、節點配置的升級、BIOS參數調優、系統服務等,加以優化。
2 高性能運算PC集群綜合優化的技術落實
2.1 網絡交換與系統服務
2.1.1 網絡交換
現在用于地震資料計算的PC集群系統構成的計算機,共有123個計算節點,每個管理節點和I/O節點,都是用網絡交換機實現交換,而數個計算節點均勻分布在多個刀片中心上,平均每個刀片中心有14個計算節點。但因為受到技術的影響,每個刀片中心只可以用1個網絡模塊處理信息,共用4個千兆的網絡寬帶。基于該系統對處理評價做出綜合性的分析后,得出其瓶頸是網絡運行受到阻礙,且數據交換也不易進行,降低了PC集群的性能。其優化方案為:把網絡直通模塊升級。即對系統內的部分零件進行調整,以刀片中心電力正常供應為前提,使用新的網絡直通模塊,運用網絡直通技術,確保任意一個刀片上的千兆節點都可以提速,從原有的286Mb/s提升為1 000Mb/s,優化數據傳輸性能,消除網絡瓶頸。
升級核心網絡交換機。網絡模塊實現升級后,原有核心網絡交換機的性能已無法滿足運行需求,特別是端口的密度與背板的帶寬,故經過分析,可以用Foundry RX16代替Cisco4506,以實現網絡升級,增加網絡的背板帶寬,加快數據傳輸的速度。
2.1.2 系統服務
PC集群內各個節點的在系統內的使用,是以優化系統運行為前提,對功能進行定制,再完成安裝。即根據系統的對功能的要求,除必要的管理節點外,把I/O與計算所需的節點按照字符模式的方式排列,并設置為默認啟動,同時,減少虛擬控制臺的操作,從多個終端中選擇一個虛擬終端,以減少資源的過度使用。另其可以把不需要的服務關閉[2]。
2.2 節點配置與BIOS參數
2.2.1 節點配置
處理地震資料的軟件有 Omega、Geocluster等,這些軟件中,某些運算模塊需優化節點的功能,有特殊要求。以Omega為例,其分析并處理地震信息時,對于疊前時間偏移模塊的處理,需要大量的內存,而運行地表一致性類工作的模塊時,除了需要較大的內存,同時也需容量較大的內置磁盤。而Geocluster運行時,與Omega提出的要求基本相同,但它疊前深度偏移模塊操作的過程中,要求加快數據傳輸的速度,對傳輸速度提出了更高的要求。所以,PC集群是預先了解處理板塊與模塊的要求,把某些節點升級,其主要包括I/O與計算節點的內存,以及計算節點的內置磁盤。這兩個節點的配置與功能提升后,可優化網絡吞吐以及系統的運算,能夠從大量的數據中快速分揀信息,加快了不同節點的處理速度,做到同時運行大量的數據,減少了小型作業的開展,縮短了系統對信息的處理時間,提升效率。
2.2.2 BIOS參數
對于系統內BIOS參數的分析,可從眾多參數中選擇可能造成系統瓶頸的參參數進行調試,比如預取相鄰緩存和硬件預取參數,前者的參數可以由Enabled變為Disabled,其調試后,能夠在處理器運行過程中,另外得到一個緩存線路,字節容量為64字節,處理器需要新的緩存空間后,64字節緩存即可供處理器使用,避免出現緩存延遲。以Enabled為參數,供處理器使用的緩存路線既包括現有路線,又有新的路線,但Disabled則是只能用現有的路線,故把硬件預取參數中的Disabled變為Enabled,可控制這一參數內存向二級緩存發出的命令,以及不同硬件數據的預取,即用Enabled操作,可用系統對二級緩存發出指令,而Disabled不可以做到這一點。
對BIOS參數的調優,可減少系統資源的使用,使系統的運行保持穩定,并可以適當放寬系統性能需要使用的指標。
除了上數量兩點的優化外,也需要對存儲系統層進行優化。軟件或系統對地震信息進行處理后,需把處理后的信息存放到指定地點,而該層是以SAN結構為主要架構,把儲存系統層方分成不同的層次,各自有相應的等級,逐級管理,同時,數據可根據實際所需,在多個設備中不斷轉移。由此,可對此層次的優化進行管理,保持數據傳輸通道的通暢,并在各層留下一定的儲存空間,為功能進一步拓展留下余地,故可使用HP XP24000、HDS AMS1000存儲系統,保證所有信息可以在線閱覽,優化計算平臺的處理。
3 結論
本文先論述了高性能運算PC集群綜合優化的技術方案,而后從網絡交換與系統服務、節點配置與BIOS參數以及存儲系統層幾方面提出系統優化的方案,并給出實施措施,如此,可優化對地震資料的處理,提高系統、軟件運行的效率。
參考文獻
[1]付喜春.基于多架構PC集群監控系統結構設計[J].信息技術,2013(9):96-99,103.
[2]趙勝平,王志杰,趙萍萍,等.應用xcat在PC集群上安裝地震資料處理系統后遇到的問題與對策[J].物探裝備,2012(6):371-375.endprint