北京機電工程研究所 柳瓊俊
走進北京機電工程研究所設計中心大樓一層大廳,“高性能計算中心”藍底白字的標牌不禁令人眼前一亮,緊閉的紅褐色大門昭示著其中些許的神秘。我作為信息化專業人員,見證了這里的高性能計算系統從無到有、量的提升、質的飛躍的歷程。
計算機軟硬件的升級換代,推動了專業技術的發展。反過來,專業技術更需要先進的軟件與高性能的計算機支撐。PC機的普及,工作站的引入,單臺高端服務器的應用,都已滿足不了復雜裝備研制任務對大內存、多CPU并行的需求,尤其是氣動專業的矛盾最為突出,在計算上花費的時間太長而影響著整個產品研發周期。在國內軍工行業尚未對高性能計算系統必要性形成共識的大環境下,論證建設高性能計算系統的進展并不順利,持續了很長一段時間。2006年,終于建成了0.8萬億次計算能力的高性能計算系統,包括4臺胖節點服務器、32臺刀片服務器和4TB的存儲系統。由于沒有專用機房,“高貴”的機器只能屈居于一間簡陋的辦公用房,好在其計算能力得到了專業技術人員的認可,甚為欣慰。
0.8萬億次高性能計算系統投入使用后,立刻凸顯出其價值,擴建的需求剛一提出即被方方面面認可。2007年,建成了2萬億次計算能力的高性能計算系統,包括4臺胖節點服務器、128臺刀片服務器和12TB的存儲系統,被體面地放置在了寬敞的新建機房內,成為當時彰顯能力的一道風景。
2009年,高新復雜裝備工程全面啟動,支撐關鍵技術和總體方案研究的CAD/CAE等計算任務急劇增加,導致計算資源異常緊張,再次擴建工作提到議事日程。受機房面積限制及經費的考慮,項目組在論證時小心地提出了擴建到12萬億次的方案,在院級審查時,領導當場拍板,直接擴建到機房能承受的最大能力24萬億次。在國防科工局、總裝備部和集團相關方大力支持下,2009年3月緊急啟動了系統擴建工作,項目組精心組織實施,快速完成方案設計、招投標、設備購置、系統集成調試等工作。2009年8月,擴建的高性能計算系統順利上線運行,極大地緩解了計算資源不足的壓力。24萬億次高性能計算系統,包括4臺胖節點服務器、384臺刀片服務器和24TB的存儲系統,運行半年后就出現了排隊現象,項目組同事不由地感慨、佩服上24萬億次決策的正確性。
隨著高新復雜裝備工程的推進,對高性能計算資源的需求愈來愈多,院內研究所之間、型號任務之間、研究室之間有時為搶占CPU資源,需多方協調。在氣動布局方面,需要開展大量的規律研究并獲得全套氣動數據,計算任務量大,任務提交后曾經出現過排隊等待超過1個月的情況,嚴重影響了科研任務進度。日趨嚴重的高性能計算任務排隊現象,使得200萬億次高性能計算系統建設迫在眉捷,很快得到了科工局、總裝備部和財政部的支持。新購計算機主機及配套設備占地面積大,一時沒有合適的地方,于是乎,位于設計中心大樓一層的研究室全體員工顧全大局,全部搬離。搬家那天,有些員工自嘲是“被機器趕走的”。
2011年6月1日,200萬億次高性能計算系統建成,包括8臺胖節點服務器、1574臺刀片服務器和240TB的存儲系統,計算能力在國內排名位居第4位,國際排名位居第43位。新建的現代化機房功能強、性能高、安全可靠,讓這些高科技的機器帶上了時尚的元素,高性能計算中心按軍工企業保密要求嚴格防護而頗顯神秘。
200萬億次高性能計算系統自投入使用以來,各軍工企業也逐步認識到其必要性,紛紛前來學習交流并在國防科工局固定資產投資科目上積極申報高性能計算項目,得到了很好的支持。隨著新裝備研制的立項及研制周期的縮短,對高性能計算系統的使用越來越多,計算資源的使用率一直處于較高水平。2014年初,為解決計算作業排隊多、時間長的問題,對計算調度策略進行了調整,將每個用戶的并發CPU核數進行了調減,每個用戶的并發作業數做了限制,從策略調整后的統計信息看,要從根本上緩解計算資源緊張的局面必須擴建。
根據各主要裝備“十三五”期間的工作任務,高新復雜裝備的技術發展研究、關鍵技術攻關等,通過分析測算,需擴建400萬億次高性能計算系統,與原有系統形成600萬億次能力。為避免新舊系統交叉使用性能“就低”的問題,擴建的計算網絡與現有的計算網絡相對獨立,管理網絡互聯,存儲擴容,升級資源調度系統、并行文件系統及集群監控管理系統等。擴建的400萬億次高性能計算系統于2017年11月投入使用,極大提高了高新復雜裝備仿真計算能力,顯著提高了研發效率與設計質量。
近年來,高性能計算硬件飛速發展,全球超級計算機排行榜,被國際計算機行業追逐著,我國在此領域的自主研發能力凸顯。在峰值上,我們擁有的600萬億次高性能計算系統與國際先進水平存在很大的差距,但絲毫不影響其在高新復雜裝備研制中所處的重要地位。它有一支專業的專職人員24小時輪崗值守,擁有各類計算分析軟件資源,包括結構有限元類、流體力學類、電磁仿真類、流固耦合類及隱身分析類等軟件。在未來的日子里,我們需要有更長遠的眼光、更深邃的思考、更廣闊的思維、更實干的精神和更創新的思路,建立起計算速度更快、應用軟件更豐富、系統能力更強的高性能計算系統,為專業設計、仿真分析、大數據等提供高效的服務,助力飛航事業及軍工行業蓬勃發展。