余科軍
(四川教育學院計算機科學系,四川成都610041)
隨著應用環境越來越復雜多變,系統規模更大,異構系統更多,異地分布更廣,通信環境更復雜,如何構建一個完善的網格系統就成為我們研究的主要課題。網格的研究源于美國聯邦政府過去10多年來資助的高性能計算項目。這類研究使用的名詞就是“網格”或“計算網格”。網格能夠充分吸納各種計算資源,并將它們轉化成一種隨處可得的、可靠的、標準的同時還是經濟的計算能力[1]。這類研究的目標是將跨地域的多臺高性能計算機、大型數據庫、貴重科研設備、通信設備、可視化設備和各種傳感器整合成一個巨大的超級計算機系統,支持科學計算和科學研究。
網格就是一個集成的計算與資源環境,或者說是一個計算資源池[2]。網格技術可以將足夠的計算機資源分配給分布在世界各地的計算機,它通過并行處理來提高分配到每個網格計算節點的計算速度。
網格(Grid)技術是近年來國際上信息技術領域的熱門課題,因此目前許多組織開發了支持網格計算的系統。網格計算研究起步最早的國家是美國,美國多家研究機構開展了與網格相關的研究工作,制定了很多網格研究計劃,如美國國家科學基金會資助的TeraGrid、美國國防部的“全球信息網格”(GIG)、美國政府資助的“大型物理實驗網格”(GriPhyN)及美國能源部的ASCIGrid、國家技術網格(NTG)等計劃。美國國家科學基金會TeraGrid計劃是一個需要多年分段實施的,為開放式科學研究而建立和使用的世界上最大、最全面的分布式基礎設施。
歐洲近年來啟動了一系列網格開發計劃,其中包括DataGrid、SIMDAT、NextGRID、AkoGriMo和CoreGRID等計劃”。歐洲數據網格計劃(DataGrid)涉及到歐盟的二十幾個國家,其目的是開發一種能支持全球性分布科學探索的全新環境。SIMDAT是歐洲的一個大型網格研究計劃。該計劃的目標是利用數據中心的網格技術來開發解決工業復雜問題的方案。NextGRID是面向工商業領域建立的下一代網格服務結構。該計劃針對的是廣泛的應用領域:法律部門的數據挖掘;廣播和娛樂;金融模型;數字媒體和供應鏈管理。CoreGRID計劃的核心網格是一個研究網絡,主要用于大規模分布式網格和對等技術的基礎建設、軟件基礎設施和應用。
日本認為網格計算技術將極大地改變日本的產業結構,成為激活經濟的原動力。日本主要在進行國家研究網格計劃(NAREGI)和生物網格計劃(BioGrid)的研究。NAREGI計劃是日本文部科學省推出的“激活經濟研究開發計劃”,目標是使最高運算速度達到100TFLOPS。生物網格計劃(BioGrid)是在2002年啟動的一項為期五年的網格研究計劃,主要由日本文部科學省資助。計劃利用網格計算技術與超高速網絡,將各大學生物工程研究機構所擁有的超級計算機、數據庫、高性能觀測設備等研究資源聯合起來。
我國同世界其他各國政府一樣,為大幅度提高我國的綜合國力和國際競爭能力,對于網格的建設也十分關注,同時在網格計算方面做了大量基礎性和前瞻性研究工作,并在863專項中提出了具體的目標,專項確立了“戰略與系統綜合研究”、“高性能計算機”、“網格結點”、“網格軟件”和“應用網格”五個方面的課題。其主要任務是研制面向網格的每秒萬億次級高性能計算機和具有每秒數萬億次聚合計算能力的高性能計算環境;開發具有自主知識產權的網格軟件;建設科學研究、經濟建設、社會發展和國防建設急需的重要應用。目前,我國已開展了“中國國家網格”、“教育科研網格”、“織女星網格”和“先進計算基礎設施北京、上海試點工程”等五大網格項目的研究。
從國內外對網格技術的研究來看,網格技術的特點主要表現為:(1)網格技術和多學科結合;(2)網格技術應用的領域非常廣泛;(3)網格技術的全球化。網格技術正在為我們作出巨大貢獻。
網格計算技術是一個正在迅猛發展的學科。從生物領域的后基因組計劃,到高能物理領域更深層次物質結構的研究,再到哈勃望遠鏡所獲取的大量宇宙數據的處理,再到氣象、地震預報預測這些重大科學領域的計算問題,促使科學家必須利用分布在世界各地的計算機資源,通過高速網絡連接起來,共同完成計算問題。網格計算技術的應用正在改變著我們的教育、生產、制造、研究等。
(1)網格技術在教育領域的應用
利用網格技術可以將各個分布在各地實驗室中的超級計算機連接起來,形成一個“強強聯合”的超級信息處理中心。如利用網格技術將伊利諾州立大學超級計算中心、圣地亞哥大學超級計算中心、阿貢國家試驗室和加州理工學院計算中心連接起來的由美國國家科學基金會建立的“分布式兆兆級網格(TeraGrid)”,就形成一個處理能力約為每秒13.5萬億次浮點操作,存儲容量接近700兆兆字節的“巨無霸”計算中心,以供許多領域的研究機構使用。
網格技術為我們的學校教學資源提供了共享的新平臺。盡管傳統的網絡教學系統或者基于網絡的遠程教學系統都強調共享,但這種共享還是處于相對較低的水平上,而且從教學資源上來看,形式多樣,格式不統一,無法進行統一有效的協調和管理;硬件和操作系統還并存著各種異構系統,許多遠程教育教學系統在不同的平臺上運行;從實現的方式上來講,大多是靜態或動態的web頁面,沒有體現服務的概念。網格教學系統的核心是教學資源的共享和教學服務系統的建立,它通過為用戶提供統一的服務接口,實現更高層次的共享。
(2)網格技術在生物科技領域的應用
網格技術能滿足生物科技對數據的存儲和管理等方面相當高的要求。生物數據由于包括物體本身、細胞、染色體、DNA、單個細胞的循環等各個方面的信息,所以非常復雜。這樣,數據庫的整合就成為關鍵問題。比如說,在研究水稻的蛋白結構時,可能會用到基因數據庫、蛋白質數據庫、基因表達數據庫和蛋白質相互作用的數據庫,在這種情況下,應用網格技術,能在較短時間內把需要的數據從不同的數據庫中挑選出來綜合在一起,省去了多次訪問不同數據庫的時間。
(3)網格技術在網絡娛樂領域的應用
虛擬現實(Virtual Reality)技術是一種利用計算機圖形技術人工合成的可以按照用戶的輸入而變化的模擬仿真環境,一個多維信息空間,一個用戶可與計算機系統自然交互的三維人機界面。由于運行虛擬現實技術所需要的計算資源太過于龐大,目前虛擬現實技術只用于飛行員、宇航員等的訓練工作,普通個人根本無法享受這一技術帶來的娛樂體驗。利用網格這種造價低廉而數據處理能力超強的計算模式,可以將虛擬現實技術運用于網絡游戲中,讓參與游戲的人可以真切地感受虛擬環境所帶來的游戲快感。美國游戲基礎設施提供商Butterfly.net公司目前使用的就是IBM的網格計算服務器。該服務器利用了網格技術自恢復特性,能夠無縫隙地將所玩的游戲轉到最近的可用服務器上,實現了用戶資源的統一調動、統一保存,極大提高了游戲運行和服務的可擴充性。據Butterfly.net與IBM的評估,在同相同的預定收益中,利用網格技術布置的網格服務器產生的利潤是傳統集中式服務器的8倍。而對于個人用戶來說,網格服務器則意味著更安全、更快捷的游戲體驗。
(4)網格技術在其它領域的應用
網格技術可以整合和管理分散在各部門的信息化資源,實現各個政府部門之間數據的無縫交換,消除“信息孤島”,打破電子政務資源共享的瓶頸;另一方面,網格技術的分布式工作模式,可以有效地實現在網絡虛擬環境下的協同辦公,提高政府的工作效率、增強為公眾服務的能力。
網格技術為企業的信息處理提供了很大的平臺。IBM推出一個網格計算力出租的計劃。為幫助軟件廠商開發新的應用程序,并測試現有的應用程序,IBM為這些軟件廠商提供IBM網格運算服務器的免費存取權。擁有免費存取權的軟件開發人員可以利用IBM網格服務器的強大運算資源,快速完成新開發的軟件所必需的調試及模擬運算,從而縮短程序從開發到應用的周期,提高軟件的開發速度。
網格技術的應用領域非常廣泛,網絡通信基礎技術和應用技術科學研究、環境資源、制造業、服務業生物工程汽車制造、制藥、太空研究和氣象研究分子電子學和生物分子元件等,這些都將為我們的生活和工作帶來巨大改變。
隨著高性能計算應用需求的迅猛發展,在單一的計算機上或單一的計算機群系統上已不能解決一些超大規模應用問題,這就需要將地理上分布、系統異構的各種高性能計算機、數據服務器、大型檢索存儲系統和可視化、虛擬現實系統等,通過高速互連網絡連接并集成起來,形成對用戶相對透明的虛擬的高性能計算環境。
可以說網格是未來信息技術和產業發展的大趨勢,它將極大地改變我們的生活和工作。未來的網格計算主要有三大發展趨勢:即標準化、大型化和技術融合化。也就是說,網格計算將在行業應用的引導下,以標準化向更廣域、多學科滲透,網格的一切對外功能都將以網格服務來體現,技術將進一步融合,且將逐漸從高性能計算走向商業應用,從前沿技術走向實用化、大眾化。可以預見,今后網格計算技術仍將快速發展,從而開創計算科學的一個新紀元。
[1] 都志輝,陳渝,劉鵬.網格計算[M].北京:清華大學出版社.2002:3-5.
[2] 許文韜.網格技術綜述.微型電腦應用[J].2002(18):62-64.
[3] 全球網格論壇.http://www.gridforum.org.