摘要:本文簡單回顧了計算機網絡發展歷程,闡述了網格技術的發展背景及網格計算的內涵,對于網格計算時代的特征及所面臨的問題作了描述和分析,并對未來網格計算的發展趨勢進行了展望。
關鍵詞:互聯網;網格計算;信息
中圖分類號:TP393文獻標識碼:A 文章編號:1009-3044(2008)17-21401-02
1 互聯網的發展歷程
記得曾任美國總統信息技術顧問委員會主席,同時也是IBM百億美元網格計劃領導人的Wladawsky-Berger在GGF上曾做過著名的“Beyond Technology:on-Demand Computing”的主題報告,他在報告中提到:“計算機的第一階段是專家使用期,是大型機一終端時代;第二階段是早期流行期,是客戶機-服務器時代;第三階段是公眾認識期,是因特網時代;第四階段是廣泛使用期,是即將到來的按需計算,即網格時代。網格技術將影響整個IT基礎設施,從高性能服務器、操作系統,到應用模式、使用方式。”[1]
按照Wladawsky-Berger的提法,網格即是下一代的互聯網,是信息化應用的第四階段。也的確如此,我們知道,第一代互聯網主要是設備級的互聯,即將世界上的計算機硬件連通,形成因特網;而第二代互聯網是萬維網,即實現了網頁的連通,將各種信息資源連接起來,由硬件相連的因特網向網頁相連的萬維網,互聯網的發展跨越了兩大里程。而21世紀初出現的網格技術[2]則是互聯網發展的第三大里程碑,也可以稱為互聯網發展的第三次浪潮,或者可以稱為第三代互聯網。
2 什么是網格和網格計算
負責美國計算網格項目的領導人之一的伊安·福斯特在1998年他所主編的題為《網格:21世紀信息技術基礎設施的藍圖》一書中這樣描述網格:“網格就是構筑在互聯網上的一組新興技術。它將高速互聯網、高性能計算機、大型數據庫、傳感器、遠程設備等融為一體,為科技人員和普通百姓提供更多的資源、功能和交互性。互聯網主要為人們提供電子函件、網頁瀏覽等通信功能,而網格的功能則更多更強,它能讓人們透明地使用計算、存儲等其他資源。” [3]
網格計算是伴隨著互聯網而迅速發展起來的,專門針對復雜科學計算的新型計算模式。這種計算模式是利用互聯網把分散在不同地理位置的電腦組織成一個“虛擬的超級計算機”,其中每一臺參與計算的計算機都是一個“節點”,而整個計算是由成千上萬個“節點”組成的“一張網格”、所以這種計算方式叫網格計算[4]。這樣組織起來的“虛擬的超級計算機”有兩個優勢:一個是數據處理能力超強,另一個是能充分利用網上的閑置處理能力。隨著超級計算機的不斷發展,它已經成為復雜科學計算領域的主宰。但超級計算機造價極高,通常只有一些國家級的部門,如航天、氣象等部門才有能力配置這樣的設備。而隨著人們日常工作遇到的商業計算越來越復雜,人們越來越需要數據處理能力更強大的計算機,而超級計算機的昂貴的價格使得它很難進入普通人的工作領域。
實際上網格計算(Grid Computing)是分布式計算[5] (Distributed Computing)的一種。網格計算模式首先把要計算的數據分割成若干“小片”,而計算這些“小片”的軟件通常是一個預先編制好的程序,然后不同節點的計算機可以根據自己的處理能力下載一個或多個數據片斷和程序。只要節點的計算機的用戶不使用計算機時,程序就會工作。網格計算資源都存在于Internet骨干網上,包括幾十億臺計算機。Internet重組為混合虛擬計算平臺[5]是一個邏輯步驟。在新的Internet環境下,用戶只需向網格提交“工作”,網格就會分配相應資源來完成工作,資源是指處理器周期、應用、存儲或數據。
3 網格計算時代給我們帶來了什么
所謂的網格計算時代,筆者認為它是一個綜合多種技術應用的一個新的計算機時代,標志著計算機技術、互聯網技術和通信技術等發展到了一個新的階段,是現代信息社會高速發展的必然趨勢。總體上說,網格計算時代的到來能使我們比較輕松地實現以下目標:
(1)按需計算[6](Computing on Demand)。有了計算網格,我們可以進行復雜而費時的科學計算和工程計算,而不必關心計算機放在何處、是什么型號、有多少CPU和存儲資源,只求所用,不求所有。
(2)個性索取(Fetching on Demand)。因數據網格的存在,我們可以按一定的規則隨意地去訪問我們所要的數據(可以公開的數據),如有關天體的軌道參數、地球上的各種氣象數據,而且可以進行各種數據處理。
(3)信息共享(Information Share)。信息網格[8]的應用可能是我們最為關心且使用最為頻繁的一件事情,如查詢各種信息,甚至還可以對所取信息進行各種集成,最后提供給我們的可能是一份報告、一份建議書、一個實施方案、一份關于某個主題的總結或摘要、一份商品的全球報價表等等。
(4)服務點播(Service Demand)。服務網格[9]可能是全面提高我們生活質量的另一個不可缺少的應用工具,如應用面非常廣泛的視頻點播服務就是一個高度智能化的系統,我們可以觀看到任何一部已經在國內甚至是國外發行的影片或電視劇,不受任何時間和空間上的限制。更為誘人的是,假如我們哪一天要出門旅游,只需要在我們的銀行帳戶中存入足夠的錢(信用卡上也可以只有少量的錢),并且告訴這個服務網格,你要去的地方及一些要求(如出行時間、住宿規格、交通工具的類型和檔次等),其他就一律交給這個服務網格來完成,它可以將一切安排妥當,且是最優化的方案。
(5)協同工作[7] (Cooperative Work)。有了應用網格,在產品設計方面可以完全不受空間的限制,因為設計師們可以通過應用網格來協同設計,進行異地團隊合作和跨國協同工作,即節省了交通、住宿等費用,又提高了工作效率和縮短了研發周期,使得整個地球真正地成為了一個“村莊”。在計算機輔助制造方面的出色表現也是令人興奮的,當設計人員在美國的某個設計室設計好了汽車模型,位于美國本土的加工工廠和中國的合資工廠就同時開始了生產,可以以最短的時間將新車型投放全球市場。
(6)普適計算[8] (Pervasive Computing)。它是計算、通信和數字技術等多種技術的融合,它把信息空間與人們生活的物理空間集成在一起成為一個整體,從而使計算和通信像水、電、空氣這樣的生活必需品。它充分滿足了人們以“5A”方式使用計算設備的愿望,即任何人(Anybody)在任何地點(Anywhere)、任何時間(Anytime)可以使用任何設備(Any device)訪問任何信息資源(Anything)。從計算機科學的角度看,普適計算本質上是一種繼主機計算(Mainframe Computing)和桌面計算(Desktop Computing)之后的全新的計算模式,它是移動計算(Mobile Computing)和分布式計算(Distributed Computing)的自然發展,而移動計算和分布式計算將隨著普適計算技術得到進一步的發展和完善。一般地,學術界把“普適計算”對應為Pervasive Computing,而工業界則對應為Ubiquitous Computing。
4 網格計算時代離我們有多遠
當然,綜上所述的景象目前還只是實現了很小的一部分,還有大量的法律上、技術上、環境及規則上的問題有待解決,主要表現在以下幾個方面的問題:
(1)計算模型方面還存在著諸如適應范圍不夠寬、模型不夠實用、編程工具不夠齊全等問題;存儲模型方面存在存儲效率不夠高、數據組織與分布的異構性、尋址與訪問方法復雜且不夠有效等問題;在信息模型方面主要有信息表示的標準性和一致性、模式轉換的準確性和有效性、信息抽取的歧義性和多義性等。
(2)資源管理及調度的高效性問題;服務的部署、定位及使用問題;安全性方面包括信賴關系、安全保護、用戶資料保密等問題。
(3)普適計算方面目前還遠未達到它的應用程度。普適環境主要包括網絡、設備和服務;網絡環境包括Internet、移動網絡、電話網、電視網和各種無線網絡等;普適計算設備更是多種多樣,包括計算機、手機、汽車、家電等能夠通過任意網絡上網的設備;服務內容包括計算、管理、控制、資源瀏覽等。普適計算具有以下環境特點:在任何時間、任何地點、任何方式的方便服務,不同的網絡(不同協議、不同帶寬)、不同的設備(屏幕、平臺、資源)、不同的個人偏好等。
(4)標準問題主要包括互聯互通標準、互操作標準、操作規范及新舊標準過渡問題。
(5)網格計算環境方面包含經濟模型、盈利機制、利益分配機制、市場運營機制等。
5 高度信息化催生智能化社會的誕生
綜觀以上敘述不難看出,網格計算時代實際上是信息化社會的高級發展階段,有些應用甚至已經是非常智能化的,隨著社會的高度信息化,人類必然會逐漸邁向智能化時代,從而離智能化社會也就不遠了。到那時,我們的生活質量、學習環境、工作條件、業余生活將會發生翻天腹地的變化,我們沒有理由不期待這一天的到來,讓我們共同去迎接吧。
參考文獻:
[1] Wladawsky-Berger. Beyond Technology:on-Demand Computing. Global Grid Forum: Moving to Open Grid Services Architecture (OGSA) Overview of GGF4 and follow-on developments. Version 1.0, 17 May, 2002.
[2] I. Foster, C. Kesselman, J. Nick, S. Tuecke, The Physiology of the Grid: An Open Grid Services Architecture for Distributed Systems Integration. Open Grid Service Infrastructure WG, Global Grid Forum, June 22,2002.
[3] I. Foster, C. Kesselman, editors. The Grid, Blueprint for a New Computing Infrastructure. Morgan, Kaufmann Publishers, Inc., San Francisco, USA, 1998.
[4] R. Buyya. Economic Based Distributed Resource Management and Scheduling for GridComputing. PhD thesis, Monash University, Melbourne, Australia, April 2002.
[5] K. Czajkowski, S. Fitzgerald, I. Foster, and C. Kesselman, \"Grid Information Services for Distributed Resource Sharing,\" presented at 10th IEEE International Symposium on High Performance Distributed Computing, 2001.
[6] IBM International Technical Support Organization, Introduction to Grid Computing with Globus, ibm.com/redbooks, September 2003.
[7] Kühn, Otto and Andreas Abecker (1997): Corporate memories for knowledgemanagement in industrial practice: Prospects and challenges. Journal of Universal Computer Science, vol. 3, no. 8, pp. 929-955.
[8] M. Satyanarayanan, “Pervasive Computing Vision and Challenges,” IEEE Personal Comm., vol. 6, no. 8, Aug. 2001, pp. 10,17.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文