毛淑賢 朱桂鳳
摘 要:語義網(wǎng)格使互聯(lián)網(wǎng)上日益膨脹的信息資源實現(xiàn)共享,通過協(xié)同工作和共享能力,為用戶提供功能強大的一站式服務(wù)。為了更加清楚地認(rèn)識語義網(wǎng)格作為一種新的資源管理技術(shù)的應(yīng)用歸納整理了語義網(wǎng)格的相關(guān)研究內(nèi)容。通過分析目前在語義網(wǎng)格已取得的研究成果,介紹語義網(wǎng)格的基本概念,梳理語義網(wǎng)格的核心技術(shù),分析語義網(wǎng)格的框架及其研究內(nèi)容,初步分析得出語義網(wǎng)格技術(shù)的發(fā)展趨勢。
關(guān)鍵詞:網(wǎng)格計算;語義網(wǎng)格;Web服務(wù);資源管理
中圖分類號:TP393
0 引 言
資源的有效管理是計算機和網(wǎng)絡(luò)有效工作的基礎(chǔ)。建立適用于互聯(lián)網(wǎng)環(huán)境的語義數(shù)據(jù)模型,實現(xiàn)有效信息、知識的服務(wù)共享和管理的一條重要途徑,語義網(wǎng)格是面向語義的智能互聯(lián)應(yīng)用環(huán)境,它需要建立一套新的理論和方法實現(xiàn)對地理分布不同的各種網(wǎng)絡(luò)資源進(jìn)行規(guī)范和靈活的組織,實現(xiàn)網(wǎng)絡(luò)資源的有效共享和智能利用。
語義網(wǎng)格是在Web技術(shù)和網(wǎng)格計算技術(shù)發(fā)展的基礎(chǔ)上發(fā)展而來的,具備智能性、協(xié)作性和可靠性等特點,使其逐步成為網(wǎng)格研究的一個新興熱點。國外已經(jīng)開展了多項關(guān)于語義網(wǎng)格的項目研究工作,已建立了100余個試驗項目,如myGrid,WSMO,GEODISE,DartGrid等。近年來,我國也非常重視這方面的研究工作,國內(nèi)的中國科院計算所、清華大學(xué)、國防科技大學(xué)等研究單位也對語義網(wǎng)格和網(wǎng)格計算開展了大量研究工作,相關(guān)課題進(jìn)行開展并取得一定的研究成果。語義網(wǎng)格的諸多優(yōu)勢使其具備廣闊的發(fā)展前景,相關(guān)研究成果必將推動網(wǎng)格、互聯(lián)網(wǎng)等技術(shù)的迅速發(fā)展。
1 語義網(wǎng)格的基本概念
2001年,David De Roure等人首次使用了語義網(wǎng)格(Semantic Grid)概念,將未來e[CD*2]Science的基礎(chǔ)研究稱為語義網(wǎng)格。語義網(wǎng)格被描述為一個支持全球范圍內(nèi),靈活協(xié)作與計算的高度自動化開放系統(tǒng)。語義網(wǎng)格概念的提出結(jié)合了語義 Web、 網(wǎng)格和 Web服務(wù)的優(yōu)點并彌補了彼此的不足。全球網(wǎng)格論壇成立了語義網(wǎng)格研究組來提供對語義網(wǎng)格的支持,研究把語義網(wǎng)技術(shù)應(yīng)用到網(wǎng)格問題中,把語義網(wǎng)格定義為當(dāng)前網(wǎng)格的延伸,因為信息和服務(wù)有了清晰明了的含義,人與計算機能夠更好地合作[3]。在該定義里,著重描述信息和服務(wù)的概念,也基本上規(guī)劃了語義網(wǎng)格的發(fā)展方向,是以信息和服務(wù)為主體,人和計算機更好的合作,不僅作為途徑,也是語義網(wǎng)格發(fā)展的中間產(chǎn)物。計算機只有具有更高的靈活性和協(xié)作性,才能更快地實現(xiàn)與人的無縫合作,達(dá)到信息服務(wù)目的。由于語義網(wǎng)格是一個基于網(wǎng)格技術(shù)和語義網(wǎng)發(fā)展起來的,針對的描述對象領(lǐng)域范圍很大,包括對象、服務(wù)、過程、資源、能力等。
從根本上看,語義網(wǎng)格實現(xiàn)了網(wǎng)格和語義網(wǎng)融合的優(yōu)勢。當(dāng)前網(wǎng)格缺乏機器可讀可理解的數(shù)據(jù)語義,缺乏人和機器的合作支撐,機器難以處理異構(gòu)資源,難以聯(lián)合、再利用信息,難以靈活協(xié)作、高度易用和無縫自動化,難以根據(jù)用戶的需求自動地生產(chǎn)知識。而語義網(wǎng)雖然實現(xiàn)了計算機可理解的數(shù)據(jù)語義問題,但難以實現(xiàn)互聯(lián)網(wǎng)上各種資源(包括硬件和軟件資源)的共享,難以滿足日益增長的計算需求。
圖1表明了Web、網(wǎng)格、語義網(wǎng)和語義網(wǎng)格的關(guān)系[4],橫軸用數(shù)據(jù)和計算能力表示網(wǎng)格的發(fā)展方向,縱軸用互操作性能表示語義網(wǎng)的發(fā)展方向。可以認(rèn)為,Web是網(wǎng)格的基礎(chǔ),Web加上數(shù)據(jù)和計算能力,則可逐步發(fā)展為網(wǎng)格;另一方面,Web(或網(wǎng)格)加上語義能力(豐富的互操作性)即可實現(xiàn)語義Web。語義網(wǎng)格則是Web結(jié)合計算和語義能力的最終產(chǎn)物。所以,它具備語義Web和網(wǎng)格的優(yōu)點,實現(xiàn)二者的結(jié)合應(yīng)用。
2 語義網(wǎng)格的核心技術(shù)
語義網(wǎng)格的關(guān)鍵之處是把作為一個分布式數(shù)據(jù)存儲的Web的當(dāng)前結(jié)構(gòu),轉(zhuǎn)化成可以被基于計算機實體理解的信息存儲結(jié)構(gòu)。這里從互聯(lián)網(wǎng)的自然特性、人類社會對互聯(lián)網(wǎng)應(yīng)用的需求、信息科學(xué)和互聯(lián)網(wǎng)本身的進(jìn)化需求所產(chǎn)生的科學(xué)問題出發(fā),介紹新一代互聯(lián)網(wǎng)應(yīng)用平臺的關(guān)鍵理論和技術(shù)[3,5[CD*2]8]。
(1) 元數(shù)據(jù)。
元數(shù)據(jù)是用于描述數(shù)據(jù)的數(shù)據(jù),包含語義和它所涉及數(shù)據(jù)的解釋,是對語義網(wǎng)格上信息的┮恢知描述方式。這種描述方式使得信息變成計算機可以理解的信息。為了把數(shù)據(jù)轉(zhuǎn)換為信息,元數(shù)據(jù)必須加入到上下文環(huán)境中。元數(shù)據(jù)和本體對語義web的發(fā)展是關(guān)鍵的。語義網(wǎng)格使用元數(shù)據(jù)來描述網(wǎng)格中的信息。將信息轉(zhuǎn)化為一些更有意義的東西,而不只是一個數(shù)據(jù)集合,這意味著需要正確理解數(shù)據(jù)的內(nèi)容、格式和重要性。語義Web就遵循這種模型,即提供其他一些元數(shù)據(jù)來幫助描述在Web頁面上顯示的信息,這樣瀏覽器、應(yīng)用程序和用戶就能夠更好地決定如何處理數(shù)據(jù)。
(2) 本體和本體庫。
本體是一個概念性的描述,共享概念模型的形式化規(guī)范說明,目標(biāo)是獲取、描述和表示相關(guān)領(lǐng)域的知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語)和詞匯間相互關(guān)系的明確定義。本體也是一個概念性的規(guī)范,該規(guī)范的本質(zhì)是在知識和Web工程的上下文空間中通過語義含義提供一個清晰的表達(dá)。與模式語言形成對比,例如XML模式,本體試圖用原始的知識表述捕獲研究領(lǐng)域的語義,使得計算機能完全或部分理解一個領(lǐng)域中的概念之間的關(guān)系。本體為域提供┮桓霆通用詞匯,并定義屬于的含義和它們之間的關(guān)系。本體指的是對一些感興趣領(lǐng)域的┮桓霆共享理解,經(jīng)常被構(gòu)思為一個類(概念)、關(guān)系、功能、原理和實例的集合。在本體中的概念通常用分類法組織。
本體庫的概念對于取得表達(dá)能力是很必要的,在用知識進(jìn)行建模和推理的過程中需要這種能力。總的來說,一個本體庫決定了術(shù)語的外延和它們之間的關(guān)系。本體庫的好處是改進(jìn)了在系統(tǒng)之間的通信,這些系統(tǒng)可以是機器、用戶或者組織。它們的目標(biāo)就是建立一個一致的,可能是規(guī)范的模型。本體庫的另外一個好處是可互操作性,一個本體庫可以作為一種國際語,它可以推動內(nèi)容的重用,確保給出一個清晰的規(guī)范來表達(dá)內(nèi)容或者服務(wù)是關(guān)于什么的,增加內(nèi)容和服務(wù)被成功集成的機會。可以說,本體庫提供了內(nèi)容的通信、集成和共享的基礎(chǔ)。但是它們還可以提供更多的便利,它可以通過去除模糊性和指出相關(guān)術(shù)語,或者通過建立從頁面得到的信息與其他信息建立聯(lián)系,來改進(jìn)搜索準(zhǔn)確性。還有,互聯(lián)網(wǎng)推理系統(tǒng)開始出現(xiàn),它可以通過從現(xiàn)有的信息中抽取和產(chǎn)生注釋來開發(fā)本體庫。
(3) Web 服務(wù)。
開放性網(wǎng)格服務(wù)架構(gòu)(Open Grid Services Architecture,OGSA)以網(wǎng)格服務(wù)為中心的架構(gòu),非常有利于構(gòu)建語義網(wǎng)格環(huán)境。在OGSA網(wǎng)格體系結(jié)構(gòu)中,由于網(wǎng)格環(huán)境中所有的組件都是虛擬的,因此通過提供一組相對統(tǒng)一的核心接口,所有的網(wǎng)格服務(wù)都基于這些接口實現(xiàn),就可以很容易構(gòu)造出具有層次結(jié)構(gòu)的、更高級別的服務(wù)。
(4) 語義Web服務(wù)。
現(xiàn)有的Web服務(wù)圍繞著UDDI,WSDL和SOAP,提供了有限的機制來實現(xiàn)服務(wù)的發(fā)現(xiàn)、配置、組合和自動協(xié)商,這對服務(wù)的調(diào)用來說抽象層次較低。語義服務(wù)的目標(biāo)是通過提升服務(wù)的描述,來指明服務(wù)的能力和任務(wù)完成的特性,使得在同一語義空間下的服務(wù)更容易整合。
(5) 管理資源。
規(guī)范組織是管理資源的有效方法,但互聯(lián)網(wǎng)應(yīng)用要求自組織性。因此,如何諧調(diào)規(guī)范性和自組織性是互聯(lián)網(wǎng)時代資源組織的關(guān)鍵問題。通過定義一套語義空間的范式來規(guī)范重構(gòu)各種網(wǎng)絡(luò)資源并與對等網(wǎng)絡(luò)技術(shù)相結(jié)合,使動態(tài)網(wǎng)絡(luò)環(huán)境下的無序資源規(guī)范化,使資源操作準(zhǔn)確、方便,以實現(xiàn)有效的資源共享。
(6) 語義互聯(lián)。
如何實現(xiàn)分布在全球的各種網(wǎng)絡(luò)資源在語義層上互聯(lián),消除資源語義孤島。通過簡潔的方式從資源空間映射到語義空間,實現(xiàn)異構(gòu)資源在語義層的互聯(lián),通過與資源空間模型相結(jié)合,形成單一語義映像,使得各種資源在簡潔的語義空間中得到統(tǒng)一和互聯(lián)。
3 語義網(wǎng)格的框架
現(xiàn)在,隨著Internet的發(fā)展,Web網(wǎng)頁的快速膨脹,面對越來越多的信息,人們無法通過互聯(lián)網(wǎng)來獲得最有效的資源或者無法獲得資源,或者被過多的引用占用。作為解決這一問題的語義網(wǎng)格,它被描述為┮恢知開放的、面向服務(wù)的體系結(jié)構(gòu)。從面向服務(wù)的觀點來看,語義網(wǎng)格可劃分為4個服務(wù)層次:基本服務(wù)、數(shù)據(jù)服務(wù)、信息服務(wù)和知識服務(wù)。其中,基礎(chǔ)服務(wù)主要涉及到分布式資源的共享,包括對資源的分配、配置和重組等;數(shù)據(jù)服務(wù)主要針對共享資源計算和分析,這個層次提供的服務(wù)與數(shù)據(jù)存儲、元數(shù)據(jù)管理、數(shù)據(jù)復(fù)制和數(shù)據(jù)傳輸有關(guān);信息服務(wù)允許同意訪問各種各樣的信息源,并且提供運行在分布式計算資源上的通用服務(wù);知識服務(wù)集中在知識表述和抽取上,支持用戶能隨時表述和存儲它生成的有用的知識,并能方便地從分布在互聯(lián)網(wǎng)上的知識倉庫中獲取摘要的知識,來解決遇到的問題。隨著因特網(wǎng)用戶的增多,互聯(lián)網(wǎng)上的知識資源能夠迅速積累并發(fā)展為整個互聯(lián)網(wǎng)團體可以通用的知識財產(chǎn)。在語義網(wǎng)格中,知識層的目標(biāo)就是作為一個支持科學(xué)知識的管理和應(yīng)用程序的基礎(chǔ)設(shè)施,達(dá)到特定的目的和目標(biāo)。總的來說,每個層次都是想要提供適應(yīng)不同應(yīng)用的服務(wù)。
更深層次的劃分,語義網(wǎng)格框架的表示如圖3所示。隨著網(wǎng)格的發(fā)展和語義網(wǎng)格概念的提出,語義網(wǎng)技術(shù)不僅在知識層起作用,而且滲透到整個語義網(wǎng)格架構(gòu)中。語義網(wǎng)格以O(shè)GSA和WSRF(Web Services Resource Framework,Web 服務(wù)資源框架)為基礎(chǔ),采用面向服務(wù)的結(jié)構(gòu),提供基本網(wǎng)格服務(wù),語義網(wǎng)格服務(wù),包括以此為基礎(chǔ)的知識網(wǎng)格,提供高級網(wǎng)格應(yīng)用的接口。語義網(wǎng)格服務(wù)可提供知識服務(wù),基于知識的信息服務(wù),基于知識的數(shù)據(jù)計算服務(wù)。語義網(wǎng)格提供了更高級的知識共享和管理平臺,使數(shù)據(jù)挖掘、文本挖掘等變得更為容易。語義網(wǎng)格在網(wǎng)格中間件和知識網(wǎng)格,高級網(wǎng)格應(yīng)用間實現(xiàn)了機器的語義理解,為整個網(wǎng)格系統(tǒng)的語義互聯(lián)提供了強有力的支撐。語義網(wǎng)格不僅能提供數(shù)據(jù)計算服務(wù)和信息服務(wù),而且引入知識層處理,提供知識的獲取、使用、檢索、發(fā)布等知識服務(wù),體現(xiàn)了下一代網(wǎng)格的特點。
4 語義網(wǎng)格的研究內(nèi)容
語義網(wǎng)格的研究重點是用語義和知識工程的方法來解決目前網(wǎng)格平臺建設(shè)和應(yīng)用中存在的各種問題。其研究內(nèi)容可以概括為以下幾個方面:
(1) 知識模型。
知識模型將描述系統(tǒng)的知識和推理需求,包括領(lǐng)域知識、推理知識和任務(wù)知識。研究元數(shù)據(jù),目前的元數(shù)據(jù)設(shè)施已經(jīng)以RDF的形式存在,┙一步工作研究支持本體設(shè)計和運用的方法和工具,注釋工具和方法;研究本體語言的邏輯框架;研究語義網(wǎng)格環(huán)境下表示本體的恰當(dāng)?shù)慕TZ集,以及基于本體的推理機制;研究語義網(wǎng)格本體語言及其語義框架。
(2) 通信模型。
通信模型主要描述系統(tǒng)之間或系統(tǒng)與用戶之間的需求和接口。
(3) 知識獲取。
研究適合海量、異構(gòu)、不完全、半結(jié)構(gòu)化數(shù)據(jù)挖掘的有效方法和算法;研究基于語義網(wǎng)格本體的知識發(fā)現(xiàn)理論和算法,在核心本體的支持下有效地把信息轉(zhuǎn)化為知識,識別與理解網(wǎng)格信息;研究網(wǎng)格信息自動分類、摘要和領(lǐng)域本體自動、半自動生成等技術(shù)。
(4) 知識組織。
研究內(nèi)容的可視化技術(shù)和方法,如何通過概念語義空間進(jìn)行知識組織,以期獲得快速檢索和高的查準(zhǔn)率。
(5) 服務(wù)管理。
面向用戶服務(wù)的模式和協(xié)議,研究網(wǎng)格服務(wù)的發(fā)布、發(fā)現(xiàn)和服務(wù)路由機制和算法,尤其是滿足服務(wù)質(zhì)量要求的網(wǎng)格服務(wù)的發(fā)布、發(fā)現(xiàn)和服務(wù)路由機制和算法。
5 語義網(wǎng)格的未來
語義網(wǎng)格不僅要融合語義網(wǎng)、Web服務(wù)和網(wǎng)格┤者的技術(shù),而且自身還要進(jìn)一步發(fā)展,所以,現(xiàn)在還處于不斷發(fā)展中,有很多地方需要改善和完善。主要有分布式資源內(nèi)容收集,各種媒體內(nèi)容及格式的引用和轉(zhuǎn)化;對資源的計算、分享方式的智能化方法以及提高數(shù)據(jù)交換速度擴展;計算機通用服務(wù)安全信任流程、方法和技術(shù)的問題;使用內(nèi)容的數(shù)字產(chǎn)權(quán)管理問題;語義多元化的體系結(jié)構(gòu)與網(wǎng)格技術(shù)的融合;設(shè)計與設(shè)置問題,所有用戶都應(yīng)易于使用從設(shè)計、發(fā)展、配置、運作、維持到重復(fù)利用整個生命周期的網(wǎng)格基礎(chǔ)架構(gòu)和應(yīng)用。
6 結(jié) 語
語義網(wǎng)格致力于建立一種基于網(wǎng)格、語義網(wǎng)和Web服務(wù)多種技術(shù)的環(huán)境,它融合三者的優(yōu)點,避免┤者各自獨立發(fā)展的限制。把信息共享和服務(wù)作為發(fā)展方向使其成為網(wǎng)格研究的熱點,它的研究必將進(jìn)一步推動網(wǎng)格、互聯(lián)網(wǎng)的發(fā)展以及其他領(lǐng)域,如生命科學(xué)和智能交通系統(tǒng),城市交通指揮系統(tǒng)等的應(yīng)用[12]。語義網(wǎng)格體現(xiàn)了多種技術(shù)融合的趨勢,表明了下一代網(wǎng)格的發(fā)展方向應(yīng)該是為所有人服務(wù)的一種網(wǎng)格。從目前的現(xiàn)狀來看,語義網(wǎng)格已成為網(wǎng)格研究的一個熱點,它使全球的網(wǎng)絡(luò)資源在語義上進(jìn)行連通,更好的為經(jīng)濟、科技、能源、社會保障等眾多領(lǐng)域服務(wù)。
參 考 文 獻(xiàn)
[1]諸葛海.語義網(wǎng)格的基礎(chǔ)理論、模型與方法研究進(jìn)展[J].中國基礎(chǔ)科學(xué),2007(6):27[CD*2]29.[LL]
[2]http://www.semanticgird.org/v1.9/semagid.pdf.2004.
[3]http://www.semanticgrid.org,20080405.
[4]李明生.語義網(wǎng)格:語義網(wǎng)技術(shù)和網(wǎng)格的結(jié)合[J].情報技術(shù),2005(10):46[CD*2]48.
[5]Zhuge H,Shi X.Toward the Eco[CD*2]grid:A Harmoniously 〦volved Interconnection Environment[J].Communications of the ACM,2004,47(9):79[CD*2]83.
[6]Zhuge H.Semantic Grid:Scientific Issues,Infrastructure and Methodology[J].Communications of the ACM,2005,48 (4):117[CD*2]119.
[7]Zhuge H.The Future Interconnection Environment[J].IEEE Computer,2005,38 (4):27[CD*2]33.
[8]Zhuge H.Autonomous Semantic Link Net Working Model for the Knowledge Grid[J].Concurrency and Computation:Practice and Experience,2007,7 (19):1 065[CD*2]1 085.
[9]黃運濤,丁穎.語義網(wǎng)格核心技術(shù)及其應(yīng)用研究[J].福建電腦,2007(12):27[CD*2]28.
[10]http://www.globus.org/research/papers/ogsa.pdf,20020622.
[11]http://www.Semanticgrid.org/documents/semgrid2004/semgrid2004.html,20080905.
[12]吳朝暉,陳華鈞.語義網(wǎng)格:模型、方法與應(yīng)用[M].杭州:浙江大學(xué)出版社,2008.
作者簡介 毛淑賢 女,1968年出生,廣東人,工程師。研究方向為計算機硬件和軟件設(shè)計。