林蒙安
科普信息資源共享平臺的研建探討
林蒙安
福建省測繪學會
科普信息網絡資源的發展形成了信息“孤島”,使科普信息資源共享及互操作難以完成,網格技術是解決這一問題的有效手段之一。該文探討了基于開放網格服務體系結構和Globus工具包,建立科普信息網絡資源共享網格平臺的方法,并提出了設計思想。
網格技術 科普信息 網絡資源共享
網格是一種能帶來巨大處理、存儲能力和其他IT資源的新型網絡。網格計算通過網絡共享將不同地點、不同節點的大量計算機相聯,實現計算資源、存儲資源、數據資源、信息資源、知識資源、專家資源等各種資源的全面性、綜合性共享[1]。網格計算的根本特征是資源共享而不是規模巨大,可以根據需要建造集團內部網格、局域網絡網格、家庭網絡網格甚至個人網格,網格計算的應用前景非常廣泛[2]。
近年來,各種科普信息資源包括文字、圖片、視頻、虛擬展館等呈現爆炸式的增長,科技館、科技中心、科普基地等科普場館遍地開花,同時,網絡技術的成熟,網絡科普成為我國提高公眾科學素質的重要措施之一[3]。但是由于網絡和操作系統的異構性特點,各種科普信息資源都是零零散散分布在各個科普網站上,各種科普信息數據庫分布在不同的部門、不同的單位中,科普信息相對分散、相對獨立,形成了一個個的信息孤島,資源管理及互操作性也難以完成,科普信息難以以一種綜合性、整體性、全面性的方式展示給公眾和科普工作者,科普信息共享是當前科普工作面臨的重要問題之一。因此,利用網格技術,建立科普信息網絡資源共享平臺,對于提高公眾參與科普的積極性,推動科普信息化的建設,具有重要意義。
網格是一個集成的計算與資源環境。1998年Ian Foster和Carl Kesselman首次定義網格“是一種由硬件和軟件構成的信息技術基礎設施,它能提供可靠的、可協調的、可擴展的和廉價的高端計算能力的訪問”[4]。互聯網主要提供包括電子郵件傳輸、網頁瀏覽、信息傳輸的各種通信功能,而網格的功能更多更強,它還能讓人們透明地使用計算、存儲等其他資源。網格能夠充分將各種網絡上分布的計算資源轉化成標準的、統一的、可靠的同時也是經濟的計算能力,計算資源還包括網絡通信、各種數據資源、各種儀器設備等相關的資源。網格給最終的使用者提供的是與地理位置和具體的計算設施無關的通用的計算能力[4]。網格的應用可以分為商業領域的應用和計算機領域的應用。網格在藥物分子設計、計算力學、計算材料、電子學、生物學、核物理反應、航空航天等眾多的領域得到廣泛的應用。
網格的基本特征是資源共享、開放性及協議標準,而不是它的規模。因此,只要有應用需求,都可以利用網格技術解決。本文討論的網格環境下的科普信息資源共享平臺,正是基于此考慮的。
隨著計算機技術、網絡技術的不斷發展,各個地區、各個部門的信息機構相繼建設和發展自己的科普信息系統和平臺,搜集和建設了一批批科普信息資源,面向社會公眾提供各種科普信息服務,為地區的經濟發展、公民文化素質提升發揮了積極的作用,取得了不少的成果。但這些科普信息網絡資源也面臨著許多問題:(1)信息資源孤島問題。近幾年來,科普信息資源呈現爆炸式增長,各種數字科技館、科普網站等科普信息資源往往且分布在各科普信息網中,離散的分布在各個網絡節點上,較多地停留在低水平的自治共享上,眾多資源成為離散孤立的信息孤島,使得難以進行大范圍、高效率的交換共享。(2)信息服務體系交互、協作和協同問題。許多科普信息服務平臺分屬不同部門,這些系統不能互聯互通,沒有基于一體化的信息處理平臺接口,難以實現系統級別數據交互、協作,更談不上為用戶提供統一的訪問入口[6-8]。
網格技術是對互聯網上所有可以共享資源的應用,顯然為解決上述問題提供了有利條件,也正因如此,研究和建立科普網絡信息資源共享平臺具有重要的意義和實用價值。
采用OGSA網格體系結構,在各種網絡科普信息資源的基礎上,應用GT3工具包,建立網格平臺,以實現網格內科普信息資源管理、科普信息服務和科普數據管理功能。以新一代的信息基礎設施為平臺,把分布在不同地點的、不同單位的、不同計算節點的各種形式的科普信息服務資源,整合為一個單一的(虛擬的)系統。網絡平臺建設采用面向服務的思想,以分散的科普信息數據庫為主要數據資源,基于P2P網絡框架結構,構建一個面向多領域并支持動態數據集成的、科普資源開發與共享的網格平臺,并應用網格的高效處理能力,為分布、自治、異構的數據庫資源的有效管理、動態數據集成和分析處理等提供一個良好的使用環境,透明地為用戶提供按需服務。
基于OGSA網格體系結構和GT3體系結構,科普信息資源共享平臺采用三層體系架構形式:資源服務器、網格服務容器及外部接口應用系統,如下圖所示。

2.3.1資源服務器。資源服務器由硬件資源和數據資源構成,其中數據資源包括科普資源、場館資源、數據資源、用戶資源等各種數據庫、文本音頻視頻等。資源服務器是科普共享平臺的數據基礎層,以分布式資源的形式存在,并依照網格資源管理系統的要求按照一定的共享策略進行組織和管理,并提供統一的訪問接口,同時,根據不同的用戶類別設置相應的權限控制來確保數據資源的安全。各種資源服務器要置于網格環境下,需要安裝運行GT3的Apache AXIS,并用其作為Web服務引擎[9]。
2.3.2服務層。服務層是科普共享平臺的核心部分,該層提供構建科普信息網格統一的共享基礎服務,可分為資源注冊池和網格服務容器。資源注冊池是所有科普信息資源進入科普信息共享平臺的入口,包括資源表示、資源注冊、資源存儲、資源更新等。網格服務容器主要由各種Web服務構成,包括服務描述、服務發布、服務資源接口、服務生命周期管理等。WEB服務的實現方式:基于Web 服務描述語言(WSDL)將各種科普信息資源的訪問接口封裝成WEB服務的方式,并形成完整的服務包,并對外部署發布,當服務部署完畢后,通過簡單對象訪問協議(SOAP)實現客戶端與網格服務端之間的通信。WSDL和SOAP 都是基于XML語言,能夠使網格服務屏蔽了異構平臺、資源之間的數據格式訪問差異,實現了平臺對異構資源進行統一的管理[10]。
2.3.3應用層。應用層是基于資源層和服務層基礎之上,為用戶的實際需求提供應用服務,主要包括科普信息服務資源檢索、數據分析、瀏覽查詢等方面的應用??破招畔①Y源共享平臺根據科普信息領域的特點和用戶的需求,為用戶提供多方位的科普信息服務。框架圖中 GIS門戶系統作為進入科普信息服務網格的公共入口,是用戶和網格服務應用的交互界面。網格平臺用戶實現科普信息資源共享的基本流程:不同角色的用戶登錄后依據自身權限向網格服務容器發出數據共享請求,網格服務調度接受請求,并按照請求的服務種類、內容調用相應的服務算法,處理完畢后將結果以WEB服務的方式傳遞給請求程序[8-10]。
作為新一代Internet的關鍵技術,網絡技術可以有效消除信息孤島、知識孤島現象,實現各種信息資源、知識資源的共享,是解決資源共享問題的系統性方案。本文在現有的各種科普信息資源網絡的基礎之上,探討構建基于網格的科普信息資源共享平臺,較好地實現了科普資源共享和系統之間的協同、交互工作,為用戶提供了統一的信息服務接口。網格技術作為一種新技術,也在不斷成熟中,它在未來網絡中的應用前景,值得繼續研究。
[1] 網格技術[EB/OL] . http://baike.baidu.com/view/806.htm
[2] 趙生慧,陳桂林. 基于網格技術的校園網資源共享探討[J]. 安徽大學學報(自然科學版), 2004,28(4):23-27.
[3] 江峻任. 科普的系統化[J]. 科技情報開發與經濟, 2004,14(4):152-153.
[4] 郁志輝,陳渝,劉鵬. 網格計算[M] .北京:清華大學出版社,2002.
[5] Globus Toolkit[EB/OL] . http://www-unix.globus.org/toolkit
[6] 文靜華,陳建中. 構建基于網格技術的農業信息共享平臺[J]. 安徽農業科學, 2010,38(3): 1590-1592.
[7] 童梅,吳志周,楊曉光. 基于網格技術的交通信息服務平臺的設計與實現[J]. 計算機工程與應用, 2007,43(25):187-191.
[8] 趙天昀. 基于網格技術構建科普信息資源共享平臺[J]. 蘭臺世界, 2012(9): 15-16.
[9] 王麗華. 基于網格技術的虛擬圖書館[J]. 情報科學, 2004,22(4):482-486.
[10] 王萍,趙丹陽,王玉超. 基于網格技術的科學數據存儲與共享[J]. 圖書情報工作, 2001,55(13):63-67.