摘要:該文介紹了新一代的中華人民共和國(guó)國(guó)史網(wǎng)的設(shè)計(jì)及技術(shù),它的建設(shè)是由于舊網(wǎng)站在很多等方面不能為廣大群眾及國(guó)史研究人員夠提供及時(shí)的信息。網(wǎng)站設(shè)計(jì)是以B/S架構(gòu),XML等技術(shù)為支持的網(wǎng)站。網(wǎng)站建設(shè)成以后將成為當(dāng)代中國(guó)研究所對(duì)外的一個(gè)嶄新的窗口。
關(guān)鍵詞:XML;數(shù)據(jù)庫(kù);Web Service技術(shù)
中圖分類(lèi)號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)04-0800-04
On the People's Republic of China History Network Design and Technical
GUAN Xiao-tong
(China Oversea Chinese History Museum, Beijing 100007, China)
Abstract: This paper introduces a new generation of the People's Republic of history network design and technology, and its construction is due to the old site in many areas such as history can not be for the masses and researchers enough to provide timely information. Web site design is based on B / S architecture, XML and other technologies to support the site. Web site into the future will become the Institute of Contemporary China's a brand new window.
Key words: data base; XML; Web service technical
1 引言
當(dāng)代中國(guó)研究所原來(lái)建立的中華人民共和國(guó)國(guó)史網(wǎng)由于網(wǎng)站建設(shè)比較早,網(wǎng)站的功能相對(duì)單一,網(wǎng)站的內(nèi)容和服務(wù)比較簡(jiǎn)單,網(wǎng)站的管理也不太方便。同時(shí),當(dāng)代中國(guó)研究所經(jīng)過(guò)多年的積累,積累了較多的資源信息庫(kù),目前這些資源庫(kù)相對(duì)獨(dú)立,不能統(tǒng)一提供檢索和資源服務(wù)。為了適應(yīng)新時(shí)期的形勢(shì),需要充分利用成熟的信息技術(shù),建設(shè)全新的當(dāng)代中國(guó)研究所國(guó)史門(mén)戶網(wǎng)站,并建立資源庫(kù)的統(tǒng)一管理和檢索,為各類(lèi)用戶提供豐富和優(yōu)質(zhì)的信息資源服務(wù)。該網(wǎng)站是中華人民共和國(guó)史研究、宣傳和教育的門(mén)戶網(wǎng)站。
2 總體設(shè)計(jì)原則
1) 先進(jìn)性
采用當(dāng)前成熟且先進(jìn)的技術(shù),保持系統(tǒng)硬件、軟件、技術(shù)方法和數(shù)據(jù)管理的先進(jìn)性,從而保證高效率、高質(zhì)量的應(yīng)用。同時(shí)具有較強(qiáng)的可移植性、可重用性,在將來(lái)能迅速采用最新技術(shù)長(zhǎng)期保持系統(tǒng)的先進(jìn)性。
2) 成熟性
在開(kāi)發(fā)工具的選型階段,盡量選擇成熟的產(chǎn)品和規(guī)范,如JAVA、XML、ODBC、JDBC之類(lèi)已經(jīng)成為標(biāo)準(zhǔn)的,被大量實(shí)踐所采用的技術(shù)。選用具有成熟性,可持續(xù)發(fā)展性的開(kāi)發(fā)工具。
3) 安全性
安全性包括軟硬件系統(tǒng)安全、應(yīng)用安全、和網(wǎng)絡(luò)通訊安全。系統(tǒng)安全、穩(wěn)定、可靠的運(yùn)行,首先取決于系統(tǒng)的整體設(shè)計(jì)、網(wǎng)絡(luò)結(jié)構(gòu)、平臺(tái)的選擇以及應(yīng)用程序的質(zhì)量;其次,必須考慮到各種特殊情況下的恢復(fù)機(jī)制和備份機(jī)制,以保證數(shù)據(jù)的一致性、完整性以及災(zāi)難恢復(fù);完整的權(quán)限控制機(jī)制、信息安全也是保證安全的重要因素。
4) 擴(kuò)展性
系統(tǒng)支撐平臺(tái)應(yīng)具有較強(qiáng)的可擴(kuò)展性,能夠處理未來(lái)變化和發(fā)展所需而帶來(lái)的功能、性能上的新要求,在平臺(tái)總體的體系結(jié)構(gòu)不需做較大的改變的前提下,能夠保證系統(tǒng)平滑升級(jí)和未來(lái)建設(shè)。
5) 簡(jiǎn)單易用性
系統(tǒng)應(yīng)具有一致的、友好的客戶化界面,易于使用和推廣,并具有實(shí)際可操作性,使用戶能夠快速地掌握系統(tǒng)的使用。用戶終端主要采用瀏覽器方式操作。
6) 易管理性
由于系統(tǒng)使用面廣,系統(tǒng)穩(wěn)定性可用性要求高,因此平臺(tái)還必須具有良好的可管理和易于維護(hù)的特點(diǎn)。在系統(tǒng)設(shè)計(jì)中應(yīng)采用成熟先進(jìn)的技術(shù),降低維護(hù)成本;在系統(tǒng)功能實(shí)現(xiàn)上,功能定義簡(jiǎn)單明了,流程清晰。
一個(gè)完善的系統(tǒng)必然有一個(gè)完善的管理機(jī)制。完善的管理機(jī)制中可維護(hù)性和可管理性是兩點(diǎn)重要的考察指標(biāo)。系統(tǒng)應(yīng)該具備安裝方便、配置方便、使用方便等特點(diǎn),同時(shí)要求有較強(qiáng)的系統(tǒng)管理手段,系統(tǒng)能夠合理地被配置、調(diào)整、監(jiān)視及控制,保證系統(tǒng)的良好運(yùn)作。
7) 經(jīng)濟(jì)性
項(xiàng)目建設(shè)充分考慮資源的合理使用,采用合理的系統(tǒng)結(jié)構(gòu),合理部署網(wǎng)絡(luò)、服務(wù)器和應(yīng)用軟件,使得系統(tǒng)具備較高性價(jià)比,在實(shí)現(xiàn)系統(tǒng)功能的前提下,盡量節(jié)省資金,并降低維護(hù)成本。
3 總體架構(gòu)設(shè)計(jì)
根據(jù)本項(xiàng)目對(duì)建設(shè)內(nèi)容和應(yīng)用目標(biāo)要求,為本項(xiàng)目設(shè)計(jì)了系統(tǒng)總體應(yīng)用架構(gòu),如圖1所示:
從應(yīng)用框架上可以看出,整個(gè)系統(tǒng)采用了分層的框架進(jìn)行設(shè)計(jì),數(shù)據(jù)存儲(chǔ)在由關(guān)系數(shù)據(jù)庫(kù)、全文數(shù)據(jù)庫(kù)(采用TRS全文數(shù)據(jù)庫(kù))、自有資源庫(kù)系統(tǒng)以及各外購(gòu)數(shù)據(jù)庫(kù)構(gòu)成的數(shù)據(jù)層,充分利用了關(guān)系數(shù)據(jù)庫(kù)的業(yè)務(wù)處理能力和全文數(shù)據(jù)庫(kù)的海量存儲(chǔ)和高性能檢索能力以及自有資源庫(kù)系統(tǒng)和外購(gòu)數(shù)據(jù)庫(kù)的特殊數(shù)據(jù)支撐能力。對(duì)于關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)資源,采用全文檢索網(wǎng)關(guān),在TRS全文數(shù)據(jù)庫(kù)中創(chuàng)建全文索引。
在數(shù)據(jù)支撐層之上,基于各類(lèi)應(yīng)用中間件部署本項(xiàng)目所需的各類(lèi)應(yīng)用平臺(tái)系統(tǒng),包括內(nèi)容管理系統(tǒng)、網(wǎng)站信息檢索和資源統(tǒng)一檢索服務(wù)系統(tǒng)、互聯(lián)網(wǎng)信息采集系統(tǒng)和其他服務(wù)(包括RSS訂閱、網(wǎng)站流量統(tǒng)計(jì)分析等),這些平臺(tái)將提供相應(yīng)的應(yīng)用服務(wù),并且通過(guò)平臺(tái)之間的功能模塊組合、集成和數(shù)據(jù)通訊,為用戶提供滿足實(shí)際應(yīng)用需求的整體解決方案。
在表現(xiàn)層實(shí)現(xiàn)國(guó)史網(wǎng)的各種功能展示,支持各種用戶訪問(wèn),能夠?yàn)橛脩籼峁┴S富的各種信息內(nèi)容服務(wù)。
上述的系統(tǒng)的框架具有良好的擴(kuò)展性,底層的數(shù)據(jù)庫(kù)可以通過(guò)集群、雙擊熱備或負(fù)載均衡技術(shù)來(lái)部署,在未來(lái)負(fù)載增加和并發(fā)訪問(wèn)壓力增大的情況下,可以方便擴(kuò)展和升級(jí),提升系統(tǒng)的處理能力。
4 網(wǎng)站功能需求
4.1內(nèi)容管理系統(tǒng)
4.1.1 面向信息服務(wù)的功能
信息瀏覽功能: 提供豐富的、滿足不同層次需求的國(guó)史信息,包括學(xué)術(shù)研究信息和宣傳教育知識(shí)信息,提供多媒體信息(文字、圖片、影視)的網(wǎng)上發(fā)布, 實(shí)現(xiàn)多媒體音視頻信息基于流媒體發(fā)布。
站內(nèi)信息檢索功能:建設(shè)高質(zhì)量的可供檢索利用的信息服務(wù)系統(tǒng),實(shí)現(xiàn)站內(nèi)多角度多層面的檢索,站內(nèi)檢索服務(wù)結(jié)合4.2搜索系統(tǒng)里面的需求,統(tǒng)一實(shí)現(xiàn)。
互動(dòng)交流功能:充分發(fā)揮網(wǎng)絡(luò)的交互功能,實(shí)現(xiàn)如讀者反饋、網(wǎng)絡(luò)調(diào)查等功能,發(fā)動(dòng)廣大干部群眾廣泛參與,滿足國(guó)史知識(shí)普及的需求
4.1.2 面向信息的搜集、采編發(fā)和管理等功能
強(qiáng)大的互聯(lián)網(wǎng)信息采集功能:詳細(xì)需求見(jiàn)4.3“互聯(lián)網(wǎng)信息采集系統(tǒng)”。
良好的內(nèi)容管理功能:為信息的采、編、發(fā)以及監(jiān)管、審計(jì)、審核提供管理手段;支持多種采集方式(人工搜集、網(wǎng)絡(luò)自動(dòng)采集、授權(quán)使用、購(gòu)買(mǎi)等)下所搜信息的篩選、分類(lèi)、主題標(biāo)引、組織入庫(kù);能實(shí)現(xiàn)不同數(shù)據(jù)格式轉(zhuǎn)換、數(shù)據(jù)庫(kù)自動(dòng)導(dǎo)入等功能;實(shí)現(xiàn)信息多級(jí)審核工作流機(jī)制。
4.1.3 分類(lèi)體系建立和管理功能
在國(guó)史信息表現(xiàn)方面,要把握時(shí)間、時(shí)期、事件、人物、地區(qū)、行業(yè)多個(gè)脈絡(luò)以及政治、經(jīng)濟(jì)、文化、外交、社會(huì)生活等方面多角度呈現(xiàn);在學(xué)術(shù)信息服務(wù)部分,按學(xué)科或主題進(jìn)行科學(xué)分類(lèi),按照作者、主題、內(nèi)容、來(lái)源、涉及事件、涉及人物、所屬專(zhuān)題、時(shí)間、類(lèi)型、研究機(jī)構(gòu)等方式多維展示,對(duì)信息資源進(jìn)行充分挖掘、關(guān)聯(lián),提供流暢深入的信息獲取手段。
根據(jù)“信息整合,標(biāo)準(zhǔn)先行”原則,特別是要想實(shí)現(xiàn)國(guó)史信息主題搜索引擎,必須建立起詳盡明晰的分類(lèi)體系、主題詞表和信息資源及其環(huán)境描述的全局元數(shù)據(jù)體系,構(gòu)建一個(gè)包含詳細(xì)國(guó)史知識(shí)概念和關(guān)系的國(guó)史知識(shí)庫(kù),以支持對(duì)數(shù)據(jù)和系統(tǒng)的管理維護(hù),揭示信息資源的特征屬性,充分反映網(wǎng)站用戶在定位、發(fā)現(xiàn)、選擇學(xué)科資源信息時(shí)可能出現(xiàn)的使用方法及習(xí)慣,并應(yīng)對(duì)不斷涌現(xiàn)的分布異構(gòu)的數(shù)據(jù)源,構(gòu)成全方位的信息揭示體系。
4.1.4 網(wǎng)站信息內(nèi)容的審核和發(fā)布權(quán)限
實(shí)施三級(jí)審核制,一般信息由信息員上傳,由網(wǎng)站責(zé)任編輯根據(jù)有關(guān)標(biāo)準(zhǔn)決定是否發(fā)布,重要信息則由網(wǎng)站編委會(huì)審核并決定是否發(fā)布。有關(guān)細(xì)則將在網(wǎng)站建設(shè)過(guò)程中制定。
4.1.5 面向系統(tǒng)管理的功能
支持用戶管理和權(quán)限管理;支持系統(tǒng)備份。
4.2 信息檢索和資源庫(kù)統(tǒng)一搜索系統(tǒng)
4.2.1 網(wǎng)站信息的主要資源和各資源庫(kù)的統(tǒng)一搜索
國(guó)史信息主要資源有:公開(kāi)出版的各種成果、研究機(jī)構(gòu)(如我所、文獻(xiàn)研究室、黨史研究室、地方史志研究機(jī)構(gòu))自有的研究成果、開(kāi)放訪問(wèn)的電子資源、有關(guān)部門(mén)的影視資料、商業(yè)數(shù)據(jù)庫(kù)資源、國(guó)內(nèi)外相關(guān)網(wǎng)站免費(fèi)資源等。信息搜集采用訂購(gòu)、授權(quán)使用、網(wǎng)絡(luò)自動(dòng)搜索和人工搜集等方式,在統(tǒng)一平臺(tái)下實(shí)現(xiàn)各種來(lái)源、各種媒介、不同地點(diǎn)信息采集人員的共建共享。
利用開(kāi)放動(dòng)態(tài)鏈接查詢技術(shù)(OpenURL)提供跨系統(tǒng)的集成整合查詢,實(shí)現(xiàn)各資源庫(kù)(包括自有資源庫(kù)、網(wǎng)絡(luò)采集所得的資源庫(kù)和各商用資源庫(kù)等)的統(tǒng)一檢索服務(wù)功能。全文檢索能實(shí)現(xiàn)復(fù)雜組合、二次、模糊檢索等功能,并有很快的反應(yīng)速度和準(zhǔn)確性。由于資源庫(kù)眾多,需要全文數(shù)據(jù)庫(kù)支持集群和負(fù)載均衡。
4.2.2 站內(nèi)信息檢索
建設(shè)高質(zhì)量的可供檢索利用的信息服務(wù)系統(tǒng),實(shí)現(xiàn)站內(nèi)多角度多層面的檢索,提供站內(nèi)檢索、欄目?jī)?nèi)檢索等,提供組合、多元、模糊等檢索模式;提供跨系統(tǒng)的集成整合查詢;建立清晰完善的導(dǎo)航系統(tǒng),提供目錄逐級(jí)展開(kāi)的分類(lèi)導(dǎo)航、多層次的關(guān)聯(lián)頁(yè)面導(dǎo)航和知識(shí)地圖導(dǎo)航,最終提供互聯(lián)網(wǎng)上國(guó)史體系的搜索引擎。
4.2.3 知識(shí)點(diǎn)鏈接
知識(shí)點(diǎn)的鏈接:做到不同領(lǐng)域、不同級(jí)別欄目?jī)?nèi)涉及的同一事件、人物或概念的相互鏈接(例如國(guó)史百科中相關(guān)詞條知識(shí)點(diǎn)和國(guó)史研究中同一知識(shí)點(diǎn)相關(guān)聯(lián)),實(shí)現(xiàn)瀏覽、檢索的一體化。
4.3 互聯(lián)網(wǎng)信息采集系統(tǒng)
強(qiáng)大的互聯(lián)網(wǎng)信息采集功能:支持人工聯(lián)機(jī)采集,支持互聯(lián)網(wǎng)國(guó)史信息自動(dòng)采集,能敏銳搜索到不論是開(kāi)放訪問(wèn)還是需認(rèn)證(在授權(quán)使用前提下)的涉及國(guó)史的信息(全文或摘要)。建立主題搜索引擎。
考慮未來(lái)在現(xiàn)有投資下建立國(guó)史體系垂直搜索引擎的擴(kuò)展建設(shè)能力。
4.4 統(tǒng)一身份認(rèn)證系統(tǒng)
實(shí)現(xiàn)統(tǒng)一身份認(rèn)證和單點(diǎn)登陸。通過(guò)門(mén)戶系統(tǒng)認(rèn)證后進(jìn)入,支持各類(lèi)用戶身份的統(tǒng)一認(rèn)證和權(quán)限管理。
4.5 其他服務(wù)
支持網(wǎng)站流量統(tǒng)計(jì)與欄目訪問(wèn)分析。
能實(shí)現(xiàn)RSS信息訂閱;原網(wǎng)站數(shù)據(jù)的數(shù)據(jù)遷移。
5 硬件與網(wǎng)絡(luò)拓?fù)鋱D
綜合考慮項(xiàng)目建設(shè)內(nèi)容、應(yīng)用需求以及總體技術(shù)路線、軟硬件配置等因素,在堅(jiān)持提供系統(tǒng)最優(yōu)服務(wù)能力和具有良好可擴(kuò)展性的原則下,我們?cè)O(shè)計(jì)如圖2所示系統(tǒng)架構(gòu)圖。
6 技術(shù)路線
本項(xiàng)目的技術(shù)設(shè)計(jì),將兼顧目前的需要以及未來(lái)的發(fā)展,體現(xiàn)出先進(jìn)、靈活、可靠、高效、經(jīng)濟(jì)實(shí)用等特點(diǎn)。
根據(jù)系統(tǒng)要求,總體技術(shù)路線與技術(shù)架構(gòu)可以從如下幾個(gè)方面來(lái)說(shuō)明:
6.1 基于B/S模式多層架構(gòu)設(shè)計(jì)
多層服務(wù)模式設(shè)計(jì)的好處在于,表現(xiàn)層與業(yè)務(wù)處理層和數(shù)據(jù)通訊層分隔,在增加一個(gè)新的訪問(wèn)渠道時(shí),僅增加渠道驅(qū)動(dòng),改變內(nèi)容展示格式,而交易處理和與后臺(tái)的數(shù)據(jù)通訊及處理不作任何修改。業(yè)務(wù)層與數(shù)據(jù)通訊層的分隔,可以在業(yè)務(wù)處理不作大量的改動(dòng)的情況下,連接到不同的后臺(tái)。因此,分層設(shè)計(jì)可以使得系統(tǒng)更加靈活、易于維護(hù)。Web服務(wù)器只是作為所有服務(wù)的訪問(wèn)入口并管理靜態(tài)的頁(yè)面,而所有的業(yè)務(wù)邏輯和后臺(tái)數(shù)據(jù)的訪問(wèn)邏輯都交給Web應(yīng)用服務(wù)器(Application Server)來(lái)處理,降低了Web服務(wù)器的負(fù)載,同時(shí)有效地將內(nèi)容服務(wù)應(yīng)用中的表示邏輯(Presentation Logic),業(yè)務(wù)邏輯(Business Logic)和對(duì)數(shù)據(jù)庫(kù)的訪問(wèn)邏輯(Data Logic)有效地分離開(kāi),極大地提高了應(yīng)用的可擴(kuò)展性,構(gòu)造了一個(gè)完整的三層次(3-tier)或多層次(N-tier)應(yīng)用;同時(shí)由于Web應(yīng)用服務(wù)器在可靠性,可擴(kuò)充性,可用性等方面的優(yōu)勢(shì),保證了整個(gè)應(yīng)用系統(tǒng)的總體可用性。
6.2 基于XML數(shù)據(jù)支持
XML(Extensible Markup Language)它是由W3C組織于1998年2月制定的一種通用語(yǔ)言規(guī)范,是SGML的簡(jiǎn)化子集,專(zhuān)門(mén)為Web應(yīng)用程序而設(shè)計(jì)。XML作為一種可擴(kuò)展性標(biāo)記語(yǔ)言,其自描述性使其非常適用于不同應(yīng)用間的數(shù)據(jù)交換,而且這種交換是不以預(yù)先規(guī)定一組數(shù)據(jù)結(jié)構(gòu)定義為前提。XML最大的優(yōu)點(diǎn)是它對(duì)數(shù)據(jù)的描述和數(shù)據(jù)傳送能力,因此具備很強(qiáng)的開(kāi)放性。為了使基于XML的業(yè)務(wù)數(shù)據(jù)交換成為可能,就必須實(shí)現(xiàn)數(shù)據(jù)庫(kù)的XML數(shù)據(jù)存取,并且將XML數(shù)據(jù)同應(yīng)用程序集成,進(jìn)而使之同現(xiàn)有的業(yè)務(wù)規(guī)則相結(jié)合。開(kāi)發(fā)基于XML的動(dòng)態(tài)應(yīng)用,如動(dòng)態(tài)信息展示、動(dòng)態(tài)數(shù)據(jù)交換等。
本系統(tǒng)全面遵循XML標(biāo)準(zhǔn)。XML數(shù)據(jù)標(biāo)準(zhǔn)的推出,增強(qiáng)了系統(tǒng)之間、應(yīng)用系統(tǒng)之間的數(shù)據(jù)交換功能,也大大增強(qiáng)了系統(tǒng)之間的集成度。以XML標(biāo)準(zhǔn)描述數(shù)據(jù)格式,能促進(jìn)多種數(shù)據(jù)格式支持、內(nèi)容共享、內(nèi)容的再利用以及增強(qiáng)客戶對(duì)服務(wù)的滿意度。
使用XML作為數(shù)據(jù)交換的格式。XML提供描述不同類(lèi)型數(shù)據(jù)的標(biāo)準(zhǔn)格式--例如:會(huì)議記錄、購(gòu)買(mǎi)定單、數(shù)據(jù)庫(kù)記錄、圖形、聲音等--并且可統(tǒng)一而正確地解碼、管理和顯示信息XML一開(kāi)始就建構(gòu)在Unicode(統(tǒng)一碼)之上,提供了對(duì)多語(yǔ)種的支持,具有世界通用性。由于采用XML技術(shù),使得本系統(tǒng)的稿件內(nèi)容描述的標(biāo)準(zhǔn)化,實(shí)現(xiàn)跨平臺(tái)、跨應(yīng)用系統(tǒng)的信息交換更加流暢和便捷,能提供更豐富的資源信息發(fā)布,包含多種格式包括文、圖、音、像、視信息能得以靈活的展現(xiàn)更周到的服務(wù)。
6.3 基于Web Service技術(shù)
6.3.1 技術(shù)優(yōu)點(diǎn)
由于組織內(nèi)各部門(mén)一般是分布在不同的地理位置,且所應(yīng)用的工作流引擎系統(tǒng)的設(shè)計(jì)及應(yīng)用技術(shù)也不一定完全一致。因此,在電子政務(wù)工作流引擎系統(tǒng)的設(shè)計(jì)實(shí)施中,如何在技術(shù)平臺(tái)的設(shè)計(jì)方面能使各部門(mén)能協(xié)同工作,并且有較好地安全性,給我們提出了一個(gè)課題。
在以前,沒(méi)有一個(gè)應(yīng)用程序通信標(biāo)準(zhǔn),是獨(dú)立于平臺(tái)、組建模型和編程語(yǔ)言的。而Web Service技術(shù)的產(chǎn)生正是為了解決這個(gè)問(wèn)題,通過(guò)Web Service客戶端和服務(wù)器才能夠自由的用HTTP進(jìn)行通信,不論兩個(gè)程序的平臺(tái)和編程語(yǔ)言是什么。Web Service技術(shù)可以讓地理上分布在不同區(qū)域的計(jì)算機(jī)和設(shè)備一起工作,以便為用戶提供各種各樣的服務(wù)。用戶可以控制要獲取信息的內(nèi)容、時(shí)間、方式,而不必像現(xiàn)在這樣在無(wú)數(shù)個(gè)信息孤島中瀏覽,去尋找自己所需要的信息。從發(fā)展趨勢(shì)上看毫無(wú)疑問(wèn),Web Service將成為下一代Web的主流技術(shù)。選擇Web Service 技術(shù)還基于如下的技術(shù)優(yōu)點(diǎn)。
Web Service是創(chuàng)建可互操作的分布式應(yīng)用程序的新平臺(tái)。Web Service 的主要目標(biāo)是跨平臺(tái)的可互操作性。為了達(dá)到這一目標(biāo),Web Service 是完全基于XML、XSD等獨(dú)立于平臺(tái)、獨(dú)立于軟件供應(yīng)商的標(biāo)準(zhǔn)的。
Web Service在應(yīng)用程序跨平臺(tái)和跨網(wǎng)絡(luò)進(jìn)行通信的時(shí)候是非常有用的。Web Service非常適用于應(yīng)用程序集成、B2B和G2G集成、代碼和數(shù)據(jù)重用,以及通過(guò)Web進(jìn)行客戶端和服務(wù)器的通信的場(chǎng)合。基于以上的優(yōu)勢(shì),我們便不難看出Web Service技術(shù)對(duì)新一代因特網(wǎng)協(xié)議標(biāo)準(zhǔn)的支持是其他技術(shù)不能望其項(xiàng)背的,這也是Web Service技術(shù)倍受推崇,并取得成功的原因所在。
6.3.2 平臺(tái)技術(shù)組成
Web Service平臺(tái)有一套協(xié)議來(lái)實(shí)現(xiàn)分布式應(yīng)用程序的創(chuàng)建。任何平臺(tái)都有它的數(shù)據(jù)表示方法和類(lèi)型系統(tǒng)。要實(shí)現(xiàn)互操作性,Web Service平臺(tái)提供了一套標(biāo)準(zhǔn)的類(lèi)型系統(tǒng),用于溝通不同平臺(tái)、編程語(yǔ)言和構(gòu)件模型中的不同類(lèi)型系統(tǒng)。在傳統(tǒng)的分布式系統(tǒng)中,基于界面(interface)的平臺(tái)提供了一些方法來(lái)描述界面、方法和參數(shù)(如COM和COBAR中的IDL語(yǔ)言)。同樣的,Web Service平臺(tái)也提供一種標(biāo)準(zhǔn)來(lái)描述Web Service,讓客戶可以得到足夠的信息來(lái)調(diào)用Web Service。這種調(diào)用的方法實(shí)際是一種遠(yuǎn)程過(guò)程調(diào)用協(xié)議(RPC)。且這種RPC協(xié)議與平臺(tái)和編程語(yǔ)言無(wú)關(guān),從而為了達(dá)到互操作。
Web Service技術(shù)是在現(xiàn)有的Web技術(shù)和設(shè)施之上,通過(guò)制定新的協(xié)議和標(biāo)準(zhǔn)、提出新的技術(shù)來(lái)實(shí)現(xiàn)的。與Web Service相關(guān)的主要協(xié)議和技術(shù)包括SOAP(Simple Object Access Protocol,簡(jiǎn)單對(duì)象訪問(wèn)協(xié)議)、WSDL(Web Services Description Language,Web Service描述語(yǔ)言)、UDDI(Universal Description, Discovery and Integration,統(tǒng)一描述、發(fā)現(xiàn)和集成)。SOAP用來(lái)定義數(shù)據(jù)描述和遠(yuǎn)程訪問(wèn)的標(biāo)準(zhǔn);WSDL是發(fā)布和請(qǐng)求Web Service的描述語(yǔ)言;UDDI則把Web Service與用戶聯(lián)系起來(lái),起中介作用。
6.3.3 體系結(jié)構(gòu)實(shí)現(xiàn)模式
Web Service的體系結(jié)構(gòu)是基于Web Service提供者、Web Service請(qǐng)求者、Web Service中介者三個(gè)角色和發(fā)布、發(fā)現(xiàn)、綁定三個(gè)動(dòng)作構(gòu)建的。簡(jiǎn)單地說(shuō),Web Service提供者就是Web Service的擁有者,它耐心等待為其他服務(wù)和用戶提供自己已有的功能;Web Service請(qǐng)求者就是Web Service功能的使用者,它利用SOAP消息向Web Service提供者發(fā)送請(qǐng)求以獲得服務(wù);Web Service中介者的作用是把一個(gè)Web Service請(qǐng)求者與合適的Web Service提供者聯(lián)系在一起,它充當(dāng)管理者的角色,一般是UDDI。這三個(gè)角色是根據(jù)邏輯關(guān)系劃分的,在實(shí)際應(yīng)用中,角色之間很可能有交叉:一個(gè)Web Service既可以是Web Service提供者,也可以是Web Service請(qǐng)求者,或者二者兼而有之。Web Service角色之間的關(guān)系:其中,“發(fā)布”是為了讓用戶或其他服務(wù)知道某個(gè)Web Service的存在和相關(guān)信息;“發(fā)現(xiàn)”是為了找到合適的Web Service;“綁定”則是在提供者與請(qǐng)求者之間建立某種聯(lián)系。
6.4 TRS全文數(shù)據(jù)庫(kù)服務(wù)器(TRS Database Server)
TRS全文數(shù)據(jù)庫(kù)系統(tǒng)在電子政務(wù)應(yīng)用中主要用來(lái)整合各類(lèi)異構(gòu)信息資源,尤其是非結(jié)構(gòu)化和半結(jié)構(gòu)化信息,與關(guān)系數(shù)據(jù)庫(kù)協(xié)同作為電子政務(wù)底層的數(shù)據(jù)庫(kù)支撐,為上層應(yīng)用提供高效、穩(wěn)定、安全的全文檢索服務(wù)。在TRS電子政務(wù)的內(nèi)外網(wǎng)門(mén)戶信息檢索、互聯(lián)網(wǎng)信息搜索、政府公文及資源庫(kù)整合檢索等應(yīng)用中發(fā)揮著重要作用。
信息分為結(jié)構(gòu)化和非結(jié)構(gòu)化兩類(lèi),對(duì)于結(jié)構(gòu)化數(shù)據(jù),關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)可以很好的管理,而非結(jié)構(gòu)化數(shù)據(jù)包括網(wǎng)頁(yè)、電子郵件、Word文檔、PDF文件以及沒(méi)有以行列格式保存的任何內(nèi)容, 關(guān)系數(shù)據(jù)庫(kù)很難進(jìn)行有效的管理和查詢。TRS 全文數(shù)據(jù)庫(kù)系統(tǒng)6.1 版繼承了得到業(yè)界廣泛使用的TRS全文檢索系統(tǒng)的全部功能和性能,針對(duì)信息內(nèi)容管理和資源建設(shè)的新需求,發(fā)展了包括Native XML, 集群,Unicode,自然語(yǔ)言及智能擴(kuò)展檢索等眾多新功能,結(jié)合TRS領(lǐng)先的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)聯(lián)合查詢技術(shù),從而滿足了用戶對(duì)企業(yè)搜索的廣泛需求。和擅長(zhǎng)公共數(shù)據(jù)搜索的Google/Baidu等搜索引擎相比,TRS全文數(shù)據(jù)庫(kù)系統(tǒng)更擅長(zhǎng)于組織內(nèi)部專(zhuān)有數(shù)據(jù)的搜索。
TRS全文數(shù)據(jù)庫(kù)系統(tǒng)由服務(wù)器、管理工具和開(kāi)發(fā)接口三部分組成。
全文檢索是在海量非結(jié)構(gòu)化信息中快速、準(zhǔn)確獲得用戶所需信息的必備功能。TRS全文檢索服務(wù)器的核心功能是對(duì)非結(jié)構(gòu)化信息提供全文檢索功能,該系統(tǒng)可以獨(dú)立于關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)獨(dú)立運(yùn)行,也可以和關(guān)系數(shù)據(jù)庫(kù)無(wú)縫集成、協(xié)同工作,為關(guān)系數(shù)據(jù)庫(kù)中的非結(jié)構(gòu)化數(shù)據(jù)提供全文檢索功能(需要TRS Gateway的支持)。
TRS全文數(shù)據(jù)庫(kù)服務(wù)器追求高查準(zhǔn)率的同時(shí)可提供100%查全的手段,輸出結(jié)果可按字段值或相關(guān)度排序,以及多字段的聯(lián)合排序,且支持檢索結(jié)果的分類(lèi)。
TRS全文數(shù)據(jù)庫(kù)服務(wù)器配套以內(nèi)容發(fā)布的模塊,構(gòu)建成一個(gè)完整的,能夠索引組織各種信息內(nèi)容,提供安全的分級(jí)授權(quán)的,提供個(gè)性豐富的檢索體驗(yàn)的企業(yè)級(jí)高端全文檢索服務(wù)。
7 結(jié)束語(yǔ)
國(guó)史網(wǎng)的設(shè)計(jì)及技術(shù)涉及到網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)等眾多方面,工作量很大,在目前的技術(shù)水平里,采用XML、WEB Service等比較先進(jìn)、完善的技術(shù),整個(gè)系統(tǒng)采用B/S多層次結(jié)構(gòu),支持各種應(yīng)用系統(tǒng)集成,形成高度可擴(kuò)展可靠的體系結(jié)構(gòu)。它最終將搭建成為一個(gè)開(kāi)放的、有高度可擴(kuò)展體系結(jié)構(gòu)的數(shù)據(jù)平臺(tái)、信息發(fā)布平臺(tái)和應(yīng)用集成平臺(tái)。
參考文獻(xiàn):
[1] 陳錦輝.XML與ASP網(wǎng)站實(shí)做大全[M].北京:中國(guó)鐵道出版社,2001.
[2] 奧尼爾.數(shù)據(jù)庫(kù)原理、編程與性能[M].周傲英,譯.北京:機(jī)械工業(yè)出版社,2004.
[3] 美國(guó)思科網(wǎng)絡(luò)技術(shù)學(xué)院.思科網(wǎng)絡(luò)技術(shù)學(xué)院教程[M].韓江,譯.北京:人民郵電出版社,2000.