摘要:科技文獻(xiàn)資源網(wǎng)絡(luò)共享系統(tǒng)主要以網(wǎng)絡(luò)為載體,實(shí)現(xiàn)相互連接的信息系統(tǒng),為更多網(wǎng)絡(luò)用戶提供檢索與原文服務(wù)。該文結(jié)合當(dāng)前科技文獻(xiàn)資源網(wǎng)絡(luò)共享系統(tǒng)運(yùn)行的實(shí)際情況,對(duì)其關(guān)鍵技術(shù)進(jìn)行分析與討論。
關(guān)鍵詞:科技文獻(xiàn)資源 網(wǎng)絡(luò)共享系統(tǒng) 關(guān)鍵技術(shù)
中圖分類(lèi)號(hào): TP319 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2013)01(b)-0-01
在科技文獻(xiàn)資源網(wǎng)絡(luò)共享系統(tǒng)中,大多以網(wǎng)站的形式面向用戶,為用戶提供了WEB頁(yè)面,用戶可就此開(kāi)展題錄檢索等服務(wù),同時(shí)也可在存儲(chǔ)器中輸入大量的原位數(shù)據(jù),提供原文服務(wù)。這種以網(wǎng)絡(luò)為媒介實(shí)現(xiàn)的科技文獻(xiàn)共享,需要信息系統(tǒng)的技術(shù)支持,以下將對(duì)幾大關(guān)鍵技術(shù)及其應(yīng)用進(jìn)行分析。
1 網(wǎng)絡(luò)技術(shù)及其應(yīng)用
在科技文獻(xiàn)資源的網(wǎng)絡(luò)共享系統(tǒng)中,主要通過(guò)網(wǎng)絡(luò)技術(shù)來(lái)實(shí)現(xiàn),包括計(jì)算機(jī)技術(shù)與通信技術(shù)的有機(jī)結(jié)合,為實(shí)現(xiàn)科技文獻(xiàn)資源共享奠定了基礎(chǔ)。隨著互聯(lián)網(wǎng)技術(shù)在我國(guó)的不斷發(fā)展與完善,除了不斷完善互聯(lián)網(wǎng)基礎(chǔ)設(shè)施以外,還在互聯(lián)網(wǎng)的用戶數(shù)、互聯(lián)網(wǎng)的具體應(yīng)用等方面進(jìn)行了深入研究,因此網(wǎng)絡(luò)技術(shù)的發(fā)展為科技文獻(xiàn)資源網(wǎng)絡(luò)共享提供保障。奠定在IP技術(shù)基礎(chǔ)上,互聯(lián)網(wǎng)不斷滿足各種用戶的應(yīng)用需求,但是當(dāng)前IP網(wǎng)絡(luò)還無(wú)法保障端到端業(yè)務(wù)質(zhì)量[1];再加上IP技術(shù)的開(kāi)放性特征,IP網(wǎng)絡(luò)業(yè)務(wù)極易受到外界的侵襲,安全問(wèn)題不容忽視。一般情況下,很多單位所采用的網(wǎng)絡(luò)以局域網(wǎng)形式為主,隨著互聯(lián)網(wǎng)應(yīng)用范圍的不斷擴(kuò)大,上網(wǎng)用戶越來(lái)越多,而網(wǎng)絡(luò)故障問(wèn)題也引起了充分重視。原本單個(gè)計(jì)算機(jī)中發(fā)生的安全問(wèn)題,可能迅速蔓延到整個(gè)系統(tǒng),造成整個(gè)局域網(wǎng)陷入癱瘓狀態(tài)。
針對(duì)網(wǎng)絡(luò)管理問(wèn)題,在傳統(tǒng)的IP網(wǎng)絡(luò)中,并沒(méi)有針對(duì)公眾環(huán)境提出具體的安全定義或者設(shè)計(jì)管理維護(hù)體系,當(dāng)網(wǎng)絡(luò)出現(xiàn)故障之后,就不能快速定位故障點(diǎn),對(duì)網(wǎng)絡(luò)的安全、穩(wěn)定、持續(xù)運(yùn)行造成影響。另外,當(dāng)前互聯(lián)網(wǎng)運(yùn)營(yíng)商之間能否實(shí)現(xiàn)互聯(lián)互通也是非常重要的問(wèn)題,如果不能支持互通,阻礙了寬帶用戶的正常訪問(wèn)[2]。在一些網(wǎng)絡(luò)資源服務(wù)系統(tǒng)中,可能需要設(shè)置若干鏡像站,才能滿足基本的用戶瀏覽需求,既浪費(fèi)了資源,也給用戶使用帶來(lái)不便。
2 網(wǎng)絡(luò)存儲(chǔ)技術(shù)及其應(yīng)用
以當(dāng)前科技文獻(xiàn)資源網(wǎng)絡(luò)共享系統(tǒng)來(lái)看,除了開(kāi)展題錄服務(wù)之外,還可以實(shí)行原文服務(wù),同時(shí)在大型網(wǎng)絡(luò)在線存儲(chǔ)設(shè)備中,存儲(chǔ)了海量的原文數(shù)據(jù),在整個(gè)文獻(xiàn)資源網(wǎng)絡(luò)共享系統(tǒng)中占據(jù)非常重要的地位。隨著網(wǎng)絡(luò)存儲(chǔ)技術(shù)的不斷完善與發(fā)展,進(jìn)一步推動(dòng)了科技文獻(xiàn)網(wǎng)絡(luò)共享系統(tǒng)的穩(wěn)定運(yùn)行,為網(wǎng)絡(luò)全文數(shù)據(jù)庫(kù)的應(yīng)用提供根本保障。在科技文獻(xiàn)資源的網(wǎng)絡(luò)共享系統(tǒng)中,以存儲(chǔ)設(shè)備作為最重要的磁盤(pán)陣列,也就是將若干個(gè)磁盤(pán)共同構(gòu)成一個(gè)陣列,作為單一的磁盤(pán)進(jìn)行使用,可以采取數(shù)據(jù)分段的方法,將數(shù)據(jù)存儲(chǔ)到不同的磁盤(pán)中。當(dāng)進(jìn)行數(shù)據(jù)存取時(shí),陣列中的磁盤(pán)就會(huì)發(fā)生動(dòng)作,有效縮短低數(shù)據(jù)存取的時(shí)間,獲取更加優(yōu)越空間利用效率[3]。與通信行業(yè)、銀行業(yè)等發(fā)展不同,科技文獻(xiàn)資源網(wǎng)絡(luò)共享系統(tǒng)在數(shù)據(jù)安全方面的要求不高,一般采取RAID5技術(shù)即可,一方面提高磁盤(pán)陣列的應(yīng)用空間,另一方面改善了數(shù)據(jù)安全問(wèn)題。
(1)直連式存儲(chǔ)技術(shù)。該技術(shù)和服務(wù)器之間的主機(jī)連接通道共同運(yùn)行,實(shí)現(xiàn)SCSI連接,其帶寬一般為20 mB/s、40 mB/s或80 mB/s等,其主要優(yōu)勢(shì)在于便于操作、實(shí)用性強(qiáng),只要在服務(wù)器的后端接好盤(pán)陣,其他則無(wú)需設(shè)置,可以直接使用。但是當(dāng)前服務(wù)器中CPU處理能力大幅提高,存儲(chǔ)硬盤(pán)的空間也相對(duì)較大,涉及到較多數(shù)量的陣列硬盤(pán),在服務(wù)器的主機(jī)中建設(shè)多個(gè)SCSI通道連接并不實(shí)際,也無(wú)法實(shí)現(xiàn)設(shè)備的擴(kuò)充。因此,在直連式存儲(chǔ)中,主要依賴服務(wù)器的主機(jī)操作系統(tǒng),實(shí)現(xiàn)了數(shù)據(jù)的IO讀寫(xiě)與存儲(chǔ)維護(hù)管理,而數(shù)據(jù)的備份與恢復(fù)等,需要占用服務(wù)器中主機(jī)資源,一般約20%~30%之間。
(2)網(wǎng)絡(luò)接入存儲(chǔ)技術(shù)。主要通過(guò)網(wǎng)絡(luò)中的TCP/IP及ATM技術(shù)等,利用網(wǎng)絡(luò)交換機(jī)的連接存儲(chǔ)系統(tǒng)、服務(wù)器主機(jī)等,完成整個(gè)運(yùn)行過(guò)程。應(yīng)用網(wǎng)絡(luò)接入存儲(chǔ)技術(shù),可直接和網(wǎng)絡(luò)介質(zhì)連接起來(lái),以特殊的設(shè)備實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)。但是在這些設(shè)備中,分別分配了IP地址,那么用戶只要利用服務(wù)器就可以完成基本的存取訪問(wèn)。
(3)存儲(chǔ)區(qū)域網(wǎng)絡(luò)技術(shù)。利用光纖通道的交換機(jī),將存儲(chǔ)陣列與服務(wù)器的主機(jī)連接起來(lái),構(gòu)建一個(gè)可應(yīng)用于數(shù)據(jù)存儲(chǔ)空間的區(qū)域網(wǎng)絡(luò)。應(yīng)用該種技術(shù),主要具備以下優(yōu)勢(shì):其一,具有良好的應(yīng)用性能,可采用專(zhuān)門(mén)的存儲(chǔ)網(wǎng),帶寬相對(duì)優(yōu)越[4];其二,可支持?jǐn)?shù)據(jù)庫(kù)的穩(wěn)定運(yùn)行,不會(huì)受到任何的應(yīng)用限制;其三,如果采取虛擬化技術(shù)應(yīng)用,則可以實(shí)現(xiàn)無(wú)限擴(kuò)容。但是這種技術(shù)的成本相對(duì)較高,在服務(wù)器中完成整個(gè)文件處理過(guò)程。
3 數(shù)字化加工技術(shù)及其應(yīng)用
采用原文數(shù)字化加工技術(shù),可以將科技文獻(xiàn)加工為電子文檔,將其存儲(chǔ)到網(wǎng)絡(luò)設(shè)備中,用戶可以通過(guò)網(wǎng)絡(luò)對(duì)相關(guān)數(shù)據(jù)、信息進(jìn)行調(diào)用、閱讀或打印,也可以利用電子文件提供原文服務(wù)。有關(guān)原文數(shù)字化加工技術(shù)與方法,可分為以下幾種:①由科技文獻(xiàn)的出版單位提供PDF文檔,可減少工作的繁瑣性、重復(fù)性,板面的質(zhì)量相對(duì)較高;②在科技文獻(xiàn)出版單位提供了書(shū)本期刊的同時(shí),也提供了排版文件,可以利用軟件將其轉(zhuǎn)化為PDF文檔,這種方法易于操作,但是轉(zhuǎn)換過(guò)程可能發(fā)生錯(cuò)誤,需及時(shí)糾正[5];其三,掃描紙頁(yè)面,進(jìn)行OCR文字識(shí)別,經(jīng)過(guò)排版校對(duì)之后形成PDF文檔,這種工作方法的強(qiáng)度較大,其通過(guò)OCR技術(shù)不能完全識(shí)別所有的文字,需采取人工干預(yù)方法;其四,雙層PDF生成系統(tǒng)。利用掃描儀將標(biāo)準(zhǔn)資料快速錄入,通過(guò)糾偏、去污以及OCR識(shí)別等技術(shù)過(guò)程,生成可用于檢索的PDF文件。該文件具有雙層性質(zhì),上層為原始文件,下層為識(shí)別文件,可以保留原有的版面效果,同時(shí)可以支持檢索、復(fù)制及選擇等功能的
實(shí)現(xiàn)。
另外,除了掌握基本的技術(shù)要點(diǎn)以外,對(duì)于原文數(shù)字化加工過(guò)程來(lái)說(shuō),一般針對(duì)原文數(shù)字化加工提出如下要求:首先,顯示的外觀和原始文檔的差異性越小越好,否則將無(wú)法體現(xiàn)原始文檔特性;其次,合理確定文件的大小尺寸,保障文件的質(zhì)量;尤其一些頁(yè)面含有圖像,文件太大將占用更多的存儲(chǔ)資源,并且影響傳輸效率;最后,應(yīng)注意保障閱讀的便捷性[6]。一般情況下,文檔以通用性閱讀器為主,更利于用戶使用和操作,符合用戶習(xí)慣,提高應(yīng)用效率,發(fā)揮文檔的應(yīng)有價(jià)值。
參考文獻(xiàn)
[1]李嘉琳,裴成發(fā).基于科技政策的科技文獻(xiàn)資源平臺(tái)建設(shè)研究[J].晉圖學(xué)刊,2010(3):1-5.
[2]羅中民,羅利華.淺析科技文獻(xiàn)資源網(wǎng)絡(luò)共享與知識(shí)產(chǎn)權(quán)保護(hù)[J].科技與經(jīng)濟(jì),2006(2):54-56.
[3]何小峰,賀培風(fēng),呂艷華,等.區(qū)域性科技文獻(xiàn)資源共享平臺(tái)的機(jī)制評(píng)價(jià)[J].中華醫(yī)學(xué)圖書(shū)情報(bào)雜志,2011(12):1-5.