摘 要:檔案網(wǎng)站是網(wǎng)絡(luò)環(huán)境下檔案信息服務(wù)的必然產(chǎn)物,檔案檢索是檔案信息服務(wù)實(shí)現(xiàn)的重要途徑,也是衡量檔案網(wǎng)站的重要指標(biāo)。通過國內(nèi)外檔案網(wǎng)站檢索功能的比較可以看出,我國檔案網(wǎng)站的檢索功能在檢索資源、檢索方式等方面還有很大潛力,但這需要在網(wǎng)站定位、資源整合、現(xiàn)代技術(shù)植入等方面加以改進(jìn)。
關(guān)鍵詞:檔案網(wǎng)站;檔案信息檢索;信息服務(wù);
Abstract:Archival websites are inevitable products of archival information service under the network enviroment. Supplying archival retriveal is an important way to achieve the information service,also is an important index to measure the websites. By comparison with the foreign archiveal websites’function of information retrieval, it is concluded that, domestic archiveal websites are of great potential to improve the information retrieval function, but measures must be taken from localization,resources conformity and the modern technology implanting.
Keywords:Archives websites;Archival information retrieval;Information service
目前,我國國家規(guī)模的檔案網(wǎng)站體系已初具雛形,從縱向上看,不同級別、不同規(guī)模的檔案網(wǎng)站紛紛建立;從橫向上看,不同專業(yè)、不同類型的檔案網(wǎng)站不斷完善。[1]縱觀各檔案網(wǎng)站,提供檔案檢索是其重要使命,沒有檔案檢索,檔案信息服務(wù)不可想象。
1 完善我國檔案網(wǎng)站檢索功能的必要性
檔案具有其他信息資源所不可比擬的優(yōu)勢,如來源的廣泛性、原生性、權(quán)威性等,這就注定了檔案網(wǎng)站必然會受到社會公眾的青睞,事實(shí)是否如此呢?
根據(jù)中國人民大學(xué)研究品牌計(jì)劃項(xiàng)目“我國檔案網(wǎng)站建設(shè)測評與評價” 2011年對我國省級檔案網(wǎng)站綜合測評與調(diào)查顯示,排名前10位的為天津、北京、遼寧、江蘇、江西、安徽、吉林、上海、湖北和浙江的檔案信息網(wǎng)站。[2]筆者于2011年11月底,查詢了這些檔案網(wǎng)站在ALEXA上的排名,其中,較為靠前的為上海檔案信息網(wǎng)、江西檔案信息網(wǎng)和北京市檔案信息網(wǎng),其流量的綜合排名分別為第2272496名、2519811名和2552074名。同時,也查詢了部分國外檔案網(wǎng)站在ALEXA上的排名情況,如,加拿大國家檔案館網(wǎng)站、美國檔案與文件署網(wǎng)站、英國國家檔案館網(wǎng)站,其流量的綜合排名分別為第580名、16481名和17733名。同時,通過ALEXA了解到,以上各網(wǎng)站的“每百萬人中訪問該網(wǎng)站的人數(shù)”,在國內(nèi),最高的為北京市檔案信息網(wǎng)和浙江檔案信息網(wǎng),其結(jié)果分別為0.6和0.4,而加拿大國家檔案館網(wǎng)站該指標(biāo)的值為1810。[3]該組數(shù)據(jù)從一定程度上反映出,我國的檔案網(wǎng)站與國外檔案網(wǎng)站的差距很大,檔案網(wǎng)站并沒有成為檔案機(jī)構(gòu)與社會公眾溝通的有效橋梁,筆者的網(wǎng)絡(luò)調(diào)查和實(shí)踐走訪也證明了這一點(diǎn)。
信息服務(wù)是檔案網(wǎng)站的重要職責(zé),提供檔案檢索是檔案網(wǎng)站信息服務(wù)的主要渠道,在檔案信息“井噴式”增長的時代,絕大多數(shù)的檔案服務(wù)都必須以有效的檢索為前提。作為檔案信息資源的集散地,檔案網(wǎng)站的檢索功能是不可小覷的。無論中外,檔案網(wǎng)站的信息服務(wù)大多都是通過檔案檢索、咨詢、開放利用等方式實(shí)現(xiàn)的,通過比較可以發(fā)現(xiàn),國內(nèi)外檔案網(wǎng)站在可供檢索的資源、檢索的途徑與方式、檢索主體、檢索體驗(yàn)等方面都有很大的不同,更準(zhǔn)確地說,國內(nèi)檔案網(wǎng)站的檢索功能亟待提高,這已成為制約我國檔案網(wǎng)站發(fā)展的重要瓶頸之一。筆者認(rèn)為,通過對中外檔案網(wǎng)站檢索功能的比較探析國外檔案網(wǎng)站的優(yōu)勢,可用以完善國內(nèi)檔案網(wǎng)站的檢索功能,有利于發(fā)掘檔案網(wǎng)站的潛力,實(shí)現(xiàn)檔案信息資源的價值。
2 中外檔案網(wǎng)站檢索功能的相異之處
2.1 檢索功能在檔案網(wǎng)站中的地位不同。由于國內(nèi)外檔案網(wǎng)站定位不同,檢索功能在各檔案網(wǎng)站中的地位也不同。我國大多數(shù)網(wǎng)站定位于“宣傳型”或“展示型”, 在檔案網(wǎng)站的首頁,檔案工作的動態(tài)、成果、大事、法規(guī)、標(biāo)準(zhǔn)等內(nèi)容占了很大篇幅,以期通過此類宣傳來展示、擴(kuò)大檔案工作的影響,增強(qiáng)社會的檔案意識。相形之下,檔案檢索功能并不突出,不引人重視甚至不容易發(fā)現(xiàn),訪問檔案網(wǎng)站的用戶大多是為了進(jìn)行檔案研究、了解檔案工作的檔案行業(yè)內(nèi)部人員。而國外檔案網(wǎng)站大多定位于“服務(wù)型”,其宗旨是為社會公眾提供檔案資源,因此,檢索功能往往置于首頁突出位置,并且,經(jīng)過檔案資源的有效整合,用戶需求能得到較好的滿足。國外的很多檔案網(wǎng)站已深入人心,成為社會公眾生活、工作中必要的好幫手。
2.2 可供檢索的資源不同。檔案網(wǎng)站是一種資源型網(wǎng)站,其使命就是提供各類檔案資源為社會公眾利用,充分體現(xiàn)檔案信息作為人類社會原始信息源的價值,實(shí)現(xiàn)檔案信息“取之于民、用之于民”的目標(biāo)。高質(zhì)量的檔案資源是檢索功能發(fā)揮的前提,也是檔案網(wǎng)站水平的重要決定力量。從可供檢索資源的來源來講,我國檔案網(wǎng)站提供的資源大多基于自身館藏,跨館建設(shè)的很少。可喜的是,北京市檔案信息網(wǎng)專設(shè)的“民生檔案資源共享模塊”中提供的婚姻檔案、戶籍檔案、房產(chǎn)檔案等33類檔案是由北京市檔案館和各區(qū)檔案館共10個檔案館共同建設(shè)的,[4]這類檔案資源的共建共享現(xiàn)象在國內(nèi)實(shí)屬鳳毛麟角。但在國外,這已經(jīng)是一種普遍現(xiàn)象,如美國檔案與文件署網(wǎng)站的ARC、AAD能提供全國范圍內(nèi)的檔案信息,加拿大國家檔案館網(wǎng)站不僅能提供全國范圍內(nèi)的檔案信息,還與國家圖書館的資源實(shí)現(xiàn)了集成。
從資源類型上看,國內(nèi)檔案網(wǎng)站提供的資源大多是經(jīng)數(shù)字化處理的傳統(tǒng)館藏資源,多媒體資源、電子檔案相對很少見。這主要是由于技術(shù)因素及電子文件的法律效力尚未被完全認(rèn)可,大多數(shù)檔案機(jī)構(gòu)沒有有效地展開多媒體資源及電子檔案的收集和提供利用。隨著電子文件管理的技術(shù)、標(biāo)準(zhǔn)、法制等方面的不斷健全(據(jù)悉,《民事訴訟法修正案(草案)》目前正在公開征求民意,QQ聊天記錄、微博私信或?qū)⒊沙侍米C供,[5]電子文件法律效力得到認(rèn)可也應(yīng)是一種必然),電子檔案、多媒體資源作為重要的一類信息資源,勢必會得到有效的開發(fā)利用。在國外,將電子檔案及多媒體資源納入檢索范疇已經(jīng)司空見慣。如英國國家檔案館網(wǎng)站的Podcast(播客)欄目,提供的是由檔案館工作人員利用館藏檔案整理的,關(guān)于各主題的視頻資料,目前,已有家庭歷史、軍事歷史、社會歷史等5類。[6]美國檔案與文件署網(wǎng)站的AAD存儲了一些數(shù)據(jù)庫和具有數(shù)據(jù)庫結(jié)構(gòu)的電子文件并提供利用。
從全文的提供情況來看,國內(nèi)大多數(shù)網(wǎng)站只提供案卷目錄或文件目錄,能提供全文信息的只有北京市檔案信息網(wǎng)、青島市檔案信息網(wǎng)等寥寥數(shù)家。而國外有相當(dāng)多的檔案網(wǎng)站能提供全文查詢,如加拿大國家檔案館網(wǎng)站、美國檔案與文件署網(wǎng)站、澳大利亞國家檔案館網(wǎng)站等。
2.3 檔案資源組織效果不同。由于對用戶需求的重視程度不同,國內(nèi)外檔案網(wǎng)站中檔案信息組織的角度及檢索系統(tǒng)效用也會不同。分類是信息組織的重要技術(shù)方法,國內(nèi)檔案網(wǎng)站的資源也都經(jīng)過分類,如北京市檔案信息網(wǎng)將“檔案目錄檢索”中的資源分成了民國檔案目錄數(shù)據(jù)庫、“建國”后檔案目錄數(shù)據(jù)庫、北京市勞動模范檔案數(shù)據(jù)庫等六個子庫。將“檔案全文閱覽”中的資源按照來源分成了北平市政府、北平市民政局、北平市社會局等7個子庫以及照片庫,點(diǎn)擊每一類,輸入關(guān)鍵詞即可實(shí)現(xiàn)檢索。國外檔案網(wǎng)站資源分類時,大多會重視用戶的需求,如美國檔案與文件署網(wǎng)站、英國國家檔案館網(wǎng)站、加拿大國家檔案館網(wǎng)站都根據(jù)用戶類型或訪問目的(如檔案研究人員、退伍軍人、教師與學(xué)生、歷史研究人員、信息管理人員等)以及檔案類型將檔案分類,不同類還會按照該類檔案的特點(diǎn)及用戶需求進(jìn)行細(xì)分。除分類外,主題法及字順法在國外的檔案網(wǎng)站中也被視為檔案資源組織的普遍方法,大多數(shù)網(wǎng)站設(shè)有主題索引,加拿大國家檔案館網(wǎng)站提供的數(shù)據(jù)庫檢索系統(tǒng)目前有101個,按數(shù)據(jù)庫名稱的首字母順序排列,并且,每個數(shù)據(jù)庫的名稱均能準(zhǔn)確揭示該庫主題,方便用戶選擇,檢索的針對性和易用性較好。
2.4 檢索途徑與方式不同。國內(nèi)檔案網(wǎng)站設(shè)置的檢索途徑大多基于檔案和檔案工作。如上海檔案信息網(wǎng)的“網(wǎng)上查檔”模塊中,“館藏檔案及資料”部分提供“檔號”、“正題名”、“第一責(zé)任者”三個檢索途徑。[7]利用這些檢索途徑,要求用戶事先要對擬查找檔案有準(zhǔn)確的認(rèn)識,大量模糊檢索不能被滿足。同時,這些檢索途徑專業(yè)性很強(qiáng),普通用戶對這些檔案術(shù)語難以理解和把握,檢索無法順利展開,進(jìn)而導(dǎo)致用戶的排斥心理。相對而言,國外檔案網(wǎng)站的檢索途徑更加多樣化。如加拿大國家檔案館網(wǎng)站中檔案分類占了首頁的很大篇幅,主題索引中,將主題按字順展開,加上導(dǎo)航檢索的使用,即使用戶事先對所需信息較模糊,也可以通過類目或主題瀏覽而明確。在其“館藏查詢”中,可進(jìn)行檔案信息的媒體形式、產(chǎn)品類型檢索,另外,該網(wǎng)站目前提供101個數(shù)據(jù)庫,不同數(shù)據(jù)庫根據(jù)其資源及用戶需求設(shè)置不同的檢索途徑。如“加拿大奧運(yùn)檔案”提供的檢索途徑為“運(yùn)動員名字”、“運(yùn)動項(xiàng)目”、“奧運(yùn)會屆次”、“獎牌類型”共四種檢索途徑,用戶可選擇查找出的檔案以“PDF”或“JPEG”的格式呈現(xiàn)。[8]多角度的檢索途徑會易化檢索過程,使人們能身心愉悅地暢游在檔案網(wǎng)站中,前文提到的經(jīng)ALEXA統(tǒng)計(jì),加拿大國家檔案館網(wǎng)站 “每百萬人中訪問該網(wǎng)站的人數(shù)” 為1810也得益于這一點(diǎn)。
另外,導(dǎo)航檢索、模糊檢索、智能檢索、布爾邏輯檢索等各種檢索方式的綜合運(yùn)用程度在國內(nèi)外檔案網(wǎng)站也有不同。從形式上看,這些檢索方式在國內(nèi)檔案網(wǎng)站中是有的,但主要是在高級檢索中使用布爾邏輯檢索。如北京市檔案信息網(wǎng)的目錄查詢系統(tǒng)的高級檢索提供“檔號”、“題名”、“起始時間”、“終止時間”四個檢索字段,前兩個字段的檢索條件為“包含”或“等于”,后兩個字段的檢索條件為“大于”、“等于”或“小于”,四個字段之間是“邏輯與”的關(guān)系。又如上海檔案信息網(wǎng)的“網(wǎng)上查檔”欄目,提供“館藏檔案及資料”和“政府公開信息”的瀏覽檢索,點(diǎn)擊“館藏檔案及資料”即進(jìn)入一個由“檔號”、“正題名”、“第一責(zé)任者”三個字段組成的檢索界面供用戶填寫,三個字段為“邏輯與”關(guān)系。點(diǎn)擊“政府公開信息”,即進(jìn)入由“索取號”、“文件編號”、“信息名稱發(fā)布機(jī)構(gòu)”等12個字段組成的檢索界面供用戶填寫,字段之間為“邏輯與”關(guān)系。相對而言,國外檔案網(wǎng)站較強(qiáng)調(diào)這些檢索技術(shù)、方法的綜合應(yīng)用。表現(xiàn)在首先是導(dǎo)航貫穿于整個檢索過程,其次,在各個檢索系統(tǒng)中,這些檢索技術(shù)和方法被有效地整合,綜合應(yīng)用程度較高。如美國檔案與文件署網(wǎng)站的AAD檢索系統(tǒng),簡單檢索供用戶描述欲查找信息的任意特征而不是指定某些字段,高級檢索供用戶描述欲查找信息的任意多個特征,并選擇這些特征之間的邏輯關(guān)系,選擇精確檢索或模糊檢索,靈活地組織檢索策略,[9]這將極大地提高檢索系統(tǒng)的易用性。
3 完善我國檔案網(wǎng)站檢索功能的策略
3.1 調(diào)整檔案網(wǎng)站的定位。定位是網(wǎng)站建設(shè)的基調(diào),它決定了網(wǎng)站的整體功能,檢索功能的優(yōu)劣也取決于此。由以上比較可以看出,由于國內(nèi)外檔案網(wǎng)站的定位不同,檔案檢索的資源、方式、效果也不同。我國大多數(shù)檔案網(wǎng)站定位于“宣傳型”、“展示型”,國外大多定位于“服務(wù)型”。為充分發(fā)揮檔案信息資源的寶貴價值,把檔案信息融入社會信息流中,必須堅(jiān)定檔案網(wǎng)站的服務(wù)功能,把服務(wù)大眾視為網(wǎng)站建設(shè)的第一要務(wù),并不斷優(yōu)化網(wǎng)站的檢索功能。在構(gòu)建檢索系統(tǒng)時,將用戶需求視為系統(tǒng)建設(shè)的第一要件,增強(qiáng)檢索系統(tǒng)的易用性和針對性。
3.2 強(qiáng)調(diào)整體規(guī)劃和資源整合。網(wǎng)站被認(rèn)可的前提是擁有合適的、充分的資源,然而,這僅靠任何一家檔案館的力量是不可能實(shí)現(xiàn)的。目前,我國各檔案館在檔案數(shù)字化、信息化等方面已經(jīng)有了很大的投入,但整體效能仍舊不強(qiáng),說明檔案資源共建共享迫在眉睫。美國、加拿大、英國等國家和地區(qū)檔案資源的共建共享已在一定程度上實(shí)現(xiàn),如美國檔案與文件署網(wǎng)站的ARC系統(tǒng)就可實(shí)現(xiàn)全美檔案資源的網(wǎng)上查詢。我國尚缺乏對檔案網(wǎng)站建設(shè)的宏觀指導(dǎo)和整體規(guī)劃,檔案網(wǎng)站建設(shè)時往往是各自為政,檔案資源割據(jù)局面越來越嚴(yán)重,這不僅造成了資源的嚴(yán)重浪費(fèi),更糟糕的是導(dǎo)致了我國檔案網(wǎng)站的整體功能較差。因此,亟待國家對檔案網(wǎng)站及資源建設(shè)進(jìn)行整體規(guī)劃,形成統(tǒng)一、規(guī)范的全國檔案網(wǎng)站體系,提高檔案網(wǎng)站的整體功能,檔案檢索功能也從中得到優(yōu)化。
3.3 重視現(xiàn)代技術(shù)的植入。檔案網(wǎng)站是檔案資源與現(xiàn)代技術(shù)結(jié)合,不斷發(fā)展的數(shù)字化技術(shù)、多媒體技術(shù)、網(wǎng)絡(luò)技術(shù)為檔案網(wǎng)站建設(shè)提供技術(shù)支持。從檢索實(shí)踐和體驗(yàn)上看,我國檔案網(wǎng)站應(yīng)重視現(xiàn)代技術(shù)植入。
首先,提供檔案全文已是大勢所趨,聲像、圖片、照片、膠片等各種載體形式和表現(xiàn)形式的檔案必須納入檔案網(wǎng)站的資源體系中。數(shù)字化技術(shù)、自動標(biāo)引、全文檢索等檔案加工處理技術(shù)也必須得以廣泛應(yīng)用。我國目前檔案數(shù)字化水平還較低,自動標(biāo)引、全文檢索技術(shù)的利用還有一定的困難,檔案加工、處理的速度遠(yuǎn)遠(yuǎn)跟不上檔案增長的速度,大多數(shù)網(wǎng)站只能提供目錄級檔案信息的查詢,并且,大量有價值的檔案信息尚未被納入信息資源體系中(如電子檔案等)。
其次,Web2.0技術(shù)能增強(qiáng)網(wǎng)站的互動性,優(yōu)化網(wǎng)站性能,因此,如RSS、Podcast(播客)、BLOG(博客)等Web2.0技術(shù)在國內(nèi)外各種網(wǎng)站中已很盛行,遺憾的是,這一技術(shù)在國內(nèi)的檔案網(wǎng)站中沒有被使用,這也是造成檔案網(wǎng)站用戶友好性不強(qiáng)的重要原因。在加拿大、英國等國家的檔案網(wǎng)站中都有通過植入RSS技術(shù),允許用戶通過RSS進(jìn)行個性化的信息定制或跟蹤,網(wǎng)站用戶的友好性較強(qiáng)。
另外,國內(nèi)檔案網(wǎng)站大多提供“關(guān)鍵詞”、“檔號”、“題名”等檢索途徑,用戶檢索都是“千人一面”、“千次一面”,長此以往,用戶會由于網(wǎng)站的單調(diào)、易用性差而不愿訪問。因此,網(wǎng)站建設(shè)應(yīng)重視檢索個性化技術(shù)的植入,如嵌入Cookie技術(shù),對一些注冊用戶或經(jīng)常來訪問的用戶記住并識別,當(dāng)該用戶再來檢索時,根據(jù)系統(tǒng)掌握的個人信息及其歷次查詢經(jīng)歷,可為其推薦信息或提供檢索結(jié)果時進(jìn)行智能篩選和排序。這種技術(shù)在各種網(wǎng)站中(尤其是電子商務(wù)網(wǎng)站)已比較成熟,若能成功植入到檔案網(wǎng)站中,對于檔案網(wǎng)站整體功能及檢索功能的提高是大有裨益的。
總之,檔案網(wǎng)站是網(wǎng)絡(luò)環(huán)境下檔案工作的必然產(chǎn)物,檔案檢索是檔案網(wǎng)站的主要功能,檢索功能是評價檔案網(wǎng)站的重要指標(biāo)。檢索功能差會降低整個檔案網(wǎng)站的效用,而檢索功能的增強(qiáng)也依賴于檔案網(wǎng)站的整體優(yōu)化,二者相互促進(jìn),相互提高。通過國內(nèi)外檔案網(wǎng)站的檢索實(shí)踐,不難看出,我國檔案網(wǎng)站的整體優(yōu)化從宏觀到微觀都有極大的發(fā)展?jié)摿Γ枰獜亩ㄎ弧⒄摺⒓夹g(shù)等方面不斷改進(jìn)。
參考文獻(xiàn):
[1]張寧.我國市級檔案網(wǎng)站綜合測評及分析[J].檔案學(xué)研究,2010(2):49~54.
[2]2011年我國省級檔案網(wǎng)站測評結(jié)果揭曉.[2011-11-11]. http://bbs.daxtx.cn/forum.php?mod=viewthreadtid=20821highlight=2011%2B%B5%B5%B0%B8%CD%F8%D5%BE,訪問于2011年11月
[3]Alexa排名查詢.[2011-11-12]. http://www.123cha.com/alexa/ 訪問于2011年11月.
[4]北京市檔案信息網(wǎng). [2011-11-12]. http://www.da.bj.cn訪問于2011年11月.
[5]楊龍.民事訴訟法首次大修,QQ微博記錄或成呈堂證供[N].深圳晚報,2011年11月21日.
[6]英國國家檔案館網(wǎng)站.[2011-11-11]. http://www.nationalarchives.gov.uk/.
[7]上海檔案信息網(wǎng).[2011-11-11]. http://www.archives.sh.cn/.訪問于2011年11月.
[8]加拿大國家圖書館與檔案館網(wǎng)站. [2011-11-13]. http://www.collectionscanada.gc.ca/index-e.html.
[9]美國檔案與文件署網(wǎng)站. [2011-11-13].http://www.archives.gov/index.html.
(作者單位:鍋艷玲,河北大學(xué)管理學(xué)院;段愛峰,河北大學(xué)教育學(xué)院 來稿日期:2011-11-21)