王 晨/南京政治學院上海校區
檔案網站是檔案事業在互聯網中的門戶,承擔著開展檔案宣傳工作與提供檔案利用服務的重要職責。隨著網絡成為信息獲取的重要渠道,檔案網站在檔案利用服務中的作用越發明顯,其檢索質量的高低將直接影響開放檔案資源的價值實現。因而,以我國目前各省級檔案網站的資源檢索現狀為研究對象,深挖網站資源檢索問題的根源并給出科學合理的應對策略分析,是新形勢下檔案信息化建設的重要舉措。
中國人民大學研究品牌計劃項目“我國檔案網站建設測評與評價”項目組成員自2004年以來對我國同一級別的33個省級檔案網站的建設現狀進行追蹤測評。該項目研究成果得到的數據顯示,截至2015年,我國各省級檔案網站的檢索建設都有了相當大的進步與突破:網站收集的檔案信息資源不斷豐富,且開始逐步滿足多樣化的檔案用戶需求;檔案網站相關信息的更新速率有所提高;人機交互的界面友好度上更加趨于人性化;與此同時,各網站逐步開始建立其頗具特色的數據庫,網站的規范程度也得到逐年加強[1]。
天津檔案網、上海檔案信息網、北京市檔案信息網和浙江檔案網等網站的建設較為突出,在該項目的綜合指標測評中排名靠前。盡管其他地區省級檔案網站建設的步伐也在加速,但相對來說,地區間網站的建設和發展水平依舊存在差異,華北、華東地區整體上仍處于領先地位[2][3]。省級檔案網站是我國綜合檔案館建設水平的最高代表,能夠直接反映出檔案信息化建設的進程,然而不可避免的是,由于我國檔案工作的整體建設水平尚未能完全滿足用戶日益個性化的利用需求,檔案網站的相關建設還存在很多問題和不足,許多功能有待進一步提升。
檔案網站的各大功能中與利用者關聯最緊密的無疑是資源檢索模塊,該功能是連接用戶和檔案的直接窗口,其建設質量的高低將會在很大程度上對檔案利用服務的用戶體驗以及用戶黏性產生影響。本文以我國各省級檔案網站中總體建設水平較高的網站為研究樣本,對其檢索模塊的各類功能進行相關剖析。
我國檔案網站目前的主要功能更多定位在做好檔案的宣傳工作,檢索模塊雖然必不可少,但就整體而言其地位并不是特別高。在對綜合測評較好的省級檔案網站的實際檢索體驗中,可以看到網站現有功能模塊都會在頁面主菜單顯示有查檔服務或者在左右兩側的宣傳欄中設計有檢索系統的簡易搜索框。例如,北京市檔案信息網查檔服務模塊下的網上查檔,天津檔案網的檔案查閱以及上海檔案信息網在頁面左側的“開放檔案一站式查詢”。
從可檢索內容上看,各檔案網站的數據庫主要提供開放的相關歷史檔案、政府信息公開查閱、企業檔案、民生檔案和部分編研成果,形式上包含了數字化的紙質檔案、電子文件以及聲像等多媒體檔案類型;從檢索方式上來看,關鍵詞搜索是目前檔案網站中最主要的檢索方式,它是針對題名、檔號等檔案著錄項所進行的重點檢索。以北京市檔案信息網的原文閱覽查詢為例,可以在搜索框內輸入任一檔案著錄項所包含的字眼作為關鍵詞在庫內進行檢索。值得一提的是,上海檔案信息公共服務平臺的主體檢索功能中還有其他諸如瀏覽查詢、專題查詢和條件查詢,可根據檔案的標題、檔號、檔案存址、目錄類型和起始終止時間對檔案目錄進行相對專業的布爾邏輯檢索。
除了輸入關鍵詞進行搜索的主體檢索方式,大多數檔案網站針對數據庫內的館藏檔案信息都進行了資源組織歸類,以實現基本的分類檢索功能。時間順序、行政區域或者檔案類型是常見的劃分依據,將檔案信息資源進行細分,然后在每一個類別下設置檢索框輸入關鍵詞實現檢索。
比較典型的如北京市檔案信息網,在其網上查檔的原文閱覽服務中將收集的檔案信息資源按照來源分為了北平市政府(J001)、北平市社會局(J002)、北平市民政局(J003)、北平市教育局(J004)、北平市衛生局(J005)和冀北電力有限公司北平分公司(J006)等6個檔案數據子庫[4][5]。同項目組在過去幾年的調研報告數據比較中發現,近年來各檔案網站的分類檢索功能除了在館藏數據上有所豐富外,在具體的分類調整上并無變化,面對日益多元化的檔案用戶需求,目前省級檔案網站的分類檢索功能還有待進一步完善。
相比國外檔案網站將資源集中化管理、一體化檢索的集成模式,我國省級檔案網站在檢索功能的設計與建設方面較為分散。除了主要的檢索通道和分類檢索,多數網站在頁面與功能設計上把政府信息公開、檔案展覽以及檔案編研成果等其他形式的輔助檢索單列在網站兩側[6]。檢索輔助設計既包括專門檔案、特色檔案數據庫及編研成果的專門查詢,同時也有館際間的資源共享服務和相關鏈接,如上海檔案信息網“開放檔案一站式查詢”中設有檔案館電子地圖,將上海市內實現聯通的檔案館標注在地圖上,并可以通過點擊訪問已聯通的區檔案館網站進行更細致深入的檔案查閱[7]。
另外,綜合測評較好的各大檔案網站中一般設置熱點排行等rank瀏覽形式的檔案檢索,突出頗具特色的檔案數據庫或單列出用戶可能會利用的檔案及文件類型以便于查詢,如北京市檔案信息網將民生檔案共享平臺、天津檔案網將企業檔案和“天津抗日群英譜”單列在網站兩側[8]。值得一提的是,大部分網站會將“查檔指南”作為輔助檢索部分嵌入到網站設計中。
盡管從整體建設上看,我國省級檔案網站的檔案資源檢索功能建設上已達到基本要求,然而即便是走在前列的檔案網站,其檢索功能在頁面總體作用中的地位也并不高,相對國外比較成熟的檔案網站而言,還存在不小的差距,主要體現在數據基礎、標準建設以及系統整合等多個方面。
就目前情況來看,我國省級檔案網站檢索系統的數據庫建設還不夠成熟,表現為數字化程度低、數據基礎相對薄弱。這一問題從本質上講,是檔案館前期的收集整理工作不到位以及數字化進度慢、程度低造成的。據統計,北京市檔案信息網目錄檢索目前能提供的檔案目錄約為81萬余條,而數據量最大的天津檔案網也才158萬余條,相比國外如美國、加拿大等相同級別的檔案網站,在數據規模方面至少相差十倍以上[9]。
而從開放檔案的門類上看,我國檔案多集中在文書檔案上,科技檔案和專門類檔案的數量不多,數據庫的整體建設質量也不高。為數不多的網站為其收集的科技與專門檔案成立單獨的數據庫展示在檢索界面,例如北京市檔案信息網的目錄檢索全部的8個數據庫中就有1個訴訟檔案目錄數據庫。另外,從網站主體檢索所能查閱到的內容上來看,除了像北京市檔案信息網和天津檔案網等為數不多的網站能夠提供原文查閱,大多數檔案網站中的檔案資源檢索服務僅提供數據庫內的目錄檢索和檔案全宗簡介等二次信息,無法實現檔案原文全文檢索和查閱。
用戶在利用檔案網站檢索系統查閱檔案信息時所能檢索到的縱向深度是對檔案網站建設質量的重點評估項之一。就國內省級檔案網站目前的建設現狀而言,對文件的著錄還無法實現“全宗—案卷—文件”的三級檢索。數據庫內檔案信息著錄項不完善、不規范,數據庫之間著錄項標準不統一是造成上述現象的主因。以在檔案網站檢索系統上摘錄的檔案信息為例,北京、上海等大多數省級檔案網站對檔案文件的信息著錄只包含檔號、責任者、標題、起始時間、終止時間和存址幾項[10][11]。由于目前的著錄沒有實現縱向層級上的多級聯通,因而從文件向上無法檢索至案卷以及全宗,知道全宗也難以向下定位至相關案卷及文件。對用戶而言,這樣的檢索服務體驗無疑會使用戶在搜索檔案信息時受到相當大程度的阻礙,從而影響檔案利用服務自身的發展。
相比國外檔案館較為成熟的檔案網站,我國各省級檔案網站檢索系統最大的問題在于整合程度過低。一方面是由于檔案館前期收集整理和數字化工作的滯后導致數據庫內檔案信息本身的數量和質量不高,因而在資源整合階段對檔案信息的分類集成便有所阻礙,信息著錄項缺損不全、關聯性不強,整合程度較低;另一方面是由于檔案網站自身的定位及相關設計理念使得本應作為檔案利用服務主要工具的檢索系統在網站頁面內的地位堪憂,技術上沒有實現同界面的跨庫檢索,各數據庫之間也存在關聯性不強且過于分散等問題,這一點在各檔案網站中表現得尤為明顯[12]。從根本上講,無論是上游的數據資源還是下游的檢索系統本身,國內各省級檔案網站都還處于相對獨立的階段,同目標要達成的系統化集成與整合還有相當一段距離。
新形勢下,我國檔案事業的發展需要“充分利用已有的信息傳輸網絡和平臺,積極推進檔案信息資源共享,支持檔案館(室)將可公開的各類檔案上傳網絡、提供利用。”[13]立足于我國檔案事業發展的實際和檢索功能的不足,筆者認為省級檔案網站的資源檢索在未來發展中需要完成“三個轉變”,實現功能上的逐步完善。
以目前各大省級檔案網站的設計理念及應用體驗來講,檔案網站更多的是作為一個宣傳檔案工作并便利專業人員檢索的媒介平臺,針對的目標群體更傾向于具有一定專業素質的檔案工作者。然而隨著社會檔案意識的提升,越來越多的人開始對檔案價值有所認知,檢索和查閱檔案的需求必然會隨之提升。因而,作為檔案工作與服務網絡門戶的檔案網站,其在線查檔的檢索用戶不可避免地將由面向專業人員逐步轉向面向普通用戶。針對這種轉變,檔案網站的檢索功能開發,一方面要完善其查檔指南等輔助設計,幫助普通用戶了解檔案網站并讓檢索步驟簡易化、便捷化;另一方面對于檢索途徑的選擇要更加“平民化”,更多地選擇基于關鍵詞、題名等易于理解的模糊或精確檢索、聯想詞檢索甚至自定義檢索途徑以彌補普通用戶認知同檔案專業術語之間的檢索鴻溝[14][15]。
檔案網站的功能定位很大程度上會決定其中各模塊的地位作用以及所占比例。由于我國各省級網站的聚焦點還停留在檔案宣傳上,因而資源檢索系統在目前來說還不是檔案網站的主要功能,數據庫零散地分布在網站頁面的側邊。然而隨著未來檔案工作的重心由“存”轉向“用”,檔案資源檢索系統必然會經歷由獨立分散向集成統一的轉變。這種轉變從本質上講是對檔案資源數據庫的有機整合,將各門類檔案資源以及特色數據庫以統一的標準融合在一個樹狀的檢索系統中[16]。以美國國家檔案與文件署網站為例,其下包含有檔案研究目錄系統(ARC)、檔案數據庫通道(AAD)、在線公共通道檢索(OPA)以及電子文件檔案館(ERA)等,所有開放的檔案信息和現行文件幾乎都能夠在其中某個庫內檢索到[17]。
未來檔案用戶需求的增長必將給檔案網站的檢索內容帶來變化。一是用戶對檔案信息的檢索需求已不僅僅滿足于得到檔案目錄信息,而更傾向于在檔案網站上直接查閱檔案信息全文;二是用戶對所查內容的檢索方式將不再僅限于檔案目錄的著錄項,而將變為輸入原文中的關鍵詞直接對原文進行檢索[18][19]。這項轉變對我國省級檔案網站的發展而言將是質的飛躍,既需要網站后臺數據庫內檔案信息的質和量都達到一定要求,還需要突破對檔案原文的數據化等實現原文檢索技術的前期必備工程。毫無疑問,用戶對檔案網站檢索內容從檔案目錄逐步過渡到原文全文的趨向已勢不可擋,關鍵要夯實用戶需求牽引過程中前期的數據支撐與技術基礎。
省級檔案網站既是反映我國檔案事業發展的一個重要場所,同時也是網絡時代用戶了解和利用檔案的重要平臺。資源檢索作為連接用戶與檔案資源的直接通道,其功能的完善與否將會直接影響用戶對檔案利用服務的印象。我國檔案網站資源檢索功能的建設還處于發展與探索期,問題與機會并存,隨著新形勢下國家和社會層面對檔案信息資源需求的不斷增加,各省級檔案網站需要在未來對其檢索系統的功能做出進一步的完善和升級。
注釋與參考文獻:
[1][2]張寧,夏天,王皓等.2015年我國省級檔案網站建設測評項目綜述[J].中國檔案,2016,(01):36-39.
[3]陳曉暉,趙屹.我國檔案網站建設情況綜述[J].檔案學研究,2013,(04):55-63.
[4][6][10][14][18]趙屹.我國檔案網站檢索系統的不足與發展策略—以美國國家檔案館的ARC系統為參照[J].檔案學研究,2014,(02):57-64.
[5][8][19]鍋艷玲,段愛峰.完善我國檔案網站檢索功能的策略研究——基于國內外檔案網站檢索功能的比較 [J].檔案管理,2012,(02):17-20.
[7]上海檔案信息網[EB/OL].[2016-03-15].http://218.242.141.101/org.html.
[9]周莉.我國檔案網站建設的問題與對策研究[D].合肥:安徽大學,2010.
[11]趙山山.淺談我國檔案網站網上檢索功能現狀與未來建設 [J].檔案管理,2009,(03):33-35.
[12]趙雪.從檢索服務角度分析我國檔案網站的現狀及發展 [J].北京檔案,2002,(09):18-20.
[13]楊冬權.做好新形勢下檔案工作、建設檔案強國的綱領性指導文獻——學習《關于加強和改進新形勢下檔案工作的意見》體會[J].中國檔案,2014,(05):17-22.
[15][17]王敏.中美檔案網站檢索功能之比較與啟示[J].檔案,2014,(03):59-62.
[16]吳建華,劉明,王斌等.中國檔案網站建設概況與重點分析 [J].檔案學通訊,2008,(04):50-54.