?
網絡背景下檔案信息資源的收集與保存策略
賈文琴
黑龍江省蘿北縣人力資源和社會保障局 154200
[摘要]當前我國的網絡信息技術不斷的發展,同時檔案信息資源的形式也有了非常大的轉變,網絡檔案信息資源也逐漸成為了信息資源的一個非常重要的組成部分,但是在檔案工作發展的過程中,檔案信息資源的收集和保存也就成了非常重要的一個問題,和傳統的檔案工作相比,其工作的方法和模式發生了非常大的轉變,這也是我們需要著重關注的一個問題,本文主要分析了網絡背景下檔案信息資源的收集與保存策略,以供參考和借鑒。
[關鍵詞]檔案信息資源;網絡;收集;保存
簡單來說,網絡檔案資源一般就是通過計算機網絡對數字化檔案進行收集、整理和利用的綜合,它主要涵蓋了三方面的內容,一個是檔案部門當中的相關信息,一個是和檔案本身有關的信息,最后一種就是數字化代碼形式下的檔案信息,但是在這一過程中需要注意的一點就是計算機網絡上的檔案信息不僅僅只是局限于我們經常使用的萬維網,不同的網絡傳輸協議也就有不同的形式,因此我們應該根據實際的情況去對網絡檔案信息資源進行系統的收集和處理。
網絡檔案信息源收集和保存的范圍和其他類型的信息資源有著非常大的相似性,只要是有參考和利用價值的網絡檔案信息和相關的元數據以及一些支持信息開發使用的軟件都在收集和保存的范圍之中,但是在這里我們需要強調的是不管檔案信息的形成著是什么,這些檔案內容都是應該由國家的檔案館進行征集和保存的,在確定保存范圍的過程中,工作人員一定要參考國家出臺的多項規范,同時在這一過程中還要充分的考慮到網絡檔案信息自身存在的一些特征,同時對數據的類型和格式進行詳細的劃分。
當前對于網絡文件是否和其他類型的電子文件一樣,應該采取何種方式進行歸檔處理或者是其收集的時間到底多長還沒有一個統一的觀點或者是規定,但是最好的一種狀態就是要在實際的工作中對完整的元數據進行收集和保存處理。相關的政策當中已經指出政策當中并沒有具體的要求各個檔案機構應該在什么時候對網絡資源進行適當的調整和處理。除此之外,我們還要對機構文件保管的需求進行適當的處理和調整,了解網站信息的具體內容,引發法律問題或者是法律訴訟的概率有多大等等。
傳統的文件檔案在收集和保存方面的要求實際上用在當前網絡檔案信息資源的相關工作中也是非常實用的,在實際的工作中應該保證網絡檔案資源信息自身的完整性和可靠性,同時還要在這一過程中充分的尊重網絡文件形成過程中的一些規律和特點,這樣就使得文件當中的內在聯系能夠有所體現,從而也就為其保管和使用提供了更好的條件,當前在我國的相關法律法規中也已經規定了相關的內容,這樣一來也就為網絡檔案信息資源的收集和保存帶來了很多有益的借鑒,但是在這一過程中需要注意的一點是網絡信息資源的形式充滿了變化性,其類型也非常的多,不同類型的檔案信息資源在自身的特點上存在著非常明顯的不同,所以這也使得信息檔案資源的收集保存和管理工作具有了更強的復雜性,不同類型的檔案信息在收集和保存的要求上可能會出現非常大的不同。
當前我國的網絡技術越來越強大,同時在檔案機構運行的過程中所面對的環境也比較復雜,技術方面的要求也越來越高,所以在這樣的情況下,要想為網絡信息資源的收集和保存提供更多的唯一性指導是非常難的,在技術層面我們主要可以采取以下幾項措施:
首先是對象驅動,這種方法在應用的過程中側重點主要是利用對象和與之相關的元數據,這種方法比較適合使用在HTML文檔的集成工作中,同時它也不需要借助互動性的網站作為其發展的平臺。采用這種方式可以很好的對網絡資源實際的變化情況進行適當的了解,同時還能夠對一些獨立的網絡資源進行實時的了解,同時在工作中還可以根據實際的需要去重建網站。
其二,事件驅動該方法重點收集網站及其用戶之間發生的事件和業務。該方法最適合于動態性網站,如果網站屬于高度互動性或應用驅動型的網站,那么捕獲“事件”(網站和用戶之間單一的事務)可能比捕獲業務處理時構成網站的對象更可行。事件驅動歸檔方法將需要收集以下信息:事件日期和時間,用戶IP或域地址(domain address),用戶概況,提問或其他操作行為,為用戶提供的資源及其相關元數據。
其三,“快照”?!翱煺铡蓖ǔJ窃谀骋粫r刻生成的完整準確的網絡資源文件拷貝。我們可以將該“快照”收集到機構文件保管系統,并根據利用時間的長短來決定其保管期限。當我們對網絡資源集合進行快照時,必須盡可能地確保對網站及其構成網頁進行不間斷處理的能力。這意味著各機構應該努力保持通過技術平臺復制網站內容、層次和功能,同時沒有損害數據完整性的能力。
該策略通過開展風險評估來確定生成拷貝和歸檔的頻率,具有較強的可操作性。“快照”屬于對象驅動方法,它對于靜態網絡資源特別有用,而不應該將它用于保管高度互動的動態性網站或資源(數據庫、事務處理服務)。該方法的不足在于,一個“快照”只能提供某個網站在某一時刻的“照片”。如果捕獲的“快照”缺乏其他網絡活動文件的話,它就不可能完整重建某一時刻的網站及其功能。由于這種收集保存方法無法使機構準確確定何時能夠獲取網站資源,因此,采用“快照”策略的機構還需要生成和保管兩個“快照”之間的網站資源變化日志。為了確保能夠完整地重建網站功能,一個“快照”應該包括網站的所有方面,即包括腳本、程序、插件和瀏覽器軟件等所有能夠使“快照”充分有效的組件。
其四,跟蹤變化。本方法涉及到跟蹤某段時間內網絡資源的變化,并生成變化或活動日志。為了滿足利用需求,我們需要將活動日志收集到文件保管系統進行管理維護。如果與網絡資源“快照”結合使用的話,本方法將是保管靜態網站的可靠選擇。跟蹤變化方法所產生的主要問題是,如果活動日志的元數據不完整,那么就會導致無法解釋過去的日志。因此,至關重要的是要明確元數據要求,文件保管系統所收集的元數據要完整、充分。我們可以使用不斷出現的網絡技術來跟蹤網站變化。例如Web robots, spiders或crawlers等自動化程序,它們訪問網站時,能夠為搜索引擎對站點進行索引。如果這些程序能夠收集足夠的信息,滿足文件保管要求的話,它們對跟蹤網站變化來說可能是有用的。
在當前的社會發展中,網絡技術已經延伸到了社會生產過程中的眾多領域,同時在實際的工作中,我們一定要轉變自己的思想,只有這樣才能更好的做好網絡檔案信息的收集與保存工作,提高檔案信息收集保管的質量和水平,為我國檔案事業的發展提供良好的條件。
參考文獻
[1]向菁,吳振新.網絡信息資源保存發展現狀及趨勢分析[J].中國圖書館學報,2009(02)
[2]鄭惠萍.談網絡管理機制中檔案信息資源的收集與保存[J].鄭州鐵路職業技術學院學報,2009(02)
[3]龐博,彭麗娟.網絡博客的檔案價值初探[J].檔案學研究,2009(04)]
[4]蔡娜,吳開平.一種特殊的網絡檔案信息資源——博客的收集保存初探[J].檔案學通訊,2008(05)