范曉青 黃芹俠

在信息化時代,隨著信息技術的深入發展,知識傳播與傳承介質形式正在發生深刻的變化,傳統紙介質的使用正在不斷減少,逐步向數字化的電子介質轉移已經成為一個不可逆轉的趨勢,在電子時代如何保存數字化信息,留下時代的烙印,傳承社會文化已經成為一個不可回避的問題。自2014年微信推出以來,以燎原之勢發展,2018年2月,微信全球用戶月活數首次突破10億大關,用戶覆蓋多個國家,微信以比任何媒體都廣泛的覆蓋面迅速擴張。為適應時代的發展,綜合檔案館也紛紛開通微信公眾號,公布數據,提供服務,開發館藏,擴大影響力。筆者以行政區劃名加檔案的關鍵詞搜索檔案微信公眾號,34個省級行政區劃檔案館微信公眾號開通率達80%。332個地級行政區共有176家檔案館開通檔案微信公眾號。檔案微信公眾號正以成為比網頁宣傳更即時的一種方式。
微信傳播即時化方便廣大群眾的同時,如何對這些轉瞬即逝的數據信息進行保存,為歷史留下一些線索,把數據庫中冰冷的字符還原成當時的激情與風貌,成為我們檔案工作者應該思考的問題,是必須并且緊迫的事情。本文將就微信歸檔的一些基本問題進行一些初步探討,供大家參考。
一、目前檔案微信公眾號的現狀
從目前開通的檔案微信公眾號看,按發送信息的內容大致將其分為: 局館信息、檔案知識、本地特色、外埠檔案和其他五類,其中局館信息占26%;檔案知識占5%;本地特色51.8%,外埠檔案占6.8%;其他共10.3%。
檔案局(館)公眾號發送信息的格式多為圖片與文字相結合,占所有形式的96.7%;單純的文字格式只有3.2%;視頻信息占比0.74%。
二、檔案微信公眾號歸檔的必要性
(一)從檔案微信公眾號的功能看
檔案微信公眾號,一般情況為檔案局(館)申請開通,多為與局(館)業務相關內容,或者根據館藏進行二次開發后的編研成果。總共可以分為兩個方面的主題,一個是文化宣傳類的,一個是服務類的。文化宣傳類的,可以反映局(館)在一定時期的工作信息和編研成果情況,工作信息能夠從一個側面反映機關工作開展情況,編研成果對今后的編研具有一定的查考價值。服務類的則能反應一定時期內的檔案服務手段和狀況。根據歸檔范圍的定義:凡是反映本機關工作活動、具有查考利用價值的文件材料均屬歸檔范圍。因此微信公眾號中有價值的內容必須進行歸檔。
(二) 從資源和記憶的角度看
在信息化、社會轉型的大背景下,記錄人類的生產生活的方式已不僅僅局限于文字,從傳統的文字逐漸演變,產生了錄音、錄像、圖片等多媒體檔案,信息傳播的載體也從傳統的紙張擴大到了網絡、手機終端,隨之而來產生的網絡信息、微信公眾號信息也慢慢進入公眾視野,成為我們需要關注的歸檔對像。無論從來源、內容、載體來看,當今社會的歸檔信息正在從“官方記錄”為主型向多元豐富的社會資源體系發展。馮惠玲教授的《檔案記憶觀——資源觀與——中國記憶——數字資源建設》一文中所說“檔案工作者有責任通過自身的業務活動積極主動地參與集體記憶的建構、 維護與傳承”。我們檔案工作者應積極主動地研究檔案微信公眾號的歸檔。
鑒于以上兩點,新興的微信公眾號的歸檔也應成為我們研究的內容。因為它是社會的記憶,更是檔案新媒體資源的一部分。微信公眾號從佐證集體記憶的角度,為集體記憶提供了佐證。
三、 如何歸檔
(一) 歸檔的卷宗問題
關于檔案微信公眾號信息歸檔國內尚無通用方法,可參照紙質文檔管理方式,將一篇微信文章視為一件,多篇合為一個子類如月刊、雙月刊,一年或多年“成集”封裝成一類如合訂本。在歸檔時,可將微信作為專題業務檔案進行保存,如“微信類”檔案類,類下可分為“首頁子類”、“專題子類”;“首頁子類”從首頁開始,向下保存N層,更深層次信息不再保存;“專題子類”如“工作信息”“紅色記憶”“檔案傳真”等,針對某一專題進行更全面的歸檔。 “首頁子類”更側重于保存當前微信公眾號的各個層級的界面歷史風貌,而“專題子類”更多則重于信息保存。
(二)元數據采集
歸檔須要有“信息保存、信息發布憑證、時代文化承載”這個三方面的內容,以留下歷史足跡、反映社會風貌、傳承時代文化。檔案微信公眾號與傳統檔案相比,有共同的元素,也有不相同的地方。參照傳統文書檔案的歸檔元數據采集范圍,筆者認為微信公眾號的元數據采集,應該包括以下內容,如右圖所示。
有兩個需要說明的內容:1.部分精選留言可以做為正文的附件,歸檔保存。如新華社短短的九個字的新聞,“剛剛,沙特王儲被廢了”全文僅有一句話,但是卻引起了極大的反響,網友反應熱烈,留言區成為最大的亮點。那么,像這樣的微信文章歸檔,筆者認為,留言必須成為一個重要的內容進行留存,這樣才能最大限度保存住當時的真實情況,更生動的展示這件檔案背后的社會記憶。2. 關于超鏈接。微信文章的超鏈接不同于其他媒體的超鏈接,可以會指關聯性的內容,微信文章的超鏈接更多的是對本微信公眾號的其他推送文章進行推送,因此,筆者認為,微信公眾號的超鏈接可以在歸檔時予以清除,以最大限度的保證歸檔信息的唯一性。
元數據的捕獲與修訂在對每一卷進行封裝,以及按子類、類打包時進行,元數據內容可以從微信頁面上實時捕獲,也可以按規則自動添加或手動添加標注。
(三)歸檔文件格式的選擇
作為新興媒體的微信公眾號,其歸檔可以參照同為新媒體的網頁歸檔的處理方式,采用網頁抓取工具,如網絡爬蟲等軟件,進行微信頁面抓取。微信頁面為HTML語言開發,考慮到HTML的標準化問題,防止保存的網頁文件失真,可采用“雙數據源”方式保存,既保存一份原始的HTML文檔,同時再將HTML文檔轉化為版式文檔進行保存。選擇版式文檔格式首先要考慮的是其應用的廣泛性、標準的公開性和商品化程度,依據這一原則,2016年我國出臺了通用版式(OFD格式)標準,采用國家標準無疑是最好的選擇,但鑒于國家標準尚不完善,普級面尚不如PDF大,在現階段,可以另存一份PDF格式作為備份,雖然這樣會造成一定的數據冗余,但可以最大程度地規避一些風險。
(四)關于微信電子文件的封裝
按時間封裝時采用時間基準方法,以某一時間為基準點,如1月1日0時0分,對所有卷進行數據打包,然后按封裝時間間隔或全時兩種模式進行增量封裝。在按固定時間間隔封裝時,可以按每周一次或每半月一次進行增量打包。
(五)微信公眾號電子文件管理相關標準
在進行網頁歸檔管理時,應參照國家有關電子文件管理相關辦法、標準與規范等,結合微信歸檔實際情況,制訂相應的“微信類”電子文件的管理辦法及相關標準規范。這類標準規范內容涉及對電子文件的捕獲、整理、封裝,以及對微信類電子檔案的保管、利用、統計、存儲、備份、轉換、遷移、銷毀及移交等多個環節。但是一個標準的出臺,往往需要大量的實踐,目前微信類電子文件的歸檔,可以先參考其他電子文件歸檔的標準,進行相應的探索,以期不久的將來,能出臺微信電子文件歸檔的相關標準。
(六)建立相應的微信公眾號電子文件歸檔管理系統
在進行微信歸檔管理時,應參照國家有關電子文件管理相關要求,建設微信公眾號歸檔管理模塊,并嵌入到現有的數字檔案室系統中去,以實現電子文件的統一管理和利用。微信公眾號歸檔管理模塊應包含采集、歸檔與管理三個主要的功能模塊。采集模塊主要實現數據采集功能,通過網頁爬蟲工具對指定微信公眾號進行按規劃自動增量采集,對采集到的微信頁面按標準規范進行元數據整理、原始信息的封裝與保存、可視化封裝與保存。歸檔模塊對初步封裝的數據包進行元數據摘錄、自動分類歸檔,數據入庫等。管理模塊對數據實行管理,進行數據簽名驗證,提供在線服務接口,提供授權管理機制,提供服務接口,數據導入導出接口,數據離線包生成、導出等功能。
(作者單位:江蘇省泰州市檔案館)