劉英捷 王芹
摘 要:本文在闡述社交媒體信息收集的必要性和國外現(xiàn)狀的基礎(chǔ)上,分析了我國社交媒體信息收集面臨的困境,提出檔案部門作為主要責(zé)任者,應(yīng)盡快開展社交媒體信息收集工作,并進(jìn)一步探討我國社交媒體信息收集的實(shí)現(xiàn)方式。
關(guān)鍵詞:社交媒體; 信息;收集
隨著互聯(lián)網(wǎng)和個人終端(如PC端和手機(jī)端)的飛速發(fā)展和普及,人們的社會活動越來越多地在網(wǎng)絡(luò)上進(jìn)行,網(wǎng)絡(luò)信息資源因而越來越豐富,但在網(wǎng)絡(luò)資源快速增長的同時,其消失速度亦十分驚人。為此,繼1996年澳大利亞、加拿大、瑞典等國家的圖書館和因特網(wǎng)檔案館開始收集網(wǎng)絡(luò)信息資源之后,許多國家級圖書館及其他機(jī)構(gòu)也紛紛展開對網(wǎng)絡(luò)資源的收集工作。與此同時,作為網(wǎng)絡(luò)資源重要形式之一的社交媒體信息也引起了一些國家的重視,英美等國紛紛開展社交媒體信息的收集工作。我國雖然從2002年也開始了網(wǎng)頁信息的收集,但是,對社交媒體信息的收集還沒有足夠重視,社交媒體信息收集工作也尚未展開。
一、社交媒體信息收集的必要性
Web2.0時代,網(wǎng)絡(luò)信息資源增長迅速,但其消失的速度相較于其它類型的信息也十分驚人。Internet Archive的創(chuàng)始人Brewster Kahle估計(jì)網(wǎng)頁信息在75天后就會消失,美國信息基礎(chǔ)架構(gòu)和保存項(xiàng)目(NDIIPP)報(bào)告中指出,網(wǎng)絡(luò)信息平均壽命為44天。社交媒體信息作為網(wǎng)絡(luò)信息的一種,也具有網(wǎng)絡(luò)信息消失速度快的特點(diǎn)。我國社交媒體平臺上每天都有幾億條動態(tài)更新,記錄著社會生活的方方面面。其中,相當(dāng)一部分具有學(xué)術(shù)、科研、文化價值的社交媒體信息隨時都可能消失,而具有時政價值的信息如果當(dāng)時沒有得到妥善保存一般都難以找回,澳大利亞2000年悉尼奧運(yùn)會網(wǎng)絡(luò)信息的佚失便是例證。筆者認(rèn)為,對于珍貴的社交媒體信息應(yīng)該盡早收集歸檔,以免造成社會記憶的缺失。
1.社交媒體信息的檔案價值
判斷社交媒體信息是否有必要收集,首先要判斷社交媒體信息是具有檔案價值,而從定義角度來判斷求證是最根本的方法。我國檔案行業(yè)標(biāo)準(zhǔn)將檔案定義為“國家機(jī)構(gòu),社會組織或個人在社會活動中直接形成的有價值的各種形式的歷史記錄”,這一定義分別明確了檔案的形成者、形成過程、價值屬性、檔案形式這幾個要素。
第一,從檔案形成者來看,檔案形成者一般是國家機(jī)構(gòu)、社會組織和個人,而社交媒體平臺上的所有信息發(fā)布者均屬于這一范圍;第二,從形成過程看,檔案必須是在社會活動中直接形成的歷史記錄,必須具有原始記錄性。可以發(fā)現(xiàn),社交媒體中很多信息都是由政府、企業(yè)和個人賬號直接發(fā)布,表達(dá)各自的觀點(diǎn)看法。如2015年8月12日天津爆炸事故、“7·23”甬溫線特大鐵路交通事故中均有社交媒體用戶發(fā)布了關(guān)于事故的照片和文字,這些數(shù)據(jù)由用戶自己生成,具有檔案最本質(zhì)的屬性——原始記錄性。第三,從價值屬性來看,社交媒體信息中的官方政府信息和非官方社會信息各有其價值。社交媒體平臺上政府賬號發(fā)布的信息,是該單位宣傳工作的窗口,可以更快速地發(fā)布信息并且與民眾互動,是該單位工作情況的反映,是值得保留的原始?xì)v史記錄;而美國Twitter存檔白皮書則稱,收集保存Twitter所有信息包括非官方政府信息“將能使未來的研究人員更全面地了解今天的文化規(guī)范、交流用語、流行動態(tài)、熱點(diǎn)事件、立法過程、原創(chuàng)作品、教育情況等等。”最后,檔案的形式是多種多樣的。從載體來看,從最早的甲骨、金石、縑帛、簡冊、紙質(zhì)發(fā)展到今天的磁帶、光碟和網(wǎng)絡(luò)載體等,并不因形式的變化而否定其為檔案的現(xiàn)實(shí),在發(fā)達(dá)國家都展開了大規(guī)模網(wǎng)頁存檔工作的今天,載體同為網(wǎng)絡(luò)形式的社交媒體信息也應(yīng)作為檔案收集存檔。
2.社交媒體信息的特有優(yōu)越性
雖然檔案是人類在社會活動中形成的歷史記錄,但是由于歷史上各種條件的限制,許多事件或留有空白,或無法得知詳細(xì)情形。而社交媒體則極大地完善了這一點(diǎn),具有傳統(tǒng)檔案所沒有的優(yōu)越性,即對突發(fā)事件的直接記錄和對歷史資料的充實(shí)豐富。
首先,歷史上,對于一些始料未及的突發(fā)事件,往往沒有第一手資料,即使后來有對親歷者的訪問,也存在著遺漏和偏差的可能,而社交媒體平臺給事件親歷者提供了第一時間發(fā)布事件經(jīng)過的可能。譬如在“7·23”甬溫線特大鐵路交通事故和“8·12”天津爆炸事故中,事故幸存者和圍觀群眾將事故經(jīng)過的圖片和文字傳上社交媒體平臺,成為再現(xiàn)歷史真實(shí)面貌的寶貴文獻(xiàn)。其次,通過社交平臺,檔案部門可以通過與民眾互動的方式,獲得普通人視角出發(fā)的鮮活、真實(shí)的歷史資料,以填補(bǔ)歷史的空白或豐富現(xiàn)有歷史資料。加拿大哈利法克斯省檔案館就利用Twitter征集哈利法克斯大爆炸事件相關(guān)故事,并將生成的微博收集歸檔,使檔案館的館藏得以豐富。這一方式同樣適用于我國,保存于南京市檔案館的南京大屠殺檔案,同樣可以通過與市民互動的方式,鼓勵民眾積極講述歷史,以豐富和完善南京大屠殺專題檔案,進(jìn)一步增強(qiáng)檔案的權(quán)威性和可信度。
二、國外社交媒體信息收集的現(xiàn)狀
以英美兩國為代表,國外社交媒體信息收集工作已率先展開。早在2006年,英國國家檔案館就開始進(jìn)行社交媒體信息收集工作,其內(nèi)容涉及近些年的重大事件,形式多樣,收集方式日趨完善。社交媒體信息資源的收集使英國政府部門得以使用數(shù)字工具與公眾進(jìn)行溝通。2010年,美國國會圖書館(Library of Congress,簡稱LC)啟動了Twitter存檔項(xiàng)目(The Twitter Archive),并于2013年1月發(fā)布了題為《Update on the Twitter Archive at the Library of Congress》的Twitter存檔白皮書(簡稱白皮書),開始大量收集平凡的有關(guān)于人們朋友、家庭、工作和飲食生活的tweets。
1. 社交媒體信息收集的時代背景
首先,國家戰(zhàn)略導(dǎo)向推動了英美社交媒體信息收集工作。英國國家檔案館對于網(wǎng)絡(luò)資源收集的戰(zhàn)略目標(biāo)是:收集實(shí)體形式和數(shù)字形式的公共記錄,以及確保能為子孫后代保存并提供實(shí)體形式和數(shù)字形式的公共記錄的利用。21世紀(jì)以來,英國國家機(jī)構(gòu)越來越多地利用社交媒體平臺發(fā)布政府信息并與民眾互動,為了全面、妥善地保存政府部門以及重大事件的公共記錄,英國國家檔案館也開始將社交媒體信息納入收集范圍。美國網(wǎng)絡(luò)信息資源戰(zhàn)略則以收集、保存和提供當(dāng)前和未來的重要數(shù)字資源特別是僅存在數(shù)字形式的信息為目標(biāo),在這樣的戰(zhàn)略導(dǎo)向下,LC在收集歸檔有關(guān)政府信息和重大事件的網(wǎng)站資源后,開始認(rèn)識到社交媒體信息中民眾生產(chǎn)的信息同樣具有很高的研究價值和歷史意義。
其次,已有網(wǎng)頁存檔技術(shù)提供了有力支持。英國從2001年開始選擇網(wǎng)頁進(jìn)行歸檔,此后開啟了網(wǎng)頁存檔項(xiàng)目(UK Web Archiving,簡稱UK WA),該項(xiàng)目旨在明確網(wǎng)絡(luò)歸檔的采集策略,并在英國網(wǎng)絡(luò)歸檔聯(lián)合會(UK Web Archiving Consortium,簡稱UKWAC)框架下進(jìn)行網(wǎng)頁的采集和保存工作。美國國會圖書館自2000年以來,一直對有關(guān)政府信息和政策事件的網(wǎng)絡(luò)資源進(jìn)行收集,其中包含了數(shù)以萬計(jì)的網(wǎng)站。在致力于網(wǎng)絡(luò)資源收集這一目標(biāo)的推動下,LC將用于捕捉和訪問這些資源的標(biāo)準(zhǔn)和工具都已開發(fā)起來。由此可見,在對社交媒體信息收集之前,英美都已展開了網(wǎng)頁存檔,且積累了一定的技術(shù)和專業(yè)知識,為社交媒體信息收集工作提供了基礎(chǔ)。
2. 社交媒體信息收集范圍各有側(cè)重
英國社交媒體信息收集側(cè)重于政府信息的保存。就Twitter檔案部分而言,英國檔案館對于檔案收集范圍做了明確規(guī)定:英國政府部門賬號和倫敦奧運(yùn)會官方賬號發(fā)出的Twitter以及這些Twitter中提到的網(wǎng)頁;被舍棄的Twitter內(nèi)容主要為政府部門轉(zhuǎn)發(fā)的推特,由政府部門發(fā)布的Twitter但其中包含非政府部門Twitter內(nèi)容的不在歸檔范圍中的。此外,Twitter內(nèi)容中的鏈接內(nèi)容也不屬于收集范圍。同樣,在社交媒體平臺Youtube上,視頻形式的社交媒體信息的收集來源是2007年以來43個政府部門開通的Youtube 賬號以及2012年倫敦奧運(yùn)會和殘奧會的相關(guān)視頻。總體來看,英國社交媒體信息收集主要是以政府工作為中心的,囊括了法律、教育、軍事、健康、經(jīng)濟(jì)等全方位的政府事務(wù)和一些政府參與其中的社會重大事件如倫敦奧運(yùn)會和蘇格蘭公投。
美國Twitter存檔項(xiàng)目中收集對象為2006年3月至2010年4月所有公開的tweets。私人賬戶信息和刪除的tweets以及圖片和網(wǎng)站的鏈接信息不在收集范圍之中。LC發(fā)表的聲明中表示,項(xiàng)目收集的資源中除了Twitter聯(lián)合創(chuàng)始人杰克· 多爾西的第一條tweet、奧巴馬總統(tǒng)贏得競選的tweet、某位在埃及被捕后因其學(xué)術(shù)探討使用Twitter引發(fā)一系列事件而被釋放的攝影記者的兩組tweets以及社會名人與重大事件的內(nèi)容之外,更將收集的重點(diǎn)放在了大量平凡的有關(guān)于人們朋友、家庭、工作和飲食生活的tweets上。雖然美國國會圖書館所收集的Twitter檔案暫不對外開放,但根據(jù)其收錄2006年至今所有Tweets的做法來看,涉及的人物上至奧巴馬、杰克多爾西等政商名流,下至美國普通百姓;其中既有美國大選、企業(yè)營銷等政治經(jīng)濟(jì)內(nèi)容,也有普通人的生活百態(tài);所涉內(nèi)容十分龐雜。也正是因其內(nèi)容的龐雜,也加大了整理歸檔的難度,從2010年獲得Twitters授權(quán)直至2013年初,LC都沒有著手分類或過濾這些多達(dá)133TB的Twitter內(nèi)容。
3.社交媒體信息收集類型多樣
社交媒體信息的收集,從內(nèi)容來看,涵蓋極為廣泛,包含了政治、經(jīng)濟(jì)、文化、生活等諸多方面的信息。從信息的產(chǎn)生來看,美國Twitter收集歸檔項(xiàng)目中既有政府賬號發(fā)布的信息,又有普通民眾、企業(yè)社會團(tuán)體等個人和非政府機(jī)構(gòu)發(fā)布的信息;而英國網(wǎng)頁歸檔項(xiàng)目中社交媒體部分只收集了政府產(chǎn)生的信息。從信息的表現(xiàn)形式來看,社交媒體信息可以分為文字信息和多媒體信息(如音視頻信息)。英國的社交媒體信息收集就包含了從Youtube社交媒體平臺收集的視頻檔案信息;自2014年Twitter宣布將開發(fā)允許發(fā)布音樂的新功能以來,美國LC收藏資源中可以預(yù)見也將包含音頻檔案信息。
4.社交媒體信息收集影響非凡。英美兩國開展社交媒體信息收集工作以來,成效顯著,影響深廣。從美國國會圖書館發(fā)布Twitter歸檔的消息起,這一項(xiàng)目便成為了Twitter上的熱門消息。除此之外,根據(jù)Go.USA.gov政府網(wǎng)站報(bào)道,美國國會圖書館因這一項(xiàng)目的緣故,博客網(wǎng)頁點(diǎn)擊量超過了41000,是其他政府URL點(diǎn)擊量的五倍多,網(wǎng)絡(luò)流量大到LC博客服務(wù)器暫時崩潰。同時,媒體如《紐約時報(bào)》、ABC新聞、法新社、PC雜志、《洛杉磯時報(bào)》、《今日美國》、《商業(yè)周刊》等對這一項(xiàng)目進(jìn)行了報(bào)道。威斯康辛大學(xué)、康涅狄格昆尼皮亞克大學(xué)、密蘇里大學(xué)、紐約巴魯克學(xué)院、喬治亞州立大學(xué)和塔夫茨大學(xué)等眾多大學(xué)都對這一項(xiàng)目給予了一定程度的關(guān)注。英國政府網(wǎng)頁檔案項(xiàng)目也被認(rèn)為是英國數(shù)字化保存非常重要的項(xiàng)目。該項(xiàng)目的主持機(jī)構(gòu)英國網(wǎng)絡(luò)資源歸檔協(xié)會(UKWAC)已與國際檔案組織(IIPC)發(fā)展為成功的合作伙伴關(guān)系。
三、我國社交媒體信息收集的困境
2002年以來,我國開展網(wǎng)頁信息收集保存工作的主要有北京大學(xué)網(wǎng)絡(luò)實(shí)驗(yàn)室主持的中國Web信息博物館和國家圖書館主持的Web Information Collection Preservation(簡稱WICP)項(xiàng)目,工作開展至今已取得了一定成果。然而,作為重要的網(wǎng)絡(luò)信息資源,社交媒體信息的收集工作還面臨諸多困境,至今尚未開展。
1.主體不明
對于網(wǎng)頁信息應(yīng)該由哪個機(jī)構(gòu)負(fù)責(zé)哪個部門領(lǐng)導(dǎo)監(jiān)管的問題,我國并未在制度層面予以明確。現(xiàn)有的網(wǎng)頁信息收集保存工作雖然由北京大學(xué)和國家圖書館主持,但這只是微觀層面的管理。宏觀的制度層面并未解決,即明確由哪個部門來作為網(wǎng)頁信息收集歸檔的主體,哪些部門提供協(xié)同和支持尚不明確。同樣的,對于社交媒體信息的收集保存工作,非常重要的一點(diǎn)就是要首先從制度層面明確其責(zé)任主體。對于網(wǎng)絡(luò)信息收集保存的主體,國內(nèi)外學(xué)者眾說紛紜:有認(rèn)為要以網(wǎng)絡(luò)信息生產(chǎn)者或網(wǎng)絡(luò)信息所在網(wǎng)絡(luò)平臺來作為主體;也有認(rèn)為要以圖書館或檔案館來作為主體以實(shí)現(xiàn)長期保存的任務(wù)。如果不能首先在制度上明確責(zé)任主體,設(shè)計(jì)一個全面完善的責(zé)任體系,難免會出現(xiàn)各自為政,收集信息內(nèi)容重合、類型單一、偏重政府網(wǎng)頁內(nèi)容等一系列問題。
2. 權(quán)責(zé)不清
我國已出臺的《知識產(chǎn)權(quán)法》承認(rèn)數(shù)字文獻(xiàn)的知識產(chǎn)權(quán),這也就意味著網(wǎng)絡(luò)上的任何信息都同傳統(tǒng)出版物一樣受知識產(chǎn)權(quán)法的保護(hù)。因而,無論是我國已經(jīng)開展的網(wǎng)頁信息收集保存,還是還未開展的社交媒體信息收集,都要征得信息生產(chǎn)者和網(wǎng)絡(luò)平臺的同意。然而,由于網(wǎng)絡(luò)信息浩如煙海,數(shù)量龐大,不可能逐一征得同意,這就要求國家首先在制度層面建立和完善數(shù)字呈繳制度,明確權(quán)責(zé),促使個人、組織或機(jī)構(gòu)主動呈繳網(wǎng)絡(luò)信息。而我國現(xiàn)在雖然已對網(wǎng)頁內(nèi)容進(jìn)行了收集保存,但制度修改和完善并沒有完全跟上,信息收集主體的權(quán)限與責(zé)任尚未厘清,必然為社交媒體信息收集埋下隱患。
3. 范圍未定
在我國已經(jīng)開展的網(wǎng)頁信息收集存檔工作中,將網(wǎng)頁信息收集范圍主要集中在中文Web空間,其中中國信息博物館主要收藏中文靜態(tài)網(wǎng)頁。但是這一收集范圍也存在問題:中文Web空間的界定不清,即究竟應(yīng)該以網(wǎng)頁使用語言、網(wǎng)頁信息生產(chǎn)者身份,還是域名或者服務(wù)器物理地址來區(qū)分。目前對于社交媒體信息收集范圍仍未明確,如果進(jìn)行社交媒體信息收集,則需要綜合考量責(zé)任主體、項(xiàng)目目標(biāo)等多種因素,盡量明確收集范圍,避免范圍上的過于寬泛或過于狹窄。
4. 人才匱乏
從2003年開始,由我國國家圖書館發(fā)起的WICP網(wǎng)頁收集項(xiàng)目現(xiàn)在處于停滯狀態(tài),除了資金和技術(shù)上的難以為繼,更多反映的是項(xiàng)目人才的缺乏。同樣,對于社交媒體信息收集工作的順利開展而言,相關(guān)專業(yè)技術(shù)人才起了至關(guān)重要的作用。以從事信息收集保管的檔案人員為例,我國目前現(xiàn)有專職檔案人員約9萬人,雖然一直處于增長態(tài)勢,但是其增長速度遠(yuǎn)遠(yuǎn)小于我國信息資源增長速度,兩者增長曲線之間的“剪刀差”越來越大;另外,檔案人員中高素質(zhì)人才極度缺乏,尤其是具備信息技術(shù)的檔案專業(yè)人才匱乏。據(jù)統(tǒng)計(jì),現(xiàn)有檔案人員中從未接受過專業(yè)檔案培訓(xùn)的比例高達(dá)40%。可以想見,如果開展社交媒體信息收集工作,也會同樣面臨人才匱乏的窘境。
四、社交媒體信息收集的實(shí)現(xiàn)方式
1. 完善法律制度
社交媒體信息收集工作涉及信息用戶發(fā)布內(nèi)容的知識產(chǎn)權(quán)、采集權(quán)與公布權(quán)等法律權(quán)限,社交媒體信息收集工作需要相關(guān)法律法規(guī)來保駕護(hù)航,而我國現(xiàn)有的法律體系在這一方面還是空白。針對這一問題,我國政府部門要積極促進(jìn)立法,效法西方國家建立數(shù)字資源呈繳制度,同時,也要完善現(xiàn)有法律體系內(nèi)知識產(chǎn)權(quán)法有關(guān)內(nèi)容,賦予檔案部門合法權(quán)利,使社交媒體信息能得以及時地大量收集, 并由檔案部門對社交媒體信息加以整理加工,以便日后的檢索利用。另外,在現(xiàn)階段雖然沒有正式的法律方法可以解決版權(quán)問題,但是檔案部門工作人員仍然可以通過與版權(quán)者協(xié)商解決的方法,來獲得版權(quán)許可。
2.明確權(quán)責(zé)主體
從國際互聯(lián)網(wǎng)聯(lián)盟的調(diào)研結(jié)果來看,目前從事網(wǎng)絡(luò)信息資源收集存檔工作的主要是國家圖書館,雖然國際通行做法是由圖書館管理,但這不意味著檔案部門應(yīng)該置身事外,相反,檔案部門應(yīng)該是社交媒體信息收集歸檔的主要責(zé)任者。一是因?yàn)樾再|(zhì)上社交媒體信息屬于檔案資源,而檔案部門具有負(fù)責(zé)接收、征集并保管所屬范圍內(nèi)的各門類檔案及有關(guān)資料,維護(hù)檔案的完整與安全的職能;二是因?yàn)闄n案部門管理組織體系較為健全成熟,各級各地檔案部門開展社交媒體收集歸檔工作時可以依照原有的規(guī)章流程進(jìn)行操作,不必另立規(guī)章條例而顯得更為方便;三是社交媒體信息所載荷的數(shù)字遺產(chǎn)屬于文化遺產(chǎn)的一部分,而檔案部門又肩負(fù)著文化遺產(chǎn)保存、傳承的職能。
3.劃定合理范圍
從英美兩國社交媒體信息收集來看,英國只將范圍確定在政府部門社交媒體賬號所發(fā)布的信息,主要采用廣泛收集和專題收集兩種方法收集社交媒體信息。而美國Twitter項(xiàng)目則將2006年至2010年間所有公開Twitter作為收集范圍,所采取的主要方法是廣泛收集法。我國開展社交媒體信息收集工作雖然是大勢所趨,但也要注意不可盲目照搬。鑒于我國社交媒體信息信息量巨大且良莠不齊的現(xiàn)實(shí),若采用廣泛收集法必然會加大收集工作操作難度,并且無法保證收集內(nèi)容的真?zhèn)魏蛢r值。加之國外檔案館如英國國家檔案館一般將其工作重點(diǎn)放在政務(wù)信息上,我國可以依循國外檔案館的工作經(jīng)驗(yàn),在社交媒體信息收集工作的初期,可以將收集范圍重點(diǎn)集中在政府社交媒體信息上,同時對社會重大事件給予關(guān)注。社交媒體信息在收集方法的選擇上也可以借鑒我國網(wǎng)頁信息收集的現(xiàn)有方法,采用復(fù)合收集策略,即對政府社交媒體信息的廣泛收集,對社會重大事件進(jìn)行專題收集。以避免收集信息不全面或者缺乏重點(diǎn)的問題。
4. 開展多方合作
由于社交媒體信息存儲于社交媒體平臺,信息創(chuàng)建者小到個人用戶大到國家機(jī)構(gòu)、社會組織,同時,社交媒體信息的收集也與一般的網(wǎng)頁收集有所區(qū)別,所以,要實(shí)現(xiàn)長期有序地對社交媒體信息進(jìn)行收集僅僅依靠檔案部門自身的人力物力是完全不夠的,這就需要檔案部門與社交媒體平臺以及網(wǎng)絡(luò)信息保存機(jī)構(gòu)開展多方合作。英國國家檔案館在收集社交媒體信息的過程中,分別與Twitter和Youtube合作,收集了屬于歸檔范圍的、政府社交媒體賬號內(nèi)的信息;而美國國會圖書館除了與Twitter合作以外,還與數(shù)據(jù)公司Gnip、網(wǎng)絡(luò)信息保存團(tuán)隊(duì)IA及美國學(xué)術(shù)界展開合作以解決資源獲取和技術(shù)支持等方面的問題。我國可以借鑒英美兩國的合作模式,積極與國內(nèi)的社交媒體平臺合作,并且簽訂資源獲取合作協(xié)議;同時檔案部門也可以和我國專業(yè)網(wǎng)絡(luò)歸檔機(jī)構(gòu)如中國信息博物館合作,以更好地了解先進(jìn)技術(shù)并將之運(yùn)用于社交媒體信息收集工作。另外,檔案部門還可以與我國學(xué)術(shù)界合作,在都柏林元數(shù)據(jù)的基礎(chǔ)上,針對社交媒體信息制定合適的個性化的元數(shù)據(jù)規(guī)則,在收集社交媒體信息內(nèi)容的同時,對每一天社交媒體信息的元數(shù)據(jù)如:日期和時間、地理數(shù)據(jù)、賬戶創(chuàng)建日期等加以規(guī)范化收集,使之后的編目、檢索更為便利。
5.加大人才培養(yǎng)
信息收集人才的培養(yǎng)是我國社交媒體信息收集工作順利開展的重中之重。社交媒體信息收集工作要求工作人員不僅要有檔案管理的專業(yè)知識,還應(yīng)具備一定的計(jì)算機(jī)與網(wǎng)絡(luò)信息技術(shù),了解數(shù)字環(huán)境下信息工作包括檔案工作的流程,有能力從事社交媒體信息收集捕獲、篩選鑒定、組織檢索和存儲等一系列工作。因此,一方面可以通過培訓(xùn)、進(jìn)修等各種方式進(jìn)一步提高檔案工作人員素質(zhì),提升信息技術(shù)水平;另一方面,也可以針對信息管理與信息技術(shù)人才,加強(qiáng)檔案管理知識的培訓(xùn),實(shí)現(xiàn)社交媒體信息收集人員在檔案工作經(jīng)驗(yàn)與計(jì)算機(jī)技能兩方面的結(jié)合。
五、結(jié)語
綜上,社交媒體信息的價值已經(jīng)越來越為人們所認(rèn)識,英美兩國有關(guān)部門已經(jīng)率先行動起來,對那些具有保存價值的社交媒體展開了收集工作,其收集戰(zhàn)略、收集范圍、收集內(nèi)容和資源類型值得我國借鑒吸收。我國雖還未展開社交媒體收集工作,但應(yīng)意識到許多具有重大價值的社交媒體信息亟待收集歸檔。我國檔案部門應(yīng)將自己作為推進(jìn)這項(xiàng)事業(yè)的主要責(zé)任人,積極促進(jìn)立法完善,開展多方合作,加緊理論研究,提高人員素質(zhì),為未來社交媒體信息收集工作的開展奠定基礎(chǔ)。
參考文獻(xiàn):
[1]Brewster Kahle.Archiving the Internet.
[2]National Digtal Information Infrastructure and Preservation.
[3]LC_twitterarchive_report_2013jan[EB/OL].
[4]萬凱莉.美國Twitter存檔項(xiàng)目對我國社交媒體信息歸檔的啟示.[J].浙江檔案,2014,(6):8-11
[5]梁皆璇.英國政府網(wǎng)頁檔案項(xiàng)目及啟示.[J].北京檔案,2014,(12):38-40
[6]New Media Atwitter Over Tweet Archive[EB/OL]. [2016/4/23].
[7]The Library of Congress in the News (May 2010) - Library of Congress InformationBulletin[EB/OL].[2016/4/23].
[8]UKWAC—Building the UK’s first web archive[EB/OL].[2016/4/23] .
[9]楊道玲.中文web資源保存現(xiàn)狀與思考.[J].大學(xué)圖書館學(xué)報(bào).2006.(4):56-60
[10]傅 華.在數(shù)字繁榮的背后——我國檔案工作人員的狀況分析.[J].浙江檔案.2007.(1):10-13
[11]周 毅.網(wǎng)絡(luò)信息存檔——檔案部門的責(zé)任與策略.[J].檔案學(xué)研究.2010.(1):70-73
作者簡介:劉英捷,女,中國科學(xué)院文獻(xiàn)情報(bào)中心16級碩士生;王芹,女,蘇州大學(xué)社會學(xué)院檔案系副教授,碩士生導(dǎo)師。