王 蕾,葉 湄,吳國良,韓 宇
2019年9月,在《民間歷史文獻整理概論》一稿初步修訂完成的時候,中山大學圖書館副館長王蕾組織與中山大學歷史人類學研究中心主任劉志偉教授進行了一次學術采訪,請他對書稿進行批評和指正,并對民間歷史文獻整理、數字開發、研究價值、資料利用方法、人才培養等問題提出指導性意見。劉教授的許多真知灼見,尤其是民間歷史文獻的界定和范圍、文獻與史學研究方法、數字人文開發與整理工作方法等是本書正文內容的補充和升華,提綱挈領地為民間歷史文獻整理與研究指出了方向。因此,本書撰著團隊將訪談進行整理,并作為代序。采訪者包括王蕾、葉湄、吳國良,整理者包括吳國良、韓宇、葉湄。
問:劉老師,我們這本書題為《民間歷史文獻整理概論》。目前學界、文獻整理界對“民間歷史文獻”仍有諸多不同的定義和理解,各地陸續發現了區域性的民間文獻,如徽州文書、清水江文書、石倉契約。您認為民間歷史文獻是什么?有什么要點就可以將某一些文獻叫做民間歷史文獻呢?
劉:歷史學把一般史料歸為兩類:一類是別人寫的歷史,就是通常由他者書寫,講歷史是怎么回事、歷史發生了什么、經過怎么樣、結果如何,這是在“寫歷史”;另一類是人們在歷史活動中,通過文字處理生活工作中的事務,以完成歷史活動,在實踐中留下來的文字,這一類的文字內容更為豐富,跟剛才講的“寫歷史”是兩回事。通俗地說,我們在工作中,寫的總結報告是一種史料,在日常工作中發出指示、填表、報賬形成的文字是另一種史料。在實踐中,借助文字來處理實際事務留下來的文字,和刻意用文字把已經發生的事情給記錄下來,是兩種不同的史料。
問:前者是第一手的、原始的史料嗎?
劉:不是這樣區分的,剛才講的史料,都可以是第一手的。不能說寫給我們學校的總結報告不是第一手的,但報告里寫的是今年做了什么事,寫的人要去想怎么講更好、還要要求分幾部分,這也可以是第一手的史料。另外一種是在做各種事情中,比如填表、信函、郵件、微信,這樣留下來的文字更是第一手史料。所以,不是第一手史料還是第二手史料的問題。回到你們開始提出的問題,什么是民間文獻?民間文獻大多數情況下是這里說的第二種史料。在歷史研究中,我們做社會經濟史的,特別重視第二種史料,為什么?因為社會經濟史研究的是各種社會關系、經濟關系、社會現象和經濟現象,都要看實際上人們怎樣生活,怎么處理自己要面對的問題,用什么辦法去處理,處理的時候發生了什么問題,又怎樣去解決。要了解這些,不會由當時的人記錄下來,大多數都要依賴分析在這些活動中所用的文字材料,這就是我們所說的民間文獻。
史料學上把史料分有意識史料和無意識史料:有意識史料是刻意去寫人怎么樣,寫事怎么樣的歷史資料;無意識史料原本不是寫給別人看的,而是要處理某件事情必須書寫的文件、填的表格、寫的公函,或者發布的告示,這些都是為了處理當時的事務而產生的。民間歷史文獻主要屬于無意識史料。我們能夠從這種史料中看見或者能夠從中探索人們的社會活動、經濟活動、社會關系、經濟關系,如果當時的人寫了一大篇東西,講了一通大道理,那我們還是不知道社會經濟的實態是怎么回事。
問:民間歷史文獻與流傳下來的官修文獻有何不同?可以包括官文書么?
劉:如果是無意識史料,就不是官還是非官的區別。官文書也是官員胥吏在處理事情、處理公務時形成的東西,性質上還是與民間歷史文獻屬于同樣類型的文獻。所以,廣義地看,我們所說的民間文獻,其實可以不只是非官府的,也可以包括官府的文書。
從文獻學傳統而言,民間歷史文獻有別于傳統圖書館的收藏,傳統圖書館一般不會收這些東西,所藏多是前面講的有意識史料。四部之書,包括正式出版與抄本,大都是為了寫書而寫出來的。當然,其中一些如會要、官典章制度類文獻也可以兼具有意識和無意識史料的屬性。就其本身性質來說,它們是作為歷史文獻有意識寫出來的,不是在實際操作中形成的,但我們也可以把官府立法過程、制定規章制度過程看成是個實踐過程,那它們又具有這種無意識史料的性質了。
問:清宮檔案屬于哪一類史料?
劉:清宮檔案屬于第二種,作為史料,主要的性質跟民間文獻是一樣的。它原本就沒準備給后人看,是各級官員之間、部門與部門之間來往的文字,這些文字不是在做歷史書寫,不是在記事,而是在辦公。
問:既然很多檔案可以看作民間歷史文獻,那么民間文獻與檔案又如何區分?
劉:廣義地說,民間文獻就是一種檔案。但在檔案系統里,就檔案狹義的定義來說,一般是指政府部門形成和保存下來的文件。近年各地檔案館也注意收集民間文獻了。檔案原來指的是政府部門形成的公文書,私文書是不歸入檔案的。因此民間文獻的叫法,有時候是相對于圖書館、檔案館原有的那套規范的收藏范圍而言的。因為這些東西原來根本不入法眼,被認為沒文化,又沒有正確性,錯字連篇,總之,不能登大雅之堂。
問:您認為有沒有一個更好的名稱來表述這類文獻?
劉:我現在想不到用更好的名稱,為什么呢?嚴格地說,所謂“民間文獻”的概念不是很嚴謹的。首先,什么是民間?什么是官府?在傳統中國,不是一個有清晰界線的分別。我們現在把某種文獻叫做“民間”,只是相對于原來圖書館、檔案館的收藏而言。圖書館、檔案館原來的收藏范圍很窄,這就意味著很多原本其實屬于非民間的東西,也包含在“民間”里面。現在一般所謂的民間文獻,其實很多是官方文件,也是政府發出的,只是它保存在民間,從我們獲得的來源這些意義上,將其歸到民間文獻中。所以,我們把原來公藏機構不收藏的,來自于所謂老百姓手上的文書,都歸為民間文獻。
問:學界目前對徽州文書的斷代下限,公認為是1949年,但我們收藏的這些文獻里有大量是中華人民共和國成立后的文書,您覺得民間歷史文獻的時間下限如何界定?
劉:對歷史學者來說,沒有下限問題,因為歷史本來就是一直延伸的。現在需要考慮下限問題,只是從收藏機構的工作策略而言。在這個意義上,我主張最好是下延到人民公社,不一定需要明確具體年份。到今天,人民公社時期的文獻該重視起來了,因為這些文獻正在喪失。對歷史學者來說,當這些文獻進入逐漸消失的階段,收集整理這類文獻就需要重視起來。一般來說,如果文獻正在消失,就要開始重視收集,消失到很罕見的程度,就要建立起專藏。民間文獻的時間下限是隨著時代的發展不斷往后延伸的,不應該設限。
問:中山大學圖書館還收藏有潮汕民間文獻,如僑批,時間大多為1949年后,您認為它是民間歷史文獻嗎?
劉:雖然目前僑批的界說還不是很清晰,但它依然可以算是民間歷史文獻的一種類型。民間歷史文獻的時間下限不一定要有明確的界定,很多時候只是眼前的策略,不要隨便界定什么時間的才是民間歷史文獻。對文獻學而言,我認為下限就是這一類文獻已經在迅速地消失的時間。
歷史不是處理保存記憶的,歷史是處理“失憶”的。就是說大部分都失去了,我們就處理殘存的那一部分,這是歷史學者的任務。如果歷史要處理記憶的話,根本無法處理那么多。事實上人類大部分活動都沒有留下來,最后就是要看在歷史過程中,什么留了下來,什么留下來還會對后世有影響,這套機制是怎么樣的,然后從這里去把握一點歷史的脈絡,只能這樣,也很無奈。
問:近代以來,隨著科學發展,民間歷史文獻中出現很多關于科技的記錄,這一類文獻屬于歷史文獻嗎?比如20世紀初研究地理的一些地質資料。
劉:這些好像不能算,屬于科技資料。民間歷史文獻主要是人們日常生產生活留下來的資料,嚴格說不應包含學術研究形成的資料,這類資料是一種比較獨特的文獻。比如,地質調查所的調查記錄,民俗學、人類學的田野筆記,都不能當成民間歷史文獻,它們是專業研究實踐產生的文獻,反映的是專業活動。這類資料在一般意義上,與民間歷史文獻所反映出來的內容不同。當然,這里肯定有很多模棱兩可、模糊不清的地方。一個科學家寫給太太的信可以算是民間歷史文獻,而他在實驗室的記錄就不能算為民間歷史文獻,就看強調哪方面:如果這封信說了愛因斯坦的幾句話,談了一個科學的重大問題,那就是科學文獻;但如果在信里未談這類科學話題,只是同家人分享自己的工作生活和情感,那就是他的家庭生活或他個人生活的內容,那也就是所謂的民間文獻。
問:歷史學已經有科技史,是否需要研究民間文獻?
劉:需要!因為科技史研究也必須要看科學家本人,他作為一個普通人有正常生活、社會交往,但從事科學活動的檔案、筆記、科學報告屬于科學文獻。前面已經界定民間文獻是在生活、生產過程中用文字去解決問題,處理相互關系而形成的文字記錄,反映的是日常生活。比如,道教培養徒弟用的經典,本身是道教文獻,而在我這里屬于日常工具書,在這種情況下屬于民間歷史文獻。再舉一個例子,如果我桌子上擺著一本《毛主席語錄》,它就是我的民間文獻,但不等于《毛主席語錄》是民間文獻,也就是說,日常使用到的《毛主席語錄》對于我來說是民間文獻,不等于《毛主席語錄》是民間文獻,這個要分清楚。
問:民間歷史文獻收藏中包含法學類文獻,如律法文書、投詞、投狀,這些文獻該如何界定其資料屬性?此外,試卷如何判定其民間文獻的屬性?
劉:投詞等是在民間作為與人們生活相關的東西而保存下來的,它不是從學術角度有意識的寫史料,因此應該算民間歷史文獻,但保存在衙門或司法機關的檔案,比如已經出版的龍泉司法檔案,它本身是司法檔案,不能視為民間文獻。不過,司法檔案里面,常常也保存著在訴訟過程中作為證據的民間文書,當我們把它們作為資料來研究民間社會生活時,它們是民間文獻;而當我們把它們作為訴訟證據來研究司法問題時,它們就是司法檔案。關于試卷,試卷本身的存在,反映人們的日常生活、教育實踐過程,可以是民間文獻;但如果一位老師把學生的所有試卷都保留下來,我們用來研究教育史,那就是教育文獻,就與民間文獻有所區別了。
問:那這些文獻要如何分類?是否要完全顛覆原來文獻學的分類思想?
劉:文獻如何分類不是我的專業范圍,那是你們圖書館的事,但依我作為圖書館服務對象的角度來看,我想,建立民間文獻分類體系,要在原來文獻分類體系的基礎上,建立起與民間文獻相符合的范式和分類體系。比如,出現在民間文獻中的四部之書可以全部歸成一類,可以稱為傳統文獻類或傳世文件類,不要再細分經史子集,而且分類體系應具有較大的可擴展性。
問:一件文書從內容看可能屬于多個類別,這種情況應怎么處理?
劉:文書有多重屬性,這是不可避免的。你們館正在整理徽州文書,但不要太局限于徽州文書,可以基于徽州文書整理提出一些想法,從這里發展出一種新的成體系的民間歷史文獻學構想或框架,這些構想或框架經過發展,最終到了某個時候能夠成熟地、全面地涵蓋所有區域的文書。
問:地方文獻和民間歷史文獻有什么區別?民間文獻屬于地方文獻么?
劉:民間文獻當然是地方文獻,但地方文獻不等同于民間文獻。所謂地方文獻,就是在一個地方產生形成,并且是關于這個地方的政治、社會、經濟、文化、歷史、地理、人群的文獻,涵蓋的文獻很廣泛。地方文獻是相對于國家典籍而言的,涵蓋了民間文獻。最典型、最有代表性的地方文獻是地方志,或者地方人士的詩文集之類。這些肯定不是民間文獻,但民間文獻肯定是地方文獻。
問:全國各地都有區域性的民間歷史文獻,是否可能開展對比研究或整體研究?
劉:目前還沒有,或者說這種研究還不成氣候。很多收藏和研究單位還處于收集整理的過程,都在探索各個地方收集的民間文獻可以做些什么研究。目前做得較好的是石倉契約、清水江文書。互相之間的比較或互相之間建立某種相關性或整體性研究,條件還不具備。當然,目前整理研究成果最豐富的還是徽州文書。學界用徽州文書做的研究已經涉及很多領域,包括日本、歐美、中國不同學科的學者都做出了很多貢獻,研究成果的規模、研究視野、牽涉問題的深度和廣度都領先于其他區域的文書。很多其他地方的民間文獻研究,或多或少,或有意識或潛意識,都有在徽州文書研究的基礎上,或以徽州文書的研究作為參照。但這一點,還不能說已經有很明顯的自覺。
問:傅衣凌先生在《福建佃農經濟史叢考》序言中提出社會經濟史研究要有社會科學的概念,要找民間的資料,要做社會調查。您認為民間歷史文獻對經濟史研究的核心價值是什么?
劉:價值就是它反映的是實際的生活,是在現實中人與人之間產生關系,是處理某件特定的事情時形成的文字。在這一點上,它是真實的。但是,用語言文字去處理實際問題的時候,可能是通過說一大堆謊話達到目標的。比如,寫一封信可以編造一大堆東西,但為什么要編造這套東西呢?背后一定有動機和目的,用這種表述方式寫出來而達到某種目的,收到寫信人希望的效果,這點是最真實的。因此,民間文書的價值,不一定是看里面的內容是真實還是不真實,對這一類文書來說,真實性不在于文字表達的內容,而在于它是在實際生活中處理現實的問題,這點是真實的。就算通篇謊言,一定有某種目的,一定是在處理某種關系。所以,對社會經濟史來說,為什么特別重視民間文獻?因為社會歷史研究的是人們實際社會經濟的關系和他們的活動,只有在這里才能夠得到第一手的直接的材料。
問:那么,使用民間歷史文獻應該把握什么方法和原則?與以往歷史學所使用的官修文獻的解讀有哪些不一樣的地方?
劉:首先要明白民間歷史文獻是在人們的實際生活過程中產生的,這些文書處理的是現實生活中的問題,是人們當時要面對、要處理,還要用當時有效的辦法去處理的問題。里面的內容講了什么,應該放在這樣一個角度去分析和處理,而不只是對內容做簡單的復述,這是最基本的,跟用一般的歷史文獻更多依據其中講述的事實不一樣。其實,所有歷史文獻從史學方法來說也需要采用這個角度,但大部分情況下,還是把它的記載當成是對事實的記錄或描述,所以那時候才有用不同文獻講述的事實互相印證的問題。民間歷史文獻一般不是從互證角度去使用。人家當時就是用這種文字書寫去處理他要處理的事情,由不得我們去評判正確與否。比如,契約就是兩家或兩家以上發生經濟關系的時候,用這種方式來定義和界定他們的經濟關系。再如,賬本就是當時人們需要把賬目記錄下來,至于賬目記得準不準,是沒辦法印證的,就算有印證又怎么樣呢?說這個人做假賬,但做假賬也是為了某種目的去做的嘛,這就是歷史事實。
我們現在有些研究是拿一件或幾件文書去解讀,印證某種觀點,這其實就是把民間文獻跟普通文獻用同樣的方式去處理。比如,最常見的契約,契約上講了一些什么概念,講了什么關系,就拿著這個來發揮。但是,對民間文獻,既然在理想情況下它是在實際生活里,面對實際的問題而形成的文字,就盡量要回到它的現場。當然,要真的回去是不可能的,時間回不去,但至少空間要設法進入,然后要通過自己的想象力和一種同情的理解,要讓自己身處其境,盡可能去理解當時這樣做是在處理什么事情、為什么這樣去處理、用這個契約處理這種關系為什么是有效的。也就是要把自己拉回到歷史現場。
問:在長期的徽學研究中,因為學者獲取資料的局限性,只看到十幾件幾十件可能有關聯的文獻中的一件,針對這一件做研究,并且有了結論。在過去的徽學研究里,是不是存在很大的問題?
劉:這些問題在學術研究里面是不可避免的。因為對歷史學者來說,永遠面對的都只是能得到的材料,其實都是零碎的,不可能有完整性的。完整性只是一個理想的追求,我們追求整體,追求關聯性,但有多少材料說多少話。不過,要避免的是,單純拿著文書望文生義,因為這樣的話,跟拿著傳統的史籍解讀,在方法上還是一樣的。
我們在研究中面對的問題,不在于多件還是單件,而在于文獻之間是不是有關聯。文書本身的關聯性非常重要。歷史學者很多時候受限于史料的缺失,作研究時,常常把沒有關聯的兩個文書放在一起。比如,這個人的書里面有幾句話這樣講,那個人的書里面有幾句話這樣講,拿來互證,但是,哪怕他們講的是一模一樣的話,也不一定是在處理同一件事,不是處理同樣的問題,牽涉的主體、目的和動機也不一樣,把它們放在一起,往往得出來的解釋,只是想當然的解釋。
問:您認為徽州區域史研究目前處于什么樣的發展情況?
劉:這個比較難講,因為不同的人做的事不一樣。早期就是1980年代或1990年代前,基本上社會經濟史是搞清楚文書里的一些基本概念,包括租佃關系、土地買賣以及里面反映出來的土地占有狀況,后來慢慢轉到關注一些社會組織、社會人的關系,現在開始關注的比較重要的包括女性、宗教活動、信仰等,但這些都是很初步的。現在最大的問題是沒有把這些文書真真正正地帶回到歷史現場,回到特定時空去解釋,當然這個太難了,只能一步步來。
問:您剛說1980年代時通過契約已經研究了一些背后的制度關系,那么,現在文書中大部分都是契約,是否已經沒有具有價值的研究空間了呢?
劉:有沒有價值,一方面要看你提出問題的是什么。比如,1990年代后,受現實關懷以及制度經濟學影響,比較重視產權問題。產權問題在1980年代前多數是一個土地所有制和土地集中程度的問題等,但現在大家都會注意這些產權的形態。隨著提出問題的不一樣,會有新的價值。但是,這些新的價值在學術上是不是有意義,有多大的研究前景,要在實踐中慢慢探索。比如,剛才講到的女性問題,現在契約里面出現的這些女性的角色的價值很多時候是可以不斷地被發掘出來的。而且,隨著文書收集數量越來越大,特別是現在學界普遍重視文書的歸戶性,最近又有學者提出歸群角度,都是越來越重視文書內在的聯系、系統性跟內在脈絡,這樣的話就會有新問題發掘出來,新問題的空間和這個前景就越來越大。在這種情況下,很難說它的價值已經被發掘盡了。
一方面是我們不斷有新的問題意識,而且這些問題意識也會轉變;另一方面是文書本身的多樣性也在增加。文書收藏量達到一定規模后,就可能呈現出一些可以找到內在聯系的東西。當數量足夠大以后,從統計學方法來看,一定會有新的空間可以發展出來。而且契約文書不但反映契約本身,還跟別的文書有關系。隨著文書數量增多,特別是隨著數字化、數字人文發展,還可以提出新的問題,所以前景是很可觀的。
總而言之,因為文書是實際生活中處理實際問題形成的文字,所以對我們了解它產生時的社會、人群、時間、地方等方面會隨著文書數量的增多以及種類的多樣性,會有不同的價值空間發展起來。
問:我們應該如何盡可能去靠近歷史現場?如果要走進歷史現場,做田野調查,我們應該重點做哪幾方面的事情?
劉:歷史現場有很多種,很多層次。一個當然是回到文書所在的地方,盡管時移世易,物是人非,現場已經變化,但是那里的生態環境不是可以在文書里面直接體現出來的,還是需要到現場去認識和體驗。再就是那里的人,雖然是現代的人,但是那些人在那個地方繼承著一代一代留下來的遺產,各種各樣的遺產、觀念、習俗以及做事的方式都是做研究要了解的內容。應該跟當地的老百姓合作,要走進的歷史現場是走到老百姓那里去,而不是只和當地的學者或研究中心進行交流了解。
不過,我覺得這是歷史學者的責任,圖書館的文獻工作就不一定非要去做這些了。圖書館等收藏機構的重點就是確認和記錄文書的來源地,盡可能搞清楚文書流傳途徑,這已經很好了。
問:關于文獻來源地,除文本與可能的收藏歷史,現在只能通過這兩條途徑去了解嗎?
劉:基本上是,這些能了解多少就算多少吧。只要能夠提供一些輔助性的幫助就可以給研究提供很大的助力了。比如,研究者拿到資料,就能知道資料的來源、存在形態、一些專有名詞或人名地名信息、確定文獻的空間和時間等。
問:針對這個問題,如果面對歷史學者或歷史系學生,您怎樣回答?
劉:要看他想做什么研究。因為不同的研究,關心的問題不一樣,希望解決的問題和需要建立起的解說也不一樣。
問:廈門大學鄭振滿教授提出的民間歷史文獻學是指什么?從圖書館等公藏機構角度來說,民間歷史文獻學應該是什么樣的定義或概念?
劉:鄭振滿教授主張用民間文獻來研究解讀歷史,他的“民間歷史文獻學”其實更多是解讀民間文獻的學問,而圖書館應該是借助歷史研究成果來整理研究文獻。比如契約,已經有很多研究,大概知道契約的基本特性、類別,以及契約上文字內容的表達方式、詞語的內涵,據此可以進行一定的整理和著錄。但是,人物關系就不是圖書館能處理的,民間文獻里很多人物名不見經傳,同一個人有不同的名字寫法,同樣的名字有不同的人。傳統文獻學也有這種問題,但它有很多線索可以去追查,民間文獻整理,傳統方法常常無能為力。
問:您是否反對圖書館作為文獻整理者參與歷史研究?
劉:你們不要太多參與歷史研究,但是,時時處處要有歷史研究的眼光和學術關懷,要和歷史研究有對話。圖書館作為公藏機構,主要是在文獻學方面著力,在徽州文書整理成果的基礎上,逐漸形成一套適用于民間文獻學的研究方法,建立起一套體系。歷史學在研究過程中,也會在文獻學方面形成很多思考,也有很多經驗,也會提出問題,這些問題其實也是對文獻學和圖書館提出的一些要求、期待或需求。所以,在這個過程中,公藏機構需要持續地跟歷史學者進行對話,雖然各自有學科范式和話語系統,但在很多實質的內容上、思路上可以有啟發的。不過,你們一定要堅持圖書文獻學本位。
問:除了用歷史方法來整理民間歷史文獻,您認為民間歷史文獻學和傳統文獻學的區別是什么?
劉:比如說民間歷史文獻分類,也就是目錄學問題,跟傳統文獻肯定不一樣,元數據的體系也不一致,必須建立另一套分類法。最基礎的是民間歷史文獻要依據其特性和歷史研究的成果、方法來整理,在整理過程中建立起規范。
問:民間歷史文獻分類借鑒了很多圖書館學、檔案學、目錄學原有的分類方法,對此您的看法是什么?
劉:這個是可以的。一方面要借鑒,因為民間歷史文獻學不可能離開原有學科范式,但又不同于傳統文獻學,必須有另外一套規范和系統,兩者之間并不矛盾。
問:所以民間歷史文獻學依然需要借鑒傳統文獻學嗎?
劉:借鑒的說法不準確,是要在原來的范式下建立起一個適合呈現民間歷史文獻特性的體系,但這個體系的每一個部分,每一個類別,可能都跟傳統文獻學不一樣。這兩者之間既有關聯,又有所不同。任何一門學科,無論如何革新,都不能從頭開始另起爐灶,否則會雜亂無章,使人難以理解,始終要扎根在原有的學科范式里。
問:您認為《民間歷史文獻整理概論》的主要價值有哪幾方面?
劉:比較系統,比較有體系、有整體性,尤其是剛才講的文獻學問題。
問:接下來想就數字化和整理工作問題向您請教。鄭振滿教授帶領的團隊在做民間文獻的數字化工作,您是否了解,可否介紹一下經驗?他們主要做哪些區域文獻的數字化?
劉:他們的做法挺好,主要在福建永泰地區。他領著一群學生帶著掃描設備到村里。我跟著他們進去村里,親眼看見他們找了兩三戶人家把文書拿出來,一個村子幾千件文書,完完整整的就是原來箱子或竹簍的樣子,他們馬上在那里拍照掃描。
問:如果從不同視角來看待問題,比如從收藏角度和長期保存角度來看待的話,這些做法是否對文獻本身沒有得到足夠的保護?
劉:我不是說拿到什么,而是他搜集到的文書,從完整性、在地性、數量上,是其他地方沒法比。我跟他走了三五個鄉村,就已經收集了數千件文書。據說他們在永泰縣已經收集到了數以萬計的文書。他們每次去一個村就幾天,就有這樣的規模,令人妒忌!但是,我們也有比他有優勢的地方,他們圖書館的人沒有直接參與,而我們圖書館有專藏庫。保護方面,當那些文書在村子消失了的時候,那些數字化的圖像資料,本身就是文獻。現在很多地方,那些文書還是老百姓家里的寶貝,人家不會給你帶走。你想帶走,人家根本不給你看,更別說拍照掃描。
問:在大數據時代,民間歷史文獻開發與研究有哪些新方向?
劉:你是講遠景還是講眼前?談遠景的話,其實只能是一些夢想,因為現在沒有這套工具,還沒有這樣的理想平臺。我的夢想主要是在云計算層次,我期望有一個沒有邊界的,可以建立無限關聯性的數據空間,這是一個無限大的系統。現在史學界所謂的大數據,其實全部是微量數據,真正的大數據是每一秒鐘都數以億萬計的數據產生,是一個只靠人力無法把握的數據變量。歷史學不只是處理清代以前的歷史,如今高德地圖、百度地圖每天的交通信息,未來也是歷史數據,而且肯定是大數據。未來所謂的數字化歷史學的任務,不是處理書寫排版活字印刷時代的歷史,而是需要處理用數字化的整套工具去生活,去處理現實問題的歷史。也就是說,現在努力去推動數字人文,是為了50年100年后的歷史學者有一套辦法,有一套歷史學的手段研究我們今天的歷史。
問:目前民間歷史文獻的研究能否用到大數據技術?
劉:能用到。民間歷史文獻以后最大量的,起碼現在可知道的最典型的民間文獻就是微信上的信息。目前的數字人文是為以后歷史學或者歷史文獻學或者文獻學發展而進行的最初步的探索,我們必須從零開始,從人力有可能處理的數據開始。歷史學也應該把現在收集到的這些歷史文獻進行數字化,再建立數據庫,慢慢發展起來,一步一步到了50年后,就有可能處理現在微信一類傳播媒體形成的數據了。如果我們現在不開始探索,人文學科連這種意識都沒有,不從零開始,不從基礎數據開始,那以后人文學科就失去解釋我們自己的社會文化的能力了。
問:請您談談民間歷史文獻數據化需要注意的問題。
劉:數據化不能夠作為一件事情一攬子完成。目前我最關心的,第一是編目整理,就是如何盡量保存文獻之間的系統性與相關性,這是最基礎性,最前提性的事。第二,文書的保護,文書作為物質載體的保護。文書進行圖像數字化后就可以避免在整理利用過程中的損壞,減少直接接觸文書的次數,盡可能保護文書原件,這也是比較迫切的。第三,利用的方便。如此大量的文書,如果都用調閱原件的方式,利用起來很不方便。前面三點都可以用數字化圖像方式來實現,還要有一個目錄索引系統。
當然,這幾個還都是很初級的,真正的數據化目前達不到。那么理想中的數字化當然是全文錄入,但在目前還做不到的時候,也許可以用提要方式,或者多加一些關鍵詞檢索。建立全文數據庫耗時耗力,單就中山大學圖書館這批文書來說,已經是一個巨大的工程,而只有建立全文數據庫,才真正談得上數字化。民間文獻的全文錄入和檔案或者傳世文獻的錄入是不一樣,涉及文字辨認,異體字處理,復雜格式處理,這些都是很難解決問題,需要長期探索,所以數字化一定是一個長期工作。全文數據庫建立后,就要建立各種計算平臺,但這需要利用民間文件的學者的研究能夠跟得上。現在最大的困難是學界的研究無法跟上發展的需要,學界對什么是數字化還沒弄清楚,懂數字化的不懂歷史,懂歷史的不懂數字化,這是困境。
問:您如何評價中山大學圖書館在徽州文書整理與研究方面的工作?
劉:我前面說過,學界在徽州文書領域已經耕耘多年,像欒成顯、周紹泉、劉伯山、曹樹基、王振忠等學者,他們有非常好的學術見地、學術眼光和學術素養,為徽州文書整理研究工作奠定了非常好的基礎。在他們的基礎上,你們能從一個公藏機構整理者的角度出發,從文獻整理、文獻學角度出發做一些徽州文書的整理研究,這也是一種很好的研究嘗試和學術貢獻。
問:古籍、碑帖、文物都有全國性普查活動,您認為民間歷史文獻有沒有必要做全國性普查?
劉:清代以前的文書,非常有必要,但比較困難,因為民間文獻還沒得到足夠的重視。從鼓吹到實踐,至今已經超過100 年,還是步履維艱,只能不斷呼吁,走一步算一步,這是一個漫長的過程。
問:中山大學圖書館藏徽州文書多數是從老百姓手里收集來的,不管原來是否屬于官府,但缺少華南區域史研究中關注的當地的碑刻、遺跡,這部分東西是否要補充?
劉:作為徽州文書整理文獻學的研究,不一定要做到這么完整。從理想狀態來說,研究者應該自己收集。比如,圖書館傳統四部之書的收藏,能夠為研究者著想,把所有版本都收集齊么?
問:在數字人文趨勢下,資料越多的話,發現的歷史脈絡關系會更容易、更清晰嗎?
劉:理論上當然沒有錯。但現在在這點上還缺乏太多共識,因為最基本的、海量的文獻資源是需要有一個沒有邊界的網絡。平時所謂的云端,更多是強調沒邊界,是無限擴大的。要用同樣的結構去建立數據庫平臺和計算平臺,計算平臺可以變,但我認為能夠共享的數據庫平臺建設才是當務之急,這可能是最難做到的,在實踐中能做到的就是大家都各做各的。現在不要說民間文獻,圖書館文獻的那些數據庫也是各做各的,那些方志庫是永遠都不可能打通。
問:對民間歷史文獻來說,人才培養、整理隊伍應該具備哪些專業素養或知識?
劉:文獻學知識是基礎,也需要有其他學科尤其是歷史學素養,還可以有一定民俗學、人類學、宗教學、法學知識。不一定需要圖書館有這些人,但需要有這些學科的學者做支撐,包括咨詢和指導。