張錦
(中國電影資料館 中國電影藝術研究中心 北京 100082)
現代口述歷史始于實踐(標志是1948年哥倫比亞大學口述歷史研究室的成立及其口述歷史項目的開展)以及實踐的整合與規范化(標志是60年代后半期美國口述歷史實踐的整合)。如果說口述傳統是一個既有社會形態的學術發現的話,那么口述歷史則是人為實踐的發明。口述歷史本體從本質上是作為一種視聽檔案實踐,[1]實踐依賴是這個領域研究的基本特征。定宜莊認為口述史作為一門學科“仍然不算成熟”:“在國內,它似乎還處于‘跑馬圈地’階段,學者們更熱衷于登高一呼……親身實踐者、尤其是長期投入的實踐者卻反而人數不多,且觀者寥寥,顯得頗為冷清寂寞,與前者的熱鬧恰成鮮明對比。我則認為,在一個學科的初興階段,實踐是最重要的。真正的樂趣、真正的體驗、真正的問題,都是在實踐里表現出來的。”[2]
反過來,簡單盲目地進行口述歷史實踐也沒有太大的學術意義,實踐的同時也需充分了解國內外既有的理論與實際操作經驗,并有自己的獨立思考。本文基于單一的案例討論口述歷史實踐的前端控制問題,希望通過對這種涉及具體實踐中遭遇到的問題的更實際的探討,形成與國內口述歷史同行實踐之間的交互,進而達成全國性共識。
前端控制作為現代檔案管理的一個重要理論,要求檔案管理從文件產生源頭就開始介入并實施控制而不是被動等待文件歸檔。而在筆者看來,這是現代檔案系統增強其社會信息控制能力的一個表現。上個世紀末,圖書情報檔案學科領域伴隨國外信息資源管理學說的引進曾引發過一場與更早的信息交流學說的論戰,筆者分別曾從1997[3]和1999年[4]開始從圖書館學領域公開自己的社會信息控制學說參與論戰,隨后經過長期系統研究,擴展到檔案學乃至整個信息與傳播研究領域,[5]并將其作為信息與傳播研究學科群的哲學基礎。很大程度上,筆者各學科領域的研究均以這一哲學思維為基礎,但本文論題與此關系更加直接。對檔案學來說,即便是在傳統主流的文字-紙質檔案時代,文檔原本就是一體的廣義檔案系統,控制就存在于文檔體系中,隱藏在制度化的慣例背后。前端控制思想一部分原因在于現代社會特別是新信息技術條件下原來文檔體系面臨的崩潰危機,也因此,這一理論更廣泛應用于那些前端階段控制相對缺乏的領域,尤其成為電子文件全程管理的基礎。與之相似,也新技術時代的視聽媒介,因此,原本就游離在文檔控制體系之外的視聽檔案就更加需要前端控制。[6]因此作為一種視聽檔案實踐的口述歷史本體的前端控制也就順理成章了。
盡管前端控制原則已廣泛的應用于電子文件管理的研究和實踐中,但是對于口述歷史前端控制的討論比較缺乏,系統論述更是尚未見到,顯然并未引起檔案學界的重視。難能可貴的是,其他學科領域的學者如電影學者陳墨[7]和圖書館學學者尹培麗[8]反而敏銳地注意到口述歷史前端控制的重要性。
口述歷史前端控制的邏輯前提是其視聽檔案歸屬。現代口述歷史產生的原因除了新技術導致傳統紙質證據信息錯失(如電話信息傳達對公文的替代等)之外,也包括20世紀歷史關注范圍向原初缺乏檔案證據信息控制體系的平民社會擴展。從歷史上看,信息技術替代紙質文件引發了主要基于美國的檔案型口述歷史;而社會歷史觀面臨的平民檔案史料缺乏產生了主要基于歐洲特別是英國的社會史家型口述歷史,也因此社會史家型口述歷史并非如同一些歷史學界的口述歷史研究者主張的那樣,即社會歷史范式轉向或隱含的對檔案型口述歷史的替代。正如美國學者唐納德·里奇(Donald A.Richie)提到的那樣,歐洲方面也逐漸承認檔案在這個領域的主導地位:口述歷史“文件是要提供給大眾使用,而不是僅供個人研究的私有文件”[9]。換句話說,即便是那些聲稱脫離檔案范式的社會史家所做的個體研究型口述歷史,也有必要在整體上納入社會檔案系統并作為這個系統的外圍,也因此必須納入整體性的檔案體系的前端控制管理之下。正如唐納德·里奇的希望:“就理想而言,檔案管理者應從口述歷史開始進行時就與研究者共事,而不是在最后階段才插入一腳”。
事實上,以視聽記錄為主要條件的現代口述歷史區別于傳統歷史研究道聽途說陋習的關鍵,就在于將口頭史料檔案化,并以檔案或文獻的思維來處理與對待口頭證詞。這其中也包括他們將采集到的口頭證據納入公共文獻體系,取得公共可獲取性、符合檔案證據要求,由此其他學者有可能根據其采集到的文獻證據可重復論證,這是現代學術的基本要求,即便出于意識形態斗爭目的的社會史家型口述歷史也需要基于證據理性。我們常常可以看到一些歷史學者引證自己對親歷者訪談的言語,卻沒有原始記錄的存留,即便他們引證言語證據的邏輯沒有問題,這種自說自話的論證力量也是大打折扣甚至是致命的。
社會化記錄的檔案維控制僅僅是其中一個方面,對于口述歷史來說還有其獨特的超級復雜性。尹培麗總結美國學者蘇珊·韋恩(Susan C.Wynne)基于集體調查得出的口述歷史復雜性給編目工作帶來困境的幾個因素:“訪問方法不統一;標準手冊需要更新;‘不倫不類’……他們更像檔案或出版的材料嗎?多種載體形式;人名、機構名稱等需要規范控制;缺少專業人員和資金;著錄信息的缺乏。”實際上,韋恩還提到,“盡管在1995年《口述歷史編目手冊(OHCM)》出版以后有了巨大的進步,但圖書館中對口述歷史的訪問仍然飽受缺乏共識與標準化之苦。”[10]很顯然,基于收藏機構的規范化不足以解決口述歷史復雜性問題而需要求助于前端控制,以在保留口述歷史實質內容多樣化活力及其口述等自身特征的同時,強化原始記錄的標準化。
韋恩所述僅是基于編目層面,而在單純基于編目層面的著錄環境中,這些口述歷史材料的利用難度近乎世界共識。美國口述歷史協會(OHA)數字化工作負責人道格·博伊德(Doug Boyd)提到:“由于模擬技術環境下純粹實用性的考慮,職業的檔案管理者通常將其元數據描述努力集中在收藏的層面。在模擬環境中對口述歷史的訪問已經證明是極端費力的。”[11]他也曾提到有收藏機構架子上的模擬磁帶數十年沒有動過。信息用戶獲取信息的耗費大于其收益,則該用戶會放棄該信息的獲取。博伊德無疑如同信息管理領域的普遍共識那樣寄望于口述歷史的數字化及其基于內容的管理,但他也同樣提到,“然而即便是在在線環境中,人們仍然低估了口述歷史資源利用的笨重性”。[12]這其中當然有口述歷史社會化采集的非標準化原因,但也有其他。例如筆者在對口述歷史與口述傳統的辨析中,認為口述歷史文本不同于口述傳統之處在于文本在訪談中的即時生成及其日常口語交流特征,從而構成其原始記錄非結構化的文本特征。[13]這種非結構化特征出于原始記錄與個體記憶呈現的需要,又需要加以完整保留而不宜進行過多結構化文本加工,不過這也帶來了利用的困難甚至可閱讀性的缺乏。
整體而言,口述歷史非結構化特征的文本,其真正有效利用需要基于人工智能的知識管理實行有效的數據挖掘與知識提取與分析,那么依托海量的元數據控制則是必然選擇。即便不考慮口述歷史視聽文本的非規范性與非結構化特征,也不考慮那些機構內部拍攝的聲像檔案,視聽材料最規范的文本或許莫過于公映電影,近乎是類似紙質媒介的正式出版物,而數字化電影的元數據量也大大超過一般人的估計。中國電影數字化平臺的元數據系統即便通過簡單介紹也可以看到,不僅著錄層次包含節目層、場景層和鏡頭層,就算單一層次的元數據描述體系也絕對是單純的編目工作者無法承受之重。[14]實際上,這一系統當初正是作為顧問的筆者所主導制定的,筆者曾為其拓展為知識管理系統而努力,但最終由于機構定位仍然基于媒體資產管理系統。換句話說,即便是沒能讓筆者滿意的媒資系統也有如此龐大的元數據負擔,更不用說更進一步的知識管理。對此問題的解決,是筆者最早1998年內部提出的基于闡釋學循環文檔KMS模型,其核心內容近乎是后來的弗朗霍夫知識管理模型,它要求知識管理融入業務流程,而元數據在其中全程生成。[15]
我們已經可以看到,對社會化采集的標準化控制,唯一的路徑是對包括前端采訪流程在內的全程施加規范化的管理,現代口述歷史在美國正式形成的標志,就是口述歷史不同實踐的整合及其標準化。[16]2018年,檔案行業標準《DAT 59-2017 口述史料采集與管理規范》實施,這是我國口述歷史領域一個尚未引起足夠關注的重大事件,雖然沒有明確,但其中含有部分前端控制的思想。當然,該規范存在很大問題而且還有相當多的相關標準尚未制定,但其中最大的一個問題在于它力圖按傳統主流的文書檔案框架來規范口述歷史,從而形成一些難以融通的矛盾。問題的根源在于該標準混淆了口述歷史相關的概念[17],筆者認為口述歷史是一種新型的視聽檔案,隱含檔案學基本理論的變革和管理模式的調整,那么很自然不能用文書檔案的模式來進行定義和管理。此外,口述歷史四不像的特性既非傳統檔案又非圖書館收藏形態,而收藏管理實踐又的確在檔案館和圖書館都廣泛存在,那么規范的制定最好能在檔案館和圖書館之間尋求兼容,而這也正是不同的案例規范需要交流的根本原因。
中國電影人口述歷史項目雖然僅僅只是一個單一項目,但卻具有其獨特的標本價值。[18]對于前端控制來說也同樣如此,作為案例,其特征滿足口述歷史需要前端控制所涉及到的諸多普遍問題。
首先,前端控制的一個基本矛盾是檔案型口述歷史與社會史家型口述歷史,兩種相互論爭的工作范式背后隱含檔案系統與歷史研究與書寫系統之間的矛盾。項目承擔機構的雙重名稱“中國電影資料館(中國電影藝術研究中心)”顯示這個機構恰好身處矛盾兩方面的“間性”。更重要的是,具體承辦部門是長期被視為這個機構“研究中心”部分的電影研究室,項目發起的一個背景首先是中國電影百年慶典以及領導班子換屆后這個部門對自身定位的重新思考,即研究室也作為檔案館的一部分應發揮什么樣的作用,正如筆者多次公開強調的那樣,雙重名稱不意味著一個單位兩個部分而是兩個側面。其次,中國電影百年慶典帶來的另一個考慮,是通過口述歷史為重寫中國電影史做史料的準備,因而項目兼有歷史研究與書寫的目的——這對于電影研究部門來說幾乎是無需贅言的。
正是在這個基礎上,口述歷史的實踐者往往會從檔案和歷史書寫與研究兩個方面來考慮問題。例如,項目啟動的目標之一就是為口述歷史在中國電影資料館這個檔案館業務中常態化做出探索與示范,并最終將不同環節的工作分別歸口到機構的各個檔案業務部門中去。對于承擔訪談任務的研究人員來說,始終明確訪談內容不僅為自己研究的需要也不僅限于自己的研究領域,而是為電影人記憶的永久保存以及后世其他研究者的公共利用。整個項目伊始就制定了詳盡的對全國(含港澳臺)電影人全面涵蓋的系統訪談計劃。此外,項目從中國電影口述歷史更名為中國電影人口述歷史則是有目的地將電影人記憶全面納入國家個體記憶保存體系之中,而不僅僅是關于電影專業的口述歷史。從這一意義上說,項目早已具有了前端控制的意識,無論是否明確,也因此陳墨注意到檔案學的前端控制也并不出人意料。
其次,即便是對于中國電影資料館來說,通常人們會認為這是一個電影系統內部的檔案館,其法定定位也是電影藝術檔案的保管機構,但很少有人知道80年代初全國檔案規劃曾一度準備以該館為基礎籌建中國聲像檔案館,而國際電影資料館聯合會的官方定位也是聲像檔案甚至“在歷史上,國際電影檔案館聯合會是聯合國教科文組織關于視聽檔案政策與文件主要制定者。例如第一份關于活動影像檔案的國際文件聯合國教科文組織的《活動影像保護與保存建議(Recommendation for the Safeguarding and Preservation of Moving Images)》就出自該組織”。[19]換句話說這個機構本應是國家視聽檔案材料的收藏中心,很簡單,電影是最早的活動影像媒介,而這種兼有視音頻的媒介又是最為典型的視聽材料。也因此,筆者《電影作為檔案》第一次在世界范圍內系統構建電影檔案理論體系,而這一理論體系實質上就是聲像檔案理論體系,電影不過是聲像檔案諸多物質載體類型中的一種。正因為這樣,各國電影檔案館很多發展為聲像檔案館,例如英國國家電影資料館——英國電影組織(BFI)同時保存有電視、數字視頻乃至常規性的國會辯論錄像等一切國家與民族的活動影像記憶。因此,雖然國家檔案局關于中國聲像檔案館的計劃沒能實現,但聲像檔案的分布式協作與整合,包括建立中國聲像檔案學會、構建全國聲像檔案協作網是筆者多年的努力目標。[20]諸多事實表明,中國電影資料館的聲像檔案意識從2010年以來也一直在不斷增強。聲像檔案如同電子文件一樣屬于需要前端控制的主要領域之一,這也是筆者知識管理研究以影視為實例的原因之一。
視聽材料自然也包括口述歷史,中國電影資料館理應成為官方的國家口述歷史收藏中心而不限于單一的電影人口述歷史,不僅應在更大范圍內采集整個國家與民族代表性人群的記憶,也應該廣泛地收羅其他研究者或個人口述歷史訪談的成果,那么也就需要面對更廣泛的項目以外的口述歷史實踐及其規范問題。陳墨的目標一致,但路徑不同,他通過本項目構建人類個體記憶庫的勃勃雄心同樣也絲毫不加掩飾,[21]甚至為此在內部研討會上與黃德泉研究員發生過激烈爭論。[22]筆者立場間乎他們之間,認為人人都做口述歷史就意味著人人的口述歷史都沒有意義,但一定代表性和一定規模的個體記憶保存是必要的,而且不可能僅僅基于電影人口述歷史單個項目實現而需要社會化的采集與整合,而它們能夠參與社會記憶的構建也只能依靠基于前端控制的大數據管理才能得以實現。實際上,持續已十多年的中國電影人口述歷史項目在筆者已知范圍內是中國大陸最大的口述歷史項目,迄今已累計訪談近5000小時,可整理出超過5000萬字的文字內容,個體記憶被掩蓋在海量數據之中才是正常現象,同時也給后期的內容清理帶來巨大壓力。
廣闊的視野不意味著深度的缺乏。項目一開始就明確目標要建立實踐的初步規范與慣例,也因此在實踐的同時展開廣泛的研究活動,這個境內最大的口述歷史項目無論是實踐還是理論水平也都處在國內領先的隊列之中。[23]電影研究者在對視聽媒介的理解方面無疑具有極大的優勢,項目實踐者也包括口述歷史文獻紀錄片的創作者,而新聞與傳媒人也是現代口述歷史緣起的重要參與者。而筆者同時也將其視為中國電影史料知識庫構建的努力之一,那么也是電影產業知識管理的一部分,口述歷史體現為對頭腦中隱性知識的控制維度,[24]而正如前述,影視行業的知識管理不過是筆者知識管理研究的實例基礎,也因此順理成章地投射到“野外”信息。與此同時,電影資料館本身圖檔博的綜合屬性筆者在《電影作為檔案》中已有充分論述,而這也是針對前述尹培麗轉國外學者口述歷史間乎檔案館與圖書館收藏之間特性最好的實驗平臺之一。
中國電影人口述歷史項目成就突出,但弱點與面臨的危機也非常明顯,而這些弱點和危機也正緣于研究部門的具體承擔,在國內口述歷史實踐中同樣具有相當的典型性。危機與機遇常常并存,這些危機迫使項目采取包括前端控制在內的一些規范措施加以彌補,也帶來新的實驗與思考。
目前最大的問題在于后期管理近乎空白,近5000小時的訪談材料長期臨時堆放,基本規范建立起來后即分別歸口機構各部門的原定計劃因故長期難以實現,因為從理論上說,研究部門直接負責的應該是對記錄材料的研究以及在采集部門框架內承擔前期訪談工作。尹培麗文章也提到:“歷史的經驗教訓表明,編目工作做得越早越好,最好在采集完成后馬上將錄音、錄像、圖片、文字等資料一起移交保管部門。因為在時間間隔短的情況下,采訪人的記憶還比較新鮮,講述者也還健在,許多有待查證的信息可以及時得到準確的核實。”
即便不考慮采訪人記憶問題,后期處理的長期拖延也將面臨其他更直接的危機。目前,本項目面臨人員更迭、業務不連續等突出問題。由于轉崗、退休等原因,原有的工作基礎不能得以良好的延續,實際從事口述歷史訪談的臨時工作人員不斷更迭,給項目開展帶來了不可估量的損失。
實際上,這一人員危機更早以另一種方式開始出現,即早期研究人員全面參與的局面——原本以歷史研究者從事檔案記憶系統保存的優勢難以維持,因為研究者長期從事與其研究課題無關的口述歷史訪談意味著巨大的職業生涯犧牲,從而導致從事前端業務的部門采訪人力資源逐漸枯竭。目前項目不得不將更廣泛的研究者與電影工作者納入項目范圍,依靠項目的資源作為聯系的紐帶,但人員組織關系則相對疏離,訪談也更立足于采訪人當時特定的研究課題和歷史興趣。這在一定意義上走向了社會化采集,更進一步凸顯了前述檔案型口述歷史與社會史家型口述歷史之間控制的矛盾,意味著慣例與統一的模式相對弱化,也因此需要增強規范控制而不僅僅依靠工作慣例與常規性的工作溝通。此外,由于資源聯系的紐帶,項目這樣一種社會化程度同時又處在項目控制能力之內,從而具備了對前端控制進行初步探索的條件。
真正促成前端控制全面實施的,仍然是一個典型的原因——數字化所帶來的危機,即SONY PXW-Z150攝像機對此前SONY HDV攝像機的替換,因此從一定意義上說也是迫不得已。HDV記錄雖說也屬于數字影像,但磁帶式拍攝存儲和視頻采集轉換的利用方式使之在管理上更類似模擬技術,最大的特征是拍攝母帶及其信息載體的物理實體式存在,基于收藏層面的編目控制可以實現表面上的管理。新的存儲卡拍攝設備在擺脫了視頻采集轉換的繁瑣利用和保管方式的同時,也失去了固定的物理實存載體,從這一意義上說,才是真正數字化的開始,由此面臨一系列管理上的新問題,例如即便是原來記錄在磁帶盒上的最基本的編目信息如今也再沒有固定的記錄載體作為依托。
由此,新設備購置后隨即展開基于前端控制的規范制定。2019年初,在新舊設備全面替換之際,以《中國電影人口述歷史項目訪談與歸檔臨時業務規范》為核心的文件開始征求意見,同年8月開始實施。
關于這一規范的臨時性除了通過實踐逐漸完善的原因之外,口述歷史收藏最終應作為機構全部收藏的一部分需以集成管理為目標并與其他類型收藏的管理模式兼容,但機構在此方面的滯后也是不得不進行前端控制但也是臨時規范的原因之一。這一規范是在原有規范和慣例基礎上的補充,但卻更集中于前端控制思維。不過,即便沒有明確意識到,原有規范也同樣隱含了諸多前端控制因素,如項目一開始就有較完備的保密規范,對非檔案背景人士來說難能可貴。
前端控制的手段很多,但基本的依托是規范化,而規范化最佳的體現是流程的程式化。筆者制定的這套規范包括上述呈現為工作流程的核心文件,以及圍繞這一工作流程相關的《采訪人形成元數據表》《記錄單元元數據表》《采訪人情況采集表》《受訪人生平年表》《目標人物生平年表》《附屬材料移交清單》《訪談安全使用事項記錄表》等10個工作用表。這些用表部分參考了國內外多個規范,如國內的DAT 59-2017與國外南希·麥凱(Nancy Mackay)[25]和納恩口述歷史中心(Nunn Center)提供的方案,并根據國內具體情況以及訪談實際進行了拆分整合與調整。
前端控制原則上無疑意味著對前端工作人員的約束,也不可避免地增加訪談相關人員的工作量,因此必須在這樣的操作中保持不同目標的平衡,也因此需要滿足幾個原則。首先,前端控制增加的規范、程式與工作不能傷害口述歷史的基本倫理,這一倫理的基礎是對受訪人意愿的尊重,讓受訪人產生不愉快的措施均需暫時停止;第二是不得傷害口述歷史本身的目的,當程式影響到重要信息的記錄或影響口述歷史自身優勢特性的時候需要暫時停止;第三是保持前端控制目的的高效性,例如訪談基礎信息盡可能不得缺失,訪談標準形態的盡量保持,以及涉及后期數據挖掘所需要的信息盡可能多地保留;第四是保持后期工作人員與前期訪談工作人員工作能力與工作量的平衡,例如部分工作對訪談人員來說輕而易舉但對后期工作人員來說卻是沒有必要的費時費力甚至根本無法完成,則盡量留給前期人員;反之亦然。在此基礎上,盡可能減輕前期訪談工作人員的負擔,因為訪談不同于后期工作流程的特征之一是在有限時間內密集的工作量以及與受訪人的直接交流,本身在工作復雜程度上已經近乎飽和狀態。例如,項目根據自身特點將《采訪人形成元數據表(IGM)》和《記錄單元元數據表》分別拆分為“自采純視頻”“自采混合記錄”和“非自采”三個分表,也是為減輕采訪人的負擔,不用面對過于龐大但卻不一定適合主要工作模式的表格,盡管這種分解相對增加后期工作流程的繁瑣程度。為此筆者規定了操作優選順序:①尊重受訪人意愿 ②足夠時間和精力記錄下實質性口述信息 ③規范 ④記錄影像與聲音的質量。
實際上,程式化就是通過將規范融入工作流程的工作流(workflow)的實際應用,讓訪談人員以最小的付出獲取最大的前端控制收益,甚至融入工作流程中那些本來就要進行的工作上,例如前述闡釋學循環KMS模式筆者針對電影數字數據的前端提取部分工作就建立在影片攝制最后一道必不可少的流程是影片完成臺本的編制上。甚至即便不考慮前端控制,程式化本身也是減輕訪談工作并將時間精力投入到具體訪談內容上的重要手段。通過最優化流程控制,其實也是前端控制的一個內容,特別是還能服務于訪談,則是更加優化的手段選擇。筆者的KMS模型也是通過為影視生產提供知識服務構成知識可持續發展的循環從而取得多贏局面,因為影視產業的知識管理是實現業務核心競爭力優化的基本路徑。[26]口述歷史同樣需要業務流程與自身知識管理的結合,而這一結合最大優勢的發揮還需等待數字化遠程分布式工作環境的形成。
梳理一下前端控制的主要內容,筆者此前分析過口述歷史是一個文獻生成的過程,那么根據筆者對文獻屬性的分析,總結為三個方面:社會歷史價值的控制,證據性(含原始性、真實性、完整性)的控制,以及公共可獲取性的控制。下面分別簡要介紹,限于篇幅,完整的表格將后續在合適的機會公開,同時也等待這個“臨時”規范在具體的實踐中繼續受到檢驗并逐漸成熟,目前規范中的大部分規定為推薦而非強制,當然這也是期待同行交流的過程,而且具體所涉內容同時也相關口述歷史的一些基本理論問題。
口述歷史的社會歷史價值控制是一個相對宏觀的控制目標,距離具體的工作流程相對較遠,因為這個目標是在總體、宏觀的范圍內進行的。在此之前,中國電影人口述歷史項目的宏觀目標中就包含了這樣的價值追求,例如陳墨提出的“社會史、專業史和個人心靈史”訪談目標三維度論,以及筆者前述所批評的以電影人口述史單一項目構建人類個體記憶庫的雄心,因為筆者主張的是個體訪談的多樣性以及社會整體文獻建檔體系的社會歷史記憶的完整存留,這也是構建口述歷史全國資源網絡和標準化的理由,而這種完整存留性是通過“代表性”來實現的。項目不僅從一開始就有一個針對全國電影行業的全面覆蓋訪談規劃,具體執行同樣如此,例如筆者負責的長春口述歷史工作組所進行的有意識的“代表性”的規劃,在《長春影事》的前言中詳細描述過這種多重代表性的覆蓋以及相對的重點,[27]如職業、年齡、來源、身份級別、性別、文化程度乃至政治觀點等。這種覆蓋也包括對此前包括文圖檔案在內的傳統史料留存既有結構的調整,也是筆者否定口述歷史平民性為口述歷史本質屬性的原因,這種平民性不過是針對傳統對權貴等強勢階層的偏向而對社會信息所施加的控制措施而已。陳墨文章批評過檔案學界口述歷史研究中的“代表人物”論,其實有所誤解,因為這種“代表人物”并非一定就是“重要人物”,平民視角的人物也是代表人物,例如筆者長春訪談對象不僅包括廠長也包括最底層普通工人的代表。不過,陳墨的批評也并非沒有意義,新頒布的檔案行業標準DAT 59-2017就將“重要人物”作為優先選擇的對象,這也是前述標準基于傳統官方檔案思維慣性的影響。
這種控制具體而言是在編制總體采訪規劃的過程中直接進行的,對于那些直接控制之外的訪談,包括筆者所鼓勵的研究者自身研究活動順帶訪談,很自然以其研究目的為中心,則更多靠數量的累積和收集鑒定達到總體的相對平衡再輔之以人為調控。也因此,訪談對象與事件各個維度代表性的元數據提取則成為流程控制中的一個重要方面,管理系統可據此進行智能分析、關聯全國或特定范圍人口統計數據,進而據此調整總體結構。項目規范最直接的流程是《受訪人(目標人物)生平年表》的填寫,目標人物是指因去世或其他原因轉而采訪其密切知情人(通常為親友)的訪談目的對象,在其生平年表正式內容之前采集相關的受控結構化數據:國籍、民族、性別、出生日期、訪談時年齡、社會身份(含職業)、政治面貌、文化程度等。隨后的生平年表結構化地展示受訪人和目標人物的經歷也是重要的社會信息偏向來源數據。與此同時,《采訪人情況采集表》不用提交生平年表,但也需提供上述類似信息,因為采訪人同樣存在這些代表性并影響其訪談的傾向。當然,這種結構化仍然是相對的結構化,等待相關標準出臺,而采訪人員也不大可能熟悉標準用詞。
前端控制的目的常常被總結為維護文件的原始性、真實性和完整性,在筆者看來就是維護并保存文件的證據性。筆者曾專門論述過口述歷史的證據理論框架,[28]提出口述歷史證據的言語記錄本位,其真實性不在于言語內容的真實而在于對言語本身的記錄真實,因為檔案的真實性是記錄真實而非內容真實,這是口述歷史乃至一般檔案領域被廣泛錯解的問題。因此,證據性控制對前端控制來說極其重要,因為證據性三個維度都嚴重依賴前端工作流程,也需要為后期證據性長期留存提供基礎。證據性控制因此包括三個方面:
4.2.1 言語層面記錄真實與完整的控制
確保對言語本身的記錄真實,如著名的不停機原則以留下口述言語沒有被篡改或刪減的證據信息(含下面談到的完整性存留)。項目從一開始曾立下慣例:如果受訪人因任何原因要求停機,采訪方都須無條件接受,但新規范要求最好能保留下受訪人要求停機的言語等視聽信息在視聽記錄中。采訪方因技術如電池耗盡等或非技術原因造成的停機也同樣處理。這種確保一定程度上有視聽記錄技術為依托,這種技術的證據存留能力本就是現代口述歷史出現的原因。
這種言語記錄的完整性還包括記錄對訪談言語自然進程的主動干預,當然僅僅只是言語與記錄的形式而非內容實質。訪談雙方在通過不同言語種類表達信息的過程中會出現語法、語義與語用等層面的模糊與記錄的缺失,從而形成對完整與準確記錄的需要。例如項目很早就形成一個慣例:受訪人講述中出現非公眾所知的重要人名、地名,采訪人有義務追問名稱具體的文字表達,彌合口頭表達與文字表達的差異。筆者實際的訪談中遭遇到這種不確定信息的情況還有很多,包括容易混淆的名稱等。不同言語種類表達還會出現記錄缺失的情況,例如受訪人在表達空間大小或尺寸的時候,常常僅僅依靠姿體語言或根據現場同樣物品做出語言上的類比,而姿體語言或現場物品可能在記錄的畫外而沒能記錄下來,新規范規定采訪人或攝像師有必要加以追問,落實準確信息并確保其被完整地視聽記錄下來。
4.2.2 口述歷史材料來源層面證據性的控制
口述歷史文本的非結構化形成導致其普遍缺乏題名,國際通行慣例是人為規定以受訪人姓名為核心來命名,這其實與檔案來源命名規則類似。因此,需要確保特定口述歷史材料是它所聲稱的口述歷史材料的證據鏈條,并如同其他方面一樣設置多重證據痕跡冗余,以便后期考證與校驗。“是它所聲稱的”是筆者《言語記錄本位》一文中引述保羅·湯普森(Paul Thompson)《過去的聲音》中的表述,并提到這一維度對口述歷史證據性來說是另一個問題而在當時沒有展開論述,因為它不在文本自身的證據范圍而是作為證據內涵討論的前提,那么本文則直接面對這一證據的存留及其完整性的維護。筆者提到這類證據性包括兩個方面:記錄的偽造(包括重新配音等)以及記錄的口述人真實身份與所聲稱的身份之間的背離。這既包括整個單次訪談文本也包括訪談單元中部分的文本。
這一部分證據性控制的手段主要包括三個方面。
1、確保原始記錄文本與其所標注的元數據信息的匹配。脫離固化實存的全數字化管理模式下,這些基本信息極易與視聽文本脫離關聯。實際上,此問題在磁帶模式下也同樣存在,筆者自己就曾有過工作失誤,直到后期文本整理才發現訪談時匆忙在磁帶盒封面上標注的筆錄信息標錯了盤符順序,因此即便在非全面數字化環境中也應該保持磁帶盒和磁帶上標注信息的冗余設置,更何況后期管理中可能出現的錯亂因為脫離了采訪人的頭腦記憶而更加難以辨識與糾正。
有鑒于此,新增規范實行采訪人形成元數據表與訪談視音頻標板雙重標注系統并設置為相互照應,后者換句話說是以口述歷史本身數據的視聽方式將元數據所需要的內容直接標注在作為原始記錄的視聽文本上。《言語記錄本位》一文中筆者曾提到自己長期所做的“內容標板”實踐,即在訪談開始之前將訪談基本信息如項目名稱、受訪人、采訪人、攝像師、訪談時間、訪談地點等通常磁帶盒標注的內容用口頭言語說明并記錄在音頻上。這種內容標板和技術標版(此處即視頻彩條)源自筆者早年制定的縮微拍攝規范中的標板系統,如同縮微標板一樣,口述歷史視聽記錄同樣還可有更多的其他標注,如在時間、地點乃至媒介切換等時機盡可能留下關于訪談的視聽痕跡,而更重要的則是類似縮微的內容標板——主要內容拍攝前以文字揭示所攝文獻主要著錄信息的畫面,因為縮微是單純的視覺媒介,那么對視聽記錄的口述歷史來說,則是在音頻標板的同時用場記板標注與音頻語言同樣的著錄信息,音頻說明結束后同樣打板,然后不停機轉入訪談現場記錄,確保標板內容與訪談現場記錄的一致性。這自然是援引自電影拍攝流程,只不過電影主要是為了幫助后期剪接識別與聲畫同步,而口述歷史更重要的是標記存檔與聲畫關聯證據的存留,同時也如同縮微文獻一樣可視為口述歷史原始記錄文本的“封面”。根據筆者實踐感受,這一做法可能會增加采訪人員(含攝像師)的工作負擔,但照念場記板也可減輕采訪人在做音頻標記時極為寶貴的腦力投入并減少口誤。此外,整個這一視聽流程有助于訪談開始的儀式化,有助于受訪人以更認真負責的態度對待訪談。
2、維護訪談視聽材料的原始性與完整性。為此要求訪談文件體系即技術性元數據的原始存留,那么對于前端來說一方面要小心維持記錄的原始性與完整性,同時一些出于方便后期管理所需要的設置則直接施加并固化到原始記錄之中。本項目的具體做法首先是盡可能采用攝像機原配軟件如Z150的CB整體轉錄而不是直接拷貝來保留文件體系的原始形態,然后在相關技術形態以及文件名的自動確定方面則通過事先設定拍攝模式與記錄單元的方式實現,盡可能采用更通用、更適合保存的文件格式(如MXF等)以及保持每一個記錄單元時間碼的連續(因為中國電影人口述歷史項目的特征之一是單個訪談時間較長,跨越甚至長達數年,同時多個訪談交叉進行的情況也很常見,因此訪談單元的時間碼連續盡管很有意義——尤其是對于視頻內容定位來說——但卻缺乏可行性),記錄單元設定為存儲卡的單次記錄并確保一人一卡,將一些后期需要做在記錄之時并保持這種視頻文件的原始狀態以及訪談連續的參數,在保持文件體系的原始性的同時保持文件體系的有序性。
這其中也包括音頻的處理,例如根據本項目的技術條件要求主要記錄受訪人言語的胸麥和主要記錄采訪人言語及環境音的話筒分別記錄到不同的聲道上,首先是保證一個聲源出現故障不會導致重要信息的漏記,其次便于后期分離處理并保持各自聲音的清晰度,最后為音頻的相互印證與參照提供憑證。
視頻文件名保持原始文件名及其事先受控的記錄順序,記錄單元命名由采訪人或攝像師按照編碼規范(受訪人姓名 文件夾順序號 本文件夾采訪日期 本文件夾視頻文件數量 本文件夾視頻總時長)記錄事先標注在記錄單元單獨的文件夾的名稱上,而存檔單元則是單個訪談(Individual Oral History Interview),由存檔人員將規范編碼標注在訪談單元(也是存檔單元)的文件夾的名稱中。訪談編碼筆者不同意DAT 59-2017的規定,需要能適當地確定一個訪談單元全國唯一性的方式。這樣的文件體系相關數據(如文件數量、視頻時長等)也標注在采訪人形成元數據表中,形成視頻文件與元數據表之間對應的參照,一旦出現錯漏能輕易檢測出來。
3、受訪人身份的確認。這一確認分視頻中受訪人與元數據標注的受訪人的同一性和視頻中受訪人身份是其所聲稱的那個人兩個層面。《言語記錄本位》一文提到在內容標板之后,正式訪談開始的最初兩個問題是讓受訪人對其姓名和出生年月日進行自我核實并標定,因為根據國際慣例,姓名和出生日期基本可標定特定歷史人物避免同名同姓,同時也包括受訪人所有曾用名的列舉。其中受訪人可能會對自己法定出生日期(身份證日期)提出質疑,也為以后更準確的史實考證提供線索。正如《言語記錄本位》所述,筆者這一慣例源于一位因筆名出現身份疑問的受訪人,而筆者為此以大量精力和費用投入其身份考證。其次是受訪人簽署協議及其身份證的照片存留,其他附屬材料如歷史老照片與現場照片、生平資料等的提供,受訪人簽字的生平年表等表格,元數據表中的受訪人身份與聯系方式數據等都提供了冗余的身份認證信息。DAT 59-2017在此也如同很多口述歷史研究中的誤解一樣,這類材料屬于口述歷史的附屬材料,是“關于口述歷史訪談”的材料而非口述歷史原始記錄本身,這些材料能有助于佐證口述歷史內容與言語的真實性,當然也包括受訪人身份。新規范甚至規定了訪談時錄音筆的附屬錄音屬于附屬材料,除非這是唯一的視聽材料,原因在于此前實踐中由于視頻采集的困難廣泛采用錄音筆現場錄音并以錄音筆錄音替代視頻提供錄音整理的文字抄本流程,而錄音筆的內容與視頻材料通常并不一致(甚至因沒有換盤限制而錄下了換盤間隙的言語而具有獨特優勢),但卻不能實現文字與視音頻的對位。此外,相關表格在存檔之前還需打印并簽名。
4.2.3 證據性與記錄完整性的長期留存的前端設置
這種設置是為保持記錄原始性的基礎上,能有效幫助后期長期留存中對證據性和完整性的前端設置,使這些設置能烙印在原始記錄之中。前面已述不贅。
4.3.1 公共可獲取性的含義與維度
正如前述,公共可獲取性是現代口述歷史區別于傳統上道聽途說著史傳統的根本區別之一,其前端控制手段可以構成體系,其內涵存在多個層面的多個維度。首先它既包括一些比較宏觀的政策性措施如對公共收藏歸檔的鼓勵策略乃至宣傳活動(如本項目對研究者的鼓勵是通過口述歷史設備、資金支持及訪談業務與規范化咨詢等方式將其納入項目體系的方式),也包括技術性的細節控制,如全國聯網的口述歷史資源編碼體系以標定每個單獨訪談并維持其命名的唯一性等。其次是它既包括對資源的可公共獲取,也包括對這種獲取的保密限制,因為即便是受限的獲得性只要存在于公共資源體系也同樣具有公共可獲得性。DAT 59-2017也做了密級規范,但完全依照主流公文檔案模式而缺乏口述歷史特征,有待全國性交流產生結構化的保密狀態描述。最后,它既包括是否納入公共資源體系的可獲取與不可獲取之絕然分界,也包括已納入公共資源體系后可獲取界面的友好程度,前者屬于原則性而后者屬于技術性側面,但我們討論更多后者。
4.3.2 公共可獲取界面的友好性控制
正如前述,口述歷史作為日常口語交流訪談的即時記錄形成的文獻,其文本可獲取性的友好性非常差,而這卻恰恰是其優勢即口語交流等特征帶來的,友好性的增加不應損害其非結構化文本的自身優勢。對于公眾來說,接觸口述史最常見途徑是對原始記錄文本進行編纂、重新書寫乃至研究分析的出版物,筆者稱之為口述歷史信息的線性組織與控制,具有相對的閱讀友好性,但特定信息的獲取效率卻遠不及數據庫式組織與控制,而更高層次的知識管理則是人工智能組織與控制(筆者也稱廣義數據庫式),而編纂式線性組織要獲取證據源仍需溯及原始記錄。實際上,筆者的編纂實踐中對線性組織結構也存在面向故事性閱讀與索引式閱讀的兩難選擇,更不用說后期對原始文本的編纂活動也能從數據庫式結構中獲取效率,而這同樣依賴于內容描述性元數據。這些元數據的采集絕大部分宜放在前端。
內容描述性元數據正是在非結構化口述文本與結構化存取之間架設橋梁的主要工具,但這些元數據的標準化表達需要專業知識,通常不為以歷史學者為主的采訪人所掌握,從可行性與減輕訪談人員負擔來說,前端暫時不宜用標準化的受控元數據形成而需更寬松的方式,并將這種標準化交給后期專業人員。實際上,對本項目來說,或者對更廣泛的口述歷史普遍實踐來說,相關標準長期缺乏,如筆者曾一度努力要促成制定而未成的部分聲像檔案標準及口述歷史總體與特定領域的主題詞表,更不用說本項目相關的電影學主題詞表以及中國電影史主題詞表,乃至基于知識管理的電影知識本體與中國電影史本體的構建。有鑒于此,筆者在主要涉及這些內容描述性元數據采集的《采訪人形成元數據表》與《受訪人(目標人物)生平年表》中規定的相關事項為關鍵詞而非主題詞,包括國際國內慣例的人名、地名、事件名、機構名等加上本項目特殊的影片名、角色人名、出版物以及專業話題等,并做出有限限定,即按慣例規定采用“規范化全稱或通用簡稱”并明確這種標準化不影響口述文本本身的非標準的口語化表達。
盡管如此,即便是采訪人不夠標準化的關鍵詞描述,也為標準體系的制定累計了素材,例如中國電影人口述歷史項目5000小時的全方位訪談所包含的海量表達,更重要的是,諸多成員很早即開始對每盤磁帶以關鍵詞標注該時段記錄的主要內容。新規范同樣將這種內容描述性元數據的填寫細化到類似磁帶的每個記錄單元,不僅細化了內容描述,同時也有助于后期基于內容管理的文本地址標定。
《受訪人(目標人物)生平年表》尚未在其他實踐中看到類似做法,但這一流程極高的性價比促使筆者頗為自信地將其列入規范。從投入來說,中國電影人口述歷史項目基于口述人生命歷程進行的全方位訪談特征,使得對受訪人或目標人物的經歷全面了解是早先制定的案例式慣例中的一個必備步驟,本身已接近制定生平年表。在實際訪談實踐中,筆者因故意打破時間順序提問的習慣反過來需要自己頭腦中清晰的受訪人生平時間線而經常自行編制其生平年表。筆者認為即便是那些專題性口述史仍需受訪人生平來建立口述證據性與言語的主客觀環境信息,受訪人生命歷程對于其口述內容偏向乃至史實考證具有重要意義。新規范的年表則將這種生平信息結構化(時間、地點、機構、事件),首先有助于這份口述歷史記錄自身的內容控制,因為這一結構化數據庫也可視為其訪談內容綱要;其次是構成整個項目整體人物經歷框架;第三是構成全國人物生平年表聯網,并可提供相應的歷史信息全網定位;最后也是構成中國電影史料庫乃至中國電影史、中國電影知識庫的經緯框架,建立起口述歷史資源與其他電影知識資源的關聯。生平年表中的受訪人聯系信息,也是知識管理已經顯性化的知識進一步與隱性知識建立關聯的橋梁。實際上,就電影史研究來說,對人物生平信息的需要已被一些電影研究者高度重視。[29]項目產生的生平年表由受訪人為主、采訪人協助核定,最后由雙方簽字的方式生成,具有獨特的史料價值。
4.3.3 保密控制
保密控制是可獲取性控制的重要方面,不僅涉及到口述歷史倫理問題,也是對文本傳播范圍有效控制的依據(包括擴大公共獲取和限制公共獲取兩個方面)。中國電影人口述歷史項目從一開始就有明確規定并在國內處于領先地位。此前這種保密控制是通過最后協議來規定,基于訪談前后訪談雙方對此問題的口頭溝通細節,并由受訪人最后確定。除受訪人的限制外,口述歷史公開計劃如編纂也存在一個基于項目方或傳播方考慮的限制措施,通常比受訪人的限制條件更加嚴格以避免法律與倫理糾紛。
新的規范需要對此做出更加程式化和可靠的元數據存留。通過對本項目近五百位受訪人的保密規定的分析,保密原因主要來自文化政治、人際關系及個人隱私三個方面。新規范更進一步以表格列舉的方式將此信息結構化——也為將來密級描述的全國標準提供素材。表格主要基于采訪人的判斷填寫,也可供受訪人在訪談后確定自己的協議條件時參考(訪談結束后受訪人往往會忘記自己說過的細節,也不確定哪些需要保密,此前采用的一種補救方式是在訪談現場用言語在需要保密的內容前后直接加以說明)。填寫方式是訪談中按次在相應的敏感項目上做記號,確定敏感信息的大致數量與地址。敏感項目的進一步細化和擴充,主要參考博伊德為納恩口述歷史中心(Nunn Center)提出的采訪人自己把控的六個問題。[30]當然,同樣也不得影響口述歷史本身的講述,包括受訪人不愉快情況下終止執行的規定,也同樣如博伊德所說,敏感信息的標注并不意味著一定會限制公開使用,但卻是參考依據。很簡單,口述歷史陳述本身的目的是盡可能真實講述,例如講述內容可能導致任何一方面臨刑事起訴與行政處罰等超越歷史目的的情況,也只是限制其公開范圍而不限制對真實事件的陳述。這無關社會正義,口述史不是審訊也不是審查,即便關乎正義也是歷史評價的正義。
口述歷史是人為發明的一種人類個體記憶的紀錄實踐,幾乎所有的理論問題都來自實踐領域,至少在初期,實踐依賴是其基本屬性。很多國內外學者認為,這個領域包括前端控制在內的規范化仍然是一個遠遠未能成熟的工作。研究者需要大量的親身實踐,實踐者需要有理性思考。實踐所產生的紀錄成果也需要全社會的網絡化整合,從而形成整體層面上的社會信息控制。因此,實踐者之間具體操作規范的交流與溝通及其重要。例如,筆者采用場記板在原始記錄的視聽文本上做出視覺的內容標板,這一想法很早就在考慮,但因為距離國內普遍做法過遠而長期停留在“想法”的狀態,直到在與崔永元口述歷史中心的趙一工先生溝通時,獲知美國加州大學洛杉磯分校(UCLA)也采用了類似做法,才有了自信并加入規范之中。換句話說,相互的實踐交流不僅能走向標準化,也鼓勵規范化進程中的創新。
實際上,口述歷史領域的現有問題也都來自實踐,也需要在實踐中解決。那些依托他人實踐做出的研究往往會走向偏差。中國電影人口述歷史項目的特征使之具有思考這些問題的獨特優勢,包括前端控制系統規范的發起,并在實踐中說明了前端控制的必要性以及可以帶給這個領域的前景。口述歷史的前端控制來源于檔案學,但又有自己的特征,因為其文本生成相比其他檔案材料更加缺乏規范,其生成的過程也面臨更多的工作安排與倫理等方面的復雜情況,從而需要確立一些原則。其主要內容依據其口述文本文獻生成的特征可以分為社會歷史價值的控制,證據性的控制,以及公共可獲取性的控制。當然,這僅僅是初步的探討,數字技術的發展也會產生新的問題、需要與創新機遇,同時也仍然希望全國同行的共同努力與交流。