文/李點
數(shù)字人文的何作何為、何去何從是數(shù)字人文學(xué)科建設(shè)中的“天問”,從其問世之日起從未停息。在人類科學(xué)史上,所有新興學(xué)科都在懷疑和質(zhì)詢的聲音中生長成型,數(shù)字人文也不例外。在加利福尼亞的硅谷,“炒作周期”(hype cycle)是一個廣為人知的術(shù)語。這個具有自嘲意味的術(shù)語描繪的是一般高科技公司發(fā)展成熟的五個周期,依次是“科技起因”“過度期望的高峰”“失望的低谷”“啟迪的山坡”和“生產(chǎn)效率的高原”。
這個卓卓有名的“炒作周期”理論是否能有效地解釋高科技公司的成敗興亡另當(dāng)別論,但數(shù)字人文目前處于“失望的低谷”已從個別學(xué)者的竊竊私語幾乎變成了學(xué)界的共識。跟前期的激烈批評不同——那時一些捍衛(wèi)傳統(tǒng)人文的學(xué)者往往對數(shù)字人文持徹底否定的立場,而近期的批評則來自數(shù)字人文的參與者,是一種反思與自省式的批評,有點恨鐵不成鋼的意味。弗朗科·莫瑞狄(Franco Moretti)可以算是這類批評的最好代表。莫瑞狄既是著名的傳統(tǒng)比較文學(xué)學(xué)者,也是公認(rèn)的數(shù)字人文的奠基者之一,他提出的“遠(yuǎn)讀”(distant reading)的概念已成為數(shù)字人文的一個標(biāo)識。然而在最近一次有關(guān)數(shù)字人文的對談里,他對數(shù)字人文的學(xué)科現(xiàn)狀卻表露出相當(dāng)悲觀的情緒,認(rèn)為“[數(shù)字人文]已取得的成績并不令人滿意……數(shù)字人文自己號稱是了不起的新事物,然而至今為止我們拿不出什么證據(jù)證明如此”。莫瑞狄想傳達(dá)的是對數(shù)字人文真切而又執(zhí)著的關(guān)懷,同時也是對數(shù)字人文目前處于“失望的低谷”的焦慮。焦慮的根源在數(shù)字人文的研究現(xiàn)狀與我們對它的“過度期望”不相般配,這是莫瑞狄的個人意見,但他很顯然綜合了眾多批評者的聲音。
數(shù)字人文孵育于20世紀(jì)六七十年代,成型于八九十年代,自2004年正式命名之后,進入迅速發(fā)展的時期,相當(dāng)于前文所說的“過度期望的高峰”。迄今為止,數(shù)字人文當(dāng)然不是一無所成;恰恰相反,它可以說是從無到有,碩果累累。除了海量的制作(圖像、數(shù)據(jù)和編碼)、論文和專著以外,數(shù)字人文的成果主要表現(xiàn)在學(xué)科本身的制度化建設(shè),包括研究中心、專業(yè)協(xié)會與行業(yè)學(xué)術(shù)刊物。數(shù)字人文的制度化建設(shè)的迅猛發(fā)展離不開充足的科研經(jīng)費支持,這方面數(shù)字人文相比傳統(tǒng)人文有明顯的優(yōu)勢,因為其與電腦科技的交叉得以模仿現(xiàn)行自然科學(xué)體制的操作模式,從而取得公共資源與私立基金會的資助。
然而,制度化建設(shè)的成功并不是一個學(xué)科成熟的決定性標(biāo)志,有效研究成果及其影響才是。迄今為止,數(shù)字人文領(lǐng)域內(nèi)發(fā)表的成果雖然非常可觀,可是真正令人滿意的杰作卻是鳳毛麟角。這正是莫瑞狄焦慮的根本原因所在,所以他對數(shù)字人文未來的工作提出如下建議:“也許數(shù)字人文接下來要做的最重要的事情是了解自己的研究成果的性質(zhì),也就是如何評估的問題。同時,我們必須反思為什么生產(chǎn)優(yōu)異的成果如此之難,盡管我們的精力、人才和工具一樣也不缺。”
數(shù)字人文研究成果的評估困難恰恰來自這個學(xué)科的新穎之處:即把數(shù)據(jù)分析帶入文本分析,通過其產(chǎn)生的統(tǒng)計性的數(shù)量化結(jié)果而導(dǎo)出新的結(jié)論,產(chǎn)生新的知識。經(jīng)過幾十年的努力,數(shù)字人文的這種工具理性的價值已經(jīng)得到了制度化的肯定,可是它的價值理性必須納入現(xiàn)有的科學(xué)評估體系,包括傳統(tǒng)人文的價值評估范式。很顯然,數(shù)字人文的數(shù)量化文本分析方法跟傳統(tǒng)人文的質(zhì)量化分析方法是有區(qū)別的,因此要想建立一個統(tǒng)一的標(biāo)準(zhǔn)是件困難的事。所以早期的數(shù)字人文學(xué)者處于相對獨立的狀態(tài),在學(xué)術(shù)領(lǐng)域的邊緣地帶獨自辛勤耕耘。進入21世紀(jì),數(shù)字人文的潛在學(xué)術(shù)價值不再令人懷疑,但是如何在現(xiàn)有的學(xué)術(shù)體系中評價數(shù)字人文研究成果引起了持久的爭議,這首先對于數(shù)字人文學(xué)者的求職、升遷和獎勵具有實際意義。有鑒于此,美國現(xiàn)代語言協(xié)會(Modern Languages Association)于2000年發(fā)布了關(guān)于評價數(shù)字人文與數(shù)字媒介學(xué)術(shù)成果的指導(dǎo)性建議,并于2012年更新。這份建議首先肯定數(shù)字媒介對教授職能在讀寫文化、學(xué)術(shù)研究、教學(xué)實踐及公共服務(wù)方面帶來的巨大變化,而數(shù)字人文代表的方法和理念是延續(xù)和張揚人文精神新的知識渠道。由于數(shù)字人文學(xué)科本身的繁復(fù)和多樣,這份建議并沒有給出非常具體的評價標(biāo)準(zhǔn),只是強調(diào)在傳統(tǒng)學(xué)術(shù)評價規(guī)則的框架之下包容更為廣泛的研究成果樣式,如電子出版物、開源期刊及數(shù)字與圖像制作。
事實上,數(shù)字人文的興起也得益于美國高等教育界自20世紀(jì)90年代以來對于高等教育的價值與目的的反思,包括有關(guān)學(xué)術(shù)文化傳統(tǒng)的重新認(rèn)識。1990年,著名教育學(xué)家歐內(nèi)斯特·博耶(Ernest Boyer)發(fā)表了影響深遠(yuǎn)的研究報告《重估學(xué)術(shù):教授職業(yè)的首要責(zé)任》,主張在高等院校日益增加的社會責(zé)任和迅速發(fā)展的信息化科技的前景之下,要突破由來已久的研究即學(xué)術(shù)的傳統(tǒng)定義。他認(rèn)為教學(xué)與研究決然對立的思維已經(jīng)過時,提出了擴展學(xué)術(shù)定義的四點意見,即發(fā)現(xiàn)的學(xué)術(shù)、整合的學(xué)術(shù)、應(yīng)用的學(xué)術(shù)和教學(xué)的學(xué)術(shù),這四點意見基本上規(guī)范了之后關(guān)于學(xué)術(shù)文化的變革方向。
當(dāng)今的美國高等教育與學(xué)術(shù)文化在很多方面已經(jīng)發(fā)生了巨大的變化,如大學(xué)財政與管理的企業(yè)化、學(xué)科交叉的制度化、在線與多媒體教育科技的普遍化等。數(shù)字人文在這個大環(huán)境中迅速發(fā)展成型也是順乎自然的事情。至少在博耶所提倡的學(xué)術(shù)文化新定義的三個方面,即整合的學(xué)術(shù)、應(yīng)用的學(xué)術(shù)和教學(xué)的學(xué)術(shù),數(shù)字人文發(fā)揮其先天的優(yōu)勢。我們注意到博耶把“發(fā)現(xiàn)的學(xué)術(shù)”列在第一位而突出其重要性。發(fā)現(xiàn)意味著創(chuàng)造、發(fā)明,是產(chǎn)生和傳遞新知識的基礎(chǔ),也是貫穿一切科學(xué)話語之中的核心價值符號。在這方面,數(shù)字人文的表現(xiàn)是不能令人滿意的。一如弗朗科·莫瑞狄的悲觀論調(diào),我認(rèn)為目前數(shù)字人文處于“失望的低谷”的說法并不過分。
那么數(shù)字人文目前面臨的挑戰(zhàn)是什么呢?筆者認(rèn)為,一是評估體系的自我指涉,二是闡釋理論的放棄。前者導(dǎo)致數(shù)字人文研究的自我封閉,大量的研究成果自娛自樂,而得不到人文學(xué)界的認(rèn)可,更不能滿足“發(fā)現(xiàn)的學(xué)術(shù)”的范式要求。后者傾向于過度相信數(shù)據(jù),視之為自在、自明的文本,把文本解讀簡化于數(shù)據(jù)統(tǒng)計和數(shù)字推理。兩者雖然在研究過程和成果呈現(xiàn)中表現(xiàn)不同,實質(zhì)上都源于方法的理性化,即以工具理性為目的的實驗主義哲學(xué)。
數(shù)字人文的學(xué)科立足點是對源數(shù)據(jù)的量化分析。對于這種分析的有效性的驗證來自兩個方面,第一是采集源數(shù)據(jù)的工具是否運行正常,第二是這個運行正常的工具所得出的結(jié)論是否可靠。常見的數(shù)字人文研究多注重于第一方面而輕視第二方面,或者把兩者混而為一。這里的“工具”是指替代人眼閱讀的機器閱讀,包括研究者依據(jù)電腦編碼語言定制的各種處理文本的專用應(yīng)用程序,或由高科技公司及行業(yè)研究機構(gòu)開發(fā)的智能數(shù)據(jù)庫與通用閱讀器,其中最有名的是由谷歌于2010年推出的“N像閱讀器”(Ngram Viewer)。這個閱讀器可以瞬時“閱讀”谷歌書庫中的海量文本,所以自問世以來成為數(shù)字人文研究者津津樂道的工具。因為其聲望和影響,關(guān)于數(shù)字人文的評估爭議也集中體現(xiàn)在N像閱讀器的功用和效率上面。
N像閱讀器實際上是一個計算機搜索引擎,它通過人為輸入的任意關(guān)鍵詞組合而給出詞語頻率和相聯(lián)關(guān)系的圖標(biāo)或數(shù)據(jù)統(tǒng)計。這種閱讀完美體現(xiàn)了莫瑞狄先于N像閱讀器所猜想的“遠(yuǎn)讀”的內(nèi)涵,因為“遠(yuǎn)讀”的實質(zhì)就是借助于數(shù)字化手段的泛讀,在海量的文本里通過“分析修辭、主題、借喻、風(fēng)格和系統(tǒng)性來尋找范式和模型”。顯而言之,完成這樣的閱讀非N像閱讀器莫屬。事實上,弗朗科·莫瑞狄身體力行,通過N像閱讀器,較早地提供了一個關(guān)于“遠(yuǎn)讀”的研究案例,即考察1740年到1850年之間出版的7000部英國小說中所體現(xiàn)的作家在小說主題和遣詞造句中的性別意識,這是數(shù)字人文早期研究一個典范性的成果。
然而,借助N像閱讀器的遠(yuǎn)讀功能而產(chǎn)生的結(jié)論的學(xué)術(shù)價值并非毫無爭議,最常見的批評是它們往往只是證實已知的常識,而非創(chuàng)造了新的知識。美國學(xué)者艾拉茲·埃登(Erez Aiden)和讓-巴蒂斯特·米歇爾(JeanˉBaptiste Michel)合著的《未知的疆域:大數(shù)據(jù)作為探究人類文化的棱鏡》是一個體現(xiàn)了數(shù)字人文的承諾與局限的例子。這兩位學(xué)者置身于信息化時代的宏觀視野,宣稱“大數(shù)據(jù)革命”不光會改變我們?nèi)绾握J(rèn)識自我,還會改變?nèi)宋暮蜕鐣茖W(xué)的性質(zhì),并重新定位商業(yè)化社會與大學(xué)這個象牙之塔的關(guān)系。基于這個宏觀視野,他們的關(guān)注點是大數(shù)據(jù)的歷史痕跡和社會影響。于此,他們依據(jù)N像閱讀器所提供的抽象數(shù)據(jù)語言來解釋許多歷史和社會現(xiàn)象,其中一個案例是該書第五章《沉默之聲》對納粹德國的藝術(shù)審查制度的研究。他們檢索發(fā)現(xiàn),許多著名現(xiàn)代藝術(shù)畫家像馬克·夏加爾(Marc Chagall)、保羅·克利(Paul Klee)在德國1933—1945年間出版的書籍中幾乎不見蹤影,這說明納粹德國已成功地根除了作為“頹廢藝術(shù)”的現(xiàn)代派藝術(shù)。這個結(jié)論,正如批評者所言,毫無新意,至多提供了關(guān)于納粹德國焚書禁言的一個細(xì)節(jié)。它代表了很多數(shù)字人文學(xué)者在構(gòu)思研究課題時的致命缺陷,即為已知的問題補充顯然的答案。
如此看來,埃登和米歇爾的成就只能說是在整合與應(yīng)用的學(xué)術(shù)方面有所貢獻(xiàn),而在發(fā)現(xiàn)的學(xué)術(shù)方面則無所建樹。更恰當(dāng)?shù)卣f,他們證明了數(shù)字人文的工具價值,即N像閱讀器遠(yuǎn)讀的強大功能。作為N像閱讀器的發(fā)明者的團隊成員,他們對這個新穎的高科技“玩具”愛不釋手,不惜以近300頁的篇幅渲染其功能與價值,有一種“工具自戀”的意味。在數(shù)字人文界,這種工具自戀的確是一種常見的現(xiàn)象,尤其是在具有科技背景的數(shù)字人文學(xué)者當(dāng)中。這種現(xiàn)象反映了數(shù)字人文對高科技產(chǎn)業(yè)炒作文化的追隨,對其軟件程序產(chǎn)品的商品特性的警醒不足,從而把學(xué)術(shù)性和市場化混為一談。更為重要的是,工具自戀遮蔽了對工具本身應(yīng)有的批評維度,對軟件程序可能的偏見與局限視而不見,從而忽略其潛在的結(jié)果與效用偏差。在計算機科學(xué)的算法研究話語中,“垃圾進,垃圾出”(garbage in,garbage out)是一句很有反省意味的流行語,意指錯誤的數(shù)據(jù)輸入會產(chǎn)生荒謬的數(shù)據(jù)輸出。這不僅強調(diào)數(shù)據(jù)采集的人為前在性,也暗含算法程序的局限性。當(dāng)今許多基于算法程序的數(shù)字化商業(yè)產(chǎn)品,尤其是使用預(yù)測模型(predictive modeling)的數(shù)據(jù)采集系統(tǒng),在種族、性別與社會弱勢群體方面都表現(xiàn)出不同程度的偏見與歧視。谷歌的N像閱讀器及其伴侶谷歌書庫也不例外,它們眾多的缺陷如書目選擇的隨意性、科目類別的代表性以及光學(xué)掃描的文字誤差都可能引發(fā)遠(yuǎn)讀的失真。
毫無疑問,數(shù)字人文不能放棄對數(shù)字化工具的批評,但這不意味著放棄數(shù)字化工具本身。數(shù)字人文,從根本上來說,就是用數(shù)字化工具來回答傳統(tǒng)人文的問題。對于任何一項數(shù)字人文研究,工具的重要性不言自明,而問題則更為重要。“正確”的問題應(yīng)該體現(xiàn)人文精神的精髓,即代表人類對經(jīng)驗的超越和對未來的構(gòu)想,指向增進理解和培育共情,其預(yù)想的答案一定含有發(fā)現(xiàn)的學(xué)術(shù)內(nèi)容,并經(jīng)得起現(xiàn)有學(xué)術(shù)評估體系的考驗。在研究過程中,這個“正確”的問題與數(shù)字化工具碰撞、交融、磨合,有可能變成無意義的問題,也有可能變形為其他的問題,或引發(fā)出別樣的衍生問題,這也許是數(shù)字人文研究不同于傳統(tǒng)人文研究的地方。這種問題為重、工具為輔的研究構(gòu)想已經(jīng)在一些成功的數(shù)字人文學(xué)者那里體現(xiàn)出來,比如英國學(xué)者梅爾芭·卡迪-基恩(Melba CuddyˉKeane)及其合作團隊關(guān)于“現(xiàn)代主義的關(guān)鍵詞”的研究項目。這項研究在一定程度上揭示了成功的數(shù)字人文研究的構(gòu)想與思路:預(yù)設(shè)的關(guān)鍵詞通過遠(yuǎn)讀得到證實或修正,新的關(guān)鍵詞形成數(shù)據(jù)鏈或圖標(biāo)、曲線,指向潛在的范式、模型,通過再次閱讀而連接傳統(tǒng)人文的課題,從而厘正已知的知識或創(chuàng)造新的知識,最終體現(xiàn)發(fā)現(xiàn)的學(xué)術(shù)文化價值。
如果說數(shù)字化的遠(yuǎn)讀一向是數(shù)字人文研究最重要的方法,那么現(xiàn)在已經(jīng)到了重新考慮它的涵義的時候。首先,我們必須摒除莫瑞狄最初所設(shè)想的遠(yuǎn)讀與近讀(close reading,又譯“細(xì)讀”)完全對立的立場,重新認(rèn)可近讀的闡釋功用。遠(yuǎn)讀是機器的閱讀,是初級閱讀,它提供了關(guān)鍵詞的譜系;近讀是人的閱讀,是再次閱讀,它為關(guān)鍵詞添加時空的坐標(biāo),然后為人類關(guān)注的現(xiàn)實性問題或終極問題給出可能的答案。遠(yuǎn)讀與近讀的糅合不應(yīng)被視為對數(shù)字人文學(xué)科特性的消解;恰恰相反,它應(yīng)被看作是電腦科技和傳統(tǒng)人文的交叉性的標(biāo)志。無論如何,數(shù)字人文的研究對象依然是文本,雖然這是數(shù)字化的文本,也可以說是文本的文本,文本性是其本質(zhì),而發(fā)現(xiàn)文本性及其意義依然是闡釋學(xué)的范疇。數(shù)字化工具為我們提供了逼近文本隱喻(allegory of textuality)的新手段,而研究者用心的近讀和機器強大的遠(yuǎn)讀仍然是領(lǐng)悟文本隱喻的必然途徑。
綜而論之,偏重數(shù)字工具還是重視學(xué)術(shù)發(fā)現(xiàn)是當(dāng)今的數(shù)字人文面臨的一個抉擇。如果我們只是繼續(xù)或重復(fù)早期數(shù)字人文學(xué)者的研究思路,把編碼制圖作為首要任務(wù),止步于采集新的數(shù)據(jù)來證明已知的結(jié)論,那么數(shù)字人文將不會得到學(xué)界的尊重,永遠(yuǎn)處于失望的低谷之中。數(shù)字人文的突破之路在于把關(guān)注的重心從工具理性的自我把玩轉(zhuǎn)移到外向性的、可傳達(dá)的發(fā)現(xiàn)性學(xué)術(shù)。這要求我們重新思考數(shù)據(jù)本身的價值及其對于人文研究的意義,相信數(shù)據(jù)的言說意義,但不迷信數(shù)據(jù)是社會現(xiàn)實的絕對、唯一的再現(xiàn)。在當(dāng)今“數(shù)據(jù)崇拜”風(fēng)行一時的數(shù)字化時代,這當(dāng)然是一件很難的事情。然而,因為數(shù)字人文占有數(shù)字工具技術(shù)與人文傳統(tǒng)精神的雙重優(yōu)勢,數(shù)字人文學(xué)者對于破解這個難局負(fù)有義不容辭的責(zé)任。正因如此,我對數(shù)字人文的未來仍然抱有期待和希望。