【摘要】中華文化數據庫的建構需要傳統出版業提供豐富的資源,更需要基礎、邏輯和傳播形態的古今融通。在內容上,出版業的數字化要注重商業性與公共性的協調;在體系上,中華文化數據庫的文化性和體系性應充分借鑒傳統典籍文獻匯編經驗,破解“知網難題”和“古籍難題”;在傳播上,中華文化數據庫要注重文化創新以及其對公眾日常生活的嵌入。中華數字文明應以一種官方、學界、商界與公眾四維共存、相互制衡的理想文化生態為前景。
【關? 鍵? 詞】中華文化數據庫;數字文明;出版業;轉型
【作者單位】林瑋,浙江大學影視藝術與新媒體學院。
【基金項目】本文系國家社科基金一般項目“人工智能時代的傳播倫理與治理框架研究”(20BXW103)的階段性成果。
【中圖分類號】G239.2【文獻標識碼】A【DOI】10.16491/j.cnki.cn45-1216/g2.2022.16.010
2022年5月,中共中央辦公廳、國務院辦公廳印發《關于推進實施國家文化數字化戰略的意見》(下文簡稱《意見》),明確提出8項重點任務,第一項即為“統籌利用文化領域已建或在建數字化工程和數據庫所形成的成果,關聯形成中華文化數據庫”。這是一項具有重大歷史意義的文化工程,中華文化數據庫的建成將標識著中華文化進入物理層面的元宇宙時代。為推進這一工程,中華文化各領域的基礎設施數字化與數據采集、分發和傳輸標準的統一化亟須提上日程。其中,出版領域具有重要的主體意義,這是因為在電子媒介出現之前,中華文化物態呈現主要體現在出版領域,建構中華文化數據庫維系于出版業轉型。
即便在互聯網高度發達的今天,出版物仍然是信息傳輸的重要載體。圖書館仍矗立在中心位置,將知識養料輸送到社會的每個角落,并經常借助電子網絡直達網絡空間的最遠端[1]。但顯而易見的是,這一形態將在元宇宙時代發生改變:物理空間里的圖書館或閱覽室可能依然矗立,但其內涵發生了根本性變化——圖書館內迅速流通的不再是大量紙質書籍,而是伴隨各種提示燈頻繁閃爍的數據流。這種數據流在信息形態上具有標準化特征,二進制代碼全球劃一。就內涵和架構來說,數字化的中華文化應體現古今融通的中華文明特殊性,從而使中華文化在數字化時代仍然能夠存續、衍生和發展,這就需要回到數字文明形態的信息層面來探索出版業轉型,研究傳統出版業如何融入中華文化數據庫。
數據庫不是數據的堆砌與集合,而是按照一定格式組織起來存放的,通常是按照數據模型組織起來的,是長期存儲在計算機內、有組織、可共享的數據集合[2]。也就是說,數據庫具有很強的組織性和結構性,這種結構性本身可能以技術的中立面貌遮蔽其價值立場和理性,計算機語言同樣可能包含現代語言所指認的語言結構,后者是一個涉及人們社會存在的顯現方式,包含敘述、理性、真理等意義的綜合概念[3]。因此,考究出版業轉型與中華文化數據庫建構關聯,有必要從不同維度分析傳統出版與數據庫傳播之間的關系。本文嘗試從文化意義上討論傳統出版業融入中華文化數據庫建構的不同維度,從中延伸出中華數字文明的核心概念,為中國出版業的轉型提供理論參考。
一、基礎:數字出版資源的商業性與公共性
《意見》提出,中華文化數據庫的形成應統籌利用文化領域已建或在建數字化工程和數據庫所形成的成果。對于出版業來說,數字化工程已有較長時間的積累。早在2004年12月,谷歌就與紐約公共圖書館、哈佛大學、斯坦福大學、密歇根大學、英國牛津大學圖書館啟動了數字圖書館計劃,將全球數千萬冊圖書數字化并上傳至網絡。同時,谷歌推出Google Scholar檢索服務,在一定程度上引領(甚至部分取代)了傳統圖書館。不過,不少研究指出,谷歌數字圖書館計劃最大的問題在于其商業公司屬性,這不僅可能造成數據庫結構的傾向和偏見,而且會導致出版資源的商業壟斷。
我國出版行業的數字化始終處于多元競爭中。期刊數字化平臺建設領域除了知網,還有萬方、維普等平臺的介入。相比之下,傳統圖書的數字化雖然前期投入大,收益周期長,但其市場規模巨大,競爭也更加激烈。圖書出版的數字化轉型主要體現在兩個方面。一是商業出版數字化,除紙質圖書電商轉型之后出現的數字閱讀企業(如京東閱讀、當當閱讀)外,商業出版數字化的主要開發主體是體量極大的電信運營商(如中國移動的咪咕閱讀、中國聯通的沃閱讀、中國電信的天翼閱讀)和互聯網巨頭(如騰訊的QQ閱讀、微信讀書,百度閱讀、網易蝸牛讀書等)。此外,以硬件起家的掌閱、海信、文石等數字閱讀企業也占有一定的市場。二是古籍出版數字化,目前我國古籍出版的數字化任務主要由代表公共性利益的社會部門如圖書館、博物館等承擔,入選國家珍貴古籍名錄的古籍的數字化由省級圖書館承擔,各地圖書館、博物館藏的古籍珍本善本的數字化則由各地自行完成。如山西博物院對館藏的五千冊古籍善本進行數字化;山西大學圖書館對館藏的三千種碑帖拓片進行數字化;中國國家圖書館從2010年開始與美國哈佛大學圖書館開展古籍善本數字化合作項目,對海外4200多種漢籍善本進行數字化處理后上網免費公布,有效實現了海外漢籍善本的回歸;復旦大學圖書館的數字化平臺及加工項目將館藏古籍中獨具特色的抄稿本進行數字掃描,研發檢索平臺,并在網上公布,很好地體現了傳統出版的公共性。
商業出版和古籍出版兩種出版資源的數字化,各自存在明顯的問題。就商業出版而言,其數字化領域迄今仍處于各自為陣的發展階段,突破性的融合還有待觀察。這是因為閱讀行為本身偏于私密,各家閱讀軟件的閱讀體驗感也不盡相同,因此均有其各自的利基市場。如2015年上線的微信讀書,主打“閱讀+社交”,口號是“讓閱讀不再孤獨”,其閱讀評論設計能夠讓一本書中的一句話推動數百人互動評論,有效地積累了數字化的出版資源,人們不僅因為圖書本身產生閱讀行為,而且因評論區中的觀點交流而深化閱讀體驗。相比之下,網易蝸牛閱讀則將評論(批注)與問答(提問)分開,突出專業問答體驗,使閱讀從社交走向知識生產與傳播。不同的閱讀軟件滿足不同閱讀群體的偏好,均有自己的忠實用戶群,在基層邏輯上很難實現統一。就古籍出版而言,其數字化領域面臨的最大問題是資金不足。中華古籍卷帙浩繁,盡管早在20世紀80年代,全國圖書館文獻縮微復制中心就開始帶動各地公共圖書館進行古籍善本的縮微膠片翻拍制作工作,但工作開展至今,縮微膠片能突破的古籍傳播困境依舊杯水車薪。此外,目前各大圖書館開展的古籍數字化工程存在標準不一、數據庫形態(如分類標簽、檢索體系等)不一等問題,很難自動與中華文化數據庫相關聯,呈現割裂趨勢。
在基礎層上,出版資源的數字化是一個宏觀難題。一方面,知識是社會之公器,它不應該被定價和買賣。另一方面,出版資源數字化工程的前期投入和用戶體驗要求極高,依靠公共部門難以完成。就此而言,以政府投入為主,倡導知識分子廣泛參與,借助民間商業力量的中國傳統出版格局值得借鑒。盛世修典是中華文治傳統的重要體現,大型文化資源的匯編與出版,乃王者所以樹風聲,流顯號,美教政,移風俗[4],歷代史書均有經籍志或藝文志加以記載,如明代的《永樂大典》、清代的《古今圖書集成》和《四庫全書》等,都可視為中華文化數據庫的前身,其以官方主導,而其過程主要依靠知識分子。當代中華文化數據庫的建構,可以廣泛發動網民(用戶)參與,在提高入庫標準的同時,以互聯網思維鼓勵多、散、雜、匿的互聯網用戶投入監督和建議中,或能在一定程度上避免商業出版的“知網難題”和公共出版的“古籍難題”。盡管中華文化數據庫基礎層的打通主要靠技術推動,但如果沒有積極主動的參與者,特別是沒有足夠彰顯官方、學界(包括出版界)和大眾的三方互動關系,是很難實現的。
二、邏輯:出版信息檢索的文化性與體系性
數據庫的建立需要對匯聚的信息進行富有邏輯性的整合,使其易于檢索。廣羅群籍之后,更重要的是分門別類,才能統為一書。如果說在基礎層上,中華文化數據庫主要體現的是數據性,那么邏輯層體現的是中華文化數據庫的文化性。不同的文化對信息匯編有著不同的認知,從而可能導致不同文化體系的形成。
作為數據庫前身的文獻信息匯編,在中國曾發生兩次巨大轉型。一次在乾隆年間,以《四庫全書》為代表,匯編原文的全書傳統取代了由三國《皇覽》開啟的類書傳統。后者是以類相從的編撰形式,分“天地”“人事”“萬物”等篇章,再設不同子目,如《藝文類聚》“人部”下就有“圣”“賢”等子目。乾隆皇帝下詔編修的《四庫全書》則網羅天下所有古今載籍的全書,它不分類目,而要“悉載全文,使閱者沿流溯源,一一征其來處”[5],此即論者所言:“當時實為類書時代告終之期,而進于求讀原書之新時代。”[6]二是在宣統年間,以《普通百科新大詞典》為代表,分條列敘的百科傳統進入中國,目的是便于“教員考檢、學子自修”[7]。這一演進標志著文化體系的轉型,也體現了中西文化交流的成效。有論者指出:“如果說中國傳統文化的知識結構是類書型的,那么中國近代文化的知識體系已經轉向了百科全書型。”[8]
從類書到百科全書,區別是顯著的。類書是分門別類匯集前人著作,百科全書則是把各種知識、事物、人物原原本本地加以敘述,用條目形式編成一篇一篇的文章,特別是把最新的知識作系統的、全面的介紹[9]。而就中華文化數據庫的建構來說,類書、全書與百科三者的結合不只是技術性的信息科學,更需要體現中華文明對文化信息和文獻匯編的深刻把握,尤其在體例、體系和檢索上要突出中華特質,使其邏輯架構具有充分的中華文化性。
不同的文化對知識體系的理解是迥異的。福柯在《詞與物》的前言中提及博爾赫斯對“某種中國百科全書”中出現的動物進行分類,曾引發知識界的廣泛討論,很多人認為福柯過分強調了中國文化的特殊性以及中西文化之間的差異性。而有研究者從博爾赫斯的原文考究中發現,作者的原意是“當我們用語言整理世界時,即把文化強加于自然之上時,不論采用什么分類法,都只可能是混亂的”“這是各民族文化的普遍遭遇”,博爾赫斯的論述“正是這種混亂的頌歌”[10]。無論是福柯還是博爾赫斯,思想家總是有其超越時代的判斷,但落實到具體的文獻匯編中,其信息架構的邏輯必然呈現某種文化性。可見,中華文化數據庫在建構過程中應充分吸收我國傳統出版業的思想和制度性遺產。
當知識被轉化為二進制的代碼,數據庫的體系性即被隱藏在算法之后。多數數據庫文獻檢索的架構指標無非相關度、發表時間、被引、下載、綜合5個維度,工具性強而文化性弱。在互聯網信息檢索上,百度競價排名更是一度傳為“惡法”,顯現了商業性對文化性的侵蝕。中華文化數據庫的邏輯架構應力避商業性,同時也不應只具備單純的工具性,而要在盡可能體現中華文明文化觀、價值觀的同時,借鑒互聯網思維,發揮知識公器價值,突出社交屬性、圈層傳播,倡導知識社群在數據庫中自我繁衍。中華文化數據庫可以嘗試配套知識社區,將知乎、得道等成熟的知識生產和傳播模式納入其中,以具有公信力和正確價值取向的算法,保證數據庫的使用不只是小群體的偏好,這是其在智能互聯時代對學者發出“只有使用才能實現古籍文獻保存的意義”呼喚的根本性回應[11]。
三、傳播:出版文化消費的場景性與體驗性
從表面上看,數據庫的建構是為了更好地實現文獻信息的留存和傳播,而其實質是要實現文獻信息的利用。在大數據、云計算和區塊鏈等互聯網技術從底層邏輯上改變文獻信息存在形態的今天,以深度學習—算法推送為進路的知識傳播,要求“只有使用”才能不斷優化數據庫的運行,實現更新迭代。“只有使用”不應局限于知識人群體,中華文化數據庫的建構更要著眼于消費場景的創新,特別是增強中華優秀傳統文化在當代年輕人生活中的存在感。
目前,由國家圖書館制作的中華古籍資源庫,已經可以實現免登錄閱覽10萬部件;中國數字文化集團已經建成國家舞臺藝術影像庫、中國傳統音樂數據庫、非物質文化遺產數據庫等多個數據庫。這些數據庫如何在新的文化消費場景中作為信息傳播的提供方,以多種形態的相互交織催生新的文化創意、內容敘事,進一步豐富人民群眾的日常生活,賦能文化創新,提升國家文化軟實力,是中華文化數據庫在關聯形成過程中要思考的重要問題。
在內容上,不同文化領域已建或在建數字化工程和數據庫,在統籌利用的關聯過程中,需要高度注重算法問題。再龐大的數據庫在使用的過程中也往往是聚焦于個體的。有國家工程背書的中華文化數據庫建構,最終也需要貼近用戶本身,互聯網技術發展的前景就是為用戶個人打造一個智慧型和個性化的網絡[12]。知識生產與傳播的算法推送不同于信息市場的商業策略,其目的絕不是為了賣出廣告,也不是為了純粹的社交(形成圈層)本身,而是激發閱讀行為,進而促成文化創新。對此,重要的是對商業算法的反向應用,避免基于瀏覽記錄的簡單算法使用戶停留在自己的認知舒適圈,應有意迫使其打破成見,產生思考,形成新的知識生產[13]。
在形式上,中華文化數據庫的使用應該突破屏幕,在跨屏傳播的基礎上進一步嵌入人們的日常生活,使“文化數據”無處不在。如借助穿戴式設備,讓國家圖書館出版社的中華古籍圖典數據庫、湖南大學的書院文化數據庫立體起來,讓中國人民大學出版社的中國思想與文化名家數據庫或學者個人制作的“唐宋文學編年地圖”“唐代邊塞詩文化挖掘研究數據集”等內容“活起來”。事實上,設備更新是文化發展的常態,如15世紀眼鏡的出現,“印刷術發明,書籍相對普及之后,眼鏡的需求增加”“更多、更好的眼鏡可能使得更多讀者得以變成更好的讀者,買更多的書籍,而為此緣故,眼鏡和知識分子、圖書館員、學者關系密切”[14]。把可穿戴設備視為眼鏡的重構,無疑是中華文化數據庫得以更好地融入群眾生活,展示文獻信息傳布的新前景,這需要信息科學、認知神經科學的持續助力。
在行為上,中華文化數據庫的使用應催生出更豐富、更具有沉浸式體驗感的文化生活。傳統出版激發的主要是閱讀行為,它調動的人的感官只有視覺。而進入數據庫時代的圖書出版,不但融入了“有聲書”“氣味閱讀”“觸覺閱讀”,還使文化內容敘事化、敘事IP化。如上海交通大學建立的中華文化內容IP數據庫,通過舉辦“當國寶遇見國漫”的公益活動,把傳統文化資源與影視、動漫、游戲、直播等數字文化相結合,獲得了熱烈反響。
四、前景:構建一種融通古今的中華數字文明
文化數字化的核心在于信息的留存與傳播。究其質而言,中華文化數字化與古代出版高度贊許的“刊布古書”是一致的。張之洞在《勸刻書說》中說道:“凡有力好事之人,若自揣德業學問,不足過人,而欲求不朽者,莫如刊布古書一法。”[15]這在古代是激發民間廣泛參與圖書編校出版的重要緣由,正是有“欲求不朽”的沖動,典籍的流傳才能成為現實。而進入數字化時代,傳統出版業融入數字文明,需要有一種新的理論作為支撐,使中華數字文明更為深刻且具有引領性。
在言及數字文明時,研究者會把目光聚焦在傳播界。在傳統媒體時代,我們把這種理性交往的語境或者實踐交給職業新聞人,即傳播者。而進入數字文明時代,當整個社會都變得可編程的時候,編輯作為把關人的缺失,導致一種新的生活形態在崛起初期伴隨著非理性(如網絡暴力)與混亂(如網絡謠言)。面對這一局面,單靠知識界的啟蒙作用將無力扭轉大局。而借鑒傳統出版業,特別是中國出版在歷史上形成的官方(政府)、書院(學界)、坊間(商界)三足鼎立的傳統模式,以中華文化數據庫的建構為核心,將能夠形成一種新的數字文化形態。在這一形態中,傳統出版格局需要被互聯網中的用戶打破,形成政府、學界、商界、公眾四維形態,四種形態之間有足夠的制衡機制,構成一種融通古今的數字文明。
在傳統社會,文字普及率不高,公眾參與度低,被學界代言的可能性高。而在當下,知識傳播需要知識人(學界)對社會進程,尤其是數字文明進程的廣泛參與來實現。就此而言,數字文明的形態也許不再以知識生產本身為核心,而是以公眾的日常生活為核心。官方參與可以保證文化或文明傳承的穩定性,學界參與可以保證其自反性和先鋒性,商界則可以不斷促發技術的優化,以滿足公眾的體驗感。這固然是一種理想的數字文明形態,也是出版業轉型所背負的傳統遺產在未來可能實現的愿景。
|參考文獻|
[1]羅伯特·達恩頓. 閱讀的未來[M]. 熊祥,譯. 北京:中信出版社,2011.
[2]陳紅順,黃秋穎,周鵬. 數據庫系統原理與實踐[M]. 北京:中國鐵道出版社,2018.
[3]王一川. 語言烏托邦:20世紀西方語言論美學探究[M]. 昆明:云南人民出版社,1999.
[4]魏征. 隋書[M]. 北京:中華書局,1973.
[5]袁詠秋,曾季光. 中國歷代圖書著錄文選[M]. 北京:北京大學出版社,1997.
[6]鄭鶴聲,鄭鶴春. 中國文獻學概要[M]. 上海:上海古籍出版社,2001.
[7]鐘少華. 進取集:鐘少華文存[M]. 北京:中國國際廣播出版社,1998.
[8]于翠玲. 傳統媒介與典籍文化[M]. 北京:中國傳媒大學出版社,2006.
[9]姜椿芳. 從類書到百科全書[M]. 北京:中國書籍出版社,1990.
[10]車槿山. 福柯《詞與物》中的“中國百科全書”[J]. 文藝理論研究,2012(1):24-27+127.
[11]蔣寅. 古籍保護與學術研究[N]. 光明日報,2018-09-03.
[12]伊萊·帕里澤. 過濾泡:互聯網對我們的隱秘操縱[M]. 方師師,楊媛,譯. 北京:中國人民大學出版社,2020.
[13]林瑋. “算法一代”的誕生:美育復興的媒介前提[J]. 教育研究,2021(7):81-93.
[14]阿爾維托·曼古埃爾. 閱讀史[M]. 吳昌杰,譯. 北京:商務印書館,2002.
[15]張之洞,范希曾. 書目答問補正[M]. 上海:上海古籍出版社,1983.