趙宇翔,練靖雯
近年數字人文在學術界的關注度逐年提升,并成功入選2018年度中國十大學術熱點之一[1]。隨著科技的進步和數智時代的進程,數字人文從理論、方法以及應用場景上都為傳統人文學科注入活力,推動了新型知識生產、傳播、出版的范式轉移,并逐漸形成新興的跨學科交叉研究領域。目前,數字人文研究在中國人文學界引發了較大的反響,包括文學、歷史學、語言學、藝術學、哲學等多個學科的學者都不同程度地投入到數字人文的研究陣營中。同時,圖書情報與檔案管理領域的學者也在數字人文研究中獨樹一幟,從信息資源采集、數據治理與信息組織、信息設計與知識表達、知識管理與服務等方面推動數字人文研究與實踐的橋接。2020年10月20-21日,中國2020數字人文年會在上海圖書館召開,相關領域專家圍繞著“沉淀與超越:數字人文與中華文化”的大會主題進行廣泛深入的探討。
根據國際數字人文中心網,截至目前,全球已經建立了200多個數字人文中心或研究機構[2]。國際較為知名的數字人文研究中心包括斯坦福大學人文實驗室、南加利福尼亞大學數字人文研究中心、牛津大學數字研究中心、倫敦大學學院數字人文研究中心等。在我國,武漢大學、南京大學、中國人民大學、北京大學和上海大學等紛紛成立或組建數字人文研究機構。2018年5月25日,中國社會科學情報學會成立數字人文專業委員會,旨在進一步整合圖情檔領域的資源并匯聚專家的智慧,為數字人文的有序且持續發展出謀劃策。學術期刊方面,2019年12月,清華大學和中華書局聯合主辦、中國大陸正式出版的第一本數字人文學術期刊《數字人文》創刊號面世。2021年3月,中國人民大學數字人文研究中心創辦的《數字人文研究》創刊號面世,旨在為數字人文的理論研究與實踐探索提供發表平臺。馮惠玲教授認為,數字人文在發展中比較注重自我認知和理論建設,“在理論和實踐中同步擴大包容性,有利于推動學科共同體和領域共同體的結成,提升各種數字人文形態的發展和成熟”[3]。
數字人文領域的蓬勃發展同樣離不開研究項目的助力。數字人文項目在一定程度上擔負著數字時代中國典籍文化傳承與傳播的使命。目前我國數字人文領域影響力較大的項目如中國國家圖書館的“中國記憶”項目[4]、敦煌數字研究院的“數字敦煌”項目[5]、中國人民大學人文北京研究中心開展的“北京記憶”項目[6]、上海圖書館的“盛宣懷檔案抄錄”項目[7]等,都在業內引發了示范效應。國家相關政策文件的頒布也彰顯出對數字人文的重視和支持。例如,2017年4月原文化部發布首個針對數字文化產業的文件《關于推動數字文化產業創新發展的指導意見》,提出促進優秀文化資源數字化等發展方向[8]。此外,由國家文化和旅游部主辦的高峰論壇專門設立了“數字人文”論壇[9]。除了由圖書館、博物館和檔案館等文化記憶機構發起的數字人文項目,許多由高校及科研院所主導負責的數字人文領域的科研項目也如雨后春筍般涌現。美國國家人文基金會專門設立“數字人文進步獎”來支持數字人文領域的項目研究[10]。值得注意的是,近年來,我國國家社會科學基金對于數字人文領域研究話題的資助力度也在逐年遞增,一些蘊含“數字人文基因”的跨界合作項目正在嶄露頭角[11],嘗試將技術領域的方法和工具運用到人文社科的研究主題和對象中。國家社會科學基金是我國在人文社科領域支持基礎研究的重要渠道,通常具有導向性、權威性和示范性作用。越來越多的數字人文類科研項目獲得國家社科基金資助在一定程度上彰顯了對數字人文研究的關注度和迫切性。
數字人文的核心在于跨界合作[12-14]。在過去幾十年里,多樣化的機構、豐富的項目以及多元的參與者共同創建并打造了如今的數字人文領域[14]。已有研究多從學術論文的角度對數字人文領域的合作特征進行分析與闡述[15-16],而從項目角度,特別是國家級縱向項目視角挖掘數字人文研究的跨學科屬性和交叉特色的探索還很少。鑒于此,本文遴選近年來國家社會科學基金重大項目中富含數字人文特色的課題作為研究對象,通過主題編碼、內容分析與社會網絡分析等方法揭示數字人文類國家社科重大項目中的學科屬性及合作特征,從而在一定程度上展現我國目前人文社科領域數字人文類項目的現狀與發展趨勢。
1.1.1 數字人文與跨界合作
人文科學與計算機的聯系可以追溯到20世紀中葉。1940年代羅伯特·布薩(Robert Busa)的工作成為人文計算的開端,并影響了文獻學、語言學和文學計算領域,同時期歷史學家開始使用計算機技術來分析數據,隨后量化分析構成1960年代末社會和政治史的重要部分[17]。進入互聯網時代,個人電腦的普及、辦公軟件的出現以及文本資料的大規模數字化等變革推動著人文學科研究進入新時代。數字技術的不斷創新與發展更是進一步激發了人文學科的活力,為人文學科提供了新的研究手段和方法。由此,數字人文的概念開始進入人們的視野并逐漸發展成為一個新興跨學科領域,致力于促進科技與人文的互動與融合。盡管至今學界對數字人文的界定還未達成共識,但各類數字人文研究如火如荼,相關項目也不斷涌現。
作為一個交叉領域,數字人文的研究項目往往通過跨界合作的模式展開。這種跨界包括跨學科、跨機構和跨地區特征。具體而言,在數字人文項目中,不同學科、不同機構乃至不同國家地區的專家學者共同參與一個項目,貢獻各自領域的知識、技能和見解,協作達成項目的實踐目標或研究目標。數字人文項目團隊通常包括傳統人文領域的學者、以計算機科學為代表的技術領域專家以及圖書情報與檔案管理領域的交叉學科學者[18],涉及公共文化場館、高校、科研院所、企業等不同機構以及國內外不同地區。這種跨界合作能夠實現資源、技術和人員的互補和合理配置,使得實踐進程和研究過程迸發出新的火花與活力。Harvey總結數字人文學者合作的好處,包括利用更廣泛的專業知識、分擔成本、匯集資源、獲取新工具以及提高認識等[19]。Poole等則表示,協作式的跨學科研究可以避免重復性建設,打破學科孤島,實現比傳統人文研究更大規模和更有影響力的工作[20]。然而,數字人文的跨界合作仍然存在不少挑戰和困難。對此,國內外學者積極開展了相關研究。例如,聶娜等對數字人文合作進行了實踐探索,以漢語歷史語音庫共享研究平臺的設計與實現為例探索不同學科和不同機構間的合作情況與經驗[21]。汪莉從高校圖書館的角度探究了圖書館參與數字人文跨界合作的現實困境并提出了對策[22]。Poole等圍繞數字人文項目的跨學科團隊協作和管理開展了一系列研究,探索不同身份的學者在數字人文合作中角色、責任和實踐[20,23-24]。
1.1.2 數字人文學者
隨著數字人文研究的不斷發展,數字人文學者也愈發受到關注。Warwick等表示,數字人文學者將計算方法應用于人文研究,或者將人文領域的方法應用于數字對象的研究,或者兩者兼有[25]。數字人文學者群體的學科背景豐富,身份多元混雜[26]。不過,也有一些從事數字人文工作的學者并不認同該身份標簽,甚至在一定程度上對于該身份認同有一些抵觸情緒[27]。
隨著數字人文研究和實踐項目的涌現,數字人文學者群體形成了幾大主力軍。他們在數字人文領域憑借各自學科優勢形成了各自的研究特征,又在某些項目中彼此合作,取長補短。人文學者是數字人文研究中的主體。除此,計算機科學家和圖情檔學者是常被提及的主要學者類型。Given和Willson在概述人文學者的工作方式時特別提及,人文學者在數字人文領域的協作團隊中與計算機科學家、信息科學家和來自其他學科的學者一起工作[28]。在本文中,筆者認為數字人文學者可以大致分為三類:傳統人文領域學者、以計算機科學為代表的技術領域學者和以信息管理學為代表的交叉領域學者。
過去由于人文研究及其過程的獨特性,傳統人文領域學者在技術采納方面一直進展緩慢[29]。隨著數字技術的不斷發展和變革,人文學者對技術的接納和使用雖然比不上自然科學和社會科學領域[30],但較從前已經有了很大的進步。他們對技術的態度因數字技術工具的普及和實用而逐漸緩和,甚至對數字技術工具開始主動出擊[28]。越來越多人文學者開始將數字技術工具引入人文研究領域,甚至嘗試進行工具的開發和調試[28]。然而,值得注意的是人文學者間也存在較大差異。許多學者在獲取和使用數字技術時存在不少障礙[31-33],依然有一定數量的學者對數字技術持懷疑甚至抵觸的態度,刻板印象一時難以改變[31-32]。這種差異在不同學科之間得以體現,如哲學、文學、歷史學和藝術學對數字技術的態度和應用情況就有所不同[34]。鑒于此,目前的數字人文深度合作依然非常有限。另一方面,計算機科學家、工程師等技術領域的學者往往能在數字人文領域找到技術應用更廣泛的天地,并在與人文學者的協作中起到技術支持作用。不過,技術流派的專家通常并不諳熟人文學科專深的領域知識,特別是對于研究問題的提煉以及術語的把握上還無法拍板[35]。此外,圖情檔領域的數字人文學者經常發揮易被忽視的中介作用,憑借專業知識和交叉學科的優勢承擔起顧問、聯絡人和技術支持的角色[23]。有學者表示,圖情檔領域的學者在與其他數字人文學者合作中存在尚未開發的潛力[23],能夠利用數字人文工作進行更強大的協作。與此同時,還有一些具有跨學科學歷背景的學者也能夠在跨學科團隊協作中起到中介作用[20]。
數字人文研究大多以項目的形式開展[35]。目前,國內外已開展了相當數量的數字人文項目,形式豐富且內容多樣。這些項目的內容和目的可以總結為開展人文主題研究(如文本分析、文本聚類、詞典編制、翻譯研究)、服務數字人文研究(如資源庫建設、平臺開發、技術工具開發)與保護和利用文化遺產(如館藏資源建設、歷史圖景虛擬重現、非遺資源數字化)三大類,但大部分數字人文項目往往不局限于其中一個目的和內容。表1為國內外數字人文項目示例。

表1 國內外數字人文項目示例

(續表1)
相比國內,國外的數字人文項目在數量和種類上略勝一籌,特別是歐美國家。不少國內學者主要通過對國外某一地區或機構的數字人文項目展開調研從而對數字人文項目類型進行歸納總結。例如,鄧要然基于對美國圖書館領域數字人文項目的調查,將數字人文項目分為數字化項目、文本挖掘項目和游戲化項目[42]。在檔案領域,李子林和許佳欣將國際數字人文項目分為檔案資源驅動型數字人文項目、檔案機構主導型數字人文項目和檔案相關型數字人文項目[43]。湯金羽通過分析英國倫敦大學學院的數字人文項目將其分為四類:輔助數字人文研究平臺設計、數字化技術研發和應用、資料庫和數據庫的建立以及人文主題研究[44]。由于國內典型的數字人文項目在數量上還不成規模,且分散在不同機構中,因此對國內數字人文項目的系統性調研和梳理還非常有限。
國家社會科學基金是我國在人文社科領域支持基礎研究的主要渠道,通常具有導向性、權威性和示范性作用。國家社科基金項目共有8種類型,其中重大項目是國家為解決重要問題所特別設立的。本文選取國家社科基金重大項目中和數字人文關聯性強的項目作為研究對象。考慮到國家社科基金重大項目從開題到結題通常要持續好幾年,新立項的項目可獲取信息有限,因此筆者以2016-2018年作為時間范圍,使用國家社會科學基金項目數據庫[45],通過“數字”“數字人文”“專題庫”“數據庫”“知識庫”“平臺”“系統”“圖譜”等關鍵詞對2016-2018年的國家社科基金重大項目名單進行初步篩選,接著通過項目資料的收集查閱以及邀請相關專家開展德爾菲方法,最終確定了符合本文研究范疇的數字人文類社科重大項目名單,共計69個項目。
本研究主要采用主題編碼、內容分析和社會網絡分析法。根據確定的數字人文類社科重大項目名單,筆者通過項目名稱及項目編號在互聯網平臺中進行項目相關數據資料的檢索,最終以全國哲學社會科學工作辦公室網站上已公開的項目開題報告、中期報告等以及各項目單位發布的項目動態信息為資料依據,通過主題編碼和內容分析法對爬取公開數據源獲得的數字人文類社科重大項目相關的數據資料進行編碼、統計、歸納和總結,最終形成以包括“項目選題”“項目首席專家”“負責人學科背景”“合作單位”“項目學科背景”“團隊組成”“項目成果”“項目所涉工具/技術”等為數據字段的項目基本數據表和以項目首席專家為代表的數字人文學者履歷表。在此基礎上,使用Excel軟件和Echarts軟件對數據集做統計和可視化,分析選取的數字人文類社科重大項目的基本情況。針對項目涉及的各類合作情況,使用Gephi 0.9.2軟件對經Excel初步處理的數據矩陣進行網絡可視化分析。最終在此基礎上,實現對我國縱向數字人文研究項目的學科屬性及合作特征的分析。
3.1.1 項目學科背景
通過統計名單中各項目所涉學科可以發現,這些項目具有豐富的學科背景,基本符合數字人文項目的跨學科合作特征。根據國家社科基金和國家自科基金一級學科分類標準,這些項目所涉學科及其項目數量情況如圖1所示。其中,“計算機科學”“電子學與信息系統”“建筑環境結構工程學科”“光學與光電子學”“地理學、土壤學和遙感”屬于自然科學學科范疇。由此可見,這些社科項目的跨學科合作并非局限在社科領域,還包括自然科學領域。此外,從圖中看出,“中國歷史”“語言學”“民族問題研究”“中國文學”“圖書館、情報與文獻學”“計算機科學”是目前我國數字人文研究陣營中的主要學科。

圖1 2016-2018年數字人文類社科項目學科背景
以項目首席專家為代表進行信息收集而形成的數字人文學者履歷表主要包括年齡、學歷、教育經歷等信息。觀察發現,首席專家的整體年齡偏大,學歷普遍較高。值得注意的是,其中不少學者在本科、碩士和博士等不同階段學習了不同的專業,擁有多學科的教育背景。因此,筆者對69名學者的教育背景做了簡單計和分析,獲得統計結果如圖2所示。除項目本身的跨學科屬性,一些項目團隊的人文學者也具有跨學科的教育背景。在69位學者中,50位學者的學科背景為單一的人文領域學科,而有19位學者擁有多學科的教育背景。其中,14位學者的多學科教育背景為人文領域的不同學科,5位學者的多學科教育背景則涉及傳統人文領域、以圖情檔為代表的人文與技術的交叉領域和以計算機科學為代表的技術領域??傮w而言,擁有跨學科教育背景的學者數量還較有限,跨人文和技術領域的學者則更少。這個結果一定程度上反映了在數字人文類社會科學研究項目的學者群體中,盡管存在兼具人文和技術學術訓練的學者,但還是以人文社科領域的學者居多。

圖2 2016-2018年數字人文類社科項目學者的教育背景
3.1.3 項目成果
對所有項目的成果(已有成果和預期成果)呈現形式進行統計,結果如圖3所示。通過總結歸類,69個項目包含的項目成果約有20種形式。其中,論文是最普遍的成果,其次是數據庫、專著、平臺、數字化標準/規范、系統等。不同于其他社科重大項目,數字人文類社科重大項目增添了許多數字相關的成果形式,包括數據庫、平臺、數字化標準/規范、系統、數字產品、網站、技術專利、索引等。除了論文之外,數據庫是這些項目最普遍的成果形式。結合項目名單,可以反映出這些項目的研究內容很大程度上集中于人文資源的數字化建設。正如以往研究揭示的,創建和共享人文數據是數字人文研究項目的核心工作[13]。不過,在檢索項目相關信息(如項目進展)時發現,在這些數字人文類社科項目中,部分項目雖以數字化形式的成果為目標,但在項目進程中數字技術與人文研究之間的協作與融合程度仍然較低。數字與人文像是兩個脫離的模塊,各自為政。數字人文具備的跨學科特征在這些項目中還只是從成果上得以凸顯(特別表現在文學領域)。從研究項目的合作模式來看,社會科學的研究項目多由人文領域學者發起和參與,一些項目將數字技術模塊直接外包給了信息技術公司,筆者推測其中原因可能是人文領域學者對這類跨學科項目還沒有足夠的管理經驗,不同人文領域的學者對數字技術的采納和接受度也有所不同。

圖3 2016-2018年數字人文類社科項目成果形式
3.1.4 項目相關的技術工具
當今數字技術工具越來越豐富,來自計算機科學領域的新技術、工具和方法催生了研究人文知識的全新工具集。它們給數字人文領域帶來了新的發展潛力,對數字人文研究產生了不可忽視的影響。劉煒和葉鷹根據這些技術在數字人文各類活動中發揮的作用提出了數字人文的技術體系,包括數字化技術、數據管理技術、數據分析技術、可視化技術、VR/AR技術和機器學習技術[46]。肖鵬等對人文學者在學術虛擬社區中的數字工具交流行為進行探索,對人文學者高頻討論和使用的數字工具進行了細致分類和統計,包括電子書、辦公類、數據庫、閱讀器、格式轉換、圖像處理等[33]。同時,研究還發現許多人文學者的“工具觀”具有模糊性,對工具的獲取和使用仍然困難重重[33]。筆者將數字技術分為工具層(基礎支撐、參與研究)和協作層(相輔相成)以展現數字技術在人文研究中角色的深入,同時為判斷數字人文項目團隊和學者對技術的涉入度提供參考[18]。根據項目相關信息,筆者對所有研究項目涉及的技術工具進行了粗略的統計,并按照上述提及的數字技術分類進行梳理,結果如圖4所示。從圖4的最外層可以看出,這些項目涉及了相當數量的技術和工具。其中,數據庫技術占據了最大比重,這與項目成果統計的結果相符。此外,在所涉及的技術工具中,起到“參與研究”和“基礎支撐”作用的技術工具占了很大比例。由此可見,學者們在這些項目研究中接觸和使用的數字技術和工具更多還停留在工具層,而對于一些要求更高的數字技術和工具的運用情況相對有限。這些項目中,真正體現數字技術與人文研究深入融合、相輔相成的情況較少,學者們對數字技術的理解和運用程度還有提升空間,這與已有的一些研究發現相吻合。朱思苑等對人文學者學術研究的數字能力現狀進行調研分析,將人文學者在學術研究過程中的數字能力劃分為基本信息能力、技術運用能力和交流共享能力,并根據對數字工具的使用情況將每個能力維度對應初級、中級和高級三類。研究顯示,不同學科之間的學者在數字能力上存在較大差異,傳統人文學科學者的數字能力總體低于其他學科[47]。

圖4 2016-2018年數字人文類社科項目涉及的技術工具
3.2.1 學科合作緊密度
筆者借助Excel軟件對69個研究項目所涉及的學科合作關系初始矩陣進行處理,而后通過Gephi軟件進行可視化,最終形成了一個由24個節點組成的學科合作網絡,如圖5所示。圖中每個圓形節點表示這些數字人文類社科項目所涉及的每一個學科。節點的大小和顏色深淺代表該學科與其他學科的合作頻次,節點形狀越大,顏色越深,表示涉及該學科的合作越多。學科間存在的合作關系及合作關系的強度則由這些節點之間的連線、粗細及顏色來表示。連線越粗,顏色越深,表示在這些項目中學科之間合作頻次越高,合作越緊密。圖中并沒有獨立的節點,說明在這些項目中,每個學科都至少與一個其他學科形成跨學科合作關系。學科合作的網絡可視化采用了Fruchterman Reingold布局,最終形成一個動態平衡的圓狀網絡??梢钥闯鲞@些數字人文類社科項目的學科合作網絡主要以網狀方式結合。網絡圖中,中間部分交錯的程度較高,中心幾個節點間的連線粗細程度顯示其合作較強,且整個網絡當中并無孤立點的存在。通過統計分析可知,該網絡圖的圖密度為0.525,可見這些數字人文類社科項目的學科合作緊密度較高。
對節點的特征向量中心度進行計算,學科合作網絡中特征向量中心度最高的8個節點如表2所示?!爸袊鴼v史”的特征向量中心度達到了1,即在該網絡中,“中國歷史”作為一個重要節點,不僅與其他許多節點有連接,而且與其相連的節點也是較重要的節點。從圖5也能明顯看出,中國歷史與其他學科合作最多,且與部分學科合作較為頻繁。此外,“藝術學”“民族問題研究”“圖書館、情報與文獻學”“計算機科學”“哲學”“社會學”和“語言學”等也是該網絡中較為重要的節點。這意味著這些學科在與其他學科的直接聯系中發揮著核心作用。觀察前五個重要節點可以發現,人文藝術學科之外,“圖書館、情報與文獻學”與“計算機科學”在合作網絡中占據了重要的位置,這與已有的數字人文領域相關研究結果相符。Su等關于數字人文跨學科合作研究結果顯示,雖然數字人文研究所涉及的學科范圍廣泛,但大部分跨學科合作還是集中在幾個學科之間,包括計算機科學、圖書情報與檔案學、語言學和文學[14]。Wang對截至2016年的803篇數字人文研究成果進行文獻計量分析發現,數字人文研究與歷史、文學和文化遺產、圖書情報與檔案學密切相關[13]。Poole表示數字人文研究結合了人文學科和計算機科學的專業知識,且依賴圖書情報與檔案學,具有跨學科性、數據驅動性和協作性[48]。
3.1.1 實用性與系統性相統一的原則 系統將各子系統根據數據鏈接有機的結合成為一個整體,實現各類數據的共享,在功能設計、數據的管理與處理方面以滿足實際需要為原則。

圖5 2016-2018年數字人文類社科項目的學科合作網絡

表2 排名前8的機構合作網絡中特征向量中心度
筆者嘗試進一步的網絡分析,以揭示哪些學科之間的協作更為密切。把節點的度設為大于等于12,剔除合作頻次較低的學科節點,得到一個局部網絡圖,如圖6所示。從該網絡圖可以非常清晰地看出,“中國歷史”和“圖書館、情報與文獻學”、“民族問題研究”和“圖書館、情報與文獻學”、“民族問題研究”和“社會學”、“中國歷史”和“語言學”、“中國歷史”和“民族問題研究”、“藝術學”與“社會學”等學科合作相對最為緊密。

圖6 2016-2018年數字人文類社科項目的高頻學科合作網絡
3.2.2 機構合作緊密度
對69個研究項目涉及的機構合作關系初始矩陣進行處理,最終形成由126個節點構成的機構合作網絡。圖中每個節點表示這些社科項目所涉及的每一個機構,節點的形狀大小和顏色深淺代表該機構的合作者數量。節點越大,顏色越深,該機構的合作機構越多;節點之間連線的粗細代表兩端節點關聯的頻次,連線越粗表示機構之間合作越頻繁。其中,有3個孤立節點被剔除在合作網絡圖外,說明在69個項目中,這三個機構與其他機構無合作關系。通過分析該網絡結構圖,可以看出這些社科項目的機構合作網絡大部分以網狀的方式結合,網絡圖中部交錯的程度相對較高,外側較為稀疏,局部呈星型結構。通過統計分析可知,該網絡圖的圖密度為0.045,機構合作網絡的緊密程度較低。
通過計算節點的特征向量中心度(見表3)可知,中國社會科學院的特征向量中心度達到了1,即在該網絡中,中國社會科學院為一個重要節點,不僅與其他許多節點有連接,而且與其相連的節點也是較重要的節點。從圖7中也能明顯看出,中國社會科學院與其他機構合作最多,且與部分機構合作較為緊密。筆者分析,這可能是因為中國社會科學院包括眾多學科分支研究所,如文哲學部下的文學研究所、宗教研究所等和歷史學部下的歷史研究所、考古研究所等,這些研究所分別參與和自身學科相關的社科重大項目,使得中國社會科學院整體合作情況較為豐富。此外,根據網絡中節點的特征向量中心度排序,云南大學、中山大學、中國人民大學、北京大學、暨南大學等也是該網絡中較為重要的節點。除了高校和科研機構,從圖中還能發現有不少節點是信息技術公司、圖書館、博物館和檔案館,均為常見的數字人文主體[49]。

表3 排名前8的機構合作網絡中特征向量中心度

圖7 2016-2018年數字人文類社科項目的機構合作網絡
對機構合作網絡進行模塊化計算,得到該網絡的模塊化指數為0.581。如圖8所示,根據圖的連接關系,該機構合作網絡中的節點被劃分為11類。其中,5個節點數量較多的大聚類均包含了至少一個特征向量中心度較高的重要節點,還有6個聚類為節點數量較少的小型稀疏網絡。

圖8 2016-2018年數字人文類社科項目的機構合作網絡模塊化結果
將度小于10的機構組合移除,得到合作相對緊密的機構合作網絡,如圖9所示。從圖中可以清晰獲知這些社科項目中常見的機構合作組合,例如“中國社會科學院”與“西南民族大學”、“中國社會科學院”與“中國人民大學”、

圖9 合作較頻繁的局部機構合作網絡
有研究發現,技術作為一種行為媒介提高了不同學科之間的合作潛力[14]。在69個研究項目中,每一個項目都有人文學者參與,但項目技術模塊的承擔者卻有所不同,包括專業的信息技術公司、技術領域學者、具備一定技術素養的人文與技術的交叉領域學者,以及擁有技術背景和能力或愿意為項目主動學習相關技術工具的人文學者。由此發現,項目團隊大多存在多主體合作關系,涉及領域專家、數據科學家、人文學者、信息技術公司、高等院校、科研機構等多種數字人文主體[49],具備高度的協作性。筆者對項目數據進行內容分析,依據項目的技術來源,總結出三種數字人文項目團隊協作方式。根據項目技術模塊的承擔者不同,將項目的技術來源總結為四種“中國社會科學院”與“北京大學”、“中國社會科學院”與“北京語言大學”、“北京大學”與“中山大學”、“暨南大學”與“中山大學”以及“四川大學”與“西南民族大學”等機構間的合作相對較為頻繁。然而,從網絡拓撲結構來看,一旦剔除該網絡中的重要節點——中國社會科學院,整個合作網絡的合作緊密度也會大幅下降(見圖10)。可見,目前數字人文類社科項目間的機構合作緊密度還有待加強。情況:技術外包、團隊有技術領域成員、團隊有交叉領域成員和人文學者自身具有技術背景/主動學習技術。這四類技術來源在一定程度上反應了項目團隊對數字技術由淺至深的涉入度。

圖10 剔除最大節點的合作較頻繁的局部機構合作網絡
這三類團隊協作方式在一定程度上反應了人文學者對數字技術由深至淺的涉入度。第一種類型是團隊僅由人文與技術領域的學者組成。來自技術領域的專家學者專門負責和協調技術模塊,為項目提供技術思路和支持。人文領域學者雖不負責技術,但需要與技術領域專家學者經常溝通交流,因此對技術有一定的涉入度??梢园l現,此類型的團隊中不少人文學者自身就具備技術背景和能力。正如美國著名的中國古代史學者、哈佛大學地理分析中心的包弼德教授在接受采訪時表示,關于數字人文是否對人文學者的計算機技術提出了更高的要求,他認為人文學者不是科學家,可以不會編程,但“如果要主導較為復雜的項目,各方面都要懂得一點,懂其他人在講什么做什么,知道為什么要這么做,知道處理問題最好的方法是什么”[50]。第二種類型是團隊有交叉領域的學者(如圖書情報與檔案管理領域的學者)在人文學者與技術專家間發揮著橋梁的作用。他們大多具備對數據和信息的處理能力[51],既可作為項目的顧問和交流中介,也可為項目提供技術支持[23]。第三種類型是項目團隊采取技術外包的模式,即人文研究團隊直接把部分技術模塊(如數據庫建設和系統開發)外包給專門的技術公司。與此同時,人文學者可專注于自身擅長的研究工作。但在這種情況下,少數項目依然有來自技術領域的專家擔任技術顧問,為項目提供技術思路和流程把控。
綜上所述,在大部分數字人文項目中,人文學者的數字技術涉入度還處于中等偏下水平,數字和人文依舊是兩個割裂的模塊,但是技術領域的學者和人文領域的學者有向彼此靠近和融合的趨勢。比如技術顧問與人文學者一起商討項目思路,人文學者主動接觸和學習新的技術工具等。從技術視角出發,這也從側面說明人文社科領域很多項目是有強烈的合作需求的。有學者對數字人文項目的合作平臺DHCOMMONS進行分析,許多數字人文項目都在平臺發布了需要其他合作者幫助的項目內容,其中,數據錄入、編程和一般數字人文咨詢這三類幫助是許多項目團隊當前迫切需要的[35]。
綜上所述,當前數字人文類國家社科重大項目呈現出明顯的跨學科屬性,同時涵蓋人文社會科學領域相關學科和自然科學領域相關學科。其中,歷史學科在數字人文研究項目中參與度最高。除眾多傳統人文學科以外,圖情檔學科和計算機科學也占據了重要地位。項目成果及項目涉及的技術工具豐富多元,其中數據庫是目前主要的數字成果形式和常用的數字技術。項目學者學科背景豐富,不乏同時擁有人文與技術背景的學者存在。在跨界合作方面,學科合作緊密度較高,跨學科的同時也顯現出跨機構合作的特征。另外,目前人文學者對數字技術工具在研究中的涉入度還較為有限,數字技術與人文研究的融合有待進一步深入。鑒于此,筆者提出若干研究啟示及未來展望以期后續的討論和探索。
(1)數字人文類研究項目可提供跨越學科界限及理論與實踐壁壘的對話交流平臺。本文分析的數字人文類社會科學重大項目呈現出明顯的跨學科屬性和交叉特色。這些項目不僅涉及人文社科領域,也涵蓋了許多自然科學領域的學科,并產生了豐富的項目成果,揭示了文理合作的可能性。同時,人文社會科學領域中不同學科間尚存在較大的差異和界限[52],如對相同術語的不同理解以及對于不同術語的相似解讀等,更不用說人文社科與自然科學領域間在認識論、本體論以及知識論層面的鴻溝和壁壘。可喜的是,一些正在進行中的大型數字人文項目有望彌合這種學科界限和專業壁壘,通過開展矩陣式的項目合作以及互補式的資源對接,讓人文學者邂逅更好的數字技術,也同時讓“高大上”的科技和工具在人文研究的土壤中開花結果。這些數字人文類社會科學重大項目運用數字技術和人文知識開展合作和跨學科研究,在很大程度上為不同學科之間提供了突破學科界限、跨越理論與實踐壁壘的對話交流平臺。這種跨越學科界限的對話可能引發不同學科學者的爭鳴與共情,并站在不同的視角上去重新審視自己的學科和研究領域,進而帶來更多對于學科內涵、學科交叉以及學科共融(如新文科、新工科和新醫科發展)的新思考和新見解。
(2)專題數據庫建設是當前人文社科領域數字人文研究的焦點,但關于項目成果的學術評價體系和可持續發展機制值得更多關注。研究發現,數字人文類項目的成果形式呈現出豐富性和多樣性。除了論文和專著這類傳統文本形式的成果,也出現了數據庫、平臺、網站、軟件、算法等新模態。其中,數據庫是最普遍的非文本類成果形式。現有的數字人文類社科重大項目很多都集中在人文資源的數字化建設上。由此可見,創建和共享人文數據是當前數字人文研究項目的重中之重[13]。值得注意的是,目前數字人文類項目的學術評價體系還不完善,甚至可以說還在起步階段。一方面,傳統以論文和專著主導的思想在一定程度上影響著學術評價的風向標,用以往單一的評價指標去衡量數字人文這類新興產物難免會有“畫地為牢”之嫌。另一方面,多元的評價體系在“不拘一格”的同時如何設計有效的“測量尺”,即在鼓勵創新的同時又秉持著客觀和公正的評價指標,還有待更多的理論探討和實踐檢驗。與此同時,數字人文項目成果的可持續發展機制需要進一步探索。目前有部分數字人文項目在完成之后往往便“束之高閣”,并沒有發揮應有的學術和應用價值。還有一些數字人文項目存在閉門造車、各自為政、重復建設等問題,缺乏在資源層面、技術層面、體系層面以及理論層面的對話和交流,從而造成了資源的浪費和效率的缺失。未來應更多關注數字人文多元主體的價值共創模式,打造可持續發展的數字人文成果追蹤、聯動、策展與應用推廣的有效機制。
(3)數字人文研究項目中呈現出人文學者從“借船出海”到“造船出?!钡哪J芥幼?。從合作模式和技術涉入度來看,在這些以人文學者主導,其他領域學者參與的人文社科研究項目中,數字技術和人文研究的融合程度還較為有限。以往大部分人文學者通常遵循著“借船出?!钡暮献鞑呗?,即把需要技術來解決的問題和模塊交到技術領域專家的手上,或者直接外包給科技公司。這種模式最大的特點在于,人文學者往往不會主動去嘗試認識和理解技術,更談不上對于技術的自主學習,這在很大程度上會影響數字人文項目的頂層設計,同時也可能產生很多由于技術理解缺失以及溝通障礙而導致的需求不明、路徑不清等問題。意識到“借船出?!钡木窒扌?,有部分人文社科領域的學者開始嘗試“造船出海”策略,即通過主動出擊,積極學習和掌握新的數字技術工具,甚至根據自己的需求進行工具的開發和調試,以達到研究的目標和項目的要求。該模式的特點在于,人文學者在主動擁抱技術的道路上邁進了一大步,這種嘗試或多或少都能提升人文學者的信息素養、媒介素養、數據素養和科技素養,并賦能人文學者在數字人文項目的宏觀規劃和頂層設計上更多的自信心和把控力,從而更好地降低溝通的成本并提升合作的效率。值得說明的是,“造船出?!辈⒉皇菍Α敖璐龊!钡姆穸?,“造船出?!币廊恢匾暱鐚W科合作與協同創新。這種模式的嬗變只是呼吁人文學者,尤其是未來數字原住民一輩的人文學者能夠在技術涉入度上有更大的進步,這也與國家啟動的“六卓越一拔尖”計劃中新文科建設的使命和愿景高度呼應。
(4)圖書情報與檔案管理學科應立足優勢,把握機遇,在數字人文研究中乘風破浪。近年來,圖情檔學科在我國的數字人文研究中具有很高的參與度和話語權,無論是從學術論文的發表、期刊的創辦、學位點和研究方向的增列還是科研項目的比重上,圖情檔領域已經成功占據了數字人文陣營的一席之地。由于數字人文典型的跨學科特點,人文研究和技術應用之間往往還需要一個通曉兩方的中介在項目中起到橋接和協調的作用。圖情檔學科無論從理論還是方法上都具有得天獨厚的優勢。圖情檔學者憑借專業特長,能夠從信息資源采集、數據治理與信息組織、信息設計與知識表達、信息檢索與知識抽取、文本挖掘與網絡分析、知識管理與情報服務等方面推動數字人文研究與實踐的發展,在數字人文項目中起到技術支持、項目管理、數據策展、信息資源管理等多方面作用。事實上,相關研究表明圖情檔學科與數字人文有很多相似相通之處,二者相輔相成,具有強大的共生潛力[23,53]。圖情檔學科的學者應該立足優勢,找準在數字人文項目中的角色和定位,積極參與到數字人文的研究對話和建設中,在數字人文研究和項目中實現本學科與數字人文的同頻共振。
本文對國家社會科學基金重大項目中數字人文類項目的學科背景、學者履歷、項目成果、項目涉及的技術工具進行統計分析,在此基礎上對項目的合作情況進行網絡可視化分析,旨在揭示數字人文類國家社科重大項目中的學科屬性及合作特征,從而在一定程度上展現我國目前人文社科領域數字人文研究項目的現狀與發展趨勢??傮w而言,數字人文正成為人文社科領域許多研究的創新點,同時保持著以人文為中心的基本原則[54]。數字人文項目成為人文學者開展數字人文研究的載體??缃绾献鞯捻椖磕J綖椴煌瑢W科之間提供了交流平臺,同時滿足了一些人文學科和學者對數字人文研究在技術方面的合作需求,一定程度上促進了各學科介入數字人文領域的進程。此外,數字人文類研究項目產生了豐富的成果,以專題數據庫和開放數據平臺為代表的典型成果能夠為人文研究提供數據基礎設施。最后筆者呼吁,鑒于項目結題、資金資助、數據更新、開發平臺迭代、專題庫之間的互操作與兼容以及標準化等因素[53],未來數字人文類項目的可持續發展問題有待相關學科和專家學者的共同關注和探索。