崔 燚
(鄭州圖書館,河南 鄭州 450000)
數(shù)字人文作為21世紀(jì)的一個現(xiàn)象級國際話語,以文獻數(shù)據(jù)為根基,以數(shù)字化技術(shù)為輔,能夠幫助文科研究者提高對人文社科文獻的研究效率。隨著計算機技術(shù)的發(fā)展及傳統(tǒng)人文學(xué)科向更深更廣領(lǐng)域發(fā)展,數(shù)字人文應(yīng)運而生,給新文科建設(shè)帶來了新的活力與機遇。“河洛古國”考古新發(fā)現(xiàn)再一次證明華夏民族創(chuàng)造了豐厚的歷史遺產(chǎn),古文獻典籍作為古代文明的有形載體,與非物質(zhì)文化遺產(chǎn)共同破除歷史虛無主義,具有深刻的現(xiàn)實意義。古籍?dāng)?shù)字化是隨著人文學(xué)科的科學(xué)化而興起的新的研究領(lǐng)域,與古文獻溯源與整理、數(shù)字保存與保真、文化保護等息息相關(guān)。2007年,國務(wù)院辦公廳印發(fā)了《關(guān)于進一步加強古籍保護工作的意見》,要求相關(guān)部門從2007年開始,用3到5年時間,對全國各系統(tǒng)的古籍藏護情況進行普查,并制訂相應(yīng)標(biāo)準(zhǔn),規(guī)范工作流程,建立中華古籍聯(lián)合目錄和古籍?dāng)?shù)字資源庫等,實現(xiàn)古籍資源的保護和有效利用。2011年、2012年,文化部印發(fā)了《關(guān)于進一步加強古籍保護工作的通知》《文化部“十二五”時期文化改革發(fā)展規(guī)劃》等文件,要求各地對古籍保護工作重視起來,強調(diào)古籍?dāng)?shù)字化建設(shè)的重要性。2022年,中共中央辦公廳、國務(wù)院辦公廳印發(fā)了《關(guān)于推進實施國家文化數(shù)字化戰(zhàn)略的意見》,要求在全面建設(shè)社會主義現(xiàn)代化國家新征程的第一個五年計劃里,完成文化數(shù)字化基礎(chǔ)設(shè)施,搭建起文化數(shù)字化的服務(wù)平臺,爭取在2035年建成國家文化大數(shù)據(jù)體系,實現(xiàn)中華文化全景呈現(xiàn)及中華文化數(shù)字化成果全民共享的遠(yuǎn)景目標(biāo)。筆者從數(shù)字人文的視角,探討了古籍相關(guān)的理論研究與學(xué)科建設(shè)的發(fā)展趨勢。
數(shù)字人文又稱為人文計算,筆者在鄭州大學(xué)搜遞系統(tǒng)以數(shù)字人文、人文計算為關(guān)鍵詞進行檢索,獲取相關(guān)文獻1,792篇。相關(guān)的統(tǒng)計結(jié)果顯示,研究主要集中在以下四個方面:一是人文資源相關(guān)的數(shù)字化研究,二是圖書、情報、檔案等學(xué)科在數(shù)字人文背景下的發(fā)展轉(zhuǎn)型,三是數(shù)字人文相關(guān)概念研究,四是數(shù)字人文技術(shù)層面的相關(guān)研究等。
在人文資源相關(guān)的數(shù)字化研究方面,黃永林探討了數(shù)字化技術(shù)在非物質(zhì)文化遺產(chǎn)保護與傳承中的重要作用,趙思淵提出了編制元數(shù)據(jù)的策略。在圖書、情報、檔案等學(xué)科的發(fā)展轉(zhuǎn)型研究方面,劉煒認(rèn)為人文科學(xué)研究正在向以數(shù)據(jù)為驅(qū)動的新型研究模式轉(zhuǎn)型,形成了數(shù)字人文研究的新范式;馬費成在分析國家社科基金項目的基礎(chǔ)上提出檔案學(xué)數(shù)字人文研究、古籍文獻的整理利用研究等已成為研究熱點;李珊珊認(rèn)為圖書、情報、檔案等學(xué)科應(yīng)加強自身構(gòu)建,改善人們心中對于傳統(tǒng)人文學(xué)科應(yīng)需而生的印象,將人文學(xué)科重新定義為生產(chǎn)型學(xué)科。在數(shù)字人文概念研究方面,林施旺追溯了人文計算向數(shù)字人文轉(zhuǎn)變的歷史過程;王麗華指出了數(shù)字人文是多學(xué)科共同構(gòu)成的新研究范式,是人文學(xué)科的延伸與發(fā)展。在數(shù)字人文技術(shù)研究方面,劉煒提出了數(shù)據(jù)驅(qū)動的研究范式應(yīng)在人文學(xué)科中得到廣泛應(yīng)用;練靖雯總結(jié)了數(shù)字人文學(xué)者的特點,從平臺設(shè)計、技術(shù)培訓(xùn)及跨學(xué)科合作的角度提出了相關(guān)數(shù)字賦能的對策;蔡迎春提出了相關(guān)機構(gòu)應(yīng)細(xì)化數(shù)字人文的相關(guān)項目,學(xué)習(xí)借鑒科研機構(gòu)的技術(shù)經(jīng)驗,加強研究人員的問題意識、學(xué)習(xí)意識、創(chuàng)新意識、協(xié)同意識、共享意識、持續(xù)意識等建議。
筆者在鄭州大學(xué)搜遞系統(tǒng)以古籍?dāng)?shù)字化、數(shù)字化古籍為關(guān)鍵詞進行檢索,獲取相關(guān)文獻2,570篇。文獻分析結(jié)果顯示,近年來,我國的古籍?dāng)?shù)字化工作在理論研究和信息化建設(shè)方面取得了實質(zhì)性進展,如:構(gòu)建了古籍?dāng)?shù)字化研究的體系結(jié)構(gòu),制定了數(shù)據(jù)庫檢索系統(tǒng)、書目數(shù)據(jù)庫的標(biāo)準(zhǔn)和規(guī)范;實現(xiàn)了國際性的古籍資源合作與資源共享,組建了跨領(lǐng)域跨學(xué)科的專業(yè)研究隊伍。
數(shù)字人文學(xué)科的建立充分體現(xiàn)了信息時代多學(xué)科交叉的特點,推動了古籍?dāng)?shù)字化管理工作的持續(xù)開展。古籍?dāng)?shù)字化研究有助于拓寬古文獻研究的范圍,弘揚中華優(yōu)秀傳統(tǒng)文化,推動學(xué)術(shù)研究的轉(zhuǎn)型發(fā)展。
在數(shù)字人文背景下,相關(guān)機構(gòu)利用現(xiàn)代信息技術(shù)對館藏古籍文獻進行數(shù)字化處理,建設(shè)了各類古籍?dāng)?shù)字化資源平臺,為研究人員提供了便利。
在數(shù)字人文背景下,相關(guān)機構(gòu)利用計算機視覺分析、數(shù)據(jù)清洗與數(shù)據(jù)分析、人工智能、物聯(lián)網(wǎng)等新技術(shù)對古籍資源進行整理,推動了古籍?dāng)?shù)字化研究的持續(xù)開展。相關(guān)機構(gòu)還組建了跨學(xué)科的數(shù)字人文研究團隊,加強了古籍?dāng)?shù)字化資源平臺建設(shè),推動了文化產(chǎn)業(yè)產(chǎn)學(xué)研的深度融合,實現(xiàn)了古籍?dāng)?shù)字化資源的共建共享,促進了古籍相關(guān)專業(yè)學(xué)科建設(shè)的發(fā)展。
目前,古籍?dāng)?shù)字化研究工作主要存在數(shù)字化水平較低的問題。近年來,我國的古籍?dāng)?shù)字化工作取得了一些成果,但也存在一些問題,如:過度重視紙質(zhì)形態(tài)的古籍文獻,相對輕視骨、金、帛、錦等載體的文獻;側(cè)重于文史一類的古籍文獻。我國古籍?dāng)?shù)字化水平較低主要體現(xiàn)以下三個方面:一是古籍?dāng)?shù)字化的開發(fā)還處于基礎(chǔ)階段,未完全實現(xiàn)語義內(nèi)容層面的深度挖掘與高效利用。二是數(shù)字化技術(shù)有待提高。古籍?dāng)?shù)字化所依據(jù)的文字轉(zhuǎn)換、文本加工、字庫、檢索等技術(shù)還有待改善。以O(shè)CR文字識別技術(shù)為例,該技術(shù)存在掃描識別度低、成本高的問題,無法實現(xiàn)對豎排繁體文字的理想識別效果。三是專業(yè)人才培養(yǎng)困難。合格的古籍?dāng)?shù)字化工作人員不僅需要具備古籍方面的專業(yè)知識、掌握計算機信息技術(shù),還需要擁有一定的工作經(jīng)驗。但是,很多古籍收藏機構(gòu)缺乏這方面的專業(yè)人才。針對上述問題,相關(guān)機構(gòu)可采取以下措施:一是加大技術(shù)方面的投入與研發(fā)力度,推動古籍?dāng)?shù)字化工作的高效開展。二是從閱讀體驗的角度出發(fā),重視讀者的意見與建議,加強古籍?dāng)?shù)字化資源平臺建設(shè)。三是注重人才培養(yǎng),加強與高校科研機構(gòu)、出版單位、數(shù)字化平臺開發(fā)機構(gòu)的交流合作,推動產(chǎn)學(xué)研的深度融合。