2020年,《關于做好國家文化大數據體系建設的通知》強調了文化與科技深度融合的重要性,提出分類采集梳理文化遺產數據,為中華優秀傳統文化的創造性轉化與創新性發展奠定基礎。隨著大數據、知識圖譜、深度學習等信息技術蓬勃發展,其研究成果已廣泛應用于傳統人文學科領域并催生出數字人文理念,數字人文將計算機學科與人文學科緊密結合,通過數字技術深度開發檔案資源,為傳統人文學科研究提供了新的研究理論與方法,使傳統人文學科研究的方式維度以及傳統人文精神的視野語境發生了改變。
近年來,數字人文理念應用于檔案學領域,通過數字技術深度開發檔案資源,使檔案資料從文件級轉化為數據級,從單元信息轉變為知識節點,實現了檔案數據的拓展與延伸,改變了人類知識發現、注釋、引用和展示的方式。同里宣卷作為國家級非物質文化遺產,其檔案資源涵蓋曲目創作、舞臺演出等多方面,具有極高的藝術與研究價值。文章聚焦于同里宣卷檔案資源的數據采集、關聯及故事化呈現模式,旨在拓寬其開發思路,豐富數字人文在檔案資源開發利用中的理論①,為非物質文化遺產的數字化保護與創新利用提供了新的視角和方法。

(一)數字人文的定義與特點
數字人文(Digital Humanities)又稱計算機人文,作為計算機學科與人文學科的深度融合產物,其以數字方法與檔案學、考古學等人文學科的交叉領域為研究對象,系統闡述數字方法與人文學科交叉融合的普遍規律及應用方法。相較于傳統人文研究,數字人文更加關注信息檢索與聚合能力,一是其研究對象實現了從傳統紙質文獻向數字化資源的轉變。文字、圖像、音頻和視頻等人文資料和文獻檔案,通過技術手段轉化為數字資源或衍生性數字資源,拓寬了研究的廣度與深度。二是數據在數字人文中占據了核心地位,但值得注意的是,數據本身并不直接等同于信息,它僅作為實體存在,數據的價值在于其被整理、聯合并解讀的過程中,轉化為有價值的信息,因此數字人文不僅強調數據的收集,更重視數據的處理與解讀能力。三是數字人文采用計算性方法進行數據的查找與提取,如運用專名識別、正則表達式等技術手段。同時,它還運用數字技術、數據管理、分析、可視化以及VR/AR、機器學習等先進技術,結合文本、內容、時序、空間、社會關系分析等多種研究方法,對數據進行深入分析,并通過可視化手段創造新的信息,為人文學科研究開辟了全新的視角與路徑。
(二)同里宣卷的歷史與特點
同里宣卷又稱寶卷,其起源于唐代的變文“俗講”與宋代的佛教“說經”,至清代逐漸演變為一種說唱藝術,主要流傳于江蘇南部的吳語地區,尤其是蘇州市吳江區同里鎮。同里宣卷綜合了文學、音樂與表演藝術,采用吳江或同里方言進行說唱,韻散結合,包含說、噱、彈、唱、表、做等多種表演手段。表演團隊一般有3到8人不等,一人主宣,一人或兩人應和,其余人員則以磬子、二胡、三弦、揚琴等樂器伴奏。
同里宣卷經歷了由“木魚宣卷”到“絲弦宣卷”的演變過程,“木魚宣卷”階段,表演團隊人數較少,曲調簡單,文本多改編自佛道經文故事,如《妙英寶卷》《觀音寶卷》《目蓮寶卷》等。“絲弦宣卷”階段,表演團隊人數增加,曲調更加豐富多樣,借鑒吸收了蘇灘、江南小調、錫劇、越劇、評彈等藝術形式的營養,同時,宣卷內容也增加了民間傳說、小說神話、同里宣卷故事和當代時事等,更具時代氣息,如《洛陽橋》《玉佩記》《白兔記》《黃金印》等。近代同里宣卷產生了大量的表演卷目,涌現出了一大批優秀的民間藝人,形成了以許維鈞為首的“許派”、以徐銀橋為首的“徐派”、以吳仲和為首的“吳派”和以褚鳳梅為首的“褚派”等四大流派,這些流派一脈同源,又各具特色,具有豐富的流變性和穩定的精神內核,是傳統文化的文獻寶庫和活化石②。目前,同里宣卷仍活躍在鄉村廟會、農家婚慶、壽誕、遷居、嬰兒剃頭等禮儀場合,成為當地民眾生活中不可或缺的一部分。
(一)數據采集:構建多元化檔案資源收集機制
首先,聯合多元主體。傳統同里宣卷檔案資源的收集主要依賴于檔案館和博物館等官方機構,這導致了檔案資源結構的單一性,尤其是照片、聲像等多媒體檔案的數量嚴重不足。為打破這一局限性,需積極聯合地方政府、檔案館、博物館、教育機構及文化公司等多元主體,共同構建一個更為豐富和全面的檔案資源收集體系。通過訪談同里宣卷藝術領域的專家、學者,更深入地了解這一藝術形式的內涵與價值,從而更準確地指導檔案資源的收集工作。
其次,拓寬收集渠道。在構建多元化收集機制的基礎上,還應積極拓寬檔案資源的征集渠道,除了傳統的征集方式外,可以利用互聯網、社交媒體等新興平臺,廣泛征集與同里宣卷相關的各類檔案資源,同時加大對與同里宣卷相關專業檔案的征集力度,如劇本、演出記錄、道具圖片等,以確保檔案資源的全面性和完整性。
最后,實現檔案內容多元化。加強對同里宣卷檔案史料、音像檔案和口述檔案等的收集工作,特別是口述檔案,作為歷史記憶的重要載體,對于還原同里宣卷的歷史面貌、傳承其文化內涵具有重要意義,同時加強對同里宣卷熱點新聞、政府公開信息、重大活動和展覽等錄音錄像的收集,并進行定期剪輯和歸檔,做到應收盡收、應歸盡歸、應管盡管。
此外,推動檔案管理向數字化轉型,強化檔案與信息科技、新興設備的融合應用。如利用光盤檢測儀等專業設備對光盤檔案數據進行定期整理、檢測與翻刻,確保信息長期保存;借助開源AI智能軟件對老舊音視頻檔案進行修復優化,提升其質量;通過統計分析工具對存量和增量數字化檔案進行歸檔、對比、檢索與核查,確保電子數據與實體數據的一致性。
(二)數據關聯:可視化構建同里宣卷檔案知識圖譜
1.知識圖譜整體架構
知識圖譜在同里宣卷檔案資源的可視化表達中扮演著核心角色,其架構由模式層與數據層共同構成,二者相輔相成,共同支撐起知識圖譜的構建與功能實現。模式層是知識圖譜的骨架,它負責定義檔案資源中的各類實體、概念及其屬性。這一過程確保了檔案元素描述的準確性和一致性,為數據的后續處理與利用奠定了堅實基礎。通過深入分析同里宣卷項目、傳承人及相關地點等檔案資源,模式層采用統一標準對這些資源進行描述,并建立起實體間的關聯,從而全面揭示了檔案資源間的內在聯系。這種內在聯系的揭示不僅提升了檔案資源的可視化程度,更為深入研究同里宣卷等文化遺產提供了有力的數據支撐。
數據層則是知識圖譜的血肉,它以事實三元組的形式存儲具體信息,實現了數據的有效組織。在數據層中,每一個事實都由一個實體、一個屬性以及一個屬性值組成,這種結構化的存儲方式使得數據易于查詢、分析和利用。通過數據層,用戶可以快速獲取到與同里宣卷相關的各類信息,如節目名稱、傳承人姓名、演出地點等,從而更加直觀地了解同里宣卷的歷史背景、藝術特色及文化價值。
2.知識圖譜構建流程
知識圖譜構建技術在文化遺產檔案資源的可視化處理中扮演著至關重要的角色,以同里宣卷檔案資源為例,其構建流程可精煉地劃分為數據定義、聚類分析及模型構建三大核心階段。
首先,數據定義是知識圖譜構建的基石,此階段需深入挖掘檔案資源中的文化記憶,篩選出關鍵記憶實體、概念及其相關屬性,構建模式層框架。對于同里宣卷檔案而言,需基于其多維度特征,明確界定節目、來源派別、主要角色、扮演者等核心記憶實體,并補充這些實體間的語義聯系,不僅為后續步驟提供了堅實的數據與理論基礎,還確保了知識圖譜構建的準確性和完整性 ③。
其次,聚類分析是知識圖譜構建的關鍵步驟,這一階段需要對已定義的檔案數據進行細致分類,并確立一個科學合理的分類體系框架。針對同里宣卷檔案資源的特性,可構建以“派別—主體”為核心的分類體系,即以流派創始人姓氏命名,將同里宣卷名家作為主體,對相關檔案數據進行聚類處理。通過聚類分析,能夠清晰地勾勒出數據關系圖譜,有效梳理數據層關系,為后續模型構建提供有力的數據支撐和邏輯依據。
最后,基于數據定義和聚類分析的結果,構建同里宣卷檔案資源的可視化知識圖譜模型??紤]到同里宣卷檔案資源的獨特性,可圍繞同里宣卷名家這一核心主體,設計包含“主體—節目—地位”三層結構的模型。在這一模型中,同里宣卷名家作為核心主體,能夠全面涵蓋檔案資源;節目則代表了檔案數據的來源關系,凸顯了同里宣卷的藝術特色與內涵;地位則體現了檔案數據的證據特性,彰顯了同里宣卷檔案資源的獨特價值與重要意義。通過這一模型,可以實現對同里宣卷檔案資源的形象化、全方位描述,從而實現對檔案知識的有效組織與延伸。
(一)故事化組織的界定與平衡
首先,受眾的多樣化需求是故事化組織的重要考量。同里宣卷檔案數據的受眾群體包括從藝人員、文化愛好者、培訓教育機構人員等,他們各自有著不同的知識需求和興趣點。因此,在故事主題的選擇上,應綜合考慮這些受眾的需求,形成全面的用戶意向知識集。例如,對于從藝人員,可以聚焦演繹輔助的主題,提供與表演技巧、曲目創作等相關的檔案故事;對于文化愛好者,則更注重文化普及,講述同里宣卷的歷史淵源、藝術特色等;而對于培訓教育機構人員則可能更關注寓教于樂的故事,通過生動的故事情節激發學習者的興趣。
其次,敘事主題的界定還需考慮同里宣卷檔案資源的特點。同里宣卷檔案資源涉及范圍廣、載體形式多樣,包括文字、圖片、音視頻等多種類型。因此,在故事化組織時,需要根據已確定的敘事主題,對檔案資源進行時間與空間范圍的進一步限定,以便深入挖掘與主題相關的檔案數據,構建全面的用戶意向知識集。
(二)故事化設計的構建與邏輯
故事化設計的核心在于精準提取故事元素與巧妙搭建故事結構。提取過程需對同里宣卷檔案數據進行深度整合與加工,確保信息的真實性和完整性。通過可視化圖譜技術可以將人物、作品、時間、情節轉折點等相關主題元素提取出來,并建立詳盡的數據庫。這一步驟深受“Data Storytelling”理念的啟發,實現了數據與敘事的完美融合,特別是在處理同理宣卷藝術家個人檔案時,能細致梳理其生平、代表作及藝術成就等故事元素。
在故事結構設計上,需兼顧受眾的知識需求與敘事的藝術性,在傳統框架中融入人文視角,使同理宣卷檔案數據相互關聯并形成有機整體。采用主題與時間并行的敘事策略,依循情節線索鋪陳故事,同時確保核心主題的突出與一致性。通過強調核心情節的亮點與意外轉折,顯著提升故事的吸引力與說服力,使同里宣卷檔案的故事講述更加引人入勝,深刻展現其文化內涵與藝術魅力。
(三)故事化表達的多元與互動
隨著檔案發展社會語境的多元化,檔案學者需多角度研究檔案文化資源,挖掘其利用潛力。針對同里宣卷檔案數據的故事化表達,不僅要使受眾接納故事,還需從多元視角提煉文化精髓,引導受眾在故事中探索同里宣卷文化,強化文化自信。
在呈現方式上,可借鑒虛擬現實、增強現實、互動游戲等數字人文技術,通過交互技術提升受眾的參與感與沉浸感,使其在欣賞故事的過程中深入理解同里宣卷文化,如開發基于同里宣卷檔案的互動游戲,讓受眾在游戲中扮演角色,體驗宣卷的表演場景和歷史背景,增進對宣卷文化的理解和共鳴。此外,還可以結合社交媒體等新媒體平臺,將同里宣卷檔案數據的故事化成果進行廣泛傳播和推廣,利用分享故事、互動評論等方式吸引更多受眾關注和參與,進一步擴大同里宣卷文化的影響力。
同里宣卷檔案數據的故事化呈現是數據組織、設計與表達的綜合過程。在數字人文視域下,通過明確受眾需求、界定敘事主題、提取故事元素、設計結構并選擇呈現方式,能充分挖掘其檔案資源價值,為受眾提供多元知識服務。這有助于同里宣卷文化的活態傳承,并最大化實現檔案資源的歷史文化及教育價值。展望未來,檔案資源開發應積極探索和實踐故事化呈現等創新方法,以更好地服務于文化傳承和社會發展,推動檔案資源價值的最大化利用。
①王思琪、黃鐘雨、付亞楠等:《數字人文視域下戲曲檔案資源開發路徑探析》,《北京檔案》,2022年第2期,第26—28頁。
②黃亞欣:《民俗文藝實踐主體在民俗活動中的功能闡釋—基于同里宣卷藝人的考察》,《民族藝術》,2023年第2期,105—115頁。
③華林、張富秋、劉菊等:《數字人文視域下館藏清代土爾扈特檔案文獻可視化開發》,《山西檔案》,2024年第3期,第74—80頁。
[1]張斌、李星玥、楊千:《檔案學視域下的數字記憶研究:歷史脈絡、研究取向與發展進路》,《檔案學研究》,2023年第1期,第18—24頁。
[2]曲春梅、胡雯嘉:《數字時代的文化記憶:檔案學視域下數字記憶的研究圖景與展望》,《北京檔案》,2024年第4期,第41—48頁。
(作者:孫媛媛,蘇州旅游與財經高等職業技術學校講師;王玉明,蘇州工業園區服務外包職業學院副研究員)
(責任編輯/陳琪穎)