張昕宇??
關鍵詞:家譜;數字化;GIS系統;書目框架;關聯數據
摘 要:家譜數字化建設與服務在家譜數據庫建設、家譜網站建設、家譜軟件應用等方面已取得了一定成績,但目前建成的家譜數字系統主要以家譜文獻管理為主要目標,存在知識服務能力不高、缺乏書目規范控制、開放性和互動性不強等問題,削弱了用戶的使用效果。文章對以上問題進行了研究,并論述了GIS技術、書目框架以及關聯數據技術在家譜數字化工作中的應用。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2017)06-0136-03
我國的家譜數字化工作起步于20世紀90年代,主要包括建設家譜書目數據庫、建設家譜全文數據庫以及家譜信息網絡化。家譜數字化工作不僅有利于圖書館對紙質家譜進行保護,還大大提高了家譜的信息服務能力。但同時,在家譜數字化進程中,由于缺乏統一的協調機構、書目質量控制標準不統一等問題,家譜數據質量及深層次服務能力仍差強人意。
1 家譜的特征
1.1 歷史久遠,數量眾多
家譜是一種以表譜形式記載一個以血緣關系為主體的家族世系繁衍及重要人物事跡的特殊圖書形態。它產生于上古時期,經過了魏晉南北朝的興盛、唐朝的發展、宋代的功能轉變、明清以來的普及,歷經歲月侵蝕,流傳至今的家譜至少有三萬余種。
我國家譜文獻起源較早,可家譜專詞的出現卻晚了許多,目前見到的最早記錄是六朝時劉孝標《〈世說新語〉注》中曾引用的《王氏家譜》。據此推斷,“家譜”一詞最晚出現在六朝時期。家譜文獻編撰之初主要是官修,編撰皇室及皇親貴族譜牒,目的是“奠系世,辨昭穆”。自司馬遷在《史記》中撰《太史公自序》詳細敘述了自家家族世系后,文人雅士紛紛效仿,逐漸形成了官私家譜并行的局面。宋朝以后,家譜撰修的目的逐步轉向“尊祖、敬宗、收族”。
1.2 結構形式較為統一
古代的家譜編撰,以證血統、助選官、襲世爵、配婚姻、劃社交、繼財產、睦家族等為目的。與其他文獻相比,家譜編撰的目的性很強,所以家譜的結構形式就較為統一,至明清兩代,家譜結構已基本定型。雖然由于時代、地區、家族的差異,所修家譜詳略不一,但總體來說,家譜的編撰體例多是按如下順序排列:譜序、題辭、凡例、譜論、恩榮、圖、節孝、像贊、考、宗規家訓、祠堂、祠產、坊、墓、派語、世系、世系錄、傳記、仕宦錄、志、雜記、文獻、修譜姓氏、五服圖、余慶錄、堂號、領譜字號等。
1.3 內容涉及面廣
中華大地姓氏眾多,目前仍在使用的姓氏至少有3,500多種。因此,歷代家譜中蘊藏著豐富的史料,內容涉及歷史學、人口學、社會學、民俗學、經濟學、遺傳學、移民史、宗族制度等,其中甚至還包括家族內部私密且沒有公開過的內容,或許還能起到與公開文獻辨偽的作用。同時,由于各家族分支眾多、家譜版本繁多,因此家譜文獻中蘊含的豐富內容有助于世人進一步了解先賢所在家族的姓氏源流、族規家法、世系圖譜、事跡詩文、分支遷徙等史實。
2 家譜數字化建設與服務中亟須解決的問題
我國家譜數字化建設與服務工作歷經三十余年的發展,在家譜數據庫建設、家譜網站建設、家譜軟件應用等方面均取得了一定的成績,基本上能夠滿足人們尋根問祖、開展學術研究的現實需求,有效解決了家譜保存與利用的現實矛盾,積累了有益的實踐經驗。但與此同時,目前建成的家譜數字系統主要以家譜文獻管理為主要目的,在數字化工作中出現了若干亟待解決的問題。
2.1 提升家譜數據庫知識服務能力
現有的家譜數字化成果多存在于書目數據庫、全文數據庫、影像文件中。對家譜內容的研究和標引揭示只是以提供簡單的字段檢索為目標,只能給用戶提供文獻本身的檢索途徑,不能滿足用戶對文獻內容的查詢需求。大量的家譜信息,如:不同家譜文獻中同姓共祖人物間的關系、家族內徙外遷的史實及路線、家譜中蘊藏的具體家族史實、先祖具體信息、家族相關數據等,均淹沒在浩瀚的家譜文獻長卷中,事實上仍需用戶耗費大量的精力自行查找。在現有的技術條件下,要想解決這類問題,提高服務能力,在家譜文獻數字化建設中融入具有良好用戶體驗的知識導航和知識發現功能就顯得尤為重要。
2.2 對家譜數據庫書目進行規范控制
在缺少書目規范控制的情況下,由于參與者眾多,地區行業水平不一,再加上家譜文獻自身信息的不統一、不確定,如古今地名差異、人名音同字不同、古僻字等,當前已建成或正在建設的家譜數據庫中的重要概念,如姓氏、機構、地名、中國歷史紀年中的朝代等描述不規范、隨意性強,技術人員難以用明確的語義來表述這些概念之間的關系。如:擁有專業人才隊伍、家譜數字化建設起步較早的上海圖書館主持編撰的家譜鴻篇巨制《中國家譜總目》以及數據量巨大且不定期更新的家譜書目查詢數據庫就存在概念不規范的問題,這給用戶檢索帶來了難題[1]。用戶基于關鍵詞等概念匹配要求的檢索結果總是差強人意,準確率大打折扣,難以準確定位到理想的結果。因此,基于概念模型對各類實體進行規范控制,解決對同一人名、地名、朝代名的不同表述方式的認定、消歧與合并等問題,對家譜數據庫建設具有重要的現實意義。
2.3 增強家譜數據庫的開放性和互動性
家譜數據庫同其他文獻數據庫不同,具有動態性、開放性和延續性,而不是一個靜止的、閉合的系統。遺憾的是,目前的家譜數據庫并沒有一個開放性的互動平臺,可以與用戶進行溝通和交流。事實上,無論是利用家譜數據庫尋根問祖的家族后人,還是利用家譜數據庫進行專題研究的學者,或者是對本族、本姓、相關史料有著深入了解和研究的團體和社群,他們既是用戶,也是專家,甚至對某一姓、某一族的家譜的了解比家譜數據庫的建設者更為全面深入。因此,引入Web2.0技術,提供一個開放性的互動平臺,使家譜數據庫建設者與用戶之間形成良性的知識互動與交流,使家譜知識在交流和傳播中增值,使新建設的家譜知識服務平臺不僅是靜態的特色數據庫,還是支持知識不斷生長和進化的有機體,都是今后家譜數據庫建設與服務過程中的重點。
3 家譜數字化建設與服務的新進展
3.1 GIS技術
GIS(Geographic Information System),即地理信息系統,是一個獲取、存儲、編輯、處理、分析和顯示地理數據的空間信息系統。GIS在家譜信息存儲、管理、分析和表達等方面的優勢突出,其空間數據庫有利于存儲和管理海量的家譜信息;其可視化表達有利于直觀地展示家譜中的世代傳承關系和空間關系;其空間分析和時空數據挖掘方法,可以與歷史文獻法相結合,從多角度深入探討家族傳承和發展的驅動機制。
南京師范大學的閭國年教授首次提出將GIS概念引入家譜數字化建設進程中。而目前對其較為成功的應用是由南京師范大學虛擬地理環境教育部重點實驗室和南京超擎圖形軟件公司聯合設計與實施的家譜GIS系統平臺。該系統平臺以GIS技術為支撐,由門戶網站(www.hxjiapu.com.cn)和客戶端軟件組成,在同一時空框架下,以數字方式存儲、分析、呈現家譜文本中所蘊含的時空信息,構建可視化的家譜時空網絡,實現家譜時空信息的規范化、顯式化表達,使各家家譜所表示的傳承關系、空間關系變得清晰易懂,并支持全社會各家各戶在同一時空框架下進行本族家譜數據庫建設[2]。
3.2 書目框架
書目框架是2011年5月由美國國會圖書館牽頭開發的互聯網時代的書目數據格式標準,用以取代MARC,并能為圖書館、檔案館、博物館、美術館等相關人類文化記憶機構共同使用。書目框架是一個從模型到詞表、再到實現技術的系統性框架,具有良好的包容性、可擴展性和開放性。書目框架作為基于關聯數據技術的本體模型,既能揭示家譜資源的文獻特征,又能描述家譜文獻中的人、地、時、事等內容,還能在家譜各種數據實體之間建立起能被機器處理和理解的關聯關系。這些措施能有效提高家譜系統的查全率和查準率,提升家譜資源服務的效果,為重組家譜資源、重構家譜服務系統提供了新的解決方案。
3.3 關聯數據技術
利用關聯數據技術建設的家譜知識服務平臺,基于領域概念體系(知識本體)而非文獻組織知識,能夠幫助圖書館充分利用長期積累的文獻研究成果,并對其中的數據、事實和其他知識點進行細粒度描述;能夠利用網絡知識組織的編碼方法和技術手段,對館藏資源進行重新組織;能夠利用全網域的互聯網平臺,實現圖書館的書目控制。對于家譜數據而言,在滿足普通用戶尋根需求的同時,針對人文研究學者提供分面可視化瀏覽、語義搜索乃至知識挖掘服務,有助于打破圖書館各類資源庫之間相互隔離的封閉狀態,推進數據開放,促進知識流動,從而在開放利用中充分發揮其多方面的潛在價值。
上海圖書館是全國首家推出關聯數據開放的圖書館,其推出的“家譜關聯數據服務平臺”采用以關聯數據為代表的新型數據管理技術,該技術主要能滿足以下三個方面的需求:①滿足圖書館的書目控制和數據共享的需求,包括對一種家譜的版本、復本、收藏單位的全面呈現和對各類內容實體的規范控制,以及用于數據重用和共享的數據消費接口建設。②滿足普通大眾和人文研究人員的知識發現需求,包括基于概念匹配的檢索和基于人、地、機構、時間之間關聯關系的可視化瀏覽。③滿足領域專家的知識進化需求,支持用戶對已有的數據進行修正和補充,并對這些知識進行保存、組織和處理[3]。通過這個服務平臺,專業人士不僅可以對數據進行調用、修正,互聯網開發人員和機構還可以基于家譜數據集研發相關的APP和游戲,提升家譜文獻資料的應用范圍。
4 效果與展望
家譜GIS系統平臺、書目框架、家譜關聯數據服務平臺的探索、實踐與完善過程,反映了以用戶為主、數據開放理念在家譜數字化工作中的貫徹與執行。這些新技術的應用較好地提高了數據檢索的查全率與查準率,促進了家譜數據的開放和共享,提升了家譜數據庫的知識服務能力。
參考文獻:
[1] 黃顯功.上海圖書館的家譜數字化資源服務:古籍保護效果的一個實例[J].圖書館學刊,2008(1):4-6.
[2] 胡迪,溫永寧,閭國年,等.基于GIS的家譜資源整合集成研究[J].人文地理,2012(1):50-53.
[3] 夏翠娟,劉煒,陳濤,等.家譜關聯數據服務平臺的開發實踐[J].中國圖書館學報,2016(3):27-38.
(編校:周雪芹)