夏翠娟 賀晨芝 劉倩倩 朱武信



摘 ? 要:數字人文的勃興為GLAM領域的資源共建共享提出了新的需求。文章以上海圖書館“中文古籍聯合目錄及循證平臺”“中國家譜知識服務平臺”“人名規范庫”“歷史文獻眾包平臺”為例,介紹數字人文環境下新的歷史文獻資源共建共享模式,主要包括“資源與服務全托管模式”“資源與服務半托管模式”“聯合編目模式”“數據中心模式”“開放鏈接模式”“眾包模式”等六種,隨后分析比較其適用范圍和可行的技術方案。通過實踐案例論證了解決數字人文環境下GLAM領域的資源共建共享問題,利用以技術的手段作為政策和機制的補充,提供一種技術驅動的低成本資源共建共享途徑。
關鍵詞:數字人文;資源共建共享;最佳實踐;模式研究
中圖分類號:G122 ? 文獻標識碼:A ? DOI:10.11968/tsyqb.1003-6938.2021008
New Exploration on the Co-construction and Sharing Mode of Historical Literature Resources in the Digital Human Environment
Abstract The development of Digital Humanities has brought forward new demands for Resource Co- Construction and Sharing in GLAM. Taking the "Chinese Ancient Books Union Catalogue and Evidence-based Platform", "Chinese Genealogy Knowledge Service Platform", "Authority Names Database" and "Historical Document Crowd-sourcing Platform" as examples, this paper explores the mode of co-construction and sharing of historical literature resources in the digital humanities environment, including six modes. The paper analyzes and compares the application scope and feasible technical solutions. Through practical cases, the paper demonstrates that the problems of resource co construction and sharing in GLAM field under the digital human environment can be solved by technical means as a supplement to policies and mechanism.
Key words digital humanities; resource co construction and sharing; best practice; mode research
1 ? 引言
圖書館界對于資源共建共享歷來十分重視,建國以來各種多機構合作修纂聯合目錄如《中國叢書綜錄》《中國古籍善本書目》《中國古籍總目》《中國家譜總目》等工作起到了摸清家底的作用,為新世紀伊始數字圖書館建設大潮中數字化歷史文獻資源的共建共享打下了基礎。21世紀初互聯網時代的到來,對網絡環境下文獻資源共建共享的研究達到一個高峰,從現狀調查和反思[1],到管理機制[1]、運行模式[2],再到實踐[3]進行了全方位的探討。由國家(原)文化部、財政部共同發起并組織實施的三項重大公共數字文化工程(簡稱“三大工程”),即“全國文化信息資源共享工程”“數字圖書館推廣工程”和“公共電子閱覽室計劃”,在公共文化服務體系的資源共建共享方面取得了一定的成就,初步完成了信息基礎設施建設,在資源建設方面也制定了系統性的資源數字化加工、數字對象管理、資源描述、長期保存的標準規范,為不同機構間的資源共建共享奠定了一定的基礎。高校圖書館經過中國高等教育文獻保障系統(CALIS)、大學數字圖書館國際合作計劃(CADAL)等項目在高校圖書館界的資源共建共享等方面也取得了類似的成就。
國家十四五規劃提出實施文化產業數字化戰略,上海市全面推進城市數字化轉型,強調以新技術廣泛應用為重點,大力提升城市創新能級。而隨著“數智時代”的到來和數字人文的興起,為數字人文研究提供“數據基礎設施”支撐和數字學術環境保障成為歷史文獻資源開發利用的目的之一。“數據基礎設施”需要充分體現資源覆蓋全,數據規模大,覆蓋時間長,地域范圍廣,描述粒度小、維度多等特點,以支持全網域(Webb-scale)的數據調度、融合和自動化的分析、統計,以及大規模數據的可視化。這就對歷史文獻資源的共建共享提出了更高的要求。數字圖書館時代以三大工程為代表的資源共建共享都有著自上而下的政策和管理驅動的特點,成本較高。數智技術不僅為數字資源的管理加工提供了更為高效的平臺和工具,也改變了資源收藏者的觀念,對資源使用者催生了新的需求,而能否通過新技術的應用,為跨機構的協同共建和開放共享提供更為便捷輕型的解決方案,滿足實際情況下各個機構對資源共建共享的不同需求,提供靈活的選擇,正是本文試圖通過家譜、古籍、人名規范庫、眾包等數字人文項目實踐來探討的問題。
2 ? 文獻調研
為避免重復建設和服務的均等化,資源的共建共享是必然的需求[4]。我國自“十二五”時期開始加強對公共數字文化資源建設的重視,并推出大量涉及公共數字文化資源整合的策略[5]。隨著三大工程的實施,各地政府推出地方數字文化網站、資源共享平臺(中心),建設地方特色數字資源,但由于各地建設技術不一、數據結構各異,造成總體內容不成體系、無法互鏈共享、更新維護欠佳等問題,也難以為公眾提供全面高質量的數字文化資源服務[6-7]。
國外資源共建共享項目起步于上世紀90年代,至今已推出各類較為成熟的跨機構、跨地域歷史文獻資源共建共享平臺,如歐盟的Europeana、紐約公共圖書館的DPLA、法國國家圖書館的Gallica、澳大利亞國家圖書館的Trove、美國國會圖書館主導開發的WDL等,集合了不同機構的大量數字文化資源,為公眾提供一站式服務[8]。
資源建設方面,各平臺以規范的數據格式上傳資源、遵循約定協議關聯整合等方式匯聚資源。Europeana制定了EDM數據模型(Europeana data model)以語義技術融合各類資源元數據,不同機構自行加工數據,將符合要求的資源元數據上傳至平臺[9]。Gallica則根據參與機構數字化能力提供不同的建設方式,除了提供基于OAI-PMH協議的資源共建方式外,還為資源尚未數字化的機構提供數字化服務并將其納入平臺,對于資源已數字化但沒有獨立數字資源發布平臺的機構,在將其資源納入平臺的同時,還提供基于Gallica平臺、在界面設計(配色)上根據機構意愿個性化定制的數字資源發布平臺建設服務[10]。Trove在機構與機構共建數據的基礎上,引入了基于用戶貢獻的眾包理念,邀請用戶通過文獻標引、全文抄錄的方式與機構共同建設資源數據[11]。
資源共享與服務方面,在提供資源統一檢索門戶的基礎上,部分網站還提供了更為深入的知識服務、數據開放服務。WDL的資源元數據都可點擊關聯至相關檢索結果,Gallica提供與主題作者等相關的資源推薦,通過不同資源間的關聯提高資源利用率與可見度。WDL還利用國際圖象相互操作框架支持圖像資源的共享、關聯與再利用。DPLA和Europeana除了常規的服務平臺以外,還有專業版服務平臺,通過開放Search API、Record API、IIIF APIs、SPARQL、OAI-PMH Service等各類資源接口提供數據開放服務[12-13]。
3 ? 數字人文環境下歷史文獻資源共建共享模式——實踐探索
圖書館參與數字人文項目的最初出發點是利用新技術更好地整合開發館藏資源,尤其是用活用好珍貴的歷史文獻資源,以為研究者提供更好的數字學術支撐環境,以上海圖書館為例,其作為研究型公共圖書館,需要利用數據可視化、AR、VR等技術拉近專業性較強的歷史文獻資源與普通大眾的距離,從總體上提高資源的利用率。上海圖書館的數字人文項目建設始于2014年,從上圖的特色資源家譜開始,利用以關聯數據、知識圖譜為主的語義萬維網(Semantic Web)技術,融合597家館藏機構和眾多私人收藏者的家譜元數據記錄、專家的研究成果(姓氏、祠堂、家規家訓)、相關的網絡資源、人名詞典,基于本體(Ontology)建模的方法重組整合數據,建成“中國家譜知識服務平臺”,在提供更好的文獻查閱服務之外還提供數據驅動的知識服務,為使該平臺成為一個不斷生長的有機體,還開發了在線捐贈、在線識譜、在線修譜、聯合編目等各種眾包功能,吸納用戶貢獻內容。經過數年的探索實踐,上海圖書館建設了手稿、檔案、古籍、紅色文獻等文獻知識庫,并以人名規范庫等知識庫作為不同機構、不同類型的文獻的數據鏈接中心和知識共享中心,形成了將各種文獻庫和知識庫融為為一體的人文數據基礎設施。在這個過程中,不可避免地涉及到跨機構的資源共建共享的問題,根據各個機構的資源管理服務政策、現狀和需求,探索了不同的資源共建共享模式。在“中國家譜知識服務平臺”中,探索了“聯合編目模式”和“眾包模式”;在“中文古籍聯合目錄及循證平臺”中探索了“資源與服務全托管模式”、“資源與服務半托管模式”和“開放鏈接”模式;而人名規范庫則是通過一個人物實體作為“數據中心”,來鏈接來自不同機構和不同類型的文獻資源;“歷史文獻眾包平臺”則是一個旨在為不同機構、不同種類的歷史文獻提供眾包項目分發、管理和回收的綜合性眾包平臺,面向個人用戶,支持元數據編目和全文圖像抄錄成文本,是典型的“眾包模式”。
3.1 ? ?資源與服務全托管模式
“資源與服務全托管模式”是指資源收藏機構無獨立的特藏資源服務站點,將要服務的資源元數據和數字化全文掃描影像提交給托管機構,由托管機構負責進行數據加工和格式轉換及系統開發,在云平臺上提供元數據和數字化全文掃描影像服務,并支持功能開發及后續維護(數據更新、站點維護管理等)。
如澳門大學圖書館與上海圖書館的古籍項目合作就是采用資源與服務全托管模式。澳門大學圖書館將其館藏2480種古籍的MARC元數據和數字化全文掃描影像托管給上海圖書館,上海圖書館數字人文團隊對元數據進行數據清洗和知識提取,提取元數據中的作品、版本、責任者等信息,按照上圖古籍本體的知識結構進行重組和RDF格式轉換,對PDF格式的古籍掃描影像進行IIIF的轉換,并在上圖中文古籍聯合目錄及循證平臺(http://gj.library.sh.cn)上為澳門大學圖書館發布了單獨的古籍目錄站點,直接在云端為該館讀者提供獨立的古籍館藏服務站點(https://gj.library.sh.cn/org/mcu)。澳門大學圖書館可以自行對該站點的界面外觀、高級檢索字段、詳情頁面顯示的字段、排序規則等進行個性化設置(見圖1),也可對資源和用戶進行維護和管理。平臺支持澳門大學圖書館管理員對資源元數據進行查詢修改、館藏導出或新增資源的批量上傳,以上設置和維護也可全權委托上海圖書館。
同時,澳門大學圖書館也可共享平臺提供的1400余家機構館藏目錄一站式檢索的“聯合目錄”功能,和融合各種聯合目錄、史志目錄、官修目錄、私家目錄和避諱字、藏印、刻工等各種外掛知識庫的“循證研究”功能,以及還原各種古籍目錄并提供全文檢索和閱覽的“古籍目錄”功能等。
這種模式適用于資源收藏機構無暇投入人力自行開發館藏資源服務站點,其優點是資源托管機構成熟的技術方案和開發經驗,能快速按既有流程完成開發,提高了開發的效率,雙方的數據深度融合形成規模化優勢;由于采用一致的數據模型和技術方案,確保了雙方資源整合時數據標準和技術架構的統一,避免了不同技術體系帶來的互操作障礙;此外,資源集中存儲,服務在云端,在后續的更新和維護上,也有一定的便利性。
3.2 ? ?資源與服務半托管模式
資源與服務半托管模式是指資源收藏機構已有獨立的特藏資源服務站點,但將要建設的元數據和數字化全文掃描影像提交給資源托管機構,由后者負責進行數據加工和格式轉換,在云平臺上提供元數據和數字化全文掃描影像服務,以及平臺功能開發及后續的維護(資源更新、站點維護管理等),云平臺的服務作為前者已有服務站點的補充。
如柏克萊加州大學東亞圖書館與上海圖書館的合作就是采用資源與服務半托管模式。前者曾將館藏的清乾隆六十年以前所有中文刻本及稿、鈔、校本編著為《柏克萊加州大學東亞圖書館中文古籍善本書志》公開出版,其中收錄該館所藏中文古籍善本802種,每種書志的著錄非常詳細和完善,包括書名、卷數、著者、版本、冊數、行款、版匡高廣、牌記、刻工、寫工、原書序跋、著者仁履、內容提要、版本考訂、收藏或經眼者批校題跋、收藏概況、鈐印等項,為反映海外圖書館漢籍收藏的一本重要工具書。上海圖書館以此書為基礎與柏克萊加州大學東亞圖書館進行合作,雙方商定,前者為后者提供中文古籍聯合目錄與循證平臺的所有登錄用戶可訪問的內容和服務,后者允許前者將802種善本書志的內容數據化后融入中文古籍聯合目錄和循證平臺。
上海圖書館數字人文團隊對善本書志進行了結構化、數據清洗和知識提取,提取元數據中的分類、作品、版本、責任者、鈐印等信息,按照上海圖書館古籍本體的知識結構進行重組和RDF格式轉換,融入中文古籍聯合目錄及循證平臺。并對該館提供的279種全文掃描影像進行IIIF轉換,在上海圖書館的中文古籍聯合目錄及循證平臺上發布了單獨的柏克萊加州大學東亞圖書館古籍目錄站點(https://gj.library.sh.cn/org/bkl),為該館讀者提供獨立的善本書志目錄全文檢索和部分全文掃描影像的IIIF服務。柏克萊加州大學東亞圖書館可以自行對站點的主頁進行個性化設置和資源維護。同時,根據柏克萊加州大學東亞圖書館的要求:善本書志的內容無條件地公開訪問,但數字化全文掃描影像則只供雙方用戶在局域網訪問。針對此需求,平臺采用IP控制和用戶權限控制的方式,支持雙方的用戶通過統一用戶登錄后,在IP控制的范圍內,訪問“中文古籍聯合目錄及循證平臺”上的所有向登錄用戶開放的內容和功能,而除數字化全文掃描影像外的全部內容,不登錄也可以訪問。
這種模式適用于收藏機構有一定的信息化和開發能力,但希望托管機構提供更好的服務作為已有服務的補充。針對收藏機構在數字化全文掃描影像服務策略上的不同需求,托管機構需提供靈活的服務方式。如上海圖書館中文古籍聯合目錄及循證平臺就支持對數字化全文掃描圖像的訪問權限進行靈活的控制,如可配置的IP控制、用戶角色權限控制、針對某種古籍單獨的權限控制等。
3.3 ? ?聯合編目模式
2018年,上海圖書館主持的國家哲學社會科學基金重大課題“ 編纂《1949年以來中國家譜總目》(18ZDA329)”立項。該課題的創新點之一是,充分利用互聯網+分布式工作的思維和上海圖書館數字人文項目建設已有的成果,在中國家譜知識服務平臺已有的新家譜目錄數據基礎上,由上海圖書館研發家譜聯合編目系統,支持參與新家譜總目編纂的各家機構基于一致的著錄規范,在同一系統在線協同聯合編目,編目數據實時與中國家譜知識服務平臺同步,一邊協同編目,一邊就能向各個收藏機構和廣大用戶提供服務。新家譜目錄編目完成后,由系統按照書本式目錄的格式生成《1949年以來中國家譜總目》草稿。
家譜聯合編目系統(http://jplb.library.sh.cn)于2020年3月研發完成開始投入使用,截至2021年2月,已有56家機構參與聯合編目,已完成1800余種家譜的著錄。系統支持不同的機構遵循一致的著錄規范進行編目。在著錄界面提供詳細的著錄范例,并對字段內容,字段格式、字段長度按照著錄規范進行自動數據校驗。系統支持著錄查重,著錄人員在著錄之前需先查重,如查到手頭待著錄的家譜已有其它機構著錄過,則只需添加本機構館藏信息如索書號、冊數、是全本還是殘本等說明。一方面減少了著錄人員的工作量,另一方面提升了家譜目錄數據的質量,有利于系統按作品-實例-單件(復本)這樣的結構生成書本式目錄,減輕了總目編纂人員的工作負擔。系統支持流程控制和質量控制。編目工作的整個生命周期分為草稿,待初審,待定審三種狀態。著錄人員在著錄過程中,可以提交,也可以暫存為草稿。提交后,著錄工作單發送到機構專家初審,機構專家負責本機構著錄工作的質量控制,確認無誤后,提交到編委會專家。編委會專家對各個機構的著錄結果以出版的要求進行第二次質量控制,對有問題的著錄工作單進行修改,確認完成定審操作。定審后,數據就會實時同步到家譜知識服務平臺提供服務。除了單條目錄著錄外,系統也支持批量查重、批量數據導入、批量數據導出功能。
“聯合編目模式”適用于歷史文獻資源聯合目錄的共建共享,其優點在于數據加工規范和格式的一致性,和在線協同工作方式的高效性,可以極大地避免重復建設,提高工作效率。但系統的研發維護成本較高、對系統穩定性和用戶體驗要求較高。
3.4 ? ?數據中心模式
“數據中心模式”是從多源異構數據中采集數據,在云端建設統一的數據中心中,記錄數據來源,反過來再根據其來源鏈接處于不同網域中的資源,關聯開放數據云(Linked Open Data Cloud)即是一種典型的數據中心模式。
上海圖書館在數字人文的項目建設中,將人名、地名、時間、事件數據從不同的資源中抽取出來,分別建設了人名規范庫,地理名詞表,歷史紀年表,歷史文化事件知識庫,作為鏈接不同資源的數據中心。其中人名規范庫建設的初衷是提供互聯網環境下人名規范控制,后來逐步成為多源異構資源的數據鏈接中心。現已收錄人物共133萬余人,來自上海圖書館的中國家譜知識服務平臺、中文古籍聯合目錄及循證平臺、手稿檔案知識庫、上海年華系列專題庫、革命(紅色)文獻服務平臺,融合了國家圖書館人名規范檔、哈佛大學中國歷代人物傳記資料庫(CBDB)、各種人名大辭典的數據,另有浦東區圖書館、華東師范大學圖書館、韜奮紀念館等機構也提供了部分人物數據。
人名規范庫作為數據中心體現在兩個方面,一是開放數據鏈接,通過一個人物鏈接到不同機構不同網域中的資源,包括文獻資源、相關人物、故居等,以“馮契”的人物信息頁面為例,打開頁面,可以看出其小傳數據來自《中國近現代人物名號大辭典》、國家圖書館人名規范檔和華東師范大學名師庫,并鏈接到上海圖書館的各種館藏資源,以及其社會網絡關系中的人物(見圖2);二是開放數據服務,人名規范庫作為上海圖書館歷史人文數據基礎設施的一部分,提供API、Sparql Endpoint、內容協商等方式將人物信息封裝成數據消費接口,供其他機構或個人通過程序調用,按需獲取數據,并用于自己的應用環境中。
3.5 ? ?開放鏈接模式
開放鏈接模式是指資源收藏機構與資源托管機構在元數據層面進行資源的共建共享,資源托管機構負責對元數據進行加工和平臺功能開發,資源收藏機構自行進行資源掃描全文部分的開發并以開放鏈接的方式提供服務。
如哈佛大學哈佛燕京圖書館與上海圖書館的古籍項目合作就是采用開放鏈接的模式。哈佛燕京圖書館藏中文善本古籍特藏,一直以質量之高、數量之大著稱于世,為方便海內外學者便捷地利用這些資料進行研究,哈佛大學燕京圖書館在特藏文獻資源的整理和服務方面也一直走在新技術應用的前沿,有自己古籍館藏資源服務站點,采用IIIF公開發布了數字化全文掃描影像,提供在線閱覽、標注和下載服務,古籍文獻有獨立的URL(http://nrs.harvard.edu/urn-3:FHCL:3622194),可全網域訪問和定位。故與上海圖書館合作時,哈佛燕京圖書館將中文善本元數據記錄共享給上海圖書館,上海圖書館技術團隊對其進行了進一步地數據清洗和知識提取,提取元數據中的類別、作品、版本、責任者、索書號、IIIF全文瀏覽頁面鏈接等信息,按照上圖古籍本體的知識結構進行重組和RDF格式轉換,在上圖古籍聯合目錄及循證平臺上發布了單獨的哈佛燕京圖書館古籍目錄站點(https://gj.library.sh.cn/org/harvard),并在每種古籍的元數據詳情頁面加入哈佛燕京圖書館古籍的IIIF服務URL,鏈接到其已有的IIIF全文瀏覽頁面。通過這樣的合作,哈佛大學的用戶也可共享“中文古籍聯合目錄及循證平臺”上的所有開放內容和功能。
若收藏機構已對館藏資源進行了一定程度的數字化或信息化開發,無需重復建設,且有提升影響力或提高資源利用率的意愿,可采用開放鏈接的合作模式,在元數據層面達成機構間資源的融合與共享,以支持資源的統一檢索。這種合作模式的前提是收藏機構在資源的信息化開發上有一定的成果并為每種資源提供開放訪問的URL和相應的服務界面。
3.6 ? ?眾包模式
眾包模式是指公共文化機構采用“眾包”的理念和用戶貢獻內容(UGC)的技術,充分吸納公眾的認知盈余來實現共建共享。機構將數字資源及建設需求發布至公共平臺,公眾根據要求自發地進行如抄錄、校對、標引、捐贈等工作,用戶貢獻的內容由專家審核收集整理并發布至服務平臺,取之于公眾,用之于公眾。上海圖書館的“歷史文獻眾包平臺”“中國家譜知識服務平臺”即是采用眾包模式進行資源共建共享的例子。
歷史文獻眾包平臺構建了一個既面向大眾又面向機構的文獻資源共建共享平臺,邀請公共文化機構發布文獻圖像資源及元數據、吸引大眾參與文獻全文抄錄及元數據深度標引,促進大眾與文化機構共同加工建設數字資源、分享再利用建設成果。平臺支持為不同的資源自定義元數據元素集,支持不同機構上傳不同類型歷史文獻圖像資源及元數據信息,以任務的形式打包發布至平臺。大眾在平臺的任務廣場頁面(見圖3)選擇感興趣的文獻資源進行全文抄錄、元數據字段標引等數據加工。對于用戶貢獻內容的質量控制,平臺采用專家審核制度進行人工審核修訂并將修訂結果反饋貢獻者,所有通過審核的數據,都將作為資源發布機構用于建設數字人文項目的數據基礎,實現細粒度的、基于文獻內容的服務。
借助該平臺,上海圖書館與南京大學合作舉辦了“文化遺產數字化”競賽,將上海圖書館館藏“盛宣懷檔案”文獻發布至任務廣場,請南京大學組織高校學生參與文本抄錄。競賽吸引了南京大學、復旦大學、南開大學等多家高校的63位學生參與,最終完成256件文獻的文本抄錄工作。截止2020年年底,平臺發布手稿、信函、章程、諭旨等多種類型文獻資源627件,參與建設用戶200余人,完成全文抄錄422件,所有完成抄錄文獻都可在眾包平臺中閱覽全文。
“中國家譜知識服務平臺”的眾包模式資源共建共享體現在上傳家譜、在線識譜、在線修譜這三個功能,邀請大眾與機構一起豐富家譜資源、并對家譜數據進行深加工。
上傳家譜(在線捐贈)區別于郵件寄送、到館捐贈等傳統家譜捐獻路徑,為大眾提供了便捷、規范的家譜捐獻窗口,同時方便了捐獻者和受贈機構。用戶只需根據網站規定格式上傳家譜影像圖片并提供譜籍地、責任者、裝訂等家譜信息即可捐獻家譜,為便于用戶理解,平臺為每個填寫字段都提供了說明文字及參考樣例,上傳家譜影像圖片也支持多種圖像格式。上傳后的家譜將交由家譜整理研究專家審核,通過審核的家譜即可設為館藏,數據進入知識服務平臺對外提供服務。
在線修譜功能服務于有家譜修纂需求的用戶,提供規范化的家譜內容輸入和世系表編輯,支持多人協作,并能按照不同的家譜體例如歐式、蘇式、寶塔式、牒記式,由系統自動生成出版格式。
在線識譜是集眾人之力對平臺開放的數字化家譜全文中的世系表進行文本化、結構化,以便于生成可視化的家族樹或為研究者提供量化分析的結構化數據。世系表是家譜最重要的內容之一,記錄歷代家族成員信息、成員關系、大事記等,蘊藏了大量的信息,可為家譜數字人文分析提供大量數據依據。但由于譜系圖結構復雜,傳統的文本識別方式僅能識別出文字但無法識別出結構化的個人信息和人與人之間的關系,不能滿足其數據化需求,在線識譜功能支持廣大用戶協同識別世系表,獲得結構化數據,加速家世系表數據化進程。
4 ? 結語
數字人文的勃興為GLAM領域的資源共建共享提出了新的需求,數字人文注重的不僅是資源的數字化,更是資源內容的數據化和數據的大規模、全量級、細粒度、長時間和大空間的覆蓋,以及在此基礎上建設以資源、數據、知識為核心、以可持續性和開放性為保障、以滿足多樣化個性化的用戶需求為導向的數據基礎設施。過去那種自上而下的依賴政策和管理機制來實現不同機構之間資源共建共享的方式已不能滿足需求。本文試圖通過上海圖書館的數字人文項目建設的實踐,探討一種利用現代信息技術自下而上地實現不同機構甚至是團體和個人之間的歷史文獻資源共建共享的路徑。總結提煉出的六種歷史文獻資源共建共享的模式,未必能解決資源共建共享中的所有問題,但有望能為業界提供另一種角度、另一種思路和參考案例。
參考文獻:
[1] ?高波,劉茲恒,于麗鳳.網絡環境下我國圖書館信息資源共建共享現狀調查報告[J].中國圖書館學報,2001,27(4):48-52.
[2] ?高波.文獻信息資源共建共享模式新論[J].中國圖書館學報,2002(6):25-28.
[3] ?袁海波,孟連生.網絡環境下信息資源共建共享的實踐——兼述國家科技圖書文獻中心的建設與發展[J].情報學報,2002,21(1):57-62.
[4] ?肖希明,完顏鄧鄧.以公共數字文化資源整合促進基本公共文化服務均等化[J].圖書館,2015(11):22-25,31.
[5] ?肖希明,盧世晴.公共數字文化資源整合政策體系探討[J].圖書館,2015(9):1-5.
[6] ?韋楠華,吳高.公共數字文化資源共建共享現狀、障礙及對策研究[J].圖書館建設,2018(9):18-26.
[7] ?吳高.地方公共數字文化特色資源建設現狀調查與思考——以全國文化信息資源共享工程省級分中心特色數字資源建設為例[J].圖書館建設,2016(1):39-46.
[8] ?張福俊,高雪,周秀霞.國內外數字資源發現平臺比較研究——以Trove,DPLA,Europeana,WDL和文津搜索為例[J].國家圖書館學刊,2018,27(1):86-96.
[9] ?Share your data[EB/OL].[2021-02-04].https://pro.europeana.eu/share-your-data/.
[10] ?Rapport dactivité 2019[EB/OL].[2021-02-04].https://www.bnf.fr/fr/ra2019-gallica-et-la-politique-de-diffusion-numerique-des-collections#bnf-l-offre-documentaire-et-les-fonctionnalit-s.
[11] ?Trove[EB/OL].[2021-02-04].https://trove.nla.gov.au/.
[12] ?李金芮,楊蕾.國外公共數字文化資源整合項目服務方式調查分析[J].圖書與情報,2015(1):22-26.
[13] ?Our APIs[EB/OL].[2021-02-04].https://pro.europeana.eu/page/apis.
作者簡介:夏翠娟,女,上海圖書館研究館員,研究方向:元數據、知識本體、知識組織、關聯數據、數字人文、文化記憶;賀晨芝,女,上海圖書館工程師,研究方向:數字人文;劉倩倩,女,上海圖書館館員,研究方向:數字人文;朱武信,男,上海圖書館工程師,研究方向:數字人文。
本文系國家哲學社會科學基金項目“支撐城市記憶項目的‘數據基礎設施理論建構與實踐探索”(項目編號:19BTQ007 )研究成果之一。
收稿日期:2021-02-18;責任編輯:柴若熔