999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

日本人文社會科學數據基礎設施的建構模式與啟示

2024-04-29 00:00:00時晨
圖書與情報 2024年1期

摘" "要:構建面向人文社會科學領域的數據基礎設施,支持數據的保存、獲取、使用、發布以實現數據的可復用、可關聯與可聚合,能有效助推人文社科研究的全面數字化轉型。文章以日本人文社會科學數據基礎設施建設項目為研究對象,從項目內容、建設模式、項目優勢等角度展開分析,發現該項目以研究者對研究數據的共享、使用流程為基礎,力求在數據生產、數據處理、數據保存、數據再利用等全生命周期提供相應的產品和服務;且該項目具有協作主體有序分工、數據標準重開放兼容、數據使用重規范、文化形成重培育等特點,能給我國的數字人文數據基礎設施建設提供實施統籌管理、發揮機構聚合優勢與完善數據標準等啟示。

關鍵詞:日本學術振興會;人文社會科學;數據基礎設施;構建模式

中圖分類號:G356" "文獻標識碼:A" "DOI:10.11968/tsyqb.1003-6938.2024006

Enlightenment and Construction Mode of Japan Data Infrastructure for the Humanities and Social Sciences Program

Abstract" Building a data infrastructure for the humanities and social sciences,supporting the data storage,access,use and release to achieve data reusability,association and aggregation,which can effectively promote the overall digital transformation of humanities and social sciences research. Taking the Japan Data Infrastructure for the Humanities and Social Sciences program as the research object,it analyzes from the perspectives of program content,construction mode and program strengths. The construction of the Japan Data Infrastructure for the Humanities and Social Sciences is based on the process of sharing and using research data by researchers,and provides corresponding products and services throughout the life cycle of data production,data processing,data storage,and data reuse. The program is characterized by an orderly division of labor among multi-subjects' collaboration,data standards that emphasize openness and compatibility,data use that emphasizes regulation,and culture formation that emphasizes cultivation,which can provide China's digital humanities research data infrastructure construction with enlightenment such as realizing coordinated management,giving full play to the advantages of organizational aggregation,and perfecting data standards.

Key words" Japan Society for the Promotion of Science; humanities and social sciences; data infrastructure; construction model

美國學者維爾蒙(Chad Wellmon)說,人文學科的繁榮發展歷經多種形式,其發展離不開新方法、新實踐和新技術的應用[1]。20世紀40年代中后期,被稱為數字人文實踐先驅的布薩(Roberto Busa)開始構建神學者阿奎那(Thomas Aquinas)著作的電子資源庫,其后十余年,人文資料的數字化與網絡化進展迅猛,人文學者或基于新材料的偶然發掘、或基于個人洞察的書齋式研究隨之發生巨變。在全面獲得、占有某一領域海量數據的基礎上,選用適當的分析挖掘工具,與跨學科團隊進行協作式研究成為人文學科研究的新模式。有學者斷言,數字人文能為傳統的人文研究提供新研究方法和工具,更能改變科研人員思考問題的角度,推動人文研究向“第四范式”轉變[2]。

“研究范式”(Paradigm)的概念由美國學者庫恩(Thomas Kuhn)提出,美國計算機科學家格瑞(Jim Gray)做出如下總結:人類科學至今經歷了四種范式,最早是以記錄與描述自然現象為主的“實驗科學”范式;其次是以模型歸納總結的“理論科學”范式;再次是伴隨著計算機技術出現的“計算科學”范式;如今則是借助計算機分析海量數據,并發現規律的“數據密集型科學”(Data-Intensive Scientific Discovery)范式,即第四研究范式[3]。研究范式的轉變本質是一場顛覆性革命,能否形成一種新的基礎設施是轉變的關鍵問題之一,因為新的基礎設施能固化新范式,并為之后的研究提供強有力的支撐。數字人文的研究依賴研究數據與方法,但人文數據源于人類表達、互動、想象等行為所產生的原始素材,有多源異構等特點,通用的研究數據基礎設施(Research Data Infrastructures,RDI)難以直接匹配。因此,建立面向人文領域的數據基礎設施,保證人文數據的長期保存、共享與重復使用極為重要。對于何為數字人文基礎設施,中外學界尚未形成共識。有研究者將其定義為數字環境下開展人文研究的必備條件,包括全球范圍內與研究主題相關的所有文獻、數據、軟件工具、學術交流和出版的公共設施及相關服務[4]。有研究者認為數字人文數據基礎設施為數字人文數據、知識的生產與組織提供支撐,是位于“后臺”(信息基礎設施)和“前臺”(特定領域研究)之間的“數據中臺”[5]。以上研究具體表述雖有異,但核心并無沖突,可以說數字人文數據基礎設施是數字人文研究過程中所使用的系列工具、平臺、系統等的總稱,能支持數據的保存、獲取、使用、發布以實現數據的可復用、可關聯與可聚合,有效助推數字人文研究者的創新研究。

2006年,世界首個以“數字人文”冠名的項目“數字人文先導計劃”(Digital Humanity Initiative)在美國啟動。同年歐美先后發布《歐洲研究基礎設施建設路線圖》(the European Roadmap for Research Infrastructures)與《我們的文化共同體》(Our Cultural Common-wealth)報告,數字人文研究的基礎設施建設就此拉開帷幕。此后十余年間,伴隨著經濟合作與開發組織(Organization for Economic Co-operation and Development,OECD)對“基于公共資金取得的研究數據應廣泛共享”的持續呼吁,以及FAIR原則在數據研究世界中的不斷下滲,歐美等國啟動了一系列大規模人文社科數據基礎設施建設項目。與建設實踐相呼應,研究者們也對人文社科基礎設施進行了多角度研究。國外學者多注重解剖具體項目的架構、技術設計與服務等,如對藝術與人文數字研究基礎設施(DARIAH)的可持續技術方案[6]、架構[7]的探討;對面向人文數據集合的人文網絡基礎設施(HuNI)設計思路的分析[8];對CLARIN基于FAIR原則的技術設計、實現[9]研究等。國內學者的研究多基于我國數字人文數據基礎設施的建設實際,如金家琴和夏翠娟設計整套通用的、支持復用并考慮未來擴展途徑的機構知識本體模型和詞表[10];陳濤等以ECNU-DHRS為例分析數字人文研究的語義支撐平臺框架的建構[11];顏佳等借助科學計量與可視化分析工具,探討未來圖像數據基礎設施建設的發展方向[12]。也有學者選擇國外典型的數字人文數據基礎設施進行研究,如周雷以德國國家文化遺產科研數據基礎設施項目NFDI4Culture為對象的個案分析[13]。不過,以上研究或聚焦本土,或關注歐美,針對其他地區數字人文數據基礎設施建設的研究較為少見。以同處亞洲的日本為例,21世紀頭十年日本的人文社會科學數字化轉型進展緩慢,日本學術振興會(Japan Society for the Promotion of Science,JSPS)于2018年啟動大型項目“人文社會科學數據基礎設施構筑推進事業”(Program for Constructing Data Infrastructure for the Humanities and Social Sciences,以下簡稱人文社科數據基建項目),目標為實現日本人文社科數據的跨國界、跨學科、跨領域共享共用。該項目為期5年,如今已近尾聲,所研發的數據目錄、在線數據分析系統等成果均已投入使用,但尚未出現對此項目的專門研究。本文擬從背景、內容、建設模式等角度對該項目展開全面剖析,以期對我國的數字人文數據基礎設施建設有所啟示。

1" "日本人文社科數據基建項目概況

1.1" " 項目背景

2015年8月,日本科學技術·學術政策研究所(National Institute of Science and Technology Policy,NISTEP)通過與英、德等國對比,發現日本在基礎科學領域的論文增速趨零,且頂級論文占比下降,日本在國際學術界的影響力降低[14]。2017年4月,文部科學省總結本國學術研究存在“三大危機”并提出解決方案,其中包括強化能適配大數據流通的信息網絡,充實能響應多元化需求的計算基礎設施等[15]。具體到社會科學領域,則要以舉國體制(All Japan)構筑數據平臺并強化功能,保證實現對社會科學各領域數據的綜合收集、保管、提供與利用。日本學術振興會隨后展開大規模“人文社科領域研究數據現狀調查”,調查顯示日本人文社科研究人員的數據共享意識較低,共享動機缺乏[16],但對利用他人公開的數據較有熱情。不過,當時日本沒有專門負責人文社科研究數據收集、保存和提供的組織或機構,數據多由研究者個體或所屬機構自行保管,數據的完整性、準確性難以保證,也沒有通用的數據共享政策或指南可供參考。鑒于此,日本學術振興會提出日本的人文社會科學研究已在開放科學大潮中落后,可能出現“日本失蹤”(日式造詞,Japan Missing)的危機。此外日本人文社科數據的多語言化進程緩慢,從事亞洲相關研究的歐美研究者更傾向于與中國、韓國或新加坡等國的研究者合作,以致“日本漠視”(日式造詞,Japan Passing)的趨勢日益明顯[17]。日本學術振興會于2018年啟動以實現人文社科數據跨國界、跨學科、跨領域共享共用為目標的人文社科數據基建項目,一方面促進人文社科數據的深度共享,推動本國人文社科研究的全面數字化轉型(Digital Transformation);另一方面增加日本人文社科研究成果的“可見度”,提升日本人文社科研究的國際影響力。

1.2" " 項目內容

在人文社科數據基建項目啟動前,日本雖沒有能覆蓋人文社科各學科的國家級數據中心,但一些在特定學科研究水平較高、擁有豐富的數據資料的機構曾被文部科學省認證為“共同利用·共同研究基地”。如自2000年起主持日本版綜合社會調查(Japanese General Social Surveys,JGSS)的大阪商業大學JGSS研究中心、長年進行日本家庭面板調查(Japan Household Panel Survey,JHPS)的慶應義塾大學附屬經濟研究所等。不過,這類機構有數據保存管理經驗,但對FAIR原則、OAI-PMH協議(Open Archives Initiative Protocol for Metadata Harvesting)等國際通用的數據共享標準規范認知度不高,員工也普遍存在圖書情報學與信息科學知識不足的問題。所以日本學術振興會專門設立“人文社會科學數據基礎設施構筑推進中心”,并聯合國立情報學研究所(National Institute of Informatics,NII)共同作為日本人文社科數據基建項目的核心機構。其后通過公開招募選定在數據生產、管理、共享上較有經驗的大阪商業大學(JGSS研究中心)、慶應義塾大學(經濟研究所)、東京大學(社會科學研究所)、一橋大學(經濟研究所)與東京大學(史料編纂所)作為項目的基地機構,在核心機構的領導下形成網絡型協作。核心機構的任務為“構筑數據使用系統”,具體業務為制定人文社科領域研究數據的共享基準,打造讓數據所有者和機構能安心提供數據的環境,以及開發面向國際的、能集中搜索人文社會科學數據出處、所有者、數據類型等元數據的跨學科綜合數據目錄(Japan Data Catalog for the Humanities and Social Sciences,JDCat)與在線數據分析系統。基地機構的任務為“構筑數據共享基礎”,負責系統整理、規范本機構的數據知識庫(Data Repository),并陸續接受外來研究者與機構提供的數據。具體業務為強化數據檔案功能(數據“公開化”)、提升國際話語權與協作能力(數據“國際化”)以及構建能連接大規模社會調查和官方統計數據的數據庫(數據“聯結化”)等[18]。核心機構和基地機構的業務各不相同,但都圍繞著構筑跨學科、跨國界、跨領域的數據基礎設施進行。除了技術層面,營造人文社科研究者共享數據的文化氛圍、促進各學科展開國內外共同研究等也屬于業務范圍。

2" "日本人文社科數據基建項目的建設模式

2.1" " 建設模式

日本人文社科數據基建項目以人文社科領域的研究者對研究數據的共享、使用流程為基礎,參照數據的生命周期,力圖在數據生產、數據處理、數據保存、數據再利用等全生命周期提供相應的產品和服務。研究者、核心機構(信息技術機構)、基地機構等主體各司其責,能動參與,具體環節如下:(1)人文社科領域的研究者在研究項目完成時,對自有研究數據進行選擇與整理,選定共享或有條件共享數據并提供給基地機構;(2)基地機構的數據知識庫接收原始數據、進行數據清洗,賦予元數據,并以FAIR數據的形式保存與公開;(3)數據目錄JDCat收割基地數據知識庫的元數據,提供檢索服務。同時,JDCat也與CiNii Research等學術檢索平臺實現了整合,CiNii Research等在提供論文、圖書、研究數據及研究人員、研究項目等信息檢索外,也可檢索JDCat所有內容項目;(4)根據JDCat或CiNii Research的檢索結果,研究人員在相應的基地機構數據知識庫下載數據。此外,人文社科數據基建項目也會不斷擴充基地機構數量,力圖與更多機構實現網絡型協作。可見日本人文社科數據基建項目的建設模式并不是簡單地匯集或提供數據,而是要在數據提供方、數據使用方、數據管理者與信息技術機構之間形成有機聯系,共同打造一種可持續的、具有彈性的人文社科科研生態系統。研究人員有需求時,可通過JDCat、CiNii Research及知識庫獲取并利用數據展開研究,成為數據使用者。研究完成后,又能通過提供數據成為提供者。國立情報學研究所等信息技術機構全過程供給技術、工具、軟件及服務,為數據提供者、使用者帶來高效、便捷體驗的同時,也得以在人文社科科研生態系統中進行多樣化的應用場景試驗。各基地機構的數據知識庫也通過不間斷的數據存取實現“吐故納新”,在不斷擴張數據資源的同時對現有數據進行再整合(日本人文社科數據基建項目所打造的人文社科科研生態系統見圖1)。

2.2" " 模式特點

日本政府于2021年3月發布《第6期科學技術·創新基本計劃》,明確提出要通過研究的數字化轉型順應數字化與開放科學的國際趨勢,并指出要進一步強化人文社科研究數據平臺的功能[19]。值得注意的是,該計劃頒布3年前人文社科數據基建項目便已被日本學術振興會圈定為重點項目,可見其前瞻性。與其他數據基礎設施相比,日本人文社科數據基建項目的建設有分工明確、兼顧開放與標準、重視規范等特點,具體如下:(1)主體協作有序分工。日本國內各研究機構、學/協會等圍繞不同的主題構建了一些數據知識庫與平臺,但它們整體上存在分散孤立、數據互操作困難等問題。數據使用者為獲取特定數據往往要登陸數個知識庫。日本人文社科數據基建項目的建設主體分為基地機構與核心機構兩類,基地機構整合現有數據,提升本機構數據平臺、知識庫的功能,為核心機構創建跨學科、跨平臺搜索的數據目錄JDCat筑牢基礎;核心機構中技術實力雄厚的國立情報學研究所研發能自動收割基地機構元數據的JDCat與在線數據分析工具,并通過與CiNii Research等成熟檢索平臺協作,為人文社科研究者構筑便捷、安心地提供與使用研究數據的環境。基地機構與核心機構各司其責,形成網狀合作關系,能充分利用現有數據基礎設施,避免重復建設,實現既有資源的優化整合。(2)數據標準重開放兼容。基地機構數據知識庫的數據按FAIR原則處理,符合國際數據通行標準。同時,JDCat的元數據模式基于“兼容第一”的理念開發,關注完整性、可拓展性與靈活性。日本國內使用日本開放獲取知識庫聯盟(Japan Consortium for Open Access Repositories,JPCOAR)的元數據標準,研發人員引入國際通用的社會科學信息組織的元數據標準DDI(Data Documentation Initiative),通過映射既能覆蓋人文學科與社會科學學科數據,又能實現國內國際的互通運用,盡可能滿足人文社科各學科科研人員數據共享、交換和整合的需求。值得注意的是,JDCat元數據采用CC0(Creative Commons Zero)發布,海內外科研人員或機構無需經過日本學術振興會或基地機構的許可,即可自由獲取與使用。(3)數據使用重規范。為了讓人文社會科學領域的科研人員在共享數據時有章可循,在保護數據所有者權益的同時避免敏感信息和隱私數據泄露造成傷害,人文社科數據基建項目的核心機構系統研究了英國數據檔案(UK Data Archive,UKDA)、芬蘭社會科學數據檔案(Finnish Social Science Data Archive,FSD)等機構的數據共享指南,其后面向包括博士、碩士研究生在內的人文社科領域研究者編寫了日本首部人文社科數據共享指南,以規范其科研數據的管理和共享行為,切實促進數據共享[20]。(4)文化形成重培育。日本學術振興會調查顯示,不少人文社科研究者對共享數據態度消極,因此人文社科數據基礎設施的建設不僅要重視硬件,更要營造數據共享共用的氛圍。因此項目將“培育數據共享文化”作為業務之一,定期邀請人文社科各領域的專家學者與圖書情報學、信息科學專業人員召開交流會,促進研究數據共享學術社群的形成。核心機構也專門設置“人文社會科學數據共享問題探討”小委員會作為學術社群的中核組織,所有對人文社科數據、數據檔案有興趣的科研人員、大學科研管理人員和圖書館館員均可加入。小委員會首先著手分享數據檔案案例,近期開始編寫數據共享問題集與教材。

3" "日本人文社科數據基建項目的優勢分析

日本人文社科數據基建項目的目標是實現人文社科數據的跨國界、跨學科、跨領域共享共用,因此項目既注重架構的可擴展性,以保障數據資源的持續連通與共享,又關注應用功能的充實,以滿足人文社科科研人員當下的需求。具體而言,日本人文社科數據基建項目的突出優勢可分為緊抓數據流通、提供豐富工具、關注協同擴展和重視規范培養等。

3.1" " 促進數據流通為主軸

日本人文社科數據基建項目的首要任務是標準化、系統化管理人文社科相關領域的科研數據。現有五個基地機構都有成熟運營的數據知識庫,但隨著現有基地機構開放力度的加大,以及基地機構數量的增加,數據資源將不斷擴充。為保證現有和將來知識庫內數據的可獲取、可發現、可復用,實現真正的互聯互通與數據共享,所有數據的采集、處理與交換都要標準化,一是保證數據具有可靠性、完整性與可用性,切實反映科研活動所需信息的特征;二是保障數據能被檢索到,在準確率、查準率、查全率等各指標上表現良好。日本人文社科數據基建項目的核心內容因此分為兩個層次:(1)各基地機構提升數據知識庫功能,如收集整理本機構與外來數據、賦予元數據、實現日英雙語化等,為科研數據的廣泛共享打下基礎。在項目實施前的基地機構選拔階段,有豐富的科研數據保存管理經驗,且數據質量和預期需求較高的機構才能入選,五個基地機構都是優中選優的結果。項目實施過程中五個基地機構也表現優異,如慶應義塾大學附屬經濟研究所在構建日本家庭面板調查數據庫時,專門編制使用手冊、提供變量創建程序、創建合成變量及插補數據以提升數據使用的便利性。(2)核心機構負責科研數據共享的系統研發,包括開發跨庫檢索JDCat、開發在線數據分析工具以及編寫共享指南等。核心機構的JDCat開發體現出跨國界、跨學科與兼顧研究教學等三個面向。對于人文和社會科學數據的發現、獲取、傳播、保存而言,是否有良好的元數據至關重要。在跨國界面向上,支持日英雙語搜索的JDCat參考了國際通用的元數據模式,并結合人文社科數據特征選用了互操作性強的DDI-C,且推薦為數據賦予DOI以促進數據識別,順應了將數據列入參考文獻的國際學術寫作慣例[21];在跨學科面向上,JDCat通過引入通用標準、借助規范文件與專業詞匯表進行關聯,輔以語義技術提升查詢能力,以覆蓋社會調查數據、官方統計數據、面板調查數據及史料等來自人文社科各學科的數據。為避免漏檢與重復檢索,提升檢索效率,也在兼顧準確與通用的基礎上制定了包括“主題”“目標區域”“數據類型”“數據語言”等9項、12種類的受控詞表(Controlled Vocabularies,CVs)。“主題”項目參考了CESSDA TC(CESSDA Topic Classification),CESSDA TC難以覆蓋的人文學科主題援引日本十進分類法(第10版)的第2次區分表和第3次區分表,政府統計匯總表沿用了《日本統計年鑒》的目錄信息。在“調查方法”和“抽樣方法”項目則參考了DDI受控詞表。在“數據類型”等項目,因分類需要創建了全新的受控詞表;在兼顧科研教學面向上,JDCat則通過整合注重可用性、定期更新的在線數據分析工具實現。

3.2" " 工具軟件提升體驗

在數字人文研究領域,不少研究者分出寶貴的科研時間學習數據處理技術,但使用時仍無法保證規范性[22]。若能基于人文社科研究者的需求研發出可用性強的專業工具軟件,并圍繞需求定期優化,實現質量與可持續的平衡,必將極大促進人文社科各學科的研究活動。包含了系列分析工具軟件的在線數據分析系統開發是日本人文社科數據基建項目的重要內容之一,研發人員廣泛參考了GESIS Notebooks、MyBinder.org等知名平臺[23],也在對人文社科研究進行全過程場景分析的基礎上突出了可用性(Usability),具體表現如下:(1)研發的工具軟件無需在本地環境下載安裝統計軟件,也無需下載數據即可創建和運行R或Python程序進行數據分析處理,Jupyter Notebook,JupyterLab,Rstudio等環境均可使用;(2)大學等認證賬戶、以ac.jp或go.jp域名電郵地址注冊的OpenIdP賬戶均可直接登錄,每個賬號可有4個分析環境;(3)使用者可自由選擇、搭配分析工具;(4)使用者可將本地環境中的數據、程序上傳,CSV、PDF、JPG、AVI等各類格式文件均可;(5)上傳至分析工具的數據可保存、下載,使用者還可保存、下載分析程序與方案。在線分析工具不但對科研活動友好,也兼顧教學需求。2020年關西大學、立教大學和東京大學等先后導入,用于《微觀政治數據分析》《情報處理應用》等社會科學課程的教學實踐,2021年開始在人文學科教學中試用。在大學課堂教學和研討中,在線分析工具無需自行建構數據分析環境即可使用,教師可通過與學生共享數據、程序進行實時指導,還可將包含了數據、程序等的分析環境保存在本地,以保證研究的可重復性和連續性,有效提升教學效果。

此外,在線分析工具既可依托GitHub使用,也和JDCat、科研數據管理平臺GakuNin RDM實現關聯,可將公開數據一鍵上傳至分析工具直接分析。按照項目實施計劃,國立情報學研究所的JAIRO Cloud系統也將與在線分析工具關聯。該系統長期為日本國內700余所大學及研究機構的機構知識庫(Institutional Repository,IR)提供云端服務,關聯完成后系統內的海量數據也可利用分析工具直接分析。

3.3" " 基于云端的便利協同

JAIRO Cloud是日本國立情報學研究所于2012年啟用、基于SaaS服務類型的機構知識庫云端服務系統,其應用軟件為WEKO,2021年升級至WEKO3。JAIRO Cloud的創建宗旨是以國立情報學研究所的雄厚技術實力為支撐,為日本全國大學及其他教育研究機構提供從建設到運營機構知識庫的全過程支持和服務。使用JAIRO Cloud的機構只需在知識庫錄入并發布期刊論文、學位論文、會議論文等學術資源,知識庫的軟/硬件管理配置、OS管理與互聯網管理都由JAIRO Cloud負責。2016年日本開放獲取知識庫聯盟成立后與國立情報學研究所共同運營JAIRO Cloud,自2020年10月開始,JAIRO Cloud也提供數據接收服務。

JAIRO Cloud所運行的WEKO3有支持機構知識庫以標準的OAI-PMH協議和ResourceSync提供元數據、為搜索引擎提供站點地圖、利用META標簽鏈接至Google Scholar、以及通過社交媒體發布研究成果等功能。在五個基地機構中,除東京大學史料編纂所使用自開發系統外,其余都是JAIRO Cloud用戶,因此JDCat的系統設計直接使用WEKO3以實現元數據的自動收割,以OAI-PMH及Resource Sync保證從基地機構數據知識庫收割元數據的完整性。而且東京大學史料編纂所的系統也只需增補OAI-PMH協議,無需進行大規模調整。

JDCat的系統設計依托JAIRO Cloud,既避免了重復建設,也有可持續性與開放性的考慮:(1)JAIRO Cloud為日本700余所大學與其他研究機構提供云端服務,JDCat不僅可自動收割基地機構元數據,隨著JDCat的穩定運行和功能擴張,其他機構知識庫的同類數據與元數據也可通過瀏覽器單獨或分批次注冊;(2)JDCat使用可擴展的元數據模式管理,可擴展至DDI之外,如都柏林核心(Dublin Core,DC)等;(3)可將使用信息歸納統計形成實時報告。JDCat開發過程中也增補了一些功能,如強化了JAIRO Cloud既有的分面檢索(Faceted Search)和詳細檢索功能,并為DDI等專門領域元數據設置分面檢索和詳細檢索。JAIRO Cloud也將以上功能開放給日本全國使用JAIRO Cloud服務的教育、科研機構。而且,因JDCat已與日本最大的學術信息檢索平臺CiNii Research實現關聯,日本人文社科數據基建項目通過JDCat、JAIRO Cloud、機構知識庫和其他機構數據知識庫的協同可以全面覆蓋人文社科科研數據的檢索、下載、使用和提供等全過程。

3.4" " 著眼未來的規范化培養

2016年日本政府頒布《第5期科學技術基本計劃》,明確了全面推進開放科學的方針。2018年頒布的“綜合創新戰略”又確定了具體推進方法,其核心是以兼顧開放潮流與國家利益的Open And Close戰略為指導,建構能實現靈活管理、保存、共享數據的基礎設施[18]。作為回應,國立情報學研究所開發出以實施國際一流水平研究數據管理為目標的NII研究數據云(NII Research Data Cloud,NII RDC);各大學與研究機構也著手構建能反映本機構科研項目實施全過程的數據管理平臺(Data Management Platform,DMP)。但是,上述政策和項目多為政府主導,少見科研人員個體或社群的自發參與。其實,無論是研究范式轉移的實現、學術情報流通的開放抑或是研究評價體系的建構,研究者都是最重要的主體,理應發揮能動作用。在20世紀末,互聯網和數字技術的迅猛發展改變了人文知識的獲取、分析與共享路徑,但日本人文社科領域研究者對國際潮流反應消極,對數據開放共享的遲疑態度正是突出表現之一。想切實推進人文社科領域的數據共享,不僅要從技術架構、模型等“硬建設”或是運營機制、發展策略等“軟建設”的角度研究如何構建更強大的數據基礎設施[24],更要推動科研人員對數據共享的認知與行為變化,并促成數據共享文化氛圍的形成。日本人文社科數據基建項目的核心機構專門編寫數據共享指南,從元數據標準與格式、數據使用、公開的規則、匿名化處理與權益關系等角度對人文數據共享進行全面講解。指南編寫的全過程與基地機構的業務進程相對應,先圍繞社會科學領域數據寫作,再針對人文學科的數據補充注釋和欄目。在社會科學領域,指南的重點對象為定量的社會調查數據和政府統計數據。個案研究和田野調查得來的定性數據因受時間和環境影響,其共享需要嚴格圈定范圍與條件。因此第一版指南只涉及數據共享的共通內容,之后再根據數據提供者、使用者以及基地機構的需求,針對不同數據(性質、種類、格式等)補充相應內容。同時,為在人文社科領域研究者中形成穩定的數據共享文化,在組建學術社群外,核心機構和基地機構也通過頒布政策、制定規章、發布優秀案例小冊子等方式規范、獎勵數據共享行為,推動數據共享成為人文社科學術圈的行為慣例。

4" "借鑒與啟示

我國的數字人文研究起步并不算晚,在2011年已有研究者提出必須大力建設包含科研信息和成果共享應用平臺、文獻資源保障體系等的基礎設施,以促進人文社會科學的繁榮發展[25]。到了今天,全國各地已建成不少面向人文社科研究的數據庫、知識庫與平臺等數據基礎設施,但不少設施的數據互操作困難,且在設計、實施等環節缺乏人文社科學者參與,與研究需求契合度不高。與歐洲等國相比,日本的人文社科數據共享起步較晚,但隨著人文社科數據基建項目的實施,以及《第6期科學技術·創新基本計劃》的推動,日本人文社科數據基礎設施的發展進入快車道。該項目的成果從2020年起陸續投入運用,距今時間尚短,難以全面驗證對人文社會科學研究活動的作用,但其建設經驗可提供一些有益的啟示。

4.1" " 實現統籌管理,完善數據政策體系

歐美等國政府對研究數據的保存、利用較為關注,如德國和荷蘭政府都設置了專管機構,有些國家雖未設機構,也有研究數據保存、利用的政府專門預算。開放科學的浪潮一日千里,政府強有力的參與才能促成研究數據基礎設施的重大重組與升級。具體到我國,國務院曾于2006年發布《國家中長期科學與技術發展規劃綱要(2006年-2020年)》,首次提出要通過建設數字平臺以促進數據共享。其后國務院又于2015年、2018年先后印發《促進大數據發展行動綱要》與《科學數據管理辦法》,提出發展科學大數據的具體行動,明確數據管理與共享的職責,為科學數據的開放與共享奠定了基礎。但以上法律法規主要針對自然科學、工程技術科學的數據管理,人文社科領域數據資源的開放與共享仍沒有專門的規定和指引。同時,我國各資助機構、人文社科學術界、學/協會組織也未能制定針對個人、團體、大學或其他科研機構在創建、獲取、使用人文社科數據時的通用規范。政策、規章、制度的不明確乃至缺失使人文社科數據的開放共享處于“制度性承諾缺乏”[26]的狀態,數據機構、科研人員因擔心違規或利益受損而消極對待,數據基礎設施的建設也難以推進。此外,我國面向數字人文的數據基礎設施建設主要依賴單一的機構或項目,雖有中國社會科學情報學會數字人文專委會等一些領域化、聯盟化的數字人文學術組織介入,但總體上建設的系統性、組織性不足,重復建設問題突出,建成的數據基礎設施獨立分散、共享程度低。日本的人文社科數據基建項目既有政府宏觀規劃《第6期科學技術·創新基本計劃》的強力支持,又吸納了學術界精英機構“日本學術會議”(Science Council of Japan,SCJ)的意見,同時日本最權威的科研資助機構“日本學術振興會”專門設立“人文社會科學數據基礎設施構筑推進中心”,并聯合日本頂尖水平的信息技術機構國立情報學研究所共同作為項目核心機構,為項目實施營造了良好的政策環境、經濟環境與技術環境。我國也應在教育部等政府部門的指導下設立人文社科數據管理頂層機構,一方面綜合統籌不同領域、不同層次、不同方向的數據基礎設施項目,積極推進互聯互通,避免重復建設;另一方面推動各級機構按數據采集、數據存儲、數據處理、數據傳輸、數據交換等過程頒布政策、完善制度,制定操作指南,使科研人員、研究機構、信息機構在生產、采集、保存、使用數據時有章可循。

4.2" " 優化組織架構,發揮機構聚合優勢

兼具靈活性與穩定性的組織架構是人文社科數據基礎設施可持續運行并不斷完善的基礎。目前我國已有不少由高校院系或研究機構牽頭建成的數字人文平臺與數據庫,較知名的有上海圖書館的“家譜知識服務平臺”、上海師范大學圖書館的“民國時期文獻目錄數據平臺”以及復旦大學的“中國歷史地理信息系統”等。以上平臺通過整合數據資源有效提高數據使用價值,為人文社科領域的研究者獲取、利用數據開展多樣化研究帶來了極大的便利。不過,已建成的平臺或數據庫在資源建設、數據協同、數據服務等方面都或多或少存在不足[27],究其原因在于各建設主體存在“各自為政”或“資源保護”傾向,協同與開放意識不足。比起從頭建設一個無所不包的數字人文數據基礎設施,連接已建成的數字平臺、數據庫和機構知識庫等分散的基礎設施,并以持續開放的姿態將來自學界、業界的利益相關者(Stakeholder)加入協作網絡,在實現多方聚力、相互協同的基礎上打造開放包容的大型數據基礎設施是更經濟、科學的建設方案。日本人文社科數據基建項目正是上述思路的具體實踐,項目選定了網絡型協作方式,除了現有的五個基地機構,對數據共享、利用有興趣的大學、科研機構甚至是社會組織也被納入考察視野,作為基地機構的備選,以實現網絡型協作的持續擴張。我國的數字人文基礎設施建設可在人文社科數據管理頂層機構的領導組織下積極推進協作,如協調大學等科研機構、博物館與圖書館等GLAM機構、人文社科類行業協會以及相關企業設立聯絡中心,一方面推動相似領域不同平臺、數據庫在人員、資金、管理等層面的有機整合與協作,為互相連通形成大型數據基礎設施奠定基礎;另一方面著眼于數據基礎設施的可持續發展,積極推進政府——企業——研究機構之間的聯合,既促進數字人文研究成果的轉化與市場應用,又貼合人文社科研究領域第一線的需求,如此才能不斷擴充數據池、人才池、資金池,實現數據基礎設施的持續運行與完善。

4.3" " 完善數據標準,提升數據服務水平

數據質量是人文社科數據價值實現的關鍵。零散、單一、粗糙的低質量數據會降低數據使用者的意愿,合格的平臺、數據庫所提供的數據資源應符合主題明確、標準規范、易獲取等要求。有研究者指出,數字平臺雖已成為我國人文社科學者,尤其是傳統學術研究者檢索資料的主要途徑,但使用體驗并不盡如人意。系統封閉、系統之間互不連通、數據準確率低、使用便捷性差、缺乏分析工具等都是頗為突出的問題[28]。日本人文社科數據基建項目的目標是實現人文社科數據的跨國界、跨學科、跨領域共享共用,因此重視數據的采集、處理與交換的標準化,也有針對性地導入語義網等技術,促進數據的可復用、可關聯與可聚合。此外通過新建數據目錄實現跨庫搜索、提供可用性強的在線工具進行數據處理分析,保證了資源獲取和服務提供的互聯互通,也促進了研究者個體與機構間、機構與機構間的互惠互利與可持續發展。由此可見,我國的數字人文基礎設施也應執行全球通用的FAIR原則,圍繞“可發現”“可訪問”“互操作”“可復用”等標準創建規范統一的元數據模型與框架方案、采用通用元數據標準和協議、明確數據訪問和使用條件,以提升既有數字人文基礎設施的可靠性、適應性和擴展性,并逐步將各基礎設施聯通為分布式網絡服務。同時,數字人文數據基建的首要消費群體是人文社科領域的科研人員,具體學科范疇的需求眾口難調,但可以提供可用性強的工具滿足其共同的科研需求,并不斷根據研究實踐的需求進行工具升級及新工具開發。若只重視“數據基礎設施”而不能服務于數字人文研究,建成的數字人文數據基礎設施技術層面再先進,也難以成為數字人文研究的“使能者”。

參考文獻:

[1]" Chad Wellmon.林太平,譯.忠實的工人和杰出的學者:大人文學科與知識倫理[J].澳門理工學報(人文社會科學版),2018(3):140-153.

[2]" 劉煒,葉鷹.數字人文的技術體系與理論結構探討[J].中國圖書館學報,2017,43(5):32-41.

[3]" 黃萃,陳靜,陳惠玲.第四研究范式:數據驅動下的人文社科研究模式躍遷[J].中國高校科技,2021(10):10-14.

[4]" 劉煒,謝蓉,張磊,等.面向人文研究的國家數據基礎設施建設[J].中國圖書館學報,2016,42(5):29-39.

[5]" 夏翠娟.面向人文研究的“數據基礎設施”建設——試論圖書館學對數字人文的方法論貢獻[J].中國圖書館學報,2020,46(3):24-37.

[6]" Wloka B,Winiwarter W,Budin G.DASISH:an Initiative for a European Data Humanities Infrastructure[A].Proceedings of the 15th International Conference on Information Integration and Web-based Applications amp; Services[C].Association for Computing Machinery,2013:433-437.

[7]" Kálmán T,Tonne D,Schmitt O.Sustainable preservation for the arts and humanities[J].New Review of Information Networking,2015,20(1-2):123-136.

[8]" Burrowa T.A data-centred \"virtual laboratory\" for the humanities:Designing the Australian Humanities Networked Infrastructure(HuNI)service[J].Literary and Linguistic Computing,2013,28(4):576-581.

[9]" De Jong F,Maegaard B,De Smedt D F,et al.CLARIN:towards FAIR and responsible data science using language resources[A].Proceedings of the Eleventh International Conference on Language Resources and Evaluation(LREC 2018)[C].European Language Resources Association (ELRA),2018:3259-3264.

[10]" 金家琴,夏翠娟.數字人文數據基礎設施建設中機構本體的構建:研究和應用[J].圖書館論壇,2020,40(4):30-39.

[11]" 陳濤,單蓉蓉,張永娟,等.數字人文研究的語義支撐平臺構建研究——以ECNU-DHRS平臺為例[J].圖書館雜志,2021,40(3):69-77.

[12]" 顏佳,楊敏,彭梅.面向數字人文的圖像數據基礎設施建設研究——以我國圖博檔領域為視角[J].圖書館,2021(5):51-58.

[13]" 周雷.德國國家文化遺產科研數據基礎設施構建模式研究及啟示[J].情報資料工作,2021,42(1):105-112.

[14]" 科學技術·學術政策研究所.科學技術指標と科學研究のベンチマーキング2015[EB/OL].[2023-05-03].https://www.mext.go.jp/b_menu/shingi/gijyutu/gijyutu4/siryo/__icsFiles/afieldfile/2016/02/17/1367033_07.pdf.

[15]" 文部科學省.基礎科學力の強化に向けて[EB/OL].[2023-05-20].https://www.mext.go.jp/component/a_menu/science/detail/__icsFiles/afieldfile/2017/06/07/1384930_02_1.pdf.

[16]" 橋本雄太.人文學資料オープンデータの可能性と現狀[J].情報の科學と技術,2015,65(12):525-530.

[17]" 內閣府.國際的動向を踏まえたオープンサイエンスに関する検討會報告書[EB/OL].[2023-05-15].http://www8.cao.go.jp/cstp/sonota/openscience/150330_openscience_1.pdf.

[18]" 內閣府.統合イノベーション戦略[EB/OL].[2023-05-03].https://www8.cao.go.jp/cstp/togo_honbun.pdf.

[19]" 內閣府.科學技術·イノベーション基本計畫[EB/OL].[2023-05-27].https://www8.cao.go.jp/cstp/kihonkeikaku/6honbun.pdf.

[20]" 日本學術振興會.人文學·社會科學におけるデ一タ共有のための手引き[EB/OL].[2023-05-09].https://www.jsps.go.jp/j-di/data/guide/tebiki_p.pdf.

[21]" 朝岡誠,林正治.Data Documentation Initiative(DDI)の意義と利用:JDCatへの応用と今後の課題[J].社會と調查,2021,27(9):31-38.

[22]" 顏佳,姚嘯華.數字人文發展的“主導者”與“使能者”——2020數字人文年會“數字人文基礎設施建設”專家論辯綜述[J].數字人文,2021(1):124-134.

[23]" 藤原一毅,林正治,朝岡誠,等.オンライン分析システムの開発狀況と活用事例[EB/OL].[2023-05-12].https://www.jsps.go.jp/j-di/data/jigyo/4_fujiwara_happyo_2021.pdf.

[24]" 饒梓欣,鄧璐薌,許鑫.國際視野下面向人文研究的數據基礎設施分析與探討[J].圖書情報知識,2022,39(5):31-41,11.

[25]" 肖瓏.人文社會科學繁榮發展的軟性基礎設施建設[J].圖書情報工作,2011,55(1):5-9.

[26]" 余文雯.數據驅動下的高校圖書館數字人文服務研究[J].圖書與情報,2017(5):114-119,148.

[27]" 張磊,夏翠娟.面向數字人文的圖書館開放數據服務研究——以上海圖書館開放數據應用開發競賽為例[J].圖書館雜志,2018,37(3):33-38,48.

[28]" 劉圣嬰,王麗華,劉煒,等.數字人文的研究范式與平臺建設[J].圖書情報知識,2022,39(1):6-29.

作者簡介:時晨,女,安徽財經大學文學院副教授,早稻田大學政治經濟學術院訪問研究員,研究方向:信息傳播與知識管理。

*本文系安徽省文旅科研項目“社會力量參與公共文化服務供給的機制與優化路徑研究”(項目編號:WL2023YB05)研究成果之一。

收稿日期:2023-06-17;通訊作者:時晨(shinstar916@163.com);責任編輯:劉婷

主站蜘蛛池模板: 九色最新网址| 亚洲一区国色天香| 亚洲天堂网站在线| 久久6免费视频| 欧美中日韩在线| 日本少妇又色又爽又高潮| 久久国产精品娇妻素人| 久久免费精品琪琪| 国产日韩精品欧美一区喷| 成人在线视频一区| 国产熟女一级毛片| 久久人搡人人玩人妻精品一| 久久午夜影院| 久久国产精品无码hdav| 狠狠色综合久久狠狠色综合| 久99久热只有精品国产15| 亚洲三级成人| 无码AV日韩一二三区| 免费国产高清精品一区在线| 亚洲欧美在线综合一区二区三区| 毛片免费视频| 久久影院一区二区h| 五月天丁香婷婷综合久久| 欧美精品影院| 国产视频自拍一区| 天堂网亚洲系列亚洲系列| 综合网天天| 狠狠综合久久| 国产免费人成视频网| 青青青草国产| 色综合热无码热国产| 午夜欧美在线| 欧美日韩第三页| 东京热一区二区三区无码视频| 国产一区二区三区在线观看视频| 一本色道久久88| 亚洲无线一二三四区男男| 精品国产一区二区三区在线观看| 草草影院国产第一页| 国产免费久久精品44| P尤物久久99国产综合精品| 黄色片中文字幕| 激情综合婷婷丁香五月尤物| 亚洲视频免费在线| 久久精品最新免费国产成人| 久久semm亚洲国产| 亚洲天堂2014| 色哟哟国产精品一区二区| 国产日韩丝袜一二三区| 国产美女在线免费观看| 精品国产免费观看| 1024国产在线| 人人爱天天做夜夜爽| 亚洲国产第一区二区香蕉| 一区二区三区精品视频在线观看| 在线免费亚洲无码视频| 中文国产成人久久精品小说| 色哟哟精品无码网站在线播放视频| 国内精品视频区在线2021| 97国产精品视频人人做人人爱| 日韩免费毛片| 国产成人精品一区二区三区| 国产成人福利在线视老湿机| 精品福利国产| 久久久无码人妻精品无码| 美女啪啪无遮挡| 亚洲日本中文字幕天堂网| 国产在线观看第二页| 第一页亚洲| a级免费视频| 波多野结衣一区二区三视频| 特级毛片免费视频| 无码丝袜人妻| 亚洲精品制服丝袜二区| a级毛片网| 97久久免费视频| 青青草原国产av福利网站| 国产精品免费入口视频| 99一级毛片| 精品国产免费观看| 欧美日韩在线亚洲国产人| 99热最新网址|