999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

國外檔案數據開放研究——基于政府數據開放平臺的調查

2022-05-30 18:10:20唐長樂武亞楠
檔案管理 2022年5期

唐長樂 武亞楠

摘? 要:檔案數據的開放是推動檔案數據開發利用,發揮檔案數據價值的重要環節。文章以英、美、法、澳等十個國家的政府數據開放平臺為調查對象,運用網絡調研法,對平臺中檔案數據的開放情況進行調查,并圍繞數據數量、數據領域、數據格式和許可協議四個方面對檔案數據開放情況進行研究。在此基礎上,總結國外檔案數據開放的特點,得出對我國檔案館開放檔案數據的啟示。

關鍵詞:檔案數據;數據開放;政府數據開放平臺

Abstract: The opening of archival data is an important link to promote the development and utilization of archival data and give full play to the value of archival data. Taking the government data open platforms of ten countries such as Britain, the United States, France and Australia as the survey object, this paper uses the network survey method to investigate the openness of archival data in the platform, and makes a study on the openness of archival data from four aspects: data quantity, data field, data format and license agreement. On this basis, this paper summarizes the characteristics of foreign Archives data opening, and draws enlightenment for the opening of Archives data in our country's Archives.

Keywords:Archival data; Open data; Government data open platform

我國從2012年起,相繼出臺了《促進大數據發展行動綱要》[1]《國家信息化發展戰略綱要》[2]《公共信息資源開放試點工作方案》[3]《“十四五”推進國家政務信息化規劃》[4]等一系列的法規政策來推動政府數據開放,充分體現了國家對于政府數據開放的重視。

檔案數據開放是“檔案機構將收集保存的所有原始數據向公眾開放”。[5]在政府數據開放的大背景下,檔案部門作為政府的基礎性職能部門之一,應積極融入政府數據開放大局,強化檔案數據支撐,滿足社會對多樣化數據資源的需求。實際上,2016年國家檔案局發布的《全國檔案事業發展“十三五”規劃綱要》中就提到了“要制定檔案數據開放計劃,落實數據開放與維護的責任”。[6]2021年出臺的《“十四五”全國檔案事業發展規劃》中提出了公布開放檔案目錄的目標要求[7]。地方層面上,《福建省“十四五”檔案事業發展規劃》中提出要“依托省公共數據資源開放平臺,拓展與民生緊密相關的檔案數據開放維度”。[8]可見我國的檔案部門已經意識到了檔案數據開放的重要性,但還缺乏實踐層面的推進機制。

目前,我國對于檔案數據開放的研究主要集中在檔案數據開放的法律和政策、推進路徑、價值實現等方面,例如英美法系的國家檔案數據開放法律與政策進行調研[9];檔案數據開放的推進路徑[10-12];政府數據開放背景下檔案數據價值實現的可行性[13]等。但目前缺少基于已開放的檔案數據本身,對檔案數據開放實踐進行研究。[14]2014年12月,國際檔案理事會加勒比地區分會第十屆大會就以“檔案與開放數據”為中心議題,討論了檔案工作者在數據開放中的角色。國外的政府數據開放平臺的建設也早于國內,不少國家的檔案館也參與到了平臺中,積累了一定的檔案數據開放經驗。

本文借鑒國外檔案數據開放的研究和實踐經驗,基于國外政府數據開放平臺,以美、英、法、德等十國在平臺上開放的檔案數據為調查對象,以期為我國檔案數據開放提供參考,提升我國檔案數據開放的水平。

1 研究設計

1.1 調查對象。在調查對象的選取上,本文通過對比各個國家的檔案工作發展水平,并結合開放數據晴雨表第四版中各個國家的排名情況確定可納入調查的國家。其中“開放數據晴雨表(ODB)由萬維網基金會在奧米迪亞網絡(Omidyar Network)的支持下制作,旨在揭示全球開放數據計劃的真實情況和影響,分析全球趨勢,并使用結合背景數據、技術評估和二級指標提供有關政府和地區的比較數據”。[15]通過比較分析,本文最終選取英、美、法、澳、加等十國檔案館在政府數據開放平臺上發布的數據集作為調查對象,如表1所示。

1.2 調查內容。本文選取數據數量、數據領域、數據格式、許可協議四個方面作為調查內容。其中數據數量體現了一個國家檔案數據開放的規模和水平;數據領域是檔案數據開放主題內容的體現;數據格式是描述檔案數據集保存和開放的編碼方式和規則;許可協議規定了利用者和再利用者可以利用哪些檔案數據資源以及受到哪些限制。

1.3 調查方法。本文對英、美、法、澳等十國檔案館在政府數據開放平臺上發布的數據集進行訪問,圍繞數據數量、數據領域、數據格式、許可協議四個部分的內容進行調查、整理、統計和分析。

2 調查結果

2.1 數據數量。對數據數量的調查主要圍繞開放數據集總數、開放檔案數據集總數、開放檔案數據集占比和檔案數據容量展開。截至2021年12月25日,10個國家在政府數據開放平臺上開放的數據集情況如表2所示。

(1)開放數據集總數是指一個國家在政府數據開放平臺上開放的數據集的總量,目前各個國家的數據集總量均已破萬,其中美國開放數據集數量最多,達到337304個,排名第一。最少的國家是澳大利亞,共計13100個。(2)開放檔案數據集總數是指各國國家檔案館在政府數據開放平臺上開放的數據集總和。調查發現,目前英國、美國和俄羅斯開放的檔案數據集總量處于前三,其次是加拿大、荷蘭、法國與韓國,另外澳大利亞和德國的開放數量相對較少,目前只開放了2個數據集。(3)開放檔案數據集占比是指開放的檔案數據集在平臺開放數據集總數中所占的比例,調查發現,目前俄羅斯位于第一位,占比0.144%,英國緊隨其后,占比0.098%,最少的為德國,占比僅為0.004%,可以看出,雖然各個國家已經積極參與到檔案數據開放中來,但是目前各國開放力度差異較大,總體的開放規模相對較小。(4)檔案數據容量是指在一個開放檔案數據集中可供下載的數據資源條目,目前英國的檔案數據容量最大,達到488條,其余國家的檔案數據容量均在100條以內,其中澳大利亞和德國的檔案數據容量僅為個位數。

2.2 數據領域。國外檔案數據開放的領域主要是涉及兩個方面,一是機構和業務工作領域的數據,二是館藏資源領域的數據,如表3所示。

(1)從各領域數據集數量來看,目前多數國家開放的數據集主要集中在機構和業務工作領域,如英國開放了47個數據集,俄羅斯和加拿大分別開放了36和20個,占檔案部門開放數據集總數的八成以上;在館藏資源數據開放上,美國所占比例較大,開放了31個數據集,韓國開放了8個數據集,約占開放數據集的三分之二,新西蘭開放的數據集中,有3個館藏資源數據的開放。

(2)從數據領域主要涉及的數據集內容來看,目前國外開放的檔案機構和業務數據中,內容大多涉及本國檔案館的檔案清單、目錄、展覽、工作計劃、發展目標、招標活動、財務管理等數據,除此之外還有檔案館工作人員的信息、客戶對于檔案館的滿意度等方面的數據;在開放的館藏資源數據中,主要是一些館中保存的法律法規、重要文件、政府公報以及一些特色館藏,例如軍人檔案數據、世界杯檔案數據等。

2.3 數據格式。調研發現,一個數據集可能包括多種不同的格式,如美國國家檔案館發布的“修訂美國:美國憲法修正案提案,1787年至2014年”(Amending America: Proposed Amendments to the United States Constitution,1787 to 2014)數據集中,就包括HTML和CSV兩種不同的數據格式。對所有數據集的數據格式進行統計,按照每類格式出現的次數進行排序,保留數量在3個及以上的數據類型,結果如圖1所示。

CSV格式的數據集數量最多,達到97個,HTML、XML、XLS、JSON、PDF、XLSX格式的數據集數量介于10~40個之間,而ODT、ZIP、API、SPARQL和ODS等格式的數據集數量較少,均少于5個。可以看出,目前國外檔案數據開放的主流格式是CSV格式,CSV格式的數據集以純文本形式存儲表格數據,是一種通用且相對方便的數據格式。而RDF和SPARQL雖然是采用W3C標準開放的數據,但在各國的應用中還相對較少。表4是各國檔案數據開放的格式統計,以及一個數據集中可下載的數據資源是否為單一格式的統計。

可以看出,各個國家檔案數據開放的格式比較豐富,主流開放格式是CSV、XML以及XLSX等格式。

目前大多數國家的數據集在開放時以只提供一種可供下載的格式的情況居多,有兩種及兩種以上的下載格式的數據資源相對較少,只有法國90%以上的數據集同時提供兩種及以上的格式;英國的單一下載格式達到33個,而兩個及以上的下載格式僅有13個;美國、俄羅斯與英國情況相似;荷蘭僅有1個數據集同時提供兩個及以上格式,韓國則是2個。

2.4 許可協議。“許可是一種準許機構和個人再利用受到版權或者數據庫權保護的資源的一種機制。”[16]在各國檔案數據開放許可中,根據調查發現,美國、澳大利亞、新西蘭、荷蘭采用非政府組織制定的知識產權許可協議。[17]其中比較通用的是CC許可協議(Creative Commons license),如澳大利亞的檔案數據開放使用“Creative Commons Attribution 3.0 Australia”(澳大利亞知識共享署名3.0協議),可以以任意形式復制、發行,或者修改和商用,但是要給出適當的署名,提供指向該許可協議的鏈接,同時標明是否(對原始作品)作了修改,可以用任何合理的方式來署名,但是不得以任何方式暗示許可方認可署名者及其使用方式。[18]

美國在采用知識共享CC零許可證(cc-zero)的同時,個別數據集未提供許可證信息,但注明如果這項工作是由美國政府的官員或雇員作為其公務的一部分準備的,則它被視為美國政府工作。而英國、法國、加拿大、德國則根據本國的實際情況來制定政府數據開放許可協議。如法國政府Etalab部門制定了政府數據開放許可協議“Licence Ouverte”,可以對數據進行復制、傳播、再分發、改編和商業利用,但是要求用戶使用開放許可協議下的信息時必須提供署名來源。[19]韓國大部分開放的檔案數據集使用范圍無限制,個別的數據集使用CC許可協議(Creative Commons License)和自定的Public Nuri協議。俄羅斯的檔案數據開放未提供任何版權協議信息,但是給出了開放數據使用條款,來規范數據資源的使用。

3 國外檔案數據開放的特點及啟示

3.1 國外檔案數據開放的特點。根據前述分析,國外檔案數據開放的特點主要表現在以下四個方面。

第一,開放意識較強。總體來看,國外在檔案開放的數量上遠超國內,且都積極參與到政府數據開放中來,70%的國家開放數量達到十位數以上,整體開放意識較強。第二,開放內容豐富,涉及領域廣。國外各個國家開放的數據集中,除了檔案館開放檔案的清單、檔案業務信息等機構和業務工作數據外,還包括館藏的聯邦歷史法規、社交媒體數據、文化電影、退伍軍人檔案數據等社會公眾廣泛關注的高價值數據資源或特色館藏數據資源。第三,檔案數據開放格式豐富,且以主流開放格式為主。國外英、美、法、加、荷的開放格式都達到了5種及以上,英國的開放格式達到了9種,美國有8種,滿足了開放格式多樣性的需要。其他開放格式低于5種的國家,也保證了至少有兩種的開放格式供利用者下載。第四,許可協議完善,代表性和參考性較強。國外的數據許可協議可以具體到每一個數據集的許可情況,對每個數據集采用何種許可協議給予明確標注。

3.2 對我國檔案數據開放的啟示

3.2.1 提升數據開放意識,提高檔案館數據開放參與度。我國目前檔案數據開放無論是在開放數據集的數量和質量上,與國外相比都有一定的差距。就開放數量來看,截至2021年12月,開放最多的是廣西區,廣西壯族自治區檔案館在廣西壯族自治區公共數據開放平臺開放了30個數據集,其次是浙江省檔案館在浙江省政府數據開放平臺上開放了25個數據集,其他大部分省份如天津、河南、重慶等的開放數據集均為個位數,如重慶市檔案局在重慶市公共數據開放系統上只開放了1個數據集。

對此,第一,檔案館應該充分認識到其在數據開放中的重要性,增強自身的數據開放意識,從實踐層面出發制定相應的檔案數據開放政策和辦法,積極與政府相關部門對接,加強與社會公眾的溝通,了解社會公眾的利用傾向,加快檔案數據開放的實踐步伐;第二,檔案工作人員也應提升自身的數據開放意識,積極了解國內外檔案數據開放現狀,學習先進經驗,與自身的館藏狀況相結合,提高檔案館在數據開放中的參與度。

3.2.2 貼合公眾數據需求,優先開放高價值檔案數據。檔案館作為我國數據資源的寶庫,保存的檔案數據資源在數量、種類以及內容上都十分豐富。2016年國家檔案局發布《全國檔案事業發展“十三五”規劃綱要》就提出了檔案數據開放的目標要求。[20]但是,目前我國檔案館開放的檔案數據更多的是機構自身的業務管理類數據,對涉及民生領域或比較有特色的館藏歷史文化數據開放較少。因此,貼合公眾數據需求,擴大高價值數據集的開放,優先選擇最有價值的數據集,是需要著重考慮的問題。

首先,檔案館可以選擇館藏資源中涉及目前社會公眾比較關注的民生、教育、就業、住房、交通、醫療等方面的高價值數據集進行開放。其次,檔案館還可以結合自身館藏特點,開放一些特色館藏資源相關的數據,例如一些歷史文化類的數據集,這類數據承載了重要的歷史記憶,具備較高的文化價值,開放這類數據對于公眾進行數字人文的研究助益頗多,也能為檔案館進行特色館藏資源的開發帶來更多的創意和可借鑒的優秀案例。

3.2.3 優化開放數據格式,充分發揮開放數據價值。我國檔案部門在政府數據開放平臺上開放的檔案數據在數據格式上仍有待優化。首先,開放格式單一。截至2021年12月,目前開放格式最多的省份是浙江省,擁有5種檔案數據開放格式,北京2種,海南、貴州等省份僅有1種數據開放格式;其次,可機讀的結構化數據格式偏少。

在我國開放的檔案數據中,部分數據資源的數據格式是PDF格式。根據Tim-Berners基于數據格式提出的開放數據五星評級模型對數據集的開放程度進行評級,發現國內很多省份僅得到了兩星。因此,我國在進行檔案數據開放時要增強數據格式的多樣性和機器可讀性。

具體而言,第一,對尚未開放的檔案數據,檔案部門要做好準備工作,要盡量為用戶提供多樣化機器可讀格式的數據格式,尤其是CSV、RDF、JSON等高結構化機器可讀數據;第二,對于已開放的檔案數據,檔案部門可借助自動化的格式處理工具,將具備較好結構化基礎的數據轉換為上述格式;第三,針對特殊領域的檔案數據,可根據實際情況,提供特殊的利用格式;第四,要加強開放后檔案數據的維護,定期篩查和接受用戶反饋,持續優化數據格式,提升數據質量。

3.2.4 重視數據許可協議,保證開放數據利用最大化。截至2021年12月,對我國省級政府數據開放平臺中各省檔案館開放的數據集中涉及的許可協議情況進行調查,以浙江省、廣西區、山東省、北京市和河南省為對象,發現目前我國的檔案數據開放在許可協議方面,并未參考或遵循國際上通用的許可協議內容和格式,只是在網站服務協議和網站聲明中進行了比較籠統的解釋。而國外的數據許可協議可以具體到每一個數據集的許可情況。

檔案部門應重視數據許可協議的使用,結合自身的數據資源特點、開放獲取的權限,從開放許可的原則、對象、用戶的權利和義務等方面出發,引用或者擴展制定符合數據資源特點的許可協議,形成權責明確、邊界清晰、合理合規、有據可循的開放利用體系,在合理范圍內保證檔案數據利用的最大化,最大限度地發揮數據價值。

參考文獻:

[1]中華人民共和國中央人民政府.國務院關于印發促進大數據發展行動綱要的通知[EB/OL].[2021-12-2].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.

[2]中華人民共和國中央人民政府.中共中央辦公廳、國務院辦公廳印發《國家信息化發展戰略綱要》[EB/OL].[2021-12-2].http://www.gov.cn/xinwen/2016-07/27/content_5095297.htm.

[3]中華人民共和國國家互聯網信息辦公室.中央網信辦?發展改革委?工業和信息化部聯合開展公共信息資源開放試點工作[EB/OL].[2021-12-2].http://www.cac.gov.cn/2018-01/05/c_1122215495.htm.

[4]中華人民共和國中央人民政府.國家發展改革委關于印發《“十四五”推進國家政務信息化規劃》的通知[EB/OL].[2022-1-6].http://www.gov.cn/zhengce/zhengceku/2022-01/06/content_5666746.htm.

[5]洪偉達,馬海群.我國開放政府數據政策的演變和協同研究——基于2012—2020年政策文本的分析[J].情報雜志,2021,40(10):139-147+138.

[6][20]國家檔案局中央檔案館.國家檔案局印發《全國檔案事業發展“十三五”規劃綱要》[EB/OL].[2021-12-2].https://www.saac.gov.cn/daj/xxgk/201604/4596bddd364641129d7c878a80d0f800.shtml.

[7]國家檔案局中央檔案館.中辦國辦印發《“十四五”全國檔案事業發展規劃》[EB/OL].[2021-12-2].https://www.saac.gov.cn/daj/toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml.

[8]福州市檔案局(館).福建省檔案局 福建省發展和改革委員會印發《福建省“十四五”檔案事業發展規劃》[EB/OL].[2021-12-2].http://daj.fuzhou.gov.cn/zz/zwgk/ghjh/202111/t20211117_4245604.htm.

[9]王協舟,尹鑫.英美法系國家檔案數據開放法律與政策調研及經驗借鑒——基于文獻?文本和案例的省思[J].檔案學通訊,2019(04):48-57.

[10]馬海群.檔案數據開放的發展路徑及政策框架構建研究[J].檔案學通訊,2017(03):50-56.

[11]陳展.檔案數據開放推進路徑探略[J].浙江檔案,2019(01):20-22.

[12]呂顏冰.論檔案部門參與開放數據建設的問題與途徑[J].檔案管理,2016(01):20-23.DOI:10.15950/j.cnki.1005-9458.2016.01.008.

[13]董聰穎,金軼瑩.政府數據開放背景下檔案數據價值實現研究[J].山東檔案,2020(05):7-10.

[14]Borglund E,Engvall T.Open data?:Data,information,document or record?[J].Records Management Journal,2014,24(02):163-180(18)

[15]THE OPEN DATA BAROMETER[EB/OL].[2022-1-21].https://opendatabarometer.org/barometer/.

[16]迪莉婭.政府數據開放許可適用研究[J].圖書館,2014(06):91-93+96.

[17]宋爍.政府數據開放許可使用進路[J].江西社會科學,2021,41(09):201-210.

[18]Attribution 3.0 Australia(CC BY 3.0 AU)[EB/OL].[2022-01-09].https://creativecommons.org/licenses/by/3.0/au/deed.en.

[19]Licence Ouverte/Open Licence[EB/OL].[2022-01-09].https://www.etalab.gouv.fr/licence-ouverte-open-licence.

主站蜘蛛池模板: 亚洲第一视频区| 亚洲黄色成人| 亚洲一级无毛片无码在线免费视频| 国产成人区在线观看视频| 她的性爱视频| 亚洲精品无码日韩国产不卡| 美女内射视频WWW网站午夜| h网址在线观看| 中文字幕av一区二区三区欲色| 黄色国产在线| 欧美a级在线| a级毛片一区二区免费视频| 欧美国产在线精品17p| 日韩毛片免费| 国产成人精品在线1区| 欧美激情首页| 99久久精品视香蕉蕉| 97久久超碰极品视觉盛宴| 日本一区二区三区精品国产| 97久久超碰极品视觉盛宴| 成人免费一级片| 18禁不卡免费网站| 中文字幕在线播放不卡| 影音先锋亚洲无码| 粗大猛烈进出高潮视频无码| 国产网站黄| 亚洲三级视频在线观看| 国产精女同一区二区三区久| 亚洲国产精品成人久久综合影院| 国产网站黄| 91成人在线观看视频| 亚洲浓毛av| 欧美成人在线免费| 亚洲专区一区二区在线观看| 免费在线观看av| 国产h视频免费观看| 亚洲av无码人妻| 国产成人啪视频一区二区三区| 日韩高清在线观看不卡一区二区| 国内精品免费| 欧美在线精品一区二区三区| 成人日韩精品| 国产亚洲精品无码专| 国产在线日本| 国产又粗又猛又爽| 97色婷婷成人综合在线观看| 国产美女久久久久不卡| 久久综合九色综合97婷婷| 成人一级免费视频| 国产精品乱偷免费视频| 天天躁夜夜躁狠狠躁躁88| 在线观看国产小视频| 亚洲一区二区三区麻豆| 伊人久久婷婷五月综合97色| 啪啪啪亚洲无码| 国产精品冒白浆免费视频| 亚洲成人网在线观看| 亚洲婷婷在线视频| 国产精品自在线拍国产电影| 国产91无码福利在线| 乱人伦99久久| 久久6免费视频| 一本大道在线一本久道| 黄色免费在线网址| 国产成在线观看免费视频| www.狠狠| 国产二级毛片| 女人18毛片水真多国产| 乱系列中文字幕在线视频| 免费高清毛片| 草草线在成年免费视频2| 超清人妻系列无码专区| 伊人91视频| 精品一区二区久久久久网站| 亚洲天堂视频在线免费观看| 爽爽影院十八禁在线观看| 国产成人精品男人的天堂下载| 伊在人亞洲香蕉精品區| 日本免费新一区视频| 999精品色在线观看| 久久免费视频播放| 国产精品三级专区|