陸莉 沙勇忠 徐雪峰



摘? ?要:數據生命周期模型是鏈接數據管理策略理念與實踐的關鍵模型。文章通過梳理典型數據生命周期模型的構建思路與階段特征,結合公共安全數據的來源與類型,構建了全面的公共安全數據生命周期模型,并以該模型為基礎,在分析公共安全治理內容的階段特征基礎上,提出了基于生命周期的公共安全數據管理三維模型,并就模型的主要功能進行了探討。
關鍵詞:數據生命周期;公共安全數據;公共安全治理;數據管理要素;數據管理模型
中圖分類號:D63;G203? ?文獻標識碼:A? ?DOI:10.11968/tsyqb.1003-6938.2019054
Research about Public Safety Data Management Model Based on the Life Cycle
Abstract Data Life Cycle (DLC) model is the critical medium interlinking the data management strategies and practices. This paper analyzed the typical DLC models' construction and phases' characteristics as research basis. Combining the sources and features of public safety data, the overall public safety data life cycle model was constructed. Then basing on the public safety activities, the public safety data management model was put forward which combines the public safety data life cycle and the public safety activities life cycle. Meantime, the function of the public safety data management model was discussed as well.
Key words data life cycle; public safety data; public safety governance; data management elements; data management model
1? ?引言
公共安全數據管理是一個新興的交叉學科研究領域,旨在探索物理空間和社會空間中的公共安全治理活動在信息空間中的映射——公共安全數據的規律與特征。通過數據科學與公共安全領域知識的融合,凝練公共安全治理活動中的數據問題,關注公共安全數據本身的管理進而促進數據在公共安全治理中的價值實現。有效的數據管理通常需要做好長期的數據管理規劃,并且在適當節點采取相應的管理活動,進行人員、機構、資源和關鍵事件之間的積極協同。在這一復雜的管理過程中,數據管理模型作為鏈接管理策略理念與管理實踐的橋梁發揮著基礎性作用。從科學數據管理與政府數據管理領域的相關研究成果來看[1-2],已提出了數據管理的生命周期模型、機構數據管理基礎設施模型以及數據監管能力成熟度模型等典型模型。其中,數據生命周期模型能夠以形象和可視的方式定義與闡明數據管理的復雜流程,將數據管理過程分解為不同的組成階段,識別和闡釋不同階段的參與者角色、管理活動職責、流程重要事件和其他關鍵成分[3],是具有基礎意義的組織數據管理活動和優化數據服務的關鍵模型。
數據生命周期研究數據本身,考察其在生命周期中的階段、狀態和規律[4]。通過定義數據的每個存在階段,以及階段之間的連接關系,使整個數據生命周期成為一個不斷演化和循環的連續統[3]。公共安全治理活動受領域特點和業務流程影響,其過程中生成或使用的數據及其生命周期有自身的規律。曾子明和楊倩雯[5]從總體上提出了城市公共安全數據的生命周期,包括數據采集、數據處理、數據存儲、數據挖掘與分析、知識可視化、數據長期保存與再利用6個階段。也有研究者對不同領域和不同類型數據的生命周期模型進行了探索,關注不同組織環境和業務情境下數據生命周期的差異性。如美國聯邦地理數據委員會提出了針對地理空間數據的生命周期模型,該模型包括數據的定義、數據清單生成與數據資產評估、數據的獲取與訪問、數據維護、數據的利用與評估以及數據歸檔6個階段[6];針對傳感器數據的生命周期模型,則對協作式生態學研究中傳感器數據的來源、情境、特征等進行了分析,構建了涵蓋實驗設計、校準和地面實況分析、數據采集、數據清洗、數值數據獲取、多源數據集成、數據分析、出版、存儲和長期保存9個階段的傳感器數據生命周期模型[7]。數據生命周期模型在不同領域中得到了擴展和細化,根據地球觀測衛星委員會2012年的調研,已有52個不同學科領域提出了有針對性的數據生命周期模型[8]。
公共安全治理常面臨復雜的跨領域、跨組織邊界治理難題,其治理過程中生成或使用的公共安全數據既具有海量多源異構等大數據的普遍性特征,又受不同行業領域和多樣化載體的影響,展現出細節上的差異性和特殊性。因此,公共安全數據生命周期的研究既要關注其整體性特征,也要對不同類型公共安全數據的特征和規律進行細化,發現其生命周期的多樣性,豐富公共安全數據生命周期的內涵,使基于生命周期的公共安全數據管理模型既能夠在理論上實現相對的統一,又能夠貼近和指導管理實踐。根據這一理念,沙勇忠等[9]提出了公共危機信息管理的雙生命周期理論模型,即在公共危機管理生命周期的每一階段嵌入信息管理全生命周期進行聚焦分析和有續統合,既從整體上實現了公共危機管理的減緩、準備、響應和恢復四階段生命周期與信息管理的信息生產、信息組織、信息分析和信息利用四階段生命周期的有機結合,同時又能夠根據公共危機管理不同階段的差異化信息需求在信息管理內容上有所側重。面對更為復雜的公共安全數據管理問題,如何實現數據管理的主體、客體、情境與活動等管理要素整體性和多樣性的統一是研究的關鍵目標。因此,本文從典型的數據生命周期模型分析出發,在梳理公共安全數據類型的基礎上,探索公共安全數據生命周期的整體性特征和差異化規律,并基于此構建了公共安全數據管理的三維模型,以數據生命周期為基礎結合公共安全數據的應用情境,探討該模型在組織公共安全數據管理和支持公共安全治理活動中的功能與應用。
2? ?數據生命周期典型模型分析
數據生命周期(Data Life Cycle,DLC)定義了從數據生產階段到消費階段完整的數據生命框架,有助于組織從數據這一視角出發定義并構建業務情境中數據生產者和管理者的活動[10]。由于從最初生成到最終應用的完成,數據不斷經歷格式、應用方式和目標等方面的多重轉變,相關參與者必須在不同階段通過一系列的數據管理活動使數據保持活力并能夠發揮最大價值,以支持組織的決策制定和業務規劃。構建數據生命周期模型的目的就在于通過有效的數據組織和清洗,實現最優的數據管理,進而為用戶提供適當的、滿足其質量需求的數據產品[11]。Sinaeepourfard A等[12]認為,構建數據生命周期模型的作用可體現在以下幾個方面:幫助管理者做好數據規劃,以應對在數據生命各個階段進行管理的復雜性問題;有助于在考慮限制條件與效率的情況下為終端用戶提供符合需求的數據產品;幫助數據生成者和管理者進行數據的質量控制,明確在何種階段移除干擾和噪音;闡明與數據生命相關的一系列基礎活動和關鍵事件;幫助設計者開發能夠可持續使用的數據管理標準或工具。在不同的數據密集型科學研究和實踐中,由于跨領域或組織的差異,不同數據集在目標、來源、屬性、所有權和傳播發布限制等方面差異性顯著,因而不同版本的數據生命周期模型在細節和數據活動上存在多樣的展現方式。
本文梳理了部分典型的數據生命周期模型(見表1)。發現不同類型的數據生命周期模型從開發目的和建構側重點來看存在兩種模式:一是偏向細節和差異性的闡釋,重點面向特定場景與應用領域,強調具體的用戶需求和數據挑戰,如專門針對社會科學研究數據的DDI模型和強調個人數據管理的APDL模型;二是側重數據生命周期的總體性概括與抽象總結,使模型具有一定的普適性和靈活性,能夠適應不同領域、多樣化情境中的數據管理問題,如DCC模型和COSA-DLC模型。兩種不同的模型構建思路是在數據生命周期整體性與多樣性、普適性與特殊性之間的權衡。同時,不同的數據生命周期模型在數據生命周期階段劃分上也存在不同的側重和表述。核心階段如數據收集、數據保存、數據獲取與使用等在大部分模型中均會出現。結合不同情境和管理需求,部分模型則會加入特定的生命周期階段和管理元素,如研究設計與數據規劃是科研數據管理過程中的初始階段。數據銷毀則僅出現在了個人數據生命周期模型中,以符合相關的數據管理和隱私保護政策。
3? ?公共安全數據的類型與生命周期模型
3.1? ? 公共安全數據類型
公共安全數據是指在公共安全治理活動中產生的或通過其他方式所獲取的,能夠反映公共安全治理活動的現象、特征和規律,進而支持管理決策的原始數據或經過加工整理的各類數據集,具有明顯的海量、多源、異構和價值密度低等大數據特征。公共安全數據目前并未有統一的分類標準,海量的公共安全數據正存在于不同行業領域、不同組織機構以及不同的數據終端中。黃全義等[18]認為城市的公共安全數據可分為城市公共基礎(市情)數據、部門業務數據、社情民意數據、物理環境與災害監測數據、城市運行數據、人行為(活動)數據、突發事件應急處置數據和公共安全知識數據八大類,每個大類下又涵蓋了各種類型的具體數據。Thakuriah P等[19]則將城市大數據劃分為傳感器系統(基于基礎設施或移動目標傳感器)數據、用戶生成內容(“社會”或“個人”傳感器)數據、管理(政府)數據(開放的和保密的微觀數據)、私營部門數據(消費者和交易記錄)、藝術和人文數據以及混合數據(鏈接數據和綜合數據)。
巴志超等[20]認為國家安全大數據是以各種復雜關聯形式分布在人、機、物高度融合的信息空間、物理世界和人類社會三元世界中。由于廣義上的公共安全指所有事關社會生活安全穩定的外部環境和秩序,包括經濟安全、環境安全、公共衛生安全、信息安全、食品安全、生產和工作場所安全等[21],因此,上述安全領域中產生或使用的數據均可稱之為公共安全數據。本研究從不同安全領域數據的共性出發,從數據來源和數據類型上對公共安全數據的分類進行總結(見表2)。
公共安全數據的來源是由通信網、互聯網、傳感網等相互融合鏈接所形成的混合環境,即從“物理空間-社會空間-虛擬網絡耦合空間”中剝離出來的數據空間。物理空間中“物”是公共安全數據的載體,既包括關鍵基礎設施、工業危險源、道路交通等結構化、半結構化基礎數據;也包括通過人類生活空間中部署的大規模多種類傳感設備所感知到的環境物理參數、圖片、聲音、視頻等非結構化、多模態數據。社會空間中,個體或組織則是公共安全數據的生產者或持有者,既包括基礎的人口統計學數據與個人或群體的個性特征、情緒表征、認知決策和壓力應對等心理數據與行為數據,也包括各類組織的業務數據或公共安全知識數據等。虛擬網絡耦合空間是指網絡空間與物理空間和社會空間的重疊耦合,其數據載體是互聯網或移動終端設備,既包括信息化建設中基礎網絡及各類應用系統處理的數據和相關信息安全風險數據(物理空間與網絡空間的耦合),也包括新聞報道、論壇帖子、博客文章等社會媒體中的非結構化和半結構化數據(社會空間與網絡空間的耦合)。
總體來說,公共安全數據具有以下明顯特征:①連續性,公共安全治理活動的持續性決定了公共安全數據生成和獲取的連續性,如政府部門的業務系統不斷產生更新數據;②復雜多樣性,公共安全數據涉及不同領域、不同來源、不同結構類型的數據,且數據規模大,增長速度快;③關聯性,公共安全治理活動需要跨部門、跨行業、跨領域的關聯,與之相應公共安全數據需要進行語義關聯以支持數據增值與重用;④涉及主體的多元性,公共安全數據的生產、管理和使用過程中涉及政府組織、企業、公眾、研究人員等不同參與主體。上述數據特征也決定了其管理活動的復雜性和系統性。
3.2? ? 公共安全數據生命周期模型
3.2.1? ?公共安全數據生命周期的階段劃分
考慮到公共安全數據的類型及其特征,本文借鑒典型數據生命周期模型的階段劃分,將公共安全數據生命周期劃分為五個主要階段,每個階段又包含了詳細的子階段。
(1)數據規劃(Data Planning):數據規劃是對公共安全數據整體狀況的描述,對數據在整個生命周期階段中如何被管理進行總體上的設計,主要包括兩個子階段:①數據情境分析。該階段是數據規劃的起點與基礎工作,結合公共安全治理活動中公共安全數據產生與應用的具體情境,明確不同情境下公共安全治理任務的實現對數據的需求和管理目標;②管理規劃設計。包括不同生命周期階段,執行數據活動的基本原則、方法、標準、政策法規、基礎設施、知識產權等關鍵問題的討論和設計。如數據產生與收集的工具、數據評估和描述標準的制定、數據質量控制措施等。
(2)數據采集(Data Acquisition):數據采集是在數據規劃階段提出的設計方案指導下,實現數據的創建、收集、描述與評估,保證數據采集的全面性、準確性和相關性,主要包括以下幾個子階段:①數據產生與創建。通過業務信息化、社會調查、部署傳感器與物聯網建設、基于社交媒體等的用戶內容生成以及儀器工具測量等方式,將潛在的數據轉化為可存儲和可獲取的數字形式;②數據收集與描述。根據規劃方案規定的收集范圍,采集確定來源、載體、格式等屬性要求的數據,規定數據收集的模板以指導多樣的數據收集者,并用適當的元數據標準對數據進行全面精準的描述。同時提供與數據相關的情境信息,包括數據收集方法及過程的描述、收集人員信息、業務情境、參數說明、知識產權等;③數據評估與選擇。在數據收集過程中執行數據質量控制標準的基礎上,進一步通過機器清洗或人工檢查保證數據質量,使其符合相關的任務要求和政策規定。
(3)數據處理(Data Processing):數據處理是對采集到的數據進行集成、分析等工作,為數據的增值和應用做好準備,以實現從數據到信息再到知識和智慧的有效流動,主要包括以下幾個子階段:①數據集成。從格式、編碼方案、本體等方面轉換不同來源獲取的相關數據集,形成機器可讀的同質數據集,以支持數據的分析和挖掘工作;②數據分析。運用統計分析、模擬仿真、自然語言處理等方法,從數據中抽取有價值的信息并發現知識,以可視化的方式將分析結果呈現給終端用戶,這是數據增值的關鍵步驟。
(4)數據保存(Data Preservation):數據保存是將有價值的數據根據公共安全治理活動需要和領域類型的差異進行分類存儲和選擇性的長期保存,主要包括以下幾個階段:①數據分類。根據數據應用情境、所在安全領域和數據來源與類型,按照統一的數據組織主題類目整理數據,為實現有效的數據存儲做準備;②數據存儲。在數據分類的基礎上,針對不同類型與來源的數據選擇相應的介質進行存儲,并通過存儲設備維護、數據備份、檢查不變性、權限設置等措施保證數據的可獲得性、準確性和安全性;③數據長期保存。由于公共安全數據的海量與持續更新的特征,需要識別具有長期保存價值的數據,并將相關數據提交專門機構進行適當的歸檔與長期保存,以減小數據管理成本、保證數據管理的安全性和持續性,支持數據的不斷增值與重用。
(5)數據使用(Data Using):數據使用指用戶發現并獲取已發布的數據,運用數據及其分析結果來支持公共安全治理活動和決策,主要包括以下幾個子階段:①數據發布。根據相關管理政策,將經過分級分類整理的數據予以發布,為指定用戶或公共終端用戶提供數據獲取和使用權限,實現數據的共享共用;②數據發現與獲取。用戶通過一定的方式獲取到關于數據的基本信息,進而定位和獲取到潛在有用的數據,如通過政府數據開放平臺提供的API等方式;③數據使用。數據生產者或者其他使用者運用數據及其分析結果支持管理決策,進行數據產品的開發和數據服務提供等;④數據重用。已保存的數據可支持領域公共安全數據庫的建設與知識庫開發,支持數據回溯、檢查與對比分析,并作為歷史數據支持學術研究與報告撰寫等工作。
公共安全數據生命周期的各個階段在理想狀態下形成線性的循環,實踐中則多會產生非線性的回路,或僅聚焦于幾個特定的生命周期階段。詳細的子階段劃分體現了較為全面的階段任務,具有很大的靈活性和適應性,能夠根據公共安全治理活動不同情境的差異性滿足特定數據需求。
3.2.2? ?公共安全數據生命周期的主體層次
從參與主體角度來看,公共安全數據生命周期模型可分為基于個體的數據生命周期、基于組織的數據生命周期和基于領域群體的數據生命周期。
(1)基于個體的數據生命周期。公共安全治理活動中的個體是最細粒度的參與主體,典型如食品安全治理活動中的每一個消費者,或者自然災害發生時的受災人群。個體在公共領域有意識的產生、并能夠提供開放利用的數據被認為是公共治理的基礎之一[25]。作為公共安全治理活動的利益相關者,其產生的如人口統計學數據、社會媒體數據、個體的心理特征與行為數據等,可為支持大規模人流監測、救災物資優化配置、危機溝通與決策制定等公共安全治理活動提供重要依據。但由于數據質量、格式、產生目的、存儲等受個體影響差異性最大,使得數據的收集、融合和長期保存難度也最大。在基于個體的公共安全數據生命周期中,數據活動往往集中在上游階段,很難形成可以不斷演化循環的回路。
(2)基于組織的數據生命周期。不同類型的組織在參與公共安全治理活動和提供公共安全服務時產生了基于組織的生命周期,其中最典型的即政府組織。作為公共安全治理活動的主導者和公共安全服務的核心提供者,政府組織也是公共安全數據的主要管理者和使用者。政府行政管理過程中產生的業務數據是公共安全數據的重要組成部分,在數據格式標準化和質量管理方面也具有行政優勢。且隨著政府數據開放運動的發展和國家大數據發展戰略的制定,政府組織內部的數據基本實現了從產生到發布共享與利用的數據生命周期各個階段的管理。但由于其數據的海量、持續性和部分數據的保密性等特征,在不同階段的數據活動投入不同,也使得全生命周期的數據管理存在薄弱環節,如數據規劃、數據評估與選擇等。企業等非政府組織也注重組織內全生命周期的數據管理。
(3)基于領域群體的數據生命周期。不同安全領域的公共安全治理活動利益相關者整體上構成了一個特定的領域群體,如食品安全領域的“食品安全監管者-食品經營者-消費者”群體。基于領域群體的數據生命周期提供一個更為宏觀的視角對實踐中的數據活動進行全面的理解,如DCC數據生命周期模型就是典型代表。該類生命周期為領域群體提供一個共享的、能夠被普遍接受的基礎解釋,可以幫助組織規劃其數據活動,保證生命周期發展的正確順序和管理過程中必須考慮在內的管理元素。相比于基于個體和組織的生命周期,基于領域群體的生命周期更能夠表征領域實踐的數據所經歷的共同階段,在細節和精確性上有所弱化,更注重普遍性特征的高度概括與總結,其內涵和特征在基于個體和組織的生命周期中有不同的側重和體現。
3.2.3? ?公共安全數據的生命周期模型
綜合上述分析,本文提出公共安全數據的生命周期模型(見圖1)。該模型從公共安全數據出發,充分考慮了公共安全治理中數據活動參與主體的差異性,形成了包括數據規劃、數據采集、數據處理、數據保存和數據使用五個主要階段在內的循環流程。其中,五個主要階段又包含了具體的子階段,涵蓋了14個公共安全數據活動的主要任務階段。不同數據階段之間的關聯通過數據格式的轉換、數據活動參與者職責的確定以及數據生產者、管理者和使用者角色的明確得以體現,是保證數據質量和促進全生命周期數據管理的關鍵。
總體來看,該公共安全數據生命周期模型是一個全面的、概括的模型,涵蓋了主要的數據生命周期階段以保證其指導性和前瞻性。同時,該模型由于考慮了公共安全治理活動中參與主體與數據類型的差異性,能夠迅速適應公共安全治理活動的不同場景,根據不同場景需求靈活地進行生命周期子階段的選擇、組合與擴展,滿足不同主體在不同情境下的異質性數據需求,并保證較高水平的數據質量。其在應用中的潛在優勢包括:可實現面向未來的數據發現、集成和處理,管理和組織總體數據集;針對具體場景提供簡單的個性化定制和采用方式;提高具體情境下的數據質量水平;對于具體應用者如數據、軟件和系統設計者來說,能夠消除額外的資源浪費和努力,根據自身需求靈活制定有效的數據架構。
4? ?基于生命周期的公共安全數據管理三維模型
4.1? ? 公共安全數據管理三維模型的構建
公共安全數據管理必須緊密結合實踐,體現公共安全治理活動的內容和需求。在明確公共安全數據生命周期模型的基礎上,本文進一步結合公共安全治理內容與情境,構建公共安全數據管理的整體模型。從管理過程而言,風險管理、應急管理、危機管理組成了公共安全活動的主要內容[26],也成為公共安全數據的主要應用情境。由于風險管理、應急管理、危機管理同樣具有其生命周期的階段特征,使得將數據生命周期嵌入公共安全治理活動,使數據活動響應不同階段公共安全治理活動的數據需求成為可能。以此構建了基于生命周期的公共安全數據管理三維模型(見圖2)。該模型將公共安全數據生命周期與公共安全治理內容的生命周期結合起來,幫助細化不同管理內容和情境下的數據需求,進而使數據管理活動能夠切合公共安全治理活動和不同組織內部的業務管理活動,實現有效的、切合公共安全治理實踐的數據管理。
公共安全治理從現實路徑來看,以突發事件應急管理為切入點,延伸至公共危機管理,進而推動社會風險治理[27]。應急管理、危機管理與風險管理在其運行機制上存在自身結構,不同管理要素的角色、功能和相互關系構成了其各自的生命周期循環。我國的應急管理循環圈包括預防與準備、預警與監測、救援與處置、善后與恢復四個階段[26];危機管理階段論也有不同的分類,美國聯邦應急管理局(FEMA)將危機發展過程分為減緩、準備、響應與恢復四個階段[9];風險管理則包括風險識別、風險分析、風險評估和風險處置四個階段。
定義和構建公共安全數據活動框架的生命周期則可看成一個嵌入到公共安全治理活動中的子集。不同的數據管理活動響應公共安全治理不同管理內容在不同階段對數據的差異性需求。如應急預防與準備階段、危機減緩和準備階段、風險識別階段均側重于人口統計學數據、公共安全基礎數據等反映自然與社會狀態基礎數據的收集與管理;應急預警與監測則注重對反映突發事件狀況實時數據的動態收集和迅速處理,如自然環境監測數據、傳感器數據和社會媒體數據等,以支持應急決策和救援資源配置工作。當然,不同管理內容與情境下的數據需求是一個復雜問題,涉及到不同安全領域又會加入更多的約束條件,需要結合實踐進行深入的探索與分析。
在公共安全活動內容的生命周期與公共安全數據生命周期的嵌套融合之下,數據活動響應公共安全治理活動和不同類型組織的業務管理活動,使得數據管理活動既能涵蓋數據管理過程中的各類要素,同時能夠有效切合公共安全治理實踐情境與組織的業務特征。
4.2? ? 公共安全數據管理三維模型的功能
基于生命周期的公共安全數據管理三維模型的功能體現在以下幾個方面:
(1)有助于統籌公共安全數據管理過程中的各類要素。該模型將客體要素(不同來源和類型的公共安全數據)、主體要素(數據活動中不同的參與主體)和情境要素(公共安全活動內容)統一起來,明確了公共安全數據管理過程中主要要素的內涵和基本問題,并以生命周期為紐帶形成了各要素之間的關聯和作用機制,為實行有效的公共安全數據管理提供了基礎條件。
(2)輔助公共安全數據管理規劃的制定。公共安全數據管理規劃從宏觀上來說,是公共安全治理活動的重要組成部分;從中觀上來說,涉及政府組織等核心主體的公共安全數據管理頂層設計與管理規劃;從微觀上來說,則是數據生命周期的第一階段,需要考慮數據各個生命周期階段的狀態和活動。該模型為不同層面的數據規劃制定提供一個統一的管理框架和靈活的適應機制,有助于不同層面數據管理規劃的制定,構建并完善公共安全數據管理體系。
(3)指導不同參與主體的公共安全數據管理活動。將生命周期貫穿于整體管理模型的構建,實現不同參與主體的管理職能和角色職責隨著生命周期階段變化而轉換,并在此基礎上將公共安全數據管理活動統一集成在公共安全活動生命周期與公共安全數據生命周期的特征與規律基礎之上,指導不同參與主體制定每個生命周期階段內的管理策略、任務和活動。
(4)支持公共安全治理活動。基于以上功能的實現,該模型通過有效的公共安全數據管理,使數據在公共安全治理活動中充分發揮價值,實現數據驅動的公共安全治理的動態監測與預警、及時反饋與精準判研、決策支持與智慧管理目標。
5? ?結語
基于生命周期所構建的公共安全數據管理三維模型。既是一種理論概括,也是一種分析框架,對公共安全數據管理這一交叉學科領域具有理論認識和實踐指導意義。一方面,該模型可作為關鍵基礎模型,豐富公共安全數據管理的基礎理論并為相關研究提供指導性框架;另一方面,該模型充分考慮了公共安全活動與數據管理要素、關系和過程的關聯統合,有助于相關組織和領域群體進行數據管理規劃和業務集成,開展全生命周期的公共安全數據管理活動。由于公共安全活動內容的領域多樣性和參與主體的多元性,不同領域情境下對公共安全數據的異質性需求和數據管理模型的具體應用需要進一步探索,從數據類型、生命周期階段、參與主體類型等多個角度對模型的合理性、解釋性和適用范圍進行驗證,并結合領域實踐進行不斷修正與完善。
注:①DCC:Digital Curation Centre,英國數字管理中心; DataONE: Data Observation Network for Earth,美國國家科學基金會地球數據觀測網;DDI:Data Documentation Initiative,描述調研、問卷、統計數據資料等社會科學研究信息的國際標準;ANDS:The Australian National Data Service,澳大利亞國家數據服務中心;COSA-DLC:Comprehensive Scenario Agnostic Data LifeCycle,與場景無關的全面數據生命周期模型;BLM:Bureau of Land Management,美國土地管理局;LOD2:Linked Open Data,關聯開放數據項目,由歐盟委員會FP7信息與通信技術工作計劃資助;JISC:The Joint Information Systems Committee,英國聯合信息系統委員會;APDL:Abstract Personal Data Lifecycle,個人數據生命周期抽象模型,由牛津大學Majed Alshammari等人提出;②6V:價值(Value)、體量(Volume)、多樣性(Variety)、速度(Velocity)、可變性(Variability)、精確性(Veracity)。
參考文獻:
[1]? 王芳,慎金花.國外數據管護(Data Curation)研究與實踐進展[J].中國圖書館學報, 2014, 40(4):116-128.
[2]? 黃如花,賴彤.數據生命周期視角下我國政府數據開放的障礙研究[J].情報理論與實踐,2018(2):7-13.
[3]? Carlson J.The use of life cycle models in developing and supporting data services[J].Research data management:Practical strategies for information professionals,2014:63-86.
[4]? 丁寧,馬浩琴.國外高校科學數據生命周期管理模型比較研究及借鑒[J].圖書情報工作,2013,57(6):18-22.
[5]? 曾子明,楊倩雯.面向第四范式的城市公共安全數據監管體系研究[J].情報理論與實踐,2018(2):82-87.
[6]? EPA IWGDD C.Harnessing the Power of Digital Data:Taking the Next Step[R].Scientific Data Management(SDM)for Government Agencies:Report from the Workshop to Improve SDM(Report No.CENDI/2011-1).Washington D.C.,2011.
[7]? Wallis J C,Borgman C L,Mayernik M S,et al.Moving archival practices upstream:An exploration of the life cycle of ecological sensing data in collaborative field research[J].International Journal of Digital Curation,2008,3(1):114-126.
[8]? CEOS.Data lifecycle models and concepts[EB/OL].[2018-11-18].http://wgiss.ceos.org/dsig/whitepapers/.
[9]? 沙勇忠.公共危機信息管理[M].北京:中國社會科學出版社,2016.
[10]? Bishop W,Grubesic T H.Data Lifecycle[M].Geographic Information,2016.
[11]? Sinaeepourfard A,Masip-Bruin X,Garcia J,et al.A Survey on Data Lifecycle Models:Discussions toward the 6Vs Challenges[DB/OL].[2019-05-20].https://www.ac.upc.edu/app/research-reports/html/RR/2015/18.pdf.
[12]? Sinaeepourfard A,Garcia J,Masip-Bruin X,et al.A comprehensive scenario agnostic Data LifeCycle model for an efficient data complexity management[C].2016 IEEE 12th International Conference on e-Science(e-Science).IEEE Computer Society,2016.
[13]? Higgins S.The DCC curation lifecycle model[J].International journal of digital curation,2008,3(1):134-140.
[14]? DataONE.Data Life Cycle[EB/OL].[2019-02-27].https://www.dataone.org/data-life-cycle.
[15]? Ball A.Review of Data Management Lifecycle Models[DB/OL].[2019-05-25].https://purehost.bath.ac.uk/ws/portalfiles/portal/206543/redm1rep120110ab10.pdf.
[16]? Auer S,Bühmann L,Dirschl C,et al.Managing the life-cycle of linked data with the LOD2 stack[C].International semantic Web conference.Springer,Berlin,Heidelberg,2012:1-16.
[17]? Alshammari M,Simpson A.Personal data management:an abstract personal data lifecycle model[C].International Conference on Business Process Management.Springer,Cham,2017:685-697.
[18]? 黃全義,夏金超,楊秀中,等.城市公共安全大數據[J].地理空間信息,2017,15(7):1-5.
[19]? Thakuriah P,Tilahun N Y,Zellner M.Big Data and Urban Informatics:Innovations and Challenges to Urban Planning and Knowledge Discovery[M].Seeing Cities Through Big Data.Springer International Publishing,2017.
[20]? 巴志超,李綱,安璐,等.國家安全大數據綜合信息集成:應用架構與實現路徑[J].中國軟科學,2018(7):9-20.
[21]? 劉莘.公共安全與秩序行政法[J].江蘇社會科學,2004(6):49-50.
[22]? Yin L,Cheng Q,Shao Z,et al.‘Big Data:Pedestrian Volume Using Google Street View Images[M].Seeing Cities Through Big Data.Springer,Cham,2017:461-469.
[23]? Gunturi V M V,Shekhar S.Big spatio-temporal network data analytics for smart cities:research needs[M].Seeing Cities Through Big Data.Springer,Cham,2017:127-140.
[24]? Goodchild M F.Citizens as sensors:the world of volunteered geography[J].GeoJournal,2007,69(4):211-221.
[25]? Meijer A,Potjer S.Citizen-generated open data:An explorative analysis of 25 cases[J].Government Information Quarterly,2018,35(4):613-621.
[26]? 薛瀾,周玲,朱琴.風險治理:完善與提升國家公共安全管理的基石[J].江蘇社會科學,2008(6):7-11.
[27]? 童星.論風險災害危機管理的跨學科研究[J].學海,2016(2):96-101.
作者簡介:陸莉(1990-),女,蘭州大學管理學院、蘭州大學應急管理研究中心博士研究生;沙勇忠(1968-),男,蘭州大學管理學院、蘭州大學應急管理研究中心教授,博士生導師;徐雪峰(1995-),男,蘭州大學管理學院、蘭州大學應急管理研究中心碩士研究生。
本文系教育部哲學社會科學研究重大課題攻關項目“大數據驅動的城市公共安全風險研究”(項目編號:16JZD023)與中央高校基本科研業務費專項資金資助重點項目“基于大數據的城市公共安全風險預警研究”(項目編號:17LZUJBWZD012)研究成果之一。
收稿日期:2019-08-20;責任編輯:魏志鵬