
摘 要:本文針對大數據時代民航系統面臨的數據管理挑戰,構建了一種全新的民航檔案數據生命周期管理模式。該模式從數據采集、分類、存儲、利用、共享到檔案化等角度,覆蓋了數據全生命周期。運用多種先進技術手段實施精細化管理,有效保障數據安全、質量和價值。模式具備全面性、靈活性、智能性、開放性和規范性特征,解決現存問題,為民航檔案數據的可持續高效管理和利用提供了新路徑。面臨的數據質量、安全性、復雜應用和檔案難題亦有望通過持續優化得到有效解決。
關鍵詞:民航系統;檔案數據;生命周期管理;數據價值
引言
在信息技術快速發展的今天,大數據已成為驅動社會創新的核心驅動力,并對傳統數據管理方式提出新的挑戰。挖掘與實現大數據價值的關鍵已轉向全生命周期的有效管理和策略設計。因此,構建適應大數據特性、覆蓋從產生至銷毀全程的生命周期管理模式是當前數據管理領域的關鍵任務。大數據生命周期理論框架包括采集、存儲、管理、利用、共享及檔案化等多個環節[1]。盡管國際國內對此的研究尚處于初級階段,但ISO、NIST和中國科學院大數據創新中心提出的五至八階段模型[2],揭示了大數據生命周期的基本構造、規律及其內在聯系,為構建有效的管理模式提供了參考。
民航系統作為復雜多元應用場景的代表,其產生的大數據具有多樣性、海量性、實時性和動態性等特點,不僅是運營基礎,還是確保安全、提升效率和促進行業創新的核心資產。為此,深入研究并建立適用于民航系統的數據生命周期管理模式,對于發揮民航數據潛能、推動行業數字化轉型至關重要。本文專注于創建一種針對民航檔案數據精細化的生命周期管理模式,在綜合國內外相關理論成果及現有模型的基礎上,結合民航數據的具體需求與特點,設計并實施全面涵蓋各生命周期階段的管理模式。
1 民航大數據概況
民航大數據體系因其多樣、海量、實時和動態特性,成為大數據應用的典型代表[3]。這一領域廣泛覆蓋了航空公司運營、機場管理、客戶服務、基礎設施建設及科技創新等多元數據集,以2022年我國為例,龐大的數據來源于41家航空公司、241個機場及3680架飛機,全年航班量超1200萬架次,服務旅客7.1億人次,貨郵吞吐量達1698.4萬噸。每日生成的數據量估計超過1PB,內容包括航班詳情、旅客信息、貨物資料、機場運行狀態等諸多維度[4]。
當前,民航系統面臨嚴峻的大數據管理挑戰:數據資源分布零散且冗余嚴重,數據庫重復率高達30%,這不僅造成資源浪費、增加管理成本,還引發了數據質量下滑問題[5]。同時,隨著大數據技術廣泛應用,數據安全威脅突出,現有管理模式的弊端明顯:被動低效的數據利用,受限的數據開放與共享。業務層面分散化的數據管理導致安全性差、數據質量不一。引入新技術雖提升了管理復雜度,但也加劇了數據安全敏感性及數據質量波動帶來的管理難度。此外,模式缺乏靈活性以適應環境變化,子系統間孤立運作,協調機制缺失,整體效率降低。而且依賴傳統理論框架,創新探索滯后,制約了民航大數據價值的深度挖掘和有效利用。
因此,在大數據時代背景下,優化民航數據管理體系迫在眉睫。本文提出構建一種靈活高效、適應性強、具有創新性和優化性的民航檔案數據生命周期管理模式,旨在提高行業數據管理水平和服務效能,推動民航業數字化轉型進程的深入發展。
2 民航檔案數據生命周期管理模式構建
為了實現民航檔案數據從產生到歸檔的全生命周期管理[6],本文提出了一個基于數據價值鏈的民航檔案數據生命周期管理模式,如圖1所示。
2.1 數據采集與生成:民航檔案數據生命周期的起點與質量基石
在民航檔案數據生命周期管理框架內,數據采集與生成環節扮演著舉足輕重的角色,作為整個數據價值鏈的起點以及確保數據質量的關鍵節點。這一階段旨在全面、精確且及時地獲取涵蓋民航業務全貌的各種必要信息,并以滿足數據完整性、準確性和實時性等核心要求為目標。
為實現上述目標,現代民航業采取了多元化的數據采集與生成方法和技術[7]。首先,在飛機運行、機場作業以及空中交通管理等實際操作層面,依托先進的傳感器設備和集成系統,自動記錄并實時生成具有高頻率、高精度特性的運行數據。這些數據構成了民航業務決策的重要依據和參考體系。其次,主動式數據采集機制則通過人工或自動化手段,針對民航業務中的特定主體和對象進行有針對性的信息收集,涵蓋了諸如旅客身份信息、航空公司運價政策以及機場安檢流程等多種關鍵業務數據。最后,借助于網絡和其他開放渠道,被動接收來自外部環境的各類數據資源。例如,氣象部門發布的天氣預報、交通管理部門提供的道路狀況信息以及社交媒體反映的公眾意見輿情反饋等。它們作為重要的輔助參考信息,有助于提高民航業務運作效能和應對復雜多變情境的能力。
2.2 數據分類與標準化:民航檔案數據生命周期管理的基礎
數據分類與標準化在民航檔案數據生命周期管理中扮演著基礎性角色,是構建數據價值鏈和保障數據質量的核心要素。該過程旨在依據數據的屬性、特征、價值及敏感度等原則,采用科學方法與標準,對民航業務相關數據進行合理劃分與規范,以滿足數據一致性、可比性和可交換性等需求。實現這一目標的關鍵包括運用數據模型、數據字典和數據標簽等多種工具和技術。
數據模型通過對民航業務數據進行抽象和概念化處理,建立邏輯結構和物理結構,如實體——關系模型、維度模型和本體模型等,為數據分類與標準化提供了堅實的基礎,并實現了數據的結構化組織與表達。數據字典作為核心組成部分,通過命名和解釋各類數據元、數據項、數據表和數據集之間的關系,描述了數據含義、來源、格式、范圍和質量等方面信息,確保了數據語義化的管理和使用。而數據標簽作為一種補充技術,通過對民航業務數據進行標記和注釋,標識出數據的類型、級別、狀態、用途等特性,如數據主題、等級、質量以及敏感性等,進一步強化了數據的特征化表示及其實際應用。
2.3 數據存儲與管理:民航檔案數據生命周期管理的核心角色
在民航檔案數據生命周期管理中,數據存儲與管理支撐整個數據價值鏈并保障數據質量。其主要目標是通過遵循數據全生命周期、業務需求及安全風險等原則,采用恰當的技術手段實現數據的安全高效存儲和管理,以確保數據的可用性、可訪問性和可維護性。
針對不同類型的數據,運用了數據庫、數據倉庫和數據湖等多種方法和技術。關系型數據庫、對象型數據庫以及文檔型數據庫主要用于結構化數據的存儲與管理,其優勢在于能提供結構化、規范化和一致性的處理環境,便于檢索、更新和分析,但受限于非結構化或半結構化數據的處理。數據倉庫技術借助星型模型、雪花模型和數據立方體集成多源異構數據,有效進行數據整合、清洗、轉換與匯總,支持多維查詢與決策挖掘,但在實時或動態數據處理上存在局限。而基于Hadoop、Spark構建的數據湖[8]則擅長海量非結構化數據的原始存儲、按需處理與自由訪問,適用于多樣性和多粒度的應用場景,要求實施嚴格的數據治理與元數據管理,否則可能導致數據混亂和效率低下。
上述方法和技術并非孤立,而是可以相互補充并協同運作,在實際應用中根據數據特性、需求和價值靈活選用。例如,結構化檔案數據存儲于數據庫,非結構化數據存于數據湖,并通過數據倉庫對兩者進行深度集成與分析,從而形成完整的檔案數據視圖。
2.4 數據利用與分析:民航檔案數據價值鏈的核心環節
數據共享與開放作為民航檔案數據生命周期管理的延伸,不僅拓展了數據價值鏈,更是數據質量反饋的重要途徑。其核心目標在于促進民航業務產生的數據有效流通和利用,以滿足公共性、社會性和開放性的要求[9]。在這一過程中,遵循數據全生命周期規律、業務屬性及用戶權益原則,采取合理策略與手段確保數據的合法流通和高效利用。
數據共享通過構建內部平臺、協議和服務,實現檔案數據在組織內部的高效流通和協作,提升了數據使用效率并有力支持內部協同創新,但在實施中需妥善處理數據的所有權、訪問權和使用權等復雜問題。數據開放則依托外部開放平臺、政策和服務,推動檔案數據的社會化流通與利用,以提升數據的社會價值,鼓勵外部參與和創新活動,但同時面臨解決隱私保護、數據安全和質量保證等關鍵挑戰。而數據交換作為一種雙向流通機制,利用相應的平臺、協議和服務實現數據間的互動與協作,旨在增強數據的整體性和優化潛力,但需關注數據一致性、兼容性以及可信性等問題。
上述方法和技術相互依存、互為補充,在實際應用中可以根據數據特性、價值定位和目的需求靈活選擇或組合運用,構建起一個既能實現內部協作又能促進社會化利用,并具有雙向互動功能的民航檔案數據共享與開放體系。例如,首先借助數據共享平臺強化內部數據流通與協作,隨后通過數據開放方式拓寬外部流通和社會價值挖掘,最后結合數據交換技術實現跨系統間的數據交互與優化,從而構筑有利于數據流動增值的數據共享與開放生態。
2.5 數據共享與開放:民航檔案數據生態構建的核心環節
數據檔案化在民航檔案數據生命周期管理中占據著至關重要的位置,既是價值鏈的終結點,也是確保數據質量的關鍵環節。其目標在于按照永久性、穩定性和可追溯性的原則,運用科學技術和方法對民航業務相關數據進行高效歸檔和持久保存。
在實現這一目標的過程中,核心手段包括檔案管理、檔案保存與檔案服務三個維度。檔案管理通過對民航檔案數據建立規范化的管理體系,如管理制度、流程及系統架構設計,為數據檔案化奠定基礎。檔案保存則關注安全可靠的數據存儲和維護,利用專業設施和技術保障數據長期穩定存儲,構成數據檔案化的支撐體系。檔案服務通過搭建服務平臺、制定政策并開放接口,有效促進了檔案數據檢索和利用,推動了數據從檔案化向服務化和利用化的深度轉變。
這些方法和技術相互配合,構建出符合檔案管理原理與實踐需求的數據檔案化整體框架。在實際操作中,根據數據特性與價值,靈活采用和整合各類技術方案,以形成高效且全面的民航數據檔案化策略,確保數據得到科學的管理和使用。
2.6 數據檔案化:民航檔案數據生命周期管理的終點
數據檔案化不僅是數據價值鏈的閉合環節,還是確保數據質量的關鍵措施。其核心目標在于按照數據永久性、穩定性和可追溯性等原則,運用合理技術和手段對涉及民航業務的數據進行有效歸檔和保存。
在實現這一目標的過程中,主要采用了檔案管理、檔案保存及檔案服務三種方法和技術。檔案管理通過對民航檔案數據實施規范化、標準化的歸檔與管理體系構建,包括管理制度、流程和系統設計,奠定了數據檔案化的基礎架構。檔案保存則側重于安全可靠的數據存儲和維護,借助專業的設施、技術和服務,確保數據長期穩定地保存,從而成為數據檔案化的中堅力量。檔案服務通過構建服務平臺、制定服務政策并開放接口等方式,有效地促進了檔案數據的檢索利用,實現了數據從檔案化到服務化、利用化的高級階段轉變。
上述方法和技術相互支撐共同構成了符合檔案管理原理和實踐需求的數據檔案化體系。在實際操作中,依據數據特性與價值定位,靈活選擇和綜合運用各類方法和技術,以構建高效且全面的民航檔案數據化體系,保障數據得到科學管理和優化利用。
3 結果與討論
本研究立足于民航系統,構建了一種全面且創新的檔案數據生命周期管理模式,該模式集全面性、靈活性、智能性、開放性和規范性于一體,涵蓋了從數據采集與生成至檔案化的全過程,包括分類與標準化、存儲與管理、利用與分析以及共享與開放等關鍵環節。在吸收借鑒國內外相關理論與實踐的基礎上,針對民航系統的特點和需求,整合運用多樣化數據管理與利用技術,為解決民航檔案數據復雜性與多樣性問題提供了新的策略。
首先,新模式實現了對民航檔案數據全生命周期的無縫對接和精細化管理,確保了數據完整性與連貫性;其次,靈活適應不同數據特點與價值需求,采用定制化方法和技術,增強了數據管理的兼容性和適應性;此外,通過嵌入智能算法與可視化手段,深度挖掘數據潛在價值,提升了知識發現和創新能力,并借助數據共享與開放機制,促進了內外部數據流通和服務效率[10]。
同時,該模式嚴格遵循檔案管理原則,強化了數據的安全保存、有效檢索與規范化歸檔,從而提高了檔案數據的價值實現與經濟效益。在實際應用中,面臨數據質量與安全、利用分析復雜性及檔案化難題等挑戰。對此,計劃采用先進的質量管理與安全防護措施優化標準和技術,以提升數據質量和安全性。深化數據挖掘與智能分析技術突破分析瓶頸。完善和實施嚴格的檔案管理流程確保檔案化進程的有效性。此模式兼具理論價值與實踐潛力,通過解決現存問題有望提供全面管理和高效利用民航檔案數據的可持續路徑。
同時,政策層面建議構建適應特點的法規標準體系,規范全生命周期操作,并推動設立專業機構如數據中心,配置專業人才,強化數據管理專業化。此外,強調塑造積極的數據文化氛圍,建立價值觀、理念與規范,激勵多方參與形成共識共享環境,全面提升數據文化品質。
參考文獻
[1]杜彥峰,相麗玲,李文龍.大數據背景下信息生命周期理論的再思考[J].情報理論與實踐,2015,38(5):25-29.
[2]中國信通院,大數據白皮書[EB/OL],2020年,http://www.caict.ac.cn/kxyj/qwfb/bps/202012/P020210208530851510348.pdf.
[3]中華人民共和國中央人民政府,中國民用航空局關于印發民航大數據建設發展的指導意見的通知[EB/OL],2022年,https://www.gov.cn/zhengce/zhengceku/2022-10/14/5718281/ files/b08159d4d0704d9fb71a42b60f318a17.pdf.
[4]景云麒,楊璐源.我國智慧民航建設探討[J].交通企業管理,2022,37(3):4-7.DOI:10.3963/j.issn.1006-8864.2022.03.002.
[5]Li Ziqing, Shenglei Pei, and Guiliang Feng. The Model Design of Medical Data Life Cycle Based on Big Data Platform, Journal of Physics: Conference Series, vol. 1865/no. 4, (2021), pp. 42088.
[6]張進,葉博嘉等.空域數據主動管理模式研究與實踐[J].辦公自動化,2022,27(2):9-12.DOI:10.3969/j.issn.1007-001X.2022.02.003.
[7]王玉.大數據時代Hadoop和Spark技術研究[J].品牌研究,2020(6):88-90.DOI:10.19373/j.cnki.14-1384/f.2020.04.035.
[8]王成鋮.大數據生命周期下檔案數據的治理策略分析[J].黑龍江檔案,2022(6):43-45.DOI:10.3969/j.issn.1673-9116.2022.06.018.
[9]商圣坤.智慧檔案全生命周期中大數據技術的運用分析[J].中國新通信, 2021,23(7):137-138. DOI:10.3969/j.issn.1673-4866.2021.07.062.
作者簡介:孫楠(1988—),大學學歷,中國民用航空局檔案館館員,工作及研究方向:檔案信息化、機關檔案管理。