999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于等保2.0的鐵路敏感數據安全關鍵技術及研究

2021-01-15 09:22:20彭劍峰徐保民張義祥
網絡安全技術與應用 2021年1期
關鍵詞:鐵路分類系統

◆彭劍峰 徐保民 張義祥

基于等保2.0的鐵路敏感數據安全關鍵技術及研究

◆彭劍峰1徐保民2張義祥1

(1.中鐵信安(北京)信息安全技術有限公司 北京 100094;2.北京交通大學 北京 100044)

本文以等保2.0對鐵路貨運數據的安全要求及貨運數據規則為基礎,結合鐵路業務系統,從“數據安全使用”的角度,對以主動防護為手段的安全保護技術進行深入研究,包括數據的分類分級、敏感數據的自動識別、敏感數據的脫敏存儲和使用,設計開發出鐵路敏感數據自動識別與動靜態脫敏于一體的大數據平臺,可在大數據環境下準確高效地對多源非結構化數據源進行自動分類分級和脫敏操作。

數據脫敏;機器學習;信息安全;數據隱私

近幾年,云物大智移等技術正逐步應用在中國鐵路上。《鐵路信息化總體規劃》和《鐵路大數據應用規劃報告》里都對鐵路數據的價值利用提出了更高的要求,同時也提出了數據安全要求。隨著鐵路數據的深入應用,數據安全問題也會日益凸顯。鐵路數據是國家基礎戰略資源,也是中國國家鐵路集團有限公司的重要資產,關系到國計民生。傳統的防火墻、反病毒軟件、入侵檢測和數據防泄漏等信息安全防護措施,已經難以獨立應對數據安全問題,并且內部人員的泄漏比外部黑客攻擊帶來的后果更嚴重。

2019年發布的網絡安全等級保護制度2.0國家標準(以下簡稱等保2.0),注重全方位主動防御、動態防御、整體防控和精準防護。等保2.0結合數據的全生命周期提出了安全防護的要求,尤其針對重要的、敏感的數據,在傳輸、存儲、使用、消除、運維等方面均有具體要求,并且對個人信息保護單列了章節,這些都是等保1.0所沒有的。通過對等級保護三級的要求分析,共有18項控制點/要求項涉及數據安全,其中安全通用要求中的技術要求6項和管理要求7項,云計算安全擴展要求3項、大數據應用場景說明2項。在《國家網絡安全法》中明確提出國家實行網絡安全等級保護制度,對公共通信和信息服務、能源、交通、水利、金融、公共服務、電子政務等重要行業和領域,以及其他一旦遭到破壞、喪失功能或者數據泄露,可能嚴重危害國家安全、國計民生、公共利益的關鍵信息基礎設施,在網絡安全等級保護制度的基礎上,實行重點保護。

從2017年起,國內市場開始重視敏感數據安全這個細分方向。2015年Gartner首次提出了數據安全治理概念,2017年在Gartner全球安全大會中提出數據安全治理已成為數據安全中的“風暴之眼”(The Eye Of Storm),2018年,Gartner首次在數據安全治理方向上專門推出研究報告《如何使用數據安全治理》。在Gartner的數據安全治理理念中,提出了“數據分級分類,針對不同級別數據實行合理的安全手段;要明確數據的訪問者(應用用戶/數據管理人員)、訪問對象、訪問行為,基于這些信息制定不同的、有針對性的數據安全策略。”Microsoft 也推出了 DGPC 方案(Data Governance for Privacy Confidentiality and Compliance),該方案是專門強調隱私、保護與合規的數據治理技術框架,提出了安全的基礎架構、身份和訪問控制、信息保護、審計和報告四個技術領域。2019年,中國網絡安全與信息化產業聯盟數據安全治理委員會(簡稱數據安全治理委員會)發布了《數據安全治理白皮書》,在國內正式提出了“讓數據使用更安全”的體系化方法論,其核心是“要滿足數據安全保護、合規性、敏感數據管理三個需求目標,通過分級分類、角色授權、場景化安全等來實現數據使用安全的精細化管控。”

1 系統架構

當前,我國鐵路建設處于高速發展期,鐵路信息化建設也需要相匹配。增強網絡空間安全防護能力,需要聚焦鐵路網絡安全突出問題,數據安全問題是關鍵問題,以等保2.0對鐵路貨運數據的安全要求及貨運數據規則和特點為基礎,結合鐵路業務系統和大數據應用的實際,從“數據安全使用”的角度,對以主動防護為手段的安全保護技術進行深入研究,以鐵路貨運相關數據為研究對象,通過對其數據分類梳理來界定敏感數據范圍,并根據其數據規則和特點,提出敏感數據分類分級標準和建議,并設計開發出鐵路敏感數據自動識別與動靜態脫敏于一體的大數據平臺,可用于大數據環境下高效準確地對多源非結構化數據源進行自動分類分級和脫敏。

圖1 鐵路敏感數據安全系統架構圖

圖1是我們所設計的鐵路敏感數據安全系統架構圖[1]。它主要由敏感數據管理門戶、數據工作臺、權限管理、敏感數據安全管控平臺、數據質量監控與審計、敏感數據安全分類、基礎庫和脫敏庫等核心部件構成。其工作流程[2]:

1)數據源配置,管理者通過頁面輸入賬號、密碼、數據源類型、訪問類型、url等信息,系統后臺根據輸入的信息讓Durid和ShardingSphere-JDBC配合使用連接源進行驗證賬號和密碼是否正確,如果驗證成功會生成對應的任務加入工作隊列,任務調度會從線程池Durid里通過ShardingSphere-JDBC連接數據源,在Spark計算引擎上執行掃描任務,通過遍歷數據源的數據跟規則進行匹配,梳理出該源的敏感信息進行存儲。

2)靜態庫生成,如果配置的是靜態庫時,Oozie會調用Datax-web通過Spark對數據源進行數據同步,同步的過程中通過梳理表和脫敏規則生成新數據,新數據會存儲到用戶指定對應的數據源類型中,根據用戶的配置更新時間,Datax-web增量同步數據到數據源。

3)動態脫敏,當第三方應用或者數據工作人員通過頁面或API訪問生產庫時,首先網關Kong對訪問進行攔截,攔截后對用戶進行身份認證和權限認證,如果沒有權限,需要通過管理員對該用戶開放權限;如果有該權限,會從線程池Druid里通過ShardingSphere-JDBC連接配置的輸入源,連接后shardingSphere-JDBC對SQL進行解析、路由和改寫,然后再通過spark去對查詢的數據進行脫敏替換,把替換后的數據返回給用戶。

4)靜態脫敏,當第三方應用或者數據工作人員通過頁面或API訪問的源是在脫敏庫中時,首先網關Kong對訪問進行攔截,攔截后對用戶進行身份認證和權限認證;如果沒有權限,需要通過管理員對該用戶開放權限,如果有該權限,直接路由到脫敏庫進行訪問。

2 關鍵技術

2.1 分類分級標準

鐵路貨運業務種類繁多,數據呈現出復雜性高,多樣性強的特點。采用規范的數據分類、分級方法[3],有助于行業機構厘清數據資產、確定數據重要性和敏感度,并針對性地采取適當、合理的管理措施和安全防護措施,形成一套科學、規范的數據資產管理與保護機制,從而在保證數據安全的基礎上促進數據開放共享。

數據分類是數據保護工作中的一個關鍵部分[3],是建立統一、準確、完善的數據架構的基礎,是實現集中化、專業化、標準化數據管理的基礎。按照統一的數據分類方法,依據自身業務特點對產生、采集、加工、使用或管理的數據進行分類,可以全面清晰地厘清數據資產,對數據資產實現規范化管理,并有利于數據的維護和擴充。數據分類為數據分級管理奠定基礎。

數據分級有助于鐵路行業根據數據不同級別,確定數據在其生命周期各個環節應采取的數據安全防護策略和管控措施,進而提高機構的數據管理和安全防護水平,確保數據的完整性、保密性和可用性。

在調研現有各綜合分類法與行業領域學科專用分類方法的基礎上,結合鐵路數據所特有的行業屬性特征,以及鐵路數據開發和共享的需求,制定鐵路數據分類分級方法。

本次的分類方法是從數據的敏感度特點出發,采用多維度方法[4](組織架構、業務對象、貨運流程)來進行分類,從組織架構角度,相同的數據不同層級的人敏感度是不一樣的,高層的敏感度少,低層的敏感度多;從業務對象角度,有些數據本身就是敏感,不同的業務和不同的人對于數據敏感度也是不一樣的;從業務流程角度,相同的數據不同的業務操作,敏感度也是不一樣的。

我們從貨運流程、業務對象、組織架構三個角度對數據進行準確的定位,這三個角度之間相互依賴,缺一不可。

2.1.1貨運流程

根據信息來源不同將對貨運流程分成29類[5]:

1)貨主咨詢:來源于客戶關系管理系統,貨運電商(貨商)平臺,貨運服務系統。

2)貨運需求:來源于95306貨商平臺、客服系統、EDI系統。

3)確認貨主需求:來源于95306貨商網站。

4)提報月計劃:來源于95306貨商平臺、FMOS系統。

5)提報旬方案:來源于95306貨商平臺、集優信息系統。

6)上門取貨:來源于物流信息系統,接取送達信息系統。

7)貨主送貨:來源于貨運站信息系統中進門、專用線管理。

8)申請集裝箱:來源于集裝箱管理系統,95306電商平臺。

9)車站超重限貨物受理:來源于超限超重貨物運輸管理信息系統,貨運站信息系統。

10)車站危險品貨物受理:來源于危險平運輸管理信息系統,貨運站信息系統。

11)車站零擔集裝箱制票,貨主交費:來源于貨票系統,電子支付系統。

12)申報日空車申請:來源于貨調系統,計劃調度系統。

13)車站倉儲:來源于貨運信息系統。

14)車站空車入貨運線:來源于調度系統,現在車系統。

15)車站裝車:來源于貨運管理系統,零擔、集裝箱管理系統,裝載加固系統,抑塵管理系統等。

16)整車制票,貨主交費:來源于貨票系統,電子支付系統,軌道衡系統。

17)車站貨車出線:來源于現在車系統。

18)車站集結列車:來源于現在車系統,確報系統。

19)車站貨檢,核對車號:來源于貨檢系統,超偏載系統,確報系統。

20)調度安排途中作業:來源于確報系統,貨檢信息系統,編組站信息系統,調度系統。

21)調度貨車到達:來源于調度系統,確報系統。

22)車站貨車入線:來源于現在車系統。

23)車站卸車:來源于貨運信息系統,抑塵系統,集裝箱、零散快運信息系統。

24)車站貨物倉儲:來源于貨運信息系統,集裝箱信息系統,零散快運信息系統。

25)車站內交付:來源于貨運信息系統,貨票系統。

26)車站外交付:來源于貨運信息系統。

27)貨主拉貨出門:來源于貨運信息系統。

28)物流送貨上門:來源于物流信息系統。

29)辦理理賠手續:保價及貨運事故處理信息系統。

2.1.2業務對象

根據業務對象數據分為客戶基本資料、身份鑒權信息、客戶運輸信息和客戶運輸內容信息[5]。

(1)客戶基本資料

政企客戶資料:政企客戶信息(姓名、聯系電話、郵箱)、發貨信息(訂單號、起始日期、終止日期、發站、發專用線、發貨單位、發貨部門、發貨單位地址、電話等)、收貨信息(品名、車數、噸數、車種、運輸特征、換裝港、終到港、保價與否、怕濕與否、散堆裝、非散堆裝、裝卸方式、單件重量等)、貨物信息、發送物流服務信息、到達物流信息(接取:取貨地點、取貨時間、聯系人姓名、電話;配送:配送地址、配送時間、聯系人姓名、聯系人電話等;倉儲服務、搬運裝卸服務)、附加信息(是否整車列裝車、是否定制信息服務、客戶備注等)實貨確認時間、實貨確認人、集裝箱承認信息、提單信息。

個人客戶資料:客戶姓名、證件類型、證件號碼、證件影印件、客戶職業、工作單位、居住地址、聯系地址、聯系電話、銀行扣費賬戶、客戶編號、年齡、性別等。

各類特殊名單:客戶姓名、證件類型、證件號碼、證件影印件、客戶職業、工作單位、居住地址、聯系地址、聯系電話、銀行扣費賬戶、客戶編號、年齡、性別等。

(2)身份鑒權信息

用戶密碼:用戶服務密碼、登錄密碼、秘鑰、支付密碼等。

(3)客戶運輸信息

詳單:收貨、發貨詳單等,內含運輸物品類型、收發貨位置、重量、收發時間等。

賬單:每月出賬的貨物運費、特定線路運費、裝卸費、保價費、倉儲費、接取送達費等。

客戶歷史信息:貨票、商務記錄、貨物記錄、理賠信息等。

(4)客戶運輸內容信息

客戶貨物內容記錄:客戶運量、運費、收入率等運輸內容。

2.1.3組織架構[5](見表1)

表1 組織架構分類

數據分級是以數據分類為基礎,根據數據的價值、內容敏感程度、影響和分發范圍不同對數據進行敏感級別劃分[6]。一旦安全性遭受破壞將直接影響到國家安全、社會秩序、公眾利益的,劃分為高度敏感數據,涉及信息量大、對客戶造成輕度影響的劃分為一般敏感數據、對用戶和鐵路都沒有影響的劃分為開發/公開數據,劃分如表2[7]:

表2 數據分類

2.2 自動分類分級模型[8]

分類分級主要采用的是k-means和向量空間模型(SVM)來識別,主要架構如圖2所示。

主要流程如下:

(1)導入數據,從數據源獲取含有敏感數據的鐵路業務數據。(2)分詞,通過分詞工具對長文本進行分詞。

(3)構建詞袋模型,將切分后的單詞進一步轉換成向量。先將所有文本中的詞匯構建成一個詞條列表,其中不含重復的詞條。然后對每個文本,構建一個向量,向量的維度與詞條列表的維度相同,向量的值是詞條列表中每個詞條在該文本中出現的次數。

(4)權限轉換,用算法TF-IDF,用來評估一個詞條對于一個文件集中一份文件的重要程度。

(5)計算余弦相似度,計算兩個向量的夾角余弦值,就可以評估他們的相似度。

(6)數據經過k-means進行自動分類,再通過內部業務人員對數據進行標識,抽取80%的數據經SVM進行訓練,剩下的20%進行測試。

圖2 自動分類分級模型

(7)評測模型,通過2個指標(準確率和召回率)評估分類模型:

F作為兩者綜合考慮的評估指標

準確率是評估捕獲的成果中目標成果所占的比例;召回率是召回目標類別的比例;而F值,則是綜合這二者指標的評估指標,用于綜合反映整體的指標。

3 結束語

本文主要設計開發了一個鐵路敏感數據安全保護的大數據平臺,系統定義一套鐵路數據的分類分級標準,通過機器學習實現敏感數據自動識別,降低人工識別的工作強度,實現靜態和動態數據脫敏功能滿足不同的業務場景,功能中涵蓋了常用的隱私保護算法,用來解決低敏數據聚合變高敏的問題。通過鐵路敏感數據安全大數據平臺能有效解決鐵路敏感數據泄露的安全問題,促進鐵路敏感數據的規范管理和安全使用,后續研究考慮使用深度學習來提高自動識別敏感數據的準確率。

[1]《數據脫敏應用指南報告》發布[EB/OL].https://www.freebuf.com/company-information/220232.html.

[2]數倉深度|數據治理之數據脫敏[EB/OL].https://mp.weixin.qq.com/s/62_IFokAl53DOUUK9eyCjg.

[3]JR/T 0158-2018 證券期貨業數據分類分級指引.

[4]JR/T 0197—2020 金融數據安全數據安全分級指南.

[5]陳光偉.鐵路信息系統應用技術[M].中國鐵道出版社,2017.

[6]《數據安全能力成熟度模型》實踐指南:數據分級分類[EB/OL].https://www.secrss.com/articles/24907

[7]數據安全治理的關鍵步驟[EB/OL].https://www.dbsec.cn/zt/aqzl/zy-3.html.

[8]機器學習筆記(3)——使用聚類分析算法對文本分類(分類數k未知)[EB/OL].https://blog.csdn.net/leaf_zizi/article/details/82684921.

中國鐵路信息科技集團有限公司科技研究開發計劃課題(《基于等保2.0的鐵路敏感數據安全關鍵技術研究》KGZG-CKY-2019027(2019B07))

猜你喜歡
鐵路分類系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
分類算一算
WJ-700無人機系統
沿著中老鐵路一路向南
云南畫報(2021年12期)2021-03-08 00:50:54
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
分類討論求坐標
鐵路通信線路維護體制改革探索與實踐
數據分析中的分類討論
教你一招:數的分類
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
主站蜘蛛池模板: 91福利在线观看视频| 97国产精品视频自在拍| 精品一區二區久久久久久久網站| 另类综合视频| 91精品专区| 国产精欧美一区二区三区| 亚洲欧洲国产成人综合不卡| 国产精品自拍露脸视频| 有专无码视频| 99久久精品免费视频| 国产成人久久综合777777麻豆| 国产色爱av资源综合区| 丰满的少妇人妻无码区| 91香蕉国产亚洲一二三区| 国产成人凹凸视频在线| 一区二区理伦视频| 久久夜夜视频| 欧美日韩成人在线观看| 在线欧美国产| 免费国产一级 片内射老| 在线播放精品一区二区啪视频| 久久不卡精品| 色哟哟国产精品| 国产成人亚洲综合a∨婷婷| 国产另类视频| 蜜桃臀无码内射一区二区三区| 亚洲天堂网在线播放| 99久久精品国产麻豆婷婷| www亚洲天堂| 91视频国产高清| 国产综合欧美| 免费一级无码在线网站| 亚洲国产精品无码久久一线| 亚洲91在线精品| 亚洲αv毛片| 久久这里只有精品66| 日韩一区二区三免费高清| 精品视频一区二区三区在线播| 欧美在线黄| 日韩成人免费网站| 欧美日韩中文国产va另类| AV熟女乱| 色婷婷久久| 高清色本在线www| 99视频在线免费| 伊人成色综合网| 91精品国产自产在线老师啪l| 国产亚洲精品自在线| 国产AV无码专区亚洲精品网站| 国产亚洲欧美在线人成aaaa| 日韩中文字幕亚洲无线码| 成人精品午夜福利在线播放| 91尤物国产尤物福利在线| 国产精品福利一区二区久久| 91久久偷偷做嫩草影院| 中国美女**毛片录像在线| av一区二区三区在线观看| 久久国产热| 免费a级毛片视频| av尤物免费在线观看| 97色伦色在线综合视频| 国产超碰在线观看| 九九九九热精品视频| 成人福利在线看| 日韩欧美中文| 久久久黄色片| 亚洲天堂首页| 日韩在线观看网站| 无码中字出轨中文人妻中文中| 久久国产亚洲欧美日韩精品| 国产成人综合久久精品下载| 欧美人与牲动交a欧美精品| 久久精品欧美一区二区| 91丝袜乱伦| 久久久久国产精品熟女影院| 亚洲系列中文字幕一区二区| 亚洲成AV人手机在线观看网站| 99精品国产自在现线观看| 欧美有码在线| 亚洲视频无码| 99精品国产自在现线观看| 国产免费好大好硬视频|