王明哲,金久強,李 健,李 鋒,席 寧
(1.中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081;2.中國鐵路網絡有限公司,北京 100038)
隨著移動設備、智能終端、傳感器等網絡設備和通信技術在鐵路客票發售與旅客出行服務方面的廣泛應用,在鐵路企業運營的基礎網絡平臺、運營支撐系統以及各類業務平臺中蘊含著海量的用戶數據,鐵路旅客數據的種類和規模正在迅速增長,鐵路科研人員將旅客大數據與行業內部現有的計算機技術相結合,從結構、半結構及非結構化的旅客數據中獲得有價值的信息。旅客大數據包含了豐富的、有價值的個人信息,如果對這些敏感信息處理不當,不僅會導致個人隱私和企業機密的泄露,損害用戶利益,還會給鐵路運營企業自身帶來一系列的社會責任和法律風險問題。因此,在旅客數據安全、隱私保護方面,需要研究一套行之有效的數據運營方案來確保旅客數據安全,規避隱私泄露所帶來的社會不良影響和法律風險。
在全球化開源社區、互聯網企業中的先行者等共同推動下,大數據技術已日漸成熟。面向鐵路運營企業內部,可以通過分析用戶的出行行為偏好,推出類似面向特定內容的、有針對性的旅客服務,在提升鐵路運營水平的同時,為旅客提供智能化、便捷化的多元服務;面向鐵路運營企業外部,可以對鐵路旅客數據進行脫敏處理、包裝,形成有市場的數據產品。鐵路科研人員積極探索鐵路旅客大數據對內、對外應用的同時,應注意大數據在廣泛應用的同時也存在著一系列的問題,例如個人數據信息的知情權、選擇權、支配權、索賠權[1]以及數據安全和個人隱私保護等。
當前,數據信息已成為了一種極為重要的原材料,甚至可以直接轉化為經濟效益,對于企業和個人而言,數據的采納和收集都極為重要[2],數據主體與數據控制者權益需實現平衡。在個人資料的收集、保管、使用等環節中,法律應該明確資料所有人的各種權利[3],通過建立如通知同意、授權協議等規則及路徑,更好地依法依規,在鐵路營運服務中合理確定數據主體并合法收集、利用個人數據。
鐵路企業需明確鐵路旅客數據使用流程和規范,在維護廣大旅客群眾利益、社會穩定、國家安全的基礎上,建立一套行之有效的鐵路旅客信息數據保護和應用流程體系,為進一步完善智能鐵路系統工程建設打下堅實的基礎。
目前,客票系統在全路擁有2個鐵路總公司級中心、18個鐵路局級中心,售票窗口3萬余個,自動售/取票機1萬余臺,電話訂票接入線數11萬條,互聯網注冊用戶超過3億人,全路日均售票量超過900萬張,峰值售票量已超1 300萬張/日,其中,12306互聯網售票系統(簡稱:12306)售票量峰值超過1 100萬張/日,占全渠道售票量70%以上[4]。從以上數據可以看出,在鐵路企業運營的基礎網絡平臺、運營支撐系統以及各類業務平臺中蘊含著海量的用戶數據。
目前,除鐵路部門12306售票平臺之外,還存在很多外部訂票平臺,這些外部訂票平臺向旅客提供包括高鐵票務、酒店預訂、出行服務等捆綁服務,代替旅客在12306售票平臺訂票,所以要求旅客提供真實信息。但由于這類外部訂票平臺缺乏在信息安全方面的投入及在內部數據安全管理方面的嚴格規定,存在很大的個人信息安全隱患,如黑客攻擊、內部人員泄露等,因此,在旅客數據安全隱私保護方面,鐵路部門急需有效的安全應用來確保旅客數據安全,同時避免個人數據泄露的事件發生。
從各國(地區)的立法來看,大多數國家(地區)的立法通常都以數據的“身份可識別性”作為判斷是否屬于個人數據的標準。比如我國《網絡安全法》第76 條、歐盟《通用數據保護條例》第4 條、臺灣《個人資料保護法》第2 條等大多數國家和地區的法律都將直接與間接可以識別個人身份的數據認定為個人數據[5],我們通過研究,基于旅客大數據設計“中鐵客戶碼”概念應用,采用“虛外實內”的方法,即旅客真實身份信息只留存在12306平臺,以虛擬代碼作為旅客身份的統一標識登錄外部訂票平臺,旅客用戶可自主選擇在12306平臺申請“中鐵客戶碼”,申請后就不需要在外部訂票平臺填寫真實身份信息,只需通過手機號發送驗證碼,通過外部訂票系統向12306后臺傳遞,由12306后臺隨機生成“中鐵客戶碼”返給客戶即可確認。通過提供以“中鐵客戶碼”為客戶統一識別方式的訂票機制,解決目前各互聯網外部訂票平臺在客戶隱私數據信息保護方面的問題,“中鐵客戶碼”在提升個人數據信息安全保護的同時,又能為公眾訂票出行提供便利。旅客使用“中鐵客戶碼”的同時,在網上簽訂個人信息采集授權電子合同,授權旅客個人數據的采集權及使用權。
鐵路旅客大數據應用通過對海量旅客數據的分析和挖掘,使大量的數據轉化為多種具有價值的信息,進而實現產品化和價值創造,為政府決策、行業發展、民生服務提供幫助。在鐵路旅客大數據創新應用方面,鐵路運營企業未來需在以下幾個層面開展研究工作。
為了更好地利用第三方大數據公司在應用領域上的成功經驗,同時確保旅客隱私信息的安全性,建議通過與各大數據應用領域處于領軍地位的第三方大數據公司合作,建立實驗室,開展數據加工、分析及建模,研究并實現包括數據失真技術、數據加密技術和匿名化限制發布技術等的應用,打造相關數據創新產品,提供一系列應用及服務。
制定科學的合作伙伴進入和退出機制,是數據安全應用需要解決的關鍵問題之一。以核心能力為評判標準的篩選體系完善和提升管理水平,例如,通過對企業征信牌照、個人征信資質和綜合建模能力等方面進行評判,進而篩選出有資質的合作伙伴。
制定相應的數據應用合規機制,從數據采集合法性、數據安全合規性、數據輸出合規性3個方面進行設計,例如,在數據采集合法性中要求旅客信息采集需與旅客之間簽定采集及使用授權電子合同;在數據安全合規性中要求需按照國務院征信業監督管理部門的規定,建立健全和嚴格執行保障信息安全的規章制度,并采取有效技術措施保障信息安全;在數據輸出合規性中要求向客戶輸出旅客脫敏數據:如信用評分、乘車頻率和消費能力等。
鐵路旅客數據主要包括用戶基本信息、登錄位置信息、交流活動信息、社交網絡信息、商業交易信息、其他應用信息等。鐵路旅客大數據應用可基于現有鐵路旅客出行信息以及平臺匯集的旅客周邊數據等建立客戶畫像,通過畫像,根據不同行業應用需求,分析其支付能力、客戶特征等,進而為銀行做精準營銷和信貸分析,為互聯網行業提供商品推薦和針對性廣告投放服務等。
需要從制度、人員和設施3方面開展數據安全和保密工作,加強鐵路旅客關鍵隱私信息基礎設施安全保護,增強數據安全預警和溯源能力。技術保障相應管理措施主要包括數據落地配套機房安裝嚴格門禁設施、重要數據訪問要求多人同時授權、核心數據管理人員要求在北京有房產等。
鐵路旅客大數據應用要加強政策、監管、法律的統籌協調,法律和行業規范的制定與實施應該和技術保持同步[6]。制定鐵路旅客大數據資源專業加工、建模分析、應用服務相關制度,完善數據隱私保護制度和技術。同時要加大對技術專利、應用產品及個人隱私等的保護力度,在維護廣大旅客利益、社會穩定、國家安全的基礎之上,建立一套規范有效的鐵路旅客數據信息保護和應用流程體系,為進一步完善智能鐵路系統工程建設打下堅實的基礎。
結合國家政策,形成高可行性、標準化的鐵路旅客隱私數據信息保護和使用規范標準。旅客數據的采集、處理、存儲、分析、建模等環節應集成在一套內部整體系統中,建議在現有12306基礎上升級,或并行建立一個集標準化、工廠化數據采集、清洗、存儲、分析、建模等一體的“一站式”旅客大數據應用開發系統,在鐵路旅客大數據應用開發及使用過程中,通過對鐵路旅客主體行為數據全自動、全天候的挖掘、分析與建模,以及實時的跟蹤監測,既能實現信息采集、隱私信息安全加密、數據運用、分析計算、應用結果的高度客觀性、智能性和高效性,同時也能做到數據不出門,最大程度地確保旅客隱私數據信息安全。
12306 通過授權確認后,鐵路旅客購票行為及相關身份信息在客戶端形成記錄,通過安全接口將數據傳遞到“一站式”旅客大數據應用開發系統的采集終端,并依據預先設定的數據關系,將旅客數據自動保存到數據庫中。整合傳輸過程由系統自動完成,整個采集過程中沒有人為參與,確保旅客個人隱私信息的安全性[7]。
根據不同業務需求,需要對采集的不合規數據、內容錯誤數據、格式錯誤數據、殘缺數據和重復數據等進行過濾和標準化。將采集的旅客信息比對處理后入庫到“核心旅客數據存儲區”,整個環節由系統自動完成,避免人工操作,防止數據泄露。如有未比對上的數據需單獨存儲,通過手工比對后重新入庫,數據工作人員須簽訂數據安全協議,全部操作都在內網環境及“一站式”旅客大數據應用開發系統上執行。
旅客數據的傳播和共享需在閉環條件下操作,參與數據使用的技術人員需要簽訂數據安全協議,對于核心數據管理人員,還需滿足其它特定條件,全部操作都在內網環境及“一站式”旅客大數據應用開發系統上執行。在與第三方用戶機構的業務合作過程中,簽訂個人數據保密協議的同時,最好是根據客戶業務需求在“一站式”旅客大數據應用開發系統進行內部建模,測試結果經用戶確認后,最終向用戶機構提供處理后的結果。
在旅客大數據深化利用的過程中,旅客數據安全和保護個人隱私是旅客大數據應用的前提,建立“中鐵客戶碼”及“一站式”旅客大數據應用開發系統,有助于鐵路運營企業積極穩妥提升鐵路旅客大數據應用服務能力,避免探索創新過程中可能遇到的輿論和法律風險。下一步,將在動態數據的利用和敏感信息保護等方面進行更深入的理論研究和實踐探索。