湯艷君 錢麗納 曾佩璇
(中國刑事警察學院 沈陽 110854) (153728099@qq.com)
在移動互聯網的發展中,個人的行為數據暴露了其應有的隱私.如用戶個人所使用的應用軟件能在其不知情的情況下輕而易舉地采集其身份、實時位置、人脈關系、日常消費行為等數據.一旦個人數據被泄露或濫用,那么個人被欺詐的風險將很難避免.即使發現個人數據被泄露或濫用,投訴難、偵查難、抓捕難的現象也較為普遍[1].
個人數據與個人信息作為不同的法律術語常出現在法律語境中,歐盟及其成員國普遍使用個人數據的概念,而我國相關立法和學者多采用個人信息的概念.張新寶教授認為,對于個人信息,使用個人數據、個人資料等稱謂,其研究對象和內容并無本質區別,遵從目前學界共識,采用個人信息稱謂與個人數據意義相同[2].
根據我國最高人民法院、最高人民檢察院《關于辦理侵犯公民個人信息刑事案件適用法律若干問題的解釋》[3]第一條中規定的“公民個人信息”可知:個人數據是指以電子或者其他方式記錄的能夠單獨或者與其他數據結合識別特定自然人身份或者反映特定自然人活動情況的各種數據,如姓名、身份證件號碼、通信聯系方式、住址、賬號密碼、財產狀況、行蹤軌跡等數據.
支付寶從2004年正式獨立運營以來,為創造良好的用戶體驗不斷地推陳出新,逐步開發、優化各個模塊.在此過程中,其采集的數據從最初的用戶名、密碼、郵箱到身份證號、地理位置、手機號、銀行卡號等逐步涉及到個人財產的重要數據,并且利用適度采集到的數據進行用戶行為分析,確實帶給了用戶智能化、簡便化、快捷化的生活體驗.但隨著科技的進步,其對用戶個人數據的采集逐步由適度化向過度化發展.
今年年初,支付寶年度賬單刷爆了朋友圈以至于大眾調侃:朋友,重新認識一下!然而有不少人易忽略的一個細節是“我同意《芝麻服務協議》”,不僅字體小,而且已默認勾選了“同意”.但是賬單的查看和此協議并沒有關聯性,選擇取消同意依然能夠查看年度賬單.如果默認同意協議就是給了支付寶采集和保留用戶個人數據的權利.根據相關規定,“芝麻”應該以顯著的方式提請用戶是否“同意”.
我國相關規定明確表示移動互聯網程序(APP)不能過度索取用戶的個人數據且獲取個人數據應遵循合法化、最小化及授權的要求.在事件曝光之前,“芝麻”直接默認同意協議,且不能再次刷看協議,這明顯是違規行為.岳屾山律師對協議解讀:使用服務就是接受協議,根據協議平臺可直接向第三方提供個人相關數據,也可將個人數據進行分析并推送給合作機構且有權不支持個人撤銷第三方的查詢授權,即使服務終止仍可繼續保留用戶個人數據,第三方具有免責權,用戶自擔風險.這種私自過度采集個人數據且協議條款明顯使用戶成為劣勢方的行為進一步為個人數據保護帶來警示.
在個人數據價值挖掘的過程中,個人數據因被過度采集而被泄露、利用的情況無時無刻不讓人瞠目結舌.hiQ公司抓取、跟蹤領英公司獲取的雇員數據,分析雇員的競爭力、離職意向等行為被領英提起訴訟.劍橋分析公司利用竊取的Facebook用戶個人數據操縱美國大選面臨生存危機.西瓜小程序公然采集用戶個人數據制作足跡地圖泄露個人行為軌跡被停用等等個人數據被過度采集、竊取的問題不斷暴露在公眾視野內.個人數據因被過度采集導致泄露、濫用的情況引發的熱議一波未平一波又起,個人數據安全問題的研究已不僅僅是法學界的焦點[4].
數據采集是整個數據處理過程的基礎.快捷支付后臺具有獲取用戶個人數據的特權,能輕而易舉地采集到用戶的個人注冊、網上消費、地理位置、資金交易等支撐APP內部網絡優化關鍵的數據.以支付寶后臺采集用戶個人數據為例,分析其采集模型的工作原理.
支付寶后臺依據網絡數據類別、用途、特性等要素采集散落在各個網元、鏈路、網管系統中的數據,然后進行處理和加工,最后通過平臺的標準化接口實現數據的開放與共享[5].網絡數據涉及移動網、傳輸網、互聯網、IP承載網、業務平臺等方面,數據類型包括:網元類,如配置、資源、性能、告警;鏈路類,如信令、用戶面;用戶感知類,如用戶投訴[6].
支付寶后臺數據采集的功能架構如圖1所示,它由業務、技術、運維3層構成.它需要更高的業務連續性、更好的高擴展性、更快的新業務發展性,主要功能如下.
業務平臺:與用戶服務連接,提供各種安全交易支付服務.
技術平臺:承接業務與運維平臺,提供可伸縮及高效的分布式事務處理、資源調度管理功能;且提供可以屏蔽底層資源復雜性的中間操作環境.
運維平臺:維護基礎資源的可伸縮性,提供各種功能接口以完成組件,同時維護底層系統平臺的穩定.

圖1 支付寶后臺網絡數據采集的功能架構

圖2 分布式的數據采集架構
支付寶不僅擁有巨大的用戶量,而且對交易成本更敏感.它使用分布式數據采集體系結構,由主要交易數據集群、用戶交易記錄數據庫集群和商戶查詢數據庫集群3個主要數據庫集群構成,如圖2所示.其中,主交易數據集群完成每筆交易的創建、狀態修改,數據變更通過可靠的數據復制中心復制到其他2個數據庫集群.為了保證可伸縮性和高可靠性,每個節點都有與之對應的備用節點和用于故障處理的failover節點[7].用戶交易記錄數據庫集群為用戶提供更好的體驗與需求.商戶查詢數據庫集群為商戶提供數據查詢與對賬服務.
一個完整的業務活動由一個主業務服務負責發起并帶動若干從業務服務完成.支付寶后臺的數據采集由數據采集控制中心發起,其他數據服務共同完成,具體采集實現如圖3所示:

圖3 數據采集實現
支付寶不僅僅是單純的支付軟件,更是阿里旗下各類業務的一個入口.其業務系統與用戶個人生活息息相關,其采集功能是由業務、技術、運維及分布式的架構和各個數據模塊共同實現.看似完善的模型實際還存在一些不可避免的數據損耗,該模型的不足主要有以下4個方面:
1) 個人數據采集規則不明確
我國有關個人數據保護的相關規定明確了個人數據的收集必須經過數據主體的許可且公開、透明.所收集的個人數據必須嚴格保密,不得泄露、偽造、破壞、買賣或非法提供給他人,且應當采取技術措施保護個人數據安全[8].但此模型并未明確規定對個人數據的采集深度與廣度,且也未明確使用個人數據的請求授權.如用戶無法知曉支付寶中包含個人充值、轉賬、紅包、繳費、余額等具體個人資產數據被采集的程度及平臺關聯機構使用的具體情況.
2) 數據被過度地披露與越權訪問
支付寶后臺采集的數據包括開源與二次封裝的個人數據[9],開源即公開,二次封裝即數據需要多次與后臺業務系統進行交互從而打包成模塊包裝.由于數據的開源與二次封裝,所以存在數據被過度使用、披露甚至被濫用、盜用的情況.越權訪問是一種授權漏洞,即用繞過權限檢查的手段去訪問或操作原本無權的數據.支付寶平臺存在此漏洞,需要改進.
3) 分表存儲周期及數據保存量不明確
任何平臺使用的服務器其存儲容量都是有限的,而用戶在使用平臺過程中產生的大規模數據是不可估量的,所以平臺需要開啟定期清理數據功能.該模型采用分表進行存儲,但未明確規定分表存儲周期、數據保留時間及保存數量.這也就意味著數據被采集后存在丟失及覆蓋的不完整性風險.
4) 底層業務變動對上層需求影響的程度不明確
支付寶底層業務是各種庫的創建、數據寫入及與上層的實時交互.上層需求是用戶最直接的感知應用,處理好底層業務與上層需求的關系是平臺運營的重要基礎.但該模型未明確指出底層業務變動對上層需求影響的程度及產生的后果.
為防止個人數據被隨意過度采集,支付寶平臺應加強實時數據采集的監測,完善監督、問責機制,從而保證合法合規地進行數據采集與處理.
大數據技術已經融入科技生活,支付寶后臺對個人數據的不規范采集和使用導致的數據泄露、濫用事件給個人及社會帶來的影響越來越大.為打造支付寶平臺良好的交易優勢,可以從以下幾個方面對其數據采集進行完善.
4.2.1加強支付寶平臺安全技術的研發
首先,為保障支付寶對個人數據采集的安全性,平臺應開放合作模式,獲取用戶個人數據應當經過多重授權,尤其強調用戶授權,如“用戶授權”+“平臺授權”+“用戶授權”[10].
其次,為解決支付寶的數據披露與越權訪問難題,應利用技術構建生態數據.根據已采集到的數據的敏感性和可用性價值對數據資產進行分類和處理,并對數據的多次訪問設置累加權限模式,以此來降低數據被盜用的風險.
第三,為明確支付寶的分表存儲周期及數據保存量,平臺應根據實時數據量并參照企業對數據存儲時間保留的相關法律規定設計可伸縮、易調整的存儲結構.
第四,為解決支付寶的底層業務變動對上層需求影響的程度,應加強底層數據控制技術研發,屏蔽底層無關數據,使得平臺能夠簡單、完整地在接口層呈現業務數據.還可以減少層次數量,細化各層次的需求且增加各層次的功能,使得每個層次滿足不同的應用.
此外,平臺應加強開發模塊應用技術和人機交互技術,施行實時透明化、安全敏捷化戰略[11].各層采取不同級別的安全防護策略,實施數據復雜加密及新的數據保護技術,并嚴格把控技術標準以加強對個人數據安全的系統保障.
4.2.2加強開發人員的安全意識
加強安全技術研發只是防范數據被過度采集而造成泄露的基礎性環節,在“技防”的基礎上提高“人防”意識可起到事半功倍的效果.開發人員作為技術核心的最重要部分,是“人防”領域中的關鍵一環,提高開發人員的數據安全保護意識才能夠真正做到防范于未然.所以平臺可以采取相應的措施確保用戶個人數據安全,比如應定期對員工進行安全培訓警示,從意識層面提高重視,時刻敲響數據安全的警鐘;加強對開發人員的技術培訓,提高對危險源的辨識度,不放過任何漏網之魚;建立個人數據安全保護制度歸責制度,將安全責任歸責到個人,打消員工懈怠心理從而降低用戶個人數據泄露的風險.
4.2.3完善平臺內部的數據安全監督機制
任何平臺的運營都離不開內部監督機制的監管,內部監督機制是保證該平臺合法合規經營、有序管理、保證產業鏈完整及規避風險的有效措施.它與其他制度相互制約制衡,是約束數據過度采集及濫用的有效方法[12].如平臺內部可加強建立各層績效評估及考核機制;及時調整獎懲措施,增加對數據安全的監管和問責機制;從而提高各層對數據采集及使用的自律性.
4.2.4完善我國有關個人數據保護的法律法規
目前,我國對個人數據保護的法律法規主要分布在《中華人民共和國網絡安全法》《大數據安全標準化白皮書》(2018年版)和《信息安全技術個人信息安全規范》等方面[13].對于如何認定個人數據保護的范圍、判斷標準等并沒有明確規定,且各種監督、審查策略還需進一步完善.所以,我國有關數據保護的法規需要進行相應完善,如規定數據使用者應用風險評估模式、規避或者減輕潛在損害的措施、完善其數據安全監管機制等.這些方法將激發數據的創新性再利用,也可在一定程度上避免個人權利受到侵害.此外,數據使用者也應為不重視數據保護的態度和不達標的安全保護措施承擔法律責任,如罰款、刑事處罰等,以此來確保數據使用者自律.
4.2.5加強個人數據安全防范意識
個人在工作生活中需要加強對自身數據的保護,例如不填寫網絡調研、網上注冊賬戶時盡可能少地提供個人數據、對賬號分級分類并設置層級密碼且定期修改和整理密碼.采用匿名方式瀏覽網頁網站;不使用公共WiFi進行支付操作,不訪問非官方站點;警惕“網絡釣魚”,避免在網絡上提交信用卡信息;注銷賬號時,更換所有的個人資料等等從細節來提高個人安全網絡意識,從而以有效的安全措施確保個人數據不被過度采集及非法使用.
在風險與挑戰并存的大數據時代,在享受數據技術所帶來便利的同時,也應警惕所帶來的安全問題,其中個人數據的過度采集和使用就是一個方面.由支付寶年度賬單事件探究其數據采集模型的不足與完善,從而引發對各平臺及軟件的數據采集的思考:商家要保證用戶對其數據被采集的授權,明確采集的最大邊界及落實相應的保護責任措施.與此同時,加強個人對數據安全的保護意識,并敢于揭發、打擊網絡違法亂紀現象.
雖然我國現有的法律法規還不能完全遏制個人數據泄露,各類風險日益加劇,但應持樂觀態度.因為我國法律法規在不斷完善,技術也在不斷進步,用戶的個人數據安全意識總體在提升,個人數據安全一定能夠得到有效的保護.