張貝貝
xID標記技術組合了上海數據交易中心的數據流通技術與公安部第三研究所的eID技術。利用數據分類規則、不可逆匿名化生成與轉化、傳輸控制等多項技術,保證了數據流通過程中的數據標識(ID)的安全性。
數據已成為國家基礎性戰略資源,大數據時代,個人信息的非法收集和利用以及無處不在的數據監控給公民的信息隱私帶來巨大威脅。在數據資源的開發與利用成為潮流的今天,必須謹慎地設計信息隱私保護的路徑,以期達到信息自由與隱私保護的平衡。而在不同領域,數據流通、隱私保護等都應該通過何種手段進行保障呢?
上海數據交易中心運營經理王潤垠認為,自從大數據概念誕生以來,數據安全和隱私保護問題一直如影隨形。尤其是在金融風控、互聯網精準營銷等涉及與“個人信息”相關數據的場景下,人們更加擔心出現隱私泄露、財產被盜等問題。如果數據流通過程中個人信息安全問題得不到解決,必將阻礙大數據產業未來向更廣闊的領域發展。
xID標記技術應運而生
在數據流通與隱私安全保護如此急需的大數據時代,xID標記技術應運而生。據介紹,xID標記技術是實現個人信息合規存儲、合規流通的底層數據安全保護技術。該技術是上海數據交易中心與公安部第三研究所聯合研制,能實現與個人信息相關數據合規存儲與流通的各類應用場景。
具體來看,xID這項技術是如何來實現數據安全保護的呢?從技術方面理解,xID標記技術將個人信息分解為“標識信息”“特征信息”以及“標識關聯性”三個基本元素?!皹俗R信息”進行多方隔離的去身份匿名化處理,“標識關聯性”進行可信第三方控制,并且保留“特征信息”,實現了在保護中流通個人信息的難點問題。這些達到了既能保護個人隱私,又能提供價值信息的數據流通目標。
從實際的應用來看,王潤垠舉例道:“比如我本人有身份證,身份證號碼就是我的數據標識,我本人的性別、家庭地址、學歷甚至包括在互聯網線上的一些消費傾向、興趣愛好等,這些都是我的個人特征信息。
此外,還有一個元素就是關聯性。我這個身份證號和這個人具體的特征信息形成關聯性。而數據保護要做的是將就身份證號碼的具體信息進行加密變成一個代號A,這樣一來,后面的那些特征描述就不會對準某一個個人,泄露A1這個人的一些行為特征。這里需要強調的是,A1這個代號不能再還原成具體的身份證號碼。也就是說,這個加密的手段和算法是不可逆的。這樣才能符合數據合規的存儲要求,也對數據隱私與保護提供了有力的保障。”
據了解,在數據流通領域,對個人信息保護的技術處理一般采取“去標識化”,但是由于各方普遍使用標準化的統一的“去標識化”算法(例如MD5或SM3等算法),使得相同個人標識在各個機構的匿名化結果相同,結果是匿名化的作用與意義被削弱。并且,目前市場數據流通方式是兩方參與(需求方與供應方),存在供應方知曉需求方商業秘密的問題。沒有第三方參與的數據流通,缺少了判斷數據交易主體間的合規性的獨立中間方,使得數據交易合規流動遇到了較大的障礙。
舉例來說,如果一套算法,可把某身份證號匿名化為A1,因為供需方的生成算法是相同的,參與數據流通的各方都會把某個身份證號轉換成A1的符號,那么從根本上就沒有起到數據保護和隔離的作用。具體到銀行風控業務中,銀行需把需查詢的數據標識發給征信公司,例如,有A1-A1000這樣1000個數據信息,但是征信公司的數據量并沒有達到等量的驗證,可能只有500個,那么這些數據供應方包括征信公司,通過幫助銀行校驗的過程積累著需求方的數據,補充自己的數據維度。另一方面,這些個人信息有可能會被泄露出去。
對此,王潤垠介紹,xID標記技術組合了數據分類規則、不可逆標記生成、傳輸控制等多項技術,使得交易數據無法識別個體且不能復原個人信息,形成的無特定標識的個體標記數據,即“去標識數據”。
同時,基于真實應用場景,在數據流通規則控制下,在線實現數據的合規按需獲取。為數據流通領域中的個人信息提供完整保護和安全利用的解決方案,為個人信息安全保駕護航。
xID助力數字經濟發展
綜合來看,上海數據交易中心的交易平臺結合xID標記技術的數據流通運營生態網絡的出現,為個人信息的數據合規治理提供了解決方案。通過xID標記技術的數據流通運營生態網絡,既實現了各方個人相關標識信息的隔離,又可在法律合規范圍內實現數據流通,為數字經濟發展提供了安全、有序、合規、可控的底層安全保障技術。
目前,按照客戶實際的反饋,銀行在業務過程中存有海量的針對個人的金融數據,對數據安全管理的要求非常高。
xID標記技術首先可以幫助銀行解決數據存儲的安全合規問題。銀行可利用xID標記技術將個人信息中隱私等級較高的標識(姓名、身份證號、銀行卡號、手機號等)轉換,實現內部數據分級管理的機制。存有個人隱私信息的數據作為機密數據管理。同時,經xID處理后,不可識別具體標識信息的數據作為普通管理等級數據處理。
“在金融獲客與風險控制等銀行常見的業務場景中,需要通過外部數據查詢的方式補充數據,在此過程中,可以通過上海數據交易中心數據合規流通網絡進行客戶數據維度的補全。在流通過程中,所有與個人隱私相關的敏感數據標識均通過xID進行流通,確保數據獲取的合規性與合法性?!蓖鯘欅髲娬{。
就銀行業一個應用場景來說,中國目前有300多家銀行與保險公司等金融機構,相關數據服務公司數以千記。金融業數據合規流通具有巨大的市場規模與應用價值。
那么,除了金融行業的一些用戶,其他領域的數據保護和流通,xID能否發揮作用呢?
對此,王潤垠談道,在互聯網行業,會通過人群畫像進行數據分析,維度越全越好,但是人群畫像、行為分析也與數據標識相關,比如運營商內部有手機號相關聯的這個人的手機使用數據及信息。
銀行、保險等金融公司有銀行卡下面的刷卡記錄分析出這張卡相關的信息。但是,要實現手機號與銀行卡關聯,需要多個行業之間關鍵數據的打通,如果采用直接數據關聯,存在法律合規性與商業機密等阻礙,較難實現。如果采用xID技術的三方數據流通,可在不同的數據源之間建立既隔離又關聯的數據服務,多維數據融合就有可能實現,可以最大范圍的整合數據資源。從行業應用層面來說,就能夠更清晰、精準的實現人群畫像。
總體來看,無論是在哪個行業的深挖和深耕,xID標記技術從本質上可實現以下兩種數據安全保護服務,幫助企業提升數據安全管理能力:
1.合規存儲。結合公安部eID(公民網絡電子身份標識)算法與上海數據交易中心的成員管理體系,為企業提供具有唯一性的個人標識信息的匿名化處理服務。
2.合規流通。利用上海數據交易中心的數據流通技術,為企業間需要流通的信息提供數據標識的關聯性服務。
通過xID標記技術的研發以及應用,實現對個人信息的保護,其核心意義在于個人信息的去標識化。
過去由于不同機構去標識化的標準不統一,對于數據是否符合流通要求的判斷不一致,檢查判斷主體的不明晰等問題,都使得這項工作進展緩慢。在結合xID標記技術形成一套在線/實時/按需的“去標識化數據”流通網絡生態,突破了傳統加密網絡點對點的限制壁壘,為數據的流通提供了更便捷、更安全的流動載體,對流通平臺進行完善及補全。
xID開出創新之花
從技術的推廣應用來看,上海數據交易中心通過現有存量轉換首年30%(供需方調整期)、次年70%(成果推廣期)的推進計劃將xID標記技術覆蓋應用整個交易平臺,并且在新增的業務上率先應用xID標記技術,一些持有敏感數據或是對數據需求希望保密的組織或企業,也會因xID標記技術所提供的安全保密機制,從而打消之前的種種顧慮,進入數據流通的生態圈來進行業務的拓展及創新。鑒于xID標記技術的附加價值提供了更高的安全公信力及業界認可度,后續平臺交易的活躍度、數據交易量都將得到增量效益,預計三年后每年提升率為30%。
從創新性來看,xID標記技術是結合“技術+規則”綜合性解決方案。該方案的創新性是將數據流通過程從兩方參與(數據需求方+數據供應方)轉換成了多方參與(標識生成服務+標識關聯轉換服務+數據需求方+數據供應方)。這種多方參與的模式是個人信息相關數據可以被分解后拆分處理,實現敏感信息有效隔離,最終實現個人信息合規存儲與流通。在此過程中,“規則”部分由上海數據交易中心研發;數據匿名化與關聯性匹配的算法技術由公安部第三研究所在eID技術基礎上實現并提供技術服務,從根本上確保了數據的安全性與服務的權威性。
訪談實錄
Q:中國大數據產業生態聯盟、《軟件和集成電路》雜志社
A:上海數據交易中心運營經理王潤垠
Q:如何從創新性的角度來詮釋和理解上海數據交易中心技術的產業貢獻?
A:上海數據交易中心承建大數據流通與交易國家工程實驗室,參與相關大數據方面的國家標準的制定,開展了以數據連接為目標的標準、規范、技術、法律方面的基礎研究。自主創新和研制的“技術+規則”雙重架構的數據互聯整體解決方案和實時在線的數據流通交易平臺,形成了“數聯網”數據連接的多個標準與專利技術,對應五層數聯網結構,主要為:
1.多維數據分類標準,控制流通數據種類;(數據層)
2.“六要素”規整方法,定義流通數據規格;(數據層)
3.xID居間標記技術,保護數據主體隱私;(數據層)
4.單側確權溯責規則,隔離責任連帶路線;(應用層)
5.前置緩存配送技術,控制數據許可范圍;(接口層)
6.三邊互聯路由技術,管控數據流通方向;(傳輸層)
7.交叉價值質量驗證,提升數據評估公信。(服務層)
Q:“六要素”數據規整方法出現的意義是什么?
A: “六要素”數據規整方法是國內首創的流通數據定義標準,已成為大數據流通領域行業認可的基礎規范;與公安部第三研究所聯合研制的xID居間隔離技術是國內當前唯一能實現個人信息保護且利用的流通解決方案。
Q:當前,除了xID方面的技術研發和應用外,貴公司還有其他哪些業務拓展?
A: 依托上海大數據資源優勢,上海數據交易中心已經組織了以營銷、征信和建設物聯網為目的的合規高效的數據流通網絡,可以快速幫助政府、行業企業獲取發展所需要的其他第三方數據資源,為企業規劃、精準營銷、內外聯動、智慧城市建設等提供有效支撐。
Q:如何通過技術和科研投入來加快技術發展的步伐?
A: 公司針對我國大數據共享交換及交易流通不暢、標準不明、數據質量參差不齊、應用需求牽引不足等問題,圍繞創建數據流通規則、加強安全與隱私保護、突破流通交易關鍵技術、拓展數據應用場景等需求,研究與建設大數據流通與交易技術創新平臺,支撐開展政企數據資源共享交換、公共數據開放流通、大數據流通的理論方法和技術驗證、樣本數據庫及其服務支持系統等技術的研發和工程化。目前,國家工程實驗室擁有一支專業知識和實踐經驗豐富、知識結構合理、創新突破能力強的科研隊伍,下設15個研究中心。
行業應用案例
案例名稱:征信行業數據流通案例
核心特點:結合xID標記技術的流通生態網絡,對流通的標識進行不可逆的轉換,以確保個人隱私信息的安全。并且在需要時可對不同流通主體轉換的標識進行匹配,避免了之前征信數據流通過程中的安全隱患,以標識代替信息,打破了惡性循環。同時,保障了數據流通的安全性,完善了流通方式的合規性。
應用解讀:在目前數據流通領域,尤其是在征信數據流通領域,存在個人隱私信息流通的隱患,對個人隱私保護存在較大的風險。目前銀行、保險等領域因業務管理流程控制,需對客戶進行個人信息的背景調查,在此過程中使得大量個人隱私信息流向征信公司。
而個人信息的外流會引起更多維度的個人信息調查校驗需求,這種惡性循環將使更多個人隱私信息外流,很多個人信息通過數據黑色/灰色產業鏈被不法人員掌握,為社會安定帶來安全隱患。
應用價值:整合xID的標識流通解決方案,保證了在法理合規的前提下,提供了安全數據流通的途徑,為征信領域的數據流通提供安全保障。完善上海數據交易中心的征信類業務場景的數據流通的安全性及合規性。