999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)探討

2020-09-19 08:02:38
網(wǎng)絡(luò)安全和信息化 2020年9期
關(guān)鍵詞:價(jià)值融合用戶

編者按:本文分析了聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖的不兼容性和融合契機(jī),梳理了適用于實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖技術(shù)融合的數(shù)據(jù)保護(hù)技術(shù),探討構(gòu)建了基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣,提出了面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)策略,為解決不同數(shù)據(jù)所有方在數(shù)據(jù)湖中共同安全、合規(guī)的使用數(shù)據(jù)資源等提供了具體的技術(shù)建議。

隨著各國(guó)的數(shù)據(jù)保護(hù)法律、政策陸續(xù)出臺(tái),如何在合規(guī)使用數(shù)字資產(chǎn)的前提下,共享數(shù)據(jù)價(jià)值、保障經(jīng)濟(jì)效益正在影響新基建所帶來(lái)的技術(shù)范式演進(jìn)。從目前的技術(shù)發(fā)展歷程來(lái)看,聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖在之前各自的技術(shù)演進(jìn)中是甚少交集的。兩者的不兼容性主要在以下兩方面:

一是用戶需求差異較大。聯(lián)邦學(xué)習(xí)在已有的商業(yè)實(shí)踐中,主要為海量的終端用戶服務(wù)。而數(shù)據(jù)湖的用戶群體源于數(shù)據(jù)倉(cāng)庫(kù)的使用者,屬于企業(yè)級(jí)用戶。不同的用戶群體的需求存在較大差異。

二是聯(lián)邦學(xué)習(xí)的網(wǎng)絡(luò)開(kāi)銷較高。聯(lián)邦學(xué)習(xí)關(guān)注數(shù)據(jù)的去中心化,但其模型更新過(guò)程中始終需要中央服務(wù)器參與。不同的終端用戶在連接中央服務(wù)器時(shí)的網(wǎng)絡(luò)環(huán)境充滿不確定性,因此海量終端用戶在進(jìn)行聯(lián)邦學(xué)習(xí)時(shí)的網(wǎng)絡(luò)開(kāi)銷較高。而數(shù)據(jù)湖在保證性能與效率的前提下,正在致力于通過(guò)分布式架構(gòu)等途徑防止網(wǎng)絡(luò)開(kāi)銷過(guò)高。

聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖的融合契機(jī)

隨著聯(lián)邦學(xué)習(xí)的商業(yè)化進(jìn)程加快,企業(yè)級(jí)用戶正在成為聯(lián)邦學(xué)習(xí)的目標(biāo)用戶。這為聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖解決不兼容性問(wèn)題,實(shí)現(xiàn)技術(shù)融合帶來(lái)了可行的應(yīng)用場(chǎng)景——同類型用戶群體、較小的用戶規(guī)模和相對(duì)穩(wěn)定的網(wǎng)絡(luò)環(huán)境。在這一應(yīng)用場(chǎng)景下,聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖具有以下三方面的融合契機(jī):

一是數(shù)據(jù)湖可以成為聯(lián)邦學(xué)習(xí)所需的可信第三方節(jié)點(diǎn)。理論上,聯(lián)邦學(xué)習(xí)不需要第三方節(jié)點(diǎn)可信,但需要滿足不同數(shù)據(jù)所有方彼此誠(chéng)實(shí)且好奇,嚴(yán)格符合安全多方計(jì)算(MPC)等條件。而這些條件目前尚難以同時(shí)滿足。此外,在聯(lián)邦學(xué)習(xí)的訓(xùn)練過(guò)程中,模型更新需要向第三方節(jié)點(diǎn)顯示敏感信息。雖然可以通過(guò)安全多方計(jì)算、差分隱私等保護(hù)隱私,但是采用可信第三方節(jié)點(diǎn)可以有效保障模型性能和系統(tǒng)效率,在經(jīng)濟(jì)效益上更為可取。

二是數(shù)據(jù)湖天然適合成為聯(lián)邦學(xué)習(xí)的商業(yè)化載體。數(shù)據(jù)湖的元數(shù)據(jù)可以為聯(lián)邦學(xué)習(xí)在商業(yè)化進(jìn)程中拓展新的數(shù)據(jù)價(jià)值共享模式。數(shù)據(jù)湖的元數(shù)據(jù)可映射為聯(lián)邦學(xué)習(xí)中的所需的標(biāo)簽Y,實(shí)現(xiàn)數(shù)據(jù)與標(biāo)簽Y的分離。這種分離使得擁有海量數(shù)據(jù)但不清楚如何使用的用戶免去協(xié)議制定的困擾,讓聯(lián)邦學(xué)習(xí)的數(shù)據(jù)價(jià)值共享模式不再拘泥于由標(biāo)簽Y的提供方制定協(xié)議。

同時(shí),目前聯(lián)邦學(xué)習(xí)正在探索商業(yè)化推進(jìn)的平臺(tái)和激勵(lì)機(jī)制,考慮通過(guò)區(qū)塊鏈等技術(shù)記錄聯(lián)邦學(xué)習(xí)參與者的貢獻(xiàn)評(píng)價(jià)和數(shù)據(jù)價(jià)值分配。而數(shù)據(jù)湖已有一定的商業(yè)實(shí)踐,并且其海量的存儲(chǔ)能力天然適合作為區(qū)塊鏈等技術(shù)的載體。因此,可以通過(guò)激勵(lì)機(jī)制在聯(lián)邦學(xué)習(xí)的協(xié)議制定中加入央行數(shù)字貨幣DC/EP,進(jìn)一步推動(dòng)數(shù)據(jù)價(jià)值共享的模式創(chuàng)新。

圖1 基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣

三是聯(lián)邦學(xué)習(xí)可以幫助數(shù)據(jù)湖解決安全性質(zhì)疑。通過(guò)聯(lián)邦學(xué)習(xí),數(shù)據(jù)湖可由直接存儲(chǔ)含有用戶隱私的原始數(shù)據(jù)轉(zhuǎn)為存儲(chǔ)加密的模型相關(guān)參數(shù)等原始數(shù)據(jù)。這樣既可以保留存儲(chǔ)原始數(shù)據(jù)的根本特征,又可以解決人們一直以來(lái)對(duì)于數(shù)據(jù)湖中原始數(shù)據(jù)安全的質(zhì)疑。解決安全性質(zhì)疑對(duì)數(shù)據(jù)湖實(shí)現(xiàn)從用戶內(nèi)部的信息基礎(chǔ)設(shè)施走向用戶間共建共享的信息基礎(chǔ)設(shè)施的技術(shù)演進(jìn)尤為重要。

適用于實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖技術(shù)融合的數(shù)據(jù)保護(hù)技術(shù)

要實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖的技術(shù)融合,數(shù)據(jù)安全是融合的前提。因此,需要按照等級(jí)保護(hù)的相關(guān)要求配備數(shù)據(jù)保護(hù)技術(shù),具備數(shù)據(jù)保護(hù)能力。根據(jù)數(shù)據(jù)保護(hù)能力的來(lái)源,適用的數(shù)據(jù)保護(hù)技術(shù)可以分為兩大類:

第一類是內(nèi)生的安全保護(hù),即聯(lián)邦學(xué)習(xí)本身包含的數(shù)據(jù)保護(hù)技術(shù)。這類技術(shù)包括基于隱私保護(hù)的數(shù)據(jù)建模、不經(jīng)意傳輸、差分隱私以及同態(tài)加密等。

第二類是外部的安全保護(hù),即其他可在數(shù)據(jù)湖中配備的數(shù)據(jù)保護(hù)技術(shù)。包括入侵防護(hù)、追蹤溯源、訪問(wèn)控制和區(qū)塊鏈等。這些技術(shù)還可以進(jìn)一步的細(xì)分,一種是直接參與聯(lián)邦學(xué)習(xí)的技術(shù),例如,記錄聯(lián)邦學(xué)習(xí)全過(guò)程的區(qū)塊鏈;另一種是防止數(shù)據(jù)湖內(nèi)存儲(chǔ)數(shù)據(jù)被惡意獲取、使用等的技術(shù),包括入侵防護(hù)、追蹤溯源和訪問(wèn)控制等。

面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)策略

綜合數(shù)據(jù)保護(hù)的對(duì)象和聯(lián)邦學(xué)習(xí)的價(jià)值共享過(guò)程,可以對(duì)直接參與聯(lián)邦學(xué)習(xí)的數(shù)據(jù)保護(hù)技術(shù)從數(shù)據(jù)保護(hù)和價(jià)值共享兩個(gè)維度進(jìn)一步細(xì)分,構(gòu)建基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣,如圖1 所示。

在數(shù)據(jù)保護(hù)維度,主要考慮需要保護(hù)的數(shù)據(jù)是本體還是附屬(關(guān)于數(shù)據(jù)本體與附屬的概念,可參看筆者拙作《大數(shù)據(jù)監(jiān)管系統(tǒng)建設(shè)研究》)。其中數(shù)據(jù)本體包括標(biāo)簽Y、模型更新的參數(shù)等,數(shù)據(jù)附屬包含聯(lián)邦學(xué)習(xí)的協(xié)議制定、參與用戶及其貢獻(xiàn)等。

在價(jià)值共享維度,通過(guò)聯(lián)邦學(xué)習(xí)進(jìn)行價(jià)值共享的過(guò)程一般可以分為兩個(gè)階段:第一階段是準(zhǔn)備階段,其中包括確定參與聯(lián)邦學(xué)習(xí)的用戶,制定協(xié)議,建立模型;第二階段是實(shí)現(xiàn)階段,由參與用戶共同訓(xùn)練模型、完成聯(lián)邦學(xué)習(xí)并進(jìn)行價(jià)值共享。

從圖中可以看到,對(duì)于數(shù)據(jù)附屬,主要通過(guò)區(qū)塊鏈所使用的零知識(shí)證明、智能合約等在保護(hù)隱私數(shù)據(jù)的同時(shí)如實(shí)記錄聯(lián)邦學(xué)習(xí)的全過(guò)程;對(duì)于數(shù)據(jù)本體,在準(zhǔn)備階段采用基于隱私保護(hù)的數(shù)據(jù)建模,防止由于原始數(shù)據(jù)參與參數(shù)傳遞導(dǎo)致的潛在數(shù)據(jù)泄露的情況,在實(shí)現(xiàn)階段采用不經(jīng)意傳輸、差分隱私、同態(tài)加密等,防止在進(jìn)行聯(lián)邦學(xué)習(xí)時(shí)的中間數(shù)據(jù)等被惡意獲取、使用等。

在面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)中,首先需要按照矩陣中的劃分對(duì)數(shù)據(jù)湖進(jìn)行相應(yīng)的配置,從而為聯(lián)邦學(xué)習(xí)的全過(guò)程中產(chǎn)生的各類數(shù)據(jù)提供針對(duì)性的保護(hù)。

同時(shí),數(shù)據(jù)湖還需要將入侵防護(hù)、追蹤溯源、訪問(wèn)控制等技術(shù)作為構(gòu)建數(shù)據(jù)保護(hù)能力的基礎(chǔ),使其成為數(shù)據(jù)湖作為用戶間共建共享的信息基礎(chǔ)設(shè)施的標(biāo)準(zhǔn)配置。

此外,面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)中還需要考慮兩類可預(yù)見(jiàn)的風(fēng)險(xiǎn):

第一類是安全性衰減風(fēng)險(xiǎn)。從技術(shù)發(fā)展的歷程看,不論是直接參與聯(lián)邦學(xué)習(xí)的數(shù)據(jù)保護(hù)技術(shù)如不經(jīng)意傳輸、差分隱私等,還是構(gòu)建共享數(shù)據(jù)湖基礎(chǔ)數(shù)據(jù)保護(hù)能力的入侵防護(hù)、追蹤溯源等技術(shù),都面臨著安全性因技術(shù)進(jìn)步而不斷下降的現(xiàn)實(shí)風(fēng)險(xiǎn)。

第二類是超范圍使用風(fēng)險(xiǎn)。目前聯(lián)邦學(xué)習(xí)的應(yīng)用研究中,正在探索采用聯(lián)邦學(xué)習(xí)進(jìn)行融合金融、醫(yī)療、用戶行為等多方數(shù)據(jù)源的商業(yè)實(shí)踐。在這類商業(yè)實(shí)踐中,用戶隱私有可能隨著關(guān)聯(lián)數(shù)據(jù)超出預(yù)計(jì)范圍而出現(xiàn)意想不到的數(shù)據(jù)泄露風(fēng)險(xiǎn)。

因此,出于合規(guī)與安全的共同需要,面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)還應(yīng)當(dāng)考慮與大數(shù)據(jù)監(jiān)管系統(tǒng)建設(shè)的適配,讓監(jiān)管部門(mén)可以實(shí)時(shí)掌握第一手情況,從而最大限度的規(guī)避技術(shù)創(chuàng)新過(guò)程中的各類風(fēng)險(xiǎn)。

總結(jié)

本文分析了聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖的不兼容性和融合契機(jī),梳理了適用于實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖技術(shù)融合的數(shù)據(jù)保護(hù)技術(shù),探討構(gòu)建了基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣,提出了面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)策略,為解決不同數(shù)據(jù)所有方在數(shù)據(jù)湖中共同安全、合規(guī)的使用數(shù)據(jù)資源等提供了具體的技術(shù)建議。

猜你喜歡
價(jià)值融合用戶
村企黨建聯(lián)建融合共贏
融合菜
從創(chuàng)新出發(fā),與高考數(shù)列相遇、融合
《融合》
一粒米的價(jià)值
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
“給”的價(jià)值
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
主站蜘蛛池模板: 国产成人区在线观看视频| 亚洲区欧美区| 国产精品手机在线播放| 午夜性刺激在线观看免费| 天堂av综合网| 被公侵犯人妻少妇一区二区三区| 91在线一9|永久视频在线| 欧美综合在线观看| 精品一区二区三区自慰喷水| 成人福利在线观看| 伊人久久大香线蕉综合影视| 色综合天天综合| 激情无码视频在线看| AV网站中文| 亚洲永久色| 国产精品漂亮美女在线观看| 日韩激情成人| 精品一区国产精品| 激情成人综合网| 国产日本欧美在线观看| 亚洲不卡影院| 国产亚洲精久久久久久无码AV| 国产精品大白天新婚身材| 成人夜夜嗨| 亚洲一级毛片免费观看| 91区国产福利在线观看午夜| 久久精品日日躁夜夜躁欧美| 久久精品中文字幕免费| 亚洲日韩久久综合中文字幕| 亚洲国产AV无码综合原创| 欧美啪啪视频免码| 国产精品美女自慰喷水| 亚洲高清在线天堂精品| 尤物国产在线| 国产国产人成免费视频77777| 欧美日本在线观看| 欧洲高清无码在线| 中文字幕在线日本| 白浆视频在线观看| 国产精品xxx| 真人免费一级毛片一区二区| 五月天综合婷婷| 欧美精品另类| 日韩在线1| 久久综合五月| 国内精品九九久久久精品| 久久99蜜桃精品久久久久小说| 亚洲人网站| 国产白浆一区二区三区视频在线| 日韩人妻精品一区| 精品无码人妻一区二区| 国产福利一区二区在线观看| 欧美区一区| 亚洲欧美成人在线视频| 精品国产成人a在线观看| h视频在线播放| 免费Aⅴ片在线观看蜜芽Tⅴ | 国产精品久久久久久久久| 久久精品午夜视频| 在线色国产| 黄色网在线| 日本午夜视频在线观看| 日本在线国产| 亚洲狠狠婷婷综合久久久久| 91年精品国产福利线观看久久 | 精品无码国产自产野外拍在线| 日韩免费视频播播| 日韩av无码精品专区| 一本大道香蕉中文日本不卡高清二区| 国产系列在线| av大片在线无码免费| 亚洲成在线观看 | 久久综合丝袜日本网| 无码福利视频| 欧美劲爆第一页| 91成人在线观看| 国产无码精品在线| 国产女人18水真多毛片18精品| 国产精品女人呻吟在线观看| 亚洲综合狠狠| 国产精品丝袜在线| 亚洲日韩精品伊甸|