趙家雪,蘇 铓,侯金鵬,付安民,
1.南京理工大學(xué) 網(wǎng)絡(luò)空間安全學(xué)院,江陰214443
2.南京理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,南京210094
深度學(xué)習(xí)技術(shù)已經(jīng)被廣泛應(yīng)用于計(jì)算機(jī)視覺[1]、語(yǔ)音識(shí)別[2]、醫(yī)療預(yù)測(cè)[3]、自動(dòng)駕駛[4]等多個(gè)領(lǐng)域并取得了重大突破.深度學(xué)習(xí)需要收集不同來源的大量數(shù)據(jù),然而這些數(shù)據(jù)可能包含用戶的敏感信息,例如醫(yī)療系統(tǒng)中患者的用藥情況和診斷結(jié)果.由于患者關(guān)注自己的隱私安全,拒絕向第三方服務(wù)提供商共享自己的醫(yī)療數(shù)據(jù),進(jìn)而阻礙數(shù)據(jù)收集和深度學(xué)習(xí)過程.近年來,個(gè)人數(shù)據(jù)泄露事件層出不窮,各個(gè)國(guó)家都開始出臺(tái)數(shù)據(jù)隱私保護(hù)相關(guān)的法律法規(guī),如歐盟2018 年5 月25 日出臺(tái)的《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation,GDPR)[5].個(gè)人隱私保護(hù)意識(shí)和嚴(yán)格的法律法規(guī)導(dǎo)致訓(xùn)練數(shù)據(jù)的收集愈發(fā)困難,致使深度學(xué)習(xí)面臨著巨大的挑戰(zhàn).
聯(lián)邦學(xué)習(xí)[6]作為一種新興的分布式訓(xùn)練系統(tǒng)受到越來越多的關(guān)注,它由一個(gè)服務(wù)器和多個(gè)用戶組成,用戶終端可以是手機(jī)、傳感器、筆記本電腦.在聯(lián)邦學(xué)習(xí)中,這些用戶使用私有數(shù)據(jù)集訓(xùn)練本地模型,在每次本地訓(xùn)練結(jié)束時(shí)將模型參數(shù)上傳到服務(wù)器.服務(wù)器接收到在線用戶的模型參數(shù)后,聚合所有用戶的本地模型參數(shù)并對(duì)聚合結(jié)果進(jìn)行廣播.每個(gè)用戶根據(jù)接收到的聚合結(jié)果更新本地模型,這樣的訓(xùn)練過程一直持續(xù)到模型收斂為止.這種分布式訓(xùn)練方式避免用戶將自己的數(shù)據(jù)暴露給其他參與方,可以保護(hù)用……