張舒黎,鄧春華,胡 松,王中武,石元兵
(成都衛(wèi)士通信息產(chǎn)業(yè)股份有限公司,四川 成都 610041)
近年來(lái),數(shù)字化浪潮蓬勃興起,數(shù)據(jù)作為基礎(chǔ)戰(zhàn)略資源和關(guān)鍵生產(chǎn)要素的地位日益凸顯。根據(jù)歐盟估測(cè),2020 年歐洲個(gè)人數(shù)據(jù)產(chǎn)生的價(jià)值占國(guó)內(nèi)生產(chǎn)總值的8%。此外,根據(jù)國(guó)際數(shù)據(jù)公司(International Data Corporation,IDC)的報(bào)道我國(guó)數(shù)據(jù)體量已超全球總量的1/5 并正處于持續(xù)增長(zhǎng)階段,數(shù)據(jù)紅利將持續(xù)推動(dòng)我國(guó)數(shù)字經(jīng)濟(jì)的向好發(fā)展。然而,在人工智能、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算和5G 等新興技術(shù)的驅(qū)動(dòng)下,數(shù)據(jù)的流通與變現(xiàn)使得數(shù)據(jù)更容易脫離控制,并出現(xiàn)非法濫用的情況。數(shù)據(jù)安全問(wèn)題日益凸顯,日益增長(zhǎng)的隱私泄露事件更是為我國(guó)敲響了警鐘[1]。
為解決數(shù)據(jù)的隱私安全問(wèn)題,同時(shí)發(fā)揮數(shù)據(jù)流動(dòng)與數(shù)據(jù)增值的能力,一系列隱私計(jì)算技術(shù)被提出。安全多方計(jì)算(Secure Multiparty Computation,MPC)[2]無(wú)疑是其中的佼佼者。在經(jīng)歷了40 年的理論研究之后,近幾年來(lái)MPC 被大量應(yīng)用于金融、政務(wù)、醫(yī)療和互聯(lián)網(wǎng)等行業(yè)領(lǐng)域的試點(diǎn)建設(shè)中,顯示出良好的應(yīng)用前景,然而從理論到實(shí)踐仍有頗多問(wèn)題亟待解決。本文就MPC 的落地應(yīng)用性進(jìn)行綜合研究,在梳理MPC 技術(shù)基礎(chǔ)上,提出MPC 技術(shù)架構(gòu)和實(shí)現(xiàn)路徑,并對(duì)行業(yè)應(yīng)用進(jìn)行歸納分析,最后從應(yīng)用推廣層面給出建議和下一步規(guī)劃,助力MPC 的規(guī)模化應(yīng)用與發(fā)展。
大數(shù)據(jù)時(shí)代,互聯(lián)網(wǎng)經(jīng)濟(jì)的本質(zhì)更趨向于圍繞用戶創(chuàng)造價(jià)值。但是在實(shí)踐中,濫用數(shù)據(jù)、損害數(shù)據(jù)主體權(quán)益的現(xiàn)象時(shí)有發(fā)生。數(shù)據(jù)安全,法律先行。越來(lái)越多的國(guó)家以頂層立法的形式規(guī)范數(shù)據(jù)的安全應(yīng)用,平衡數(shù)據(jù)保護(hù)與數(shù)據(jù)流通的關(guān)系。例如,歐盟出臺(tái)的《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation,GDPR)以及美國(guó)簽發(fā)的《加利福尼亞州消費(fèi)者隱私保護(hù)法案》(California Consumer Privacy Act,CCPA)都是數(shù)據(jù)安全立法的典范。我國(guó)高度重視數(shù)據(jù)安全,先后頒布了《網(wǎng)絡(luò)安全法》《密碼法》頂層律法,并持續(xù)推動(dòng)“等保”“密評(píng)”系列保障工作。2021 年6 月10 日,我國(guó)頒布《數(shù)據(jù)安全法》,自2021 年9 月1 日起施行,顯示出了我國(guó)數(shù)據(jù)安全治理的決心。
隱私計(jì)算是解決數(shù)據(jù)隱私保護(hù)與數(shù)據(jù)價(jià)值流通的系列技術(shù)的統(tǒng)稱,其目標(biāo)是“數(shù)據(jù)可用不可見(jiàn)”。隱私計(jì)算主要涵蓋4 類技術(shù)路線:可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE)[3]、差分隱私(Differential Privacy,DP)[4]、聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)[5]以及MPC[2]。
TEE 使用硬件隔離技術(shù)構(gòu)建出安全可信區(qū)域,加密后的數(shù)據(jù)在此區(qū)域內(nèi)運(yùn)算。若無(wú)密鑰授權(quán),即使操作系統(tǒng)也無(wú)法訪問(wèn)其中的數(shù)據(jù)。TEE 的安全性主要依賴于硬件實(shí)現(xiàn),比較典型的方案為Intel SGX以及ARM Trust-Zone。
DP 技術(shù)的基本思想是在數(shù)據(jù)中增加噪聲以達(dá)到數(shù)據(jù)混淆不可區(qū)分的目的,主要應(yīng)用于數(shù)據(jù)結(jié)果的隱私保護(hù)。DP 在提供隱私安全的同時(shí),會(huì)一定程度影響數(shù)據(jù)的實(shí)用性。
FL 是谷歌公司在2014 年針對(duì)數(shù)據(jù)孤島提出的分布式機(jī)器學(xué)習(xí)方法。最初的FL 主要是基于“數(shù)據(jù)不出域,模型跑路”的思想實(shí)現(xiàn)聯(lián)合建模,然而模型參數(shù)并未得到充分保護(hù),存在隱私泄露風(fēng)險(xiǎn)。后續(xù)研究者提出一系列結(jié)合DP、MPC 的FL 安全增強(qiáng)方案,以實(shí)現(xiàn)隱私性和實(shí)用性的平衡。
MPC 是一種在參與方不共享各自數(shù)據(jù)且沒(méi)有可信第3 方的情況下安全地計(jì)算約定函數(shù)的密碼學(xué)技術(shù)。該技術(shù)具備高安全性、多場(chǎng)景適用性的特點(diǎn),同時(shí)擁有實(shí)用性和可擴(kuò)展性的優(yōu)勢(shì),具有非常高的研究熱度和應(yīng)用價(jià)值。本文將重點(diǎn)分析MPC 的技術(shù)特點(diǎn)和架構(gòu)思想,提出以MPC 構(gòu)建隱私計(jì)算體系的實(shí)踐之路。
1982 年,MPC 由清華大學(xué)姚期智院士基于百萬(wàn)富翁問(wèn)題提出[2]。MPC 使多個(gè)參與方能夠以一種安全的方式正確執(zhí)行分布式計(jì)算任務(wù)。具體來(lái)說(shuō),n個(gè)參與方{Pi}i∈[1,n]希望利用各自的秘密輸入共同計(jì)算n元功能函數(shù),元功能函數(shù)通常是一個(gè)隨機(jī)函數(shù)f(x1,x2,…,xn)=,每個(gè)參與方Pi,持有秘密輸入xi,計(jì)算完成得到輸出yi。且每個(gè)參與方除了自己的輸入和輸出以及由其可以推出的信息外得不到任何額外信息。
如圖1 所示,MPC 涵蓋無(wú)中心、隱私安全以及數(shù)據(jù)價(jià)值3 方面核心要求。去中心化是MPC 區(qū)別于傳統(tǒng)集中式計(jì)算的核心,數(shù)據(jù)隱私是MPC 的安全目標(biāo),數(shù)據(jù)價(jià)值則是MPC 能力交付的關(guān)鍵。

圖1 MPC 核心要求
如圖2 所示,MPC 是一系列密碼技術(shù)的體系化組合,主要涵蓋密碼資源供給、密碼學(xué)基礎(chǔ)、密碼應(yīng)用3 個(gè)層面。和傳統(tǒng)的密碼系統(tǒng)類似,MPC 的密碼底層資源也包括密碼芯片、板卡、整機(jī)、軟件、系統(tǒng)和云服務(wù)等多種形態(tài)密碼產(chǎn)品。MPC 密碼學(xué)基礎(chǔ)[6]在傳統(tǒng)的對(duì)稱密碼與公鑰基礎(chǔ)設(shè)施(Public Key Infrastructure,PKI)等技術(shù)基礎(chǔ)上,拓展了基于標(biāo)識(shí)的密碼系統(tǒng)(Identity-Based Cryptograph,IBC)以及無(wú)證書(shū)公鑰密碼體制(Certificateless Public Key Cryptography,CL-PKC)等技術(shù)。MPC作為一門(mén)前沿密碼技術(shù),面向不同應(yīng)用場(chǎng)景主要提供秘密分享[7-11]、同態(tài)加密[12-15]、混淆電路[2]以及定制技術(shù)等4 類技術(shù)方案或組合。

圖2 MPC 密碼技術(shù)體系
表1 對(duì)4 種技術(shù)方案進(jìn)行了對(duì)比和總結(jié)。總的來(lái)說(shuō),秘密分享技術(shù)應(yīng)用最為廣泛,適用于所有MPC 場(chǎng)景,這也可以從絕大多數(shù)MPC 產(chǎn)品都支持秘密分享這一事實(shí)進(jìn)行佐證。同態(tài)加密隨著算法的逐漸成熟,未來(lái)將會(huì)有更廣闊的應(yīng)用空間。混淆電路技術(shù)多用于布爾運(yùn)算場(chǎng)景。針對(duì)特定場(chǎng)景的定制技術(shù)也有較多應(yīng)用案例。

表1 不同MPC 技術(shù)比較
以MPC 技術(shù)為核心構(gòu)建的隱私計(jì)算產(chǎn)品,往往稱為MPC 平臺(tái),參考框架如圖3 所示。MPC 平臺(tái)是以密碼為核心的隱私安全產(chǎn)品,合規(guī)是其最基本的要求,因此它應(yīng)當(dāng)遵循相關(guān)法律法規(guī),并滿足系列標(biāo)準(zhǔn)要求。MPC 技術(shù)平臺(tái)支持兩種技術(shù)架構(gòu)。MPC 直接貫通平臺(tái)的方式中MPC 直接貫通平臺(tái)和MPC 增強(qiáng)FL 構(gòu)建平臺(tái),首先采用MPC 協(xié)議、MPC編譯器、MPC 應(yīng)用適配構(gòu)建MPC 運(yùn)算模塊;其次通過(guò)MPC 運(yùn)算模塊支撐上層的通用運(yùn)算和機(jī)器學(xué)習(xí)運(yùn)算;最后實(shí)現(xiàn)隱私求交、隱私統(tǒng)計(jì)和聯(lián)合建模等隱私計(jì)算功能。以MPC 增強(qiáng)FL 的方式構(gòu)建平臺(tái),首先在底層構(gòu)建FL 運(yùn)算模塊,并使用MPC 對(duì)其進(jìn)行安全增強(qiáng);其次通過(guò)FL 運(yùn)算模塊支撐上層的機(jī)器學(xué)習(xí)算法;最后實(shí)現(xiàn)機(jī)器學(xué)習(xí)類的隱私計(jì)算功能。

圖3 MPC 平臺(tái)體系框架
從產(chǎn)品的角度看,MPC 平臺(tái)是涉及多個(gè)節(jié)點(diǎn)的分布式計(jì)算平臺(tái),至少包含6 類角色:任務(wù)發(fā)起方、調(diào)度方、算法提供方、數(shù)據(jù)提供方、結(jié)果使用方以及計(jì)算方。角色之間的邏輯視圖關(guān)系如圖4 所示。可以看出,一個(gè)節(jié)點(diǎn)可以包括多種角色,如某節(jié)點(diǎn)既可能是數(shù)據(jù)提供方,也可能是計(jì)算方;多個(gè)節(jié)點(diǎn)可以組成同一個(gè)角色,如多個(gè)節(jié)點(diǎn)以集群的方式成為一個(gè)計(jì)算方。
近年來(lái),MPC 理論研究不斷推陳出新,取得進(jìn)步;工業(yè)上MPC 產(chǎn)業(yè)初見(jiàn)規(guī)模。如何利用開(kāi)放的MPC 成果,構(gòu)建MPC 平臺(tái)是值得思考的問(wèn)題。
通過(guò)研究分析,同時(shí)結(jié)合產(chǎn)業(yè)情況,本文提出如圖5 所示的兩種產(chǎn)品化思路。

圖5 自底向上與自頂向下的平臺(tái)構(gòu)建思路
(1)自底向上。這是密碼工程師的視角。具體的是以底層密碼學(xué)原語(yǔ)為基石,一步步自底向上構(gòu)建密碼協(xié)議、密碼應(yīng)用及平臺(tái)產(chǎn)品。此種方式安全強(qiáng)度得到充分控制,可以達(dá)到設(shè)定的安全目標(biāo),但通常情況下產(chǎn)品周期較長(zhǎng),可能存在交付問(wèn)題。
(2)自頂向下。這是軟件工程師的視角。具體的是先選擇平臺(tái)框架,后續(xù)工作主要為基于平臺(tái)框架的應(yīng)用開(kāi)發(fā),同時(shí)兼顧其中的MPC 技術(shù)的應(yīng)用和優(yōu)化。此種方式適合快速工程實(shí)現(xiàn),不過(guò)隨著產(chǎn)品的應(yīng)用發(fā)展,會(huì)以安全補(bǔ)丁的形式持續(xù)增強(qiáng)安全性。
兩種方式?jīng)]有絕對(duì)的優(yōu)劣,在具體的工業(yè)實(shí)現(xiàn)中,應(yīng)當(dāng)根據(jù)實(shí)際場(chǎng)景及安全強(qiáng)度要求選擇適用的方法。
政務(wù)領(lǐng)域是MPC 的主戰(zhàn)場(chǎng)。主要包括政務(wù)數(shù)據(jù)公開(kāi)共享、大數(shù)據(jù)交易兩類場(chǎng)景。
政務(wù)數(shù)據(jù)屬于公共資源,其基本屬性就決定了數(shù)據(jù)公開(kāi)、共享等性質(zhì)。傳統(tǒng)的數(shù)據(jù)共享交換方式仍然存在數(shù)據(jù)出域不受控等風(fēng)險(xiǎn),實(shí)際推廣應(yīng)用受到了較多阻礙。MPC 突破隱私安全限制,是政務(wù)數(shù)據(jù)共享落地的有力抓手,圖6 描述了MPC 如何助力政務(wù)數(shù)據(jù)惠民服務(wù)。

圖6 政務(wù)大數(shù)據(jù)多方計(jì)算
大數(shù)據(jù)交易是在數(shù)據(jù)要素賦能產(chǎn)業(yè)升級(jí)的背景下提出的。近年來(lái),全國(guó)多地紛紛成立大數(shù)據(jù)交易所,提供一系列數(shù)據(jù)清洗、供需撮合、法律咨詢和價(jià)值評(píng)估等市場(chǎng)化專業(yè)服務(wù),MPC便是其底層核心技術(shù)之一。
金融是數(shù)據(jù)密集型行業(yè),MPC 需求最為迫切。事實(shí)上,MPC 最好的商業(yè)機(jī)會(huì)確實(shí)來(lái)自于金融領(lǐng)域。MPC 等隱私計(jì)算技術(shù)正在重構(gòu)金融3 大核心業(yè)務(wù):營(yíng)銷、風(fēng)控、反欺詐。
圖7 給出了MPC 在金融風(fēng)控場(chǎng)景中的應(yīng)用示例。在進(jìn)行貸款業(yè)務(wù)時(shí),往往單一金融機(jī)構(gòu)無(wú)法形成用戶客群的完整畫(huà)像,很難綜合評(píng)判用戶信用。此時(shí)便需要多家金融機(jī)構(gòu),如各大商業(yè)銀行、保險(xiǎn)公司和貸款機(jī)構(gòu)等,共同聯(lián)合刻畫(huà)用戶行為和決策風(fēng)險(xiǎn)。

圖7 金融風(fēng)控應(yīng)用示例
MPC 在醫(yī)療行業(yè)存在巨大潛在價(jià)值,但依然面臨著艱巨的挑戰(zhàn)。由于醫(yī)療數(shù)據(jù)天然不可能做成集中式公共數(shù)據(jù)集且消費(fèi)邊界清晰,因此MPC 機(jī)會(huì)頗多。但醫(yī)療行業(yè)面臨數(shù)據(jù)整合難、政策限制多和法律不明確等系列困難,MPC 難落地。
圖8 給出了MPC 在大數(shù)據(jù)醫(yī)療中的應(yīng)用示意。結(jié)合MPC、醫(yī)療大數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù),構(gòu)建醫(yī)療人工智能系統(tǒng),能夠?qū)崿F(xiàn)精準(zhǔn)流調(diào)排查、自主醫(yī)療診斷和精準(zhǔn)藥物研制等目標(biāo)。在后疫情時(shí)代,基于MPC 的醫(yī)療大數(shù)據(jù)應(yīng)用或?qū)⒊蔀榭焖侔l(fā)展的市場(chǎng)。

圖8 醫(yī)療MPC 示例
信息技術(shù)的飛速發(fā)展拓展了MPC的應(yīng)用領(lǐng)域,MPC 在和區(qū)塊鏈、物聯(lián)網(wǎng)、邊緣計(jì)算和5G 等新興技術(shù)的碰撞與融合中,創(chuàng)造了更多的創(chuàng)新應(yīng)用模式。圖9 給出了萬(wàn)物互聯(lián)場(chǎng)景下的MPC 示例。安全計(jì)算節(jié)點(diǎn)不再局限于傳統(tǒng)的機(jī)構(gòu)或單位,而是向邊緣側(cè)、終端側(cè)下沉,形成了覆蓋端、邊、云的協(xié)同計(jì)算資源池,實(shí)現(xiàn)了更廣義的隱私安全。

圖9 萬(wàn)物互聯(lián)場(chǎng)景下的MPC 示例
當(dāng)前,MPC面臨的困難主要體現(xiàn)在以下3個(gè)方面。
(1)上位法律形成,但政策引領(lǐng)不足。我國(guó)已頒布網(wǎng)絡(luò)安全法、數(shù)據(jù)安全法、密碼法等系列上位律法,能夠從頂層牽引MPC 等隱私計(jì)算的落地應(yīng)用,指導(dǎo)意義巨大;然而,行業(yè)規(guī)范、應(yīng)用法規(guī)等系列下位政策并未及時(shí)跟進(jìn),總體上存在責(zé)任邊界不清晰、應(yīng)用要求不明確等現(xiàn)狀,導(dǎo)致用戶不敢用、市場(chǎng)不好推等困難。
(2)技術(shù)百花齊放,但標(biāo)準(zhǔn)化程度低。盡管金融等行業(yè)開(kāi)始涉足標(biāo)準(zhǔn)化等工作,但標(biāo)準(zhǔn)化規(guī)劃仍然非常欠缺。由于MPC 技術(shù)的多樣性和碎片化,客觀上導(dǎo)致沒(méi)有一個(gè)技術(shù)可以解決所有隱私計(jì)算問(wèn)題,而且相互之間很難互通,數(shù)據(jù)孤島問(wèn)題轉(zhuǎn)為技術(shù)孤島問(wèn)題。
(3)應(yīng)用前景廣闊,但局面并未打開(kāi)。目前,MPC 項(xiàng)目仍然是研究和試點(diǎn),處于探索階段,政府、銀行等機(jī)構(gòu)還在論證安全性、可行性及適用性,未來(lái)還有一段漫長(zhǎng)的推廣之路。
本文對(duì)MPC 的發(fā)展和應(yīng)用提出以下建議:
(1)健全政策配套,補(bǔ)齊行業(yè)規(guī)范,明確應(yīng)用要求;
(2)聚合產(chǎn)業(yè)生態(tài),建立標(biāo)準(zhǔn)化聯(lián)盟,打破技術(shù)孤島;
(3)加大技術(shù)突破,構(gòu)建成熟商用的能力體系,提升應(yīng)用體驗(yàn);
(4)多元行業(yè)并舉,在政務(wù)、金融、醫(yī)療等行業(yè)樹(shù)立標(biāo)桿并規(guī)模化推廣,同時(shí)打通企業(yè)數(shù)字化、智慧城市等應(yīng)用場(chǎng)景,全面做大MPC 應(yīng)用規(guī)模。
本文對(duì)MPC 的技術(shù)與應(yīng)用進(jìn)行了梳理,分析了數(shù)據(jù)安全政策背景及隱私計(jì)算需求,重點(diǎn)針對(duì)MPC 研究技術(shù)體系、架構(gòu)體系以及產(chǎn)品設(shè)計(jì)體系,提出了MPC 在政務(wù)、金融、醫(yī)療、創(chuàng)新領(lǐng)域的應(yīng)用方案,并基于當(dāng)前現(xiàn)狀提出未來(lái)發(fā)展建議。本文提出的研究成果具備總體性、系統(tǒng)性、實(shí)用性,能夠?yàn)槲磥?lái)MPC 的發(fā)展提供支撐。