999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

隱私保護的群體感知數(shù)據(jù)交易算法

2022-06-07 04:27:24張勇李丹丹韓璐黃小紅
通信學報 2022年5期
關(guān)鍵詞:消費者

張勇,李丹丹,韓璐,黃小紅

(北京郵電大學計算機學院(國家示范性軟件學院),北京 100876)

0 引言

為了發(fā)掘數(shù)據(jù)中蘊含的潛在價值,打破“數(shù)據(jù)孤島”,一些數(shù)據(jù)交易市場應(yīng)運而生,如Infochimps、Datacoup、Microsoft Azure Market-place 等。數(shù)據(jù)消費者可以在這些平臺上搜索和購買他們所需要的數(shù)據(jù)[1-2]。然而,當前這些平臺的數(shù)據(jù)大部分是機構(gòu)或組織出于自身的業(yè)務(wù)需求而保存下來的數(shù)據(jù),無法滿足數(shù)據(jù)消費者多樣化的數(shù)據(jù)需求,從而使數(shù)據(jù)的可用性大打折扣[3-4]。因此,從多樣性的角度來看,當前交易市場中的數(shù)據(jù)還十分有限,無法滿足日益增長的數(shù)據(jù)交易需求。為解決這個問題,學者們提出了一種新的數(shù)據(jù)交易模式,即群體感知數(shù)據(jù)交易(CDT,crowd-sensed data trading)。CDT 采用移動群體感知技術(shù)為數(shù)據(jù)消費者提供數(shù)據(jù)資源,即數(shù)據(jù)提供者使用手機、平板電腦等智能設(shè)備按照數(shù)據(jù)消費者的需求為其收集數(shù)據(jù)[5-6]。

典型的CDT 系統(tǒng)(例如Thingful、Thingspeak)包括數(shù)據(jù)交易平臺(以下簡稱為平臺)、數(shù)據(jù)消費者(以下簡稱為消費者)和感知任務(wù)參與者(以下簡稱為參與者)。平臺根據(jù)消費者的任務(wù)需求聘請大量的參與者,然后將參與者感知到的數(shù)據(jù)出售給消費者。當前,已有一些關(guān)于CDT 系統(tǒng)設(shè)計的工作。An 等[7]提出了一個基于逆向拍賣的群體感知數(shù)據(jù)交易系統(tǒng),采用貪心策略來招募參與者,并保證拍賣過程的真實性。Zheng 等[8]提出了一個收益驅(qū)動的數(shù)據(jù)收集框架,采用拍賣機制來最小化數(shù)據(jù)收集的成本。Jiang 等[9]提出了一個基于質(zhì)量感知的數(shù)據(jù)共享市場模型,從博弈論的角度分析了消費者行為,并提出了最優(yōu)響應(yīng)迭代算法來提高社會福利。

當前,大部分群體感知系統(tǒng)將平臺建模為半可信的,即平臺能夠誠實地執(zhí)行預定程序,但同時會分析參與者的數(shù)據(jù)進而窺探其隱私[10-11]。少數(shù)文獻關(guān)注了群體感知數(shù)據(jù)交易市場中的隱私問題。其中,Gao 等[12]和Niu 等[13]使用同態(tài)加密和簽名驗證機制保護了數(shù)據(jù)交易過程中消費者的出價隱私和身份隱私。Zhao 等[14]提出了一種基于區(qū)塊鏈的數(shù)據(jù)交易模型,采用環(huán)簽名和相似性學習來保護參與者的身份隱私。當前的隱私保護方案主要針對消費者和參與者的身份及報價等信息進行保護,而如果將這些方案用于參與者的數(shù)據(jù)隱私保護,不僅效率低下,還會導致數(shù)據(jù)的可用性急劇下降。還有一些學者基于本地差分隱私提出了感知方案,允許參與者通過報告噪聲數(shù)據(jù)來保護自己的數(shù)據(jù)隱私。Wang 等[15]基于本地化差分隱私提出了一種參與者位置保護方案。Xue 等[16]為保護參與者的隱私,基于本地化差分隱私提出一種個性化的隱私保護方案。然而,這些方案往往需要大量的參與者,在參與者數(shù)量較少的情況下,數(shù)據(jù)的實用性較差,而如果選取大量的參與者,則會增加平臺的招募成本。基于此,本文提出了一種新穎的基于差分隱私的群體感知方案,參與者不再需要提交原始數(shù)據(jù),而是提交對原始數(shù)據(jù)進行分析或計算得到的任務(wù)結(jié)果,同時通過對結(jié)果添加噪聲來保護他們的數(shù)據(jù)隱私,噪聲的分布是由平臺分配的隱私預算來確定的。在這種情況下,平臺可以通過對參與者隱私預算的動態(tài)調(diào)節(jié)來均衡結(jié)果的精度水平和相應(yīng)的招募成本。

為激勵用戶參與群體感知數(shù)據(jù)交易,價格機制的設(shè)計也是需要考慮的問題。當前針對數(shù)據(jù)交易的價格機制研究主要考慮了數(shù)據(jù)量、數(shù)據(jù)質(zhì)量等數(shù)據(jù)本身的因素[17-18]。例如,Yu 等[19]通過考慮數(shù)據(jù)質(zhì)量和數(shù)據(jù)多版本發(fā)布的策略,提出了一個雙層數(shù)學規(guī)劃模型來優(yōu)化數(shù)據(jù)交易。Jiao 等[20]考慮了大數(shù)據(jù)的“無限供給”性,提出了一種基于拍賣的大數(shù)據(jù)市場模型,通過拍賣機制得到最優(yōu)的數(shù)據(jù)交易價格和交易量。黃小紅等[21]基于數(shù)據(jù)質(zhì)量、數(shù)據(jù)屬性等多維因素構(gòu)建了數(shù)據(jù)交易的價格機制。

本文提出的隱私保護的群體感知方案中,參與者上傳的數(shù)據(jù)不再是原始數(shù)據(jù),而是由數(shù)據(jù)分析得出的結(jié)果,并不具有上述方案中所考慮的數(shù)據(jù)屬性,如數(shù)據(jù)量、數(shù)據(jù)質(zhì)量等,因此不適用于上述價格機制。受到隱私數(shù)據(jù)發(fā)布的啟發(fā)[22-23],在滿足消費者對結(jié)果偏差容忍的條件下,本文考慮了對參與者的隱私泄露補償,以及平臺的收益來優(yōu)化數(shù)據(jù)交易。平臺根據(jù)收到的消費者的偏差閾值、報價以及參與者的成本等信息,通過優(yōu)化招募方案,在滿足消費者偏差的容忍約束的基礎(chǔ)上,最小化招募參與者的成本,最大化自身的收益。

因此,為了保護參與者的數(shù)據(jù)隱私,同時構(gòu)建適用的價格機制,本文提出了隱私保護的群體感知數(shù)據(jù)交易算法。通過差分隱私聚合算法,平臺聚合參與者的結(jié)果。對于結(jié)果的計算,可以采用參與者獨立計算或者在平臺的組織下所有參與者協(xié)同計算的方式進行。同時,本文提出了信譽模型,以確保參與者的可信性,在考慮消費者的偏差約束和參與者隱私泄露補償?shù)幕A(chǔ)上,構(gòu)建了交易優(yōu)化模型,以最大化平臺的收益。本文的主要貢獻如下。

1) 為實現(xiàn)對參與者的隱私保護,以及保障數(shù)據(jù)的可用性,提出了基于差分隱私的數(shù)據(jù)聚合方案。平臺為招募到的參與者動態(tài)地分配隱私預算。參與者根據(jù)收到的隱私預算,在計算得到的結(jié)果中添加噪聲。這樣既保護了參與者的隱私,又保證了聚合后結(jié)果的可用性。此外,為確保參與者的可信性,提出了信譽模型。

2) 為激勵消費者和參與者進行數(shù)據(jù)交易,通過考慮消費者對數(shù)據(jù)偏差的容忍約束,參與者的隱私泄露補償構(gòu)建了交易優(yōu)化模型以優(yōu)化平臺的收益。通過優(yōu)化參與者的招募來提高平臺的收益,并提出了基于遺傳算法的收益優(yōu)化算法(POA,profit optimization algorithm)來求解該模型。

3) 使用北京的天氣和空氣質(zhì)量數(shù)據(jù)進行了實驗,以評估模型的性能。結(jié)果表明,該模型不僅實現(xiàn)了對參與者的隱私保護,同時提升了平臺的收益。

1 系統(tǒng)模型

1.1 群體感知數(shù)據(jù)交易框架

圖1 展示了本文構(gòu)建的群體感知數(shù)據(jù)交易框架,其中包括消費者、平臺和參與者。消費者將任務(wù)發(fā)送給平臺,平臺按照任務(wù)的需求招募參與者,同時為每個參與者分配隱私預算。參與者收集數(shù)據(jù)并將分析或計算出的結(jié)果在添加噪聲后發(fā)送給平臺。平臺聚合參與者的結(jié)果以完成消費者的任務(wù)。

圖1 群體感知數(shù)據(jù)交易框架

群體感知數(shù)據(jù)交易框架中包含3 種實體:消費者、平臺和參與者。

1) 消費者是向平臺發(fā)布任務(wù)的數(shù)據(jù)消費者。消費者會將自己的任務(wù)及相應(yīng)的描述發(fā)送給平臺,同時,以優(yōu)化自身的滿意度為目標確定報價和期望的偏差閾值。

2) 平臺是群體感知數(shù)據(jù)交易的組織者。平臺在收到消費者的任務(wù)后,會根據(jù)任務(wù)描述分析出完成該任務(wù)所需要的數(shù)據(jù)屬性等,并招募相應(yīng)的參與者以完成任務(wù)。在招募過程中,平臺會以最大化自身的收益為目標,同時也需要為招募的參與者分配隱私預算以滿足消費者的偏差要求。根據(jù)任務(wù)需求,平臺也可以組織參與者進行聯(lián)邦學習等協(xié)同計算以得到任務(wù)需求的結(jié)果。

3) 參與者是搜集數(shù)據(jù)的數(shù)據(jù)提供者。在收到平臺所公布的任務(wù)要求后,參與者將自己所能滿足的要求及相應(yīng)的報價發(fā)送給平臺,報價包含硬件成本(硬件損耗、能源消耗等)和隱私泄露成本。參與者收集數(shù)據(jù),通過統(tǒng)計分析、數(shù)據(jù)挖掘或協(xié)同計算等方式得出消費者所需要的結(jié)果,并按照平臺給出的隱私預算添加噪聲后發(fā)送給平臺。

1.2 數(shù)據(jù)交易流程

數(shù)據(jù)交易的過程如圖2 所示,其具體流程如下。

圖2 數(shù)據(jù)交易流程

1) 消費者將想要查詢的任務(wù)發(fā)送到平臺,其中包括對任務(wù)的詳細描述、所能支付的報酬及期望的偏差閾值。

2) 平臺對消費者的任務(wù)描述進行分析,提取出所需收集的數(shù)據(jù)屬性以及需要計算的標簽,然后將這些要求發(fā)送給參與者。

3) 參與者將自己所能收集的數(shù)據(jù)屬性及相應(yīng)的報價發(fā)送給平臺。

4) 平臺查詢交易記錄,以計算參與者的信譽值。平臺以最大化自身的收益為目標確定招募的參與者,并為每個參與者分配隱私預算,隨后將招募結(jié)果及隱私預算發(fā)送給相應(yīng)的參與者。

5) 參與者根據(jù)任務(wù)的需求收集數(shù)據(jù),并利用所收集的數(shù)據(jù)進行統(tǒng)計分析、數(shù)據(jù)挖掘或在平臺的組織下進行協(xié)同計算以得出消費者想要的結(jié)果(即相應(yīng)的標簽),再根據(jù)平臺分配的參數(shù)添加噪聲后發(fā)送給平臺。

6) 平臺聚合所有參與者的結(jié)果,并將聚合的結(jié)果回復給消費者。消費者將報酬支付給平臺,平臺按照參與者的報價將酬金支付給參與者。

2 群體感知數(shù)據(jù)交易模型

本節(jié)將描述基于差分隱私的聚合方案,并構(gòu)建數(shù)據(jù)交易優(yōu)化模型。

2.1 問題描述

本節(jié)在描述問題之前,給出系統(tǒng)參數(shù)和變量的含義,如表1 所示。

表1 系統(tǒng)參數(shù)和變量的含義

在當前的CDT 方案中,平臺招募參與者收集數(shù)據(jù),然后將數(shù)據(jù)出售給消費者,但是過程中可能泄露參與者的隱私。為保護參與者的隱私,本文基于差分隱私提出了聚合方案。參與者在計算出任務(wù)的結(jié)果后,將按照平臺分配的隱私預算添加噪聲,隨后將結(jié)果發(fā)送給平臺。同時,為確保參與者的可信性,避免招募惡意的參與者,本文提出了參與者的信譽模型。最后,為了激勵用戶參與交易,通過考慮消費者對結(jié)果偏差的容忍約束和對參與者的隱私泄露補償,本文建立了以平臺收益最大化為目標的交易優(yōu)化模型并進行了求解。因此,本節(jié)將描述提出的差分隱私聚合方案、信譽模型和交易優(yōu)化模型的構(gòu)建及求解。

2.2 差分隱私聚合方案

將圖1 所示平臺記作P。一段時間內(nèi),P收集消費者的任務(wù)請求。令U表示消費者集合,U中包含J位消費者,uj∈U,1≤ j≤ J,uj向P提交任務(wù) γj,所有任務(wù)的集合為Η,

設(shè)參與者的集合為W,wi∈W,1≤i≤ I。wi對任務(wù) γj計算得到ri,j,ri,j∈[0,1],添加的噪聲為φi,j,則P對于任務(wù) γj聚合得到的結(jié)果為

其中,fj(·) 表示聚合函數(shù),為參與者結(jié)果的加權(quán)求和;qi,j表示wi針對任務(wù) γj的歸一化權(quán)重;xi,j是一個二值函數(shù),xi,j∈{0,1},xi,j=1表示wi被選中來參與任務(wù) γj,xi,j=0表示wi未被選中;Wj表示被選中參與任務(wù) γj的參與者的集合,設(shè)Wj中參與者的數(shù)量為K,0≤ K≤ I。

聚合后結(jié)果偏差可以定義為

CDT 中需要考慮的是單個參與者的隱私泄露問題,主要應(yīng)對差分攻擊。差分隱私是一種應(yīng)對差分攻擊的有效方法。首先定義差分隱私。

定義1εi,j-差分隱私[24]。任務(wù) γj的聚合函數(shù)fj:[0,1]K→ R 滿足εi,j-差分隱私,則fj需要滿足:若存在2 個只在第i位參與者的結(jié)果處存在區(qū)別的相鄰向量(r1,j,…,ri′,j,…,rI,j),fj對于任何一組聚合結(jié)果O?Range(fj)都滿足式(3),則fj滿足εi,j-差分隱私。

其中,εi,j是正的參數(shù),用來表征隱私保護的強度,εi,j越小,隱私保護強度越大,隱私泄露就越少。因此,隱私預算 εi,j可以用來表征泄露的隱私量。

對于聚合函數(shù)fj,提供差分隱私的一個著名方法是將拉普拉斯分布得出的隨機噪聲添加到聚合函數(shù)[25]。由于本文方案允許每個參與者自己增加噪聲,因此需要仔細設(shè)計噪聲,使這些噪聲的和等于從拉普拉斯分布中得到的隨機噪聲,即聚合噪聲服從拉普拉斯分布。

結(jié)論已知所有參與者的xi,j和qi,j,在聚合函數(shù)fj下,針對任務(wù) γj每個參與者的隱私預算和聚合結(jié)果的偏差可表示為

證明已知所有參與者的xi,j和qi,j,在聚合函數(shù)fj下,敏感度為

等式變換(a)是由拉普拉斯分布的可分性得到的,φj是一個均值為0、方差為的拉普拉斯隨機變量。

如此,構(gòu)建了參與者的隱私預算和結(jié)果偏差與參與者選取的關(guān)系。從式(8)和式(9)可以看出,參與者越多,結(jié)果偏差越小,但是隱私預算越大。從直觀上說,對于相同的任務(wù),參與者越多,結(jié)果越精確,但每個參與者的隱私損失越大。此外,還需要仔細選擇參與者,因為他們有不同的信譽值(即qi,j),這也會導致不同的偏差。同時,不同參與者的成本也不同。因此,需要尋找一組合適的參與者來完成感知任務(wù)。

在得到Xj后,P會為每個參與者分配隱私預算,并聚合他們的結(jié)果,具體算法如算法1 所示。

算法1差分隱私聚合算法

4) end for

5) P 聚合參與者的結(jié)果(式(1)),得到回復給消費者的任務(wù)結(jié)果rj

需要注意的是,由于添加的噪聲服從拉普拉斯分布,因此算法1 適用于計算結(jié)果是連續(xù)型的情況。證畢。

2.3 信譽模型

當前已經(jīng)有一些研究通過度量參與者的工作能力來確定其信譽值,但平臺需要知道參與者的一些信息如計算能力、存儲能力、所處位置、軌跡信息等,這些信息中往往蘊含著用戶的隱私[28-29]。因此,本文方案通過參與者在任務(wù)中的表現(xiàn)來設(shè)計信譽模型,基于參與者所提供的結(jié)果的準確程度來度量參與者的可信性,不再需要參與者提供上述隱私信息。參與者所提供的結(jié)果越精確,參與者的可信性越好,相應(yīng)的信譽越高。不失一般性地,假設(shè)大部分參與者都是誠實的,會如實上報自己的結(jié)果。同時,用戶在注冊成為參與者時,平臺一般會進行一些測試以確保用戶有滿足需求的工作能力[30]。

信譽模型是通過平臺對參與者在任務(wù)中的評價而建立的。針對當前任務(wù) γj,P對wi的信譽評價為

其中,τ 是固定的閾值,表示對誤差的容忍程度。

P 會更傾向于選擇近期進行過交易且信譽較高的wi,因此wi會存在累積信譽,并且交易時間越接近,對當前任務(wù)信譽值的影響就越大。設(shè)wi在一段時間內(nèi)參與過Ψ 次P發(fā)布的任務(wù),1≤ψ≤Ψ,影響參數(shù)越大表示距離當前任務(wù)越近,影響參數(shù)也越大。考慮時間因素,信譽模型可以更新為

同時,任務(wù)的相似程度也是需要考慮的問題,與wi當前所參與的任務(wù)越相似,給出的評價越具有價值。采用任務(wù)所需要收集數(shù)據(jù)屬性的杰卡德相似系數(shù)來度量2 個任務(wù)的相似程度[21]。因此,進一步考慮任務(wù)的相似程度,信譽模型可以更新為

其中,Mψ是第ψ 次任務(wù)所需要收集的數(shù)據(jù)屬性,Mj是P經(jīng)過分析后認為完成任務(wù) γj需要收集的數(shù)據(jù)屬性。式(1)中采用的qi,j是通過計算ei,j并進行歸一化得到的,即

2.4 交易優(yōu)化模型的構(gòu)建及求解

交易優(yōu)化模型的目標是在滿足消費者對結(jié)果偏差的約束及對參與者的隱私泄露補償?shù)幕A(chǔ)上優(yōu)化平臺的收益。平臺招募參與者以完成消費者的任務(wù),因此平臺的收益與消費者支付的報酬以及需要支付給參與者的酬金相關(guān)。

2.4.1 消費者支付的報酬

對于收到的結(jié)果,偏差越小,消費者從結(jié)果中得到的收益越大,但同時需要付出的成本也會越多,因此消費者會在收益和成本之間進行權(quán)衡。基于結(jié)果的偏差,構(gòu)建消費者的滿意度函數(shù),它包含2 個部分:消費者從結(jié)果中所獲取的收益以及需要支付的報酬。消費者通過優(yōu)化自身的滿意程度來確定最優(yōu)的偏差,以及所支付的報酬。

設(shè)uj收到的結(jié)果的偏差為θj,uj可容忍的最大偏差為則uj的滿意度函數(shù)可以表示為

其中,S(uj)表示uj的收益,它是 θj的單調(diào)遞減函數(shù),即偏差越大所能獲得的滿意度越低。因此,構(gòu)建 S (uj)為

其中,αj表示固定的參數(shù),由uj的特性決定,用來調(diào)整消費者對滿意度函數(shù)和成本的側(cè)重程度。

C (uj)表示消費者uj的成本,也就是消費者支付給平臺的報酬,結(jié)果是偏差越小,需要支付的報酬就越大,理論上,θj越小,C(uj)的增長程度越大,因為精度越高,繼續(xù)提高精度需要的成本越大[31]。因此,定義

其中,βj表示固定的參數(shù),由消費者對成本的容忍程度來決定。因此,ST(uj)的完整形式為

消費者的目標是最大化其滿意度ST(uj),也就是最小化(-S T(uj))。

由于式(20)所示函數(shù)是嚴格凹的,且具有凸的約束,因此在KKT 條件下存在唯一的最優(yōu)解。放寬約束,得到拉格朗日函數(shù)為

其中,λj和ηj是拉格朗日參數(shù)。

最優(yōu)解滿足以下條件

2.4.2 支付給參與者的酬金

wi在收到P發(fā)布的任務(wù)后,將針對 γj能夠收集的數(shù)據(jù)屬性Mi,j及報價發(fā)送給平臺,設(shè)wi的報價為由2 個部分構(gòu)成。一部分是wi完成任務(wù) γj所需的固定成本,用hi,j表示,包含能源消耗、計算成本、數(shù)據(jù)傳輸成本等[32]。另一部分是wi的隱私成本,用pi,j表示,它與wi在任務(wù)中泄露的隱私成正比[22-23]。此時,參與者只需要上報單位隱私的價格,隱私的量可由平臺給出的隱私預算得出。當wj放棄任務(wù) γj時將回復bi,j=0。

假設(shè)wi被分配任務(wù) γj,對于任務(wù) γj,wi的隱私成本為

其中,ωi,j表示單位隱私預算的成本;εi,j表示泄露的隱私量,添加的噪聲越多,隱私泄露越少,相應(yīng)的成本越低。由于執(zhí)行的任務(wù)都有時間限制,在劃分的時間間隔內(nèi)消費者只會被分配一個任務(wù)。平臺支付給參與者的酬金為

2.4.3 交易優(yōu)化模型

交易模型的目標是最大化平臺的收益,也就是從消費者處收到的報酬及支付給參與者的酬金之間的差值,因此可以將它的目標函數(shù)表示為

約束式(26)保證消費者得到的任務(wù)結(jié)果滿足預期的偏差。約束式(27)表明當結(jié)果不滿足消費者的預期偏差時,不會有參與者再進行此任務(wù)。約束式(28)說明參與者只有參與任務(wù)或不參與任務(wù)2 種狀態(tài)。約束式(29)保證每個參與者最多只能參與一個任務(wù)。

2.4.4 收益優(yōu)化算法

交易優(yōu)化模型具有大量的變量且約束函數(shù)包含二值函數(shù),很難采用數(shù)值方法進行求解,而采用遍歷的方法計算復雜度較高,為JI,其中I和J分別表示參與者和消費者的數(shù)量。因此,本文基于遺傳算法提出了POA,如算法2 所示。

算法2POA

3 實驗結(jié)果

本文實驗使用北京的天氣和空氣質(zhì)量數(shù)據(jù)來提供空氣質(zhì)量預測服務(wù)。該數(shù)據(jù)集包含12 個空氣質(zhì)量監(jiān)測站點的空氣污染物數(shù)據(jù)。空氣質(zhì)量數(shù)據(jù)來自北京市環(huán)境監(jiān)測中心。每個空氣質(zhì)量監(jiān)測站點的氣象數(shù)據(jù)均與最近的氣象站相匹配。時間段是從2013 年3 月1 日到2017 年2 月28 日。因此每個數(shù)據(jù)集都包含35 064 條數(shù)據(jù)樣本。每條樣本包含時間、PM2.5、PM10、SO2含量等17 種屬性。實驗中,將每個空氣質(zhì)量監(jiān)測站的數(shù)據(jù)分成10 份,并將每一份看成一個參與者收集的數(shù)據(jù),因此實驗中共引入了120 位參與者。為了使這120 位參與者的數(shù)據(jù)產(chǎn)生顯著差異,實驗中刪除了某些參與者的一些數(shù)據(jù)屬性。在實驗過程中,參與者使用經(jīng)典的機器學習算法(如線性回歸算法等)提供空氣質(zhì)量查詢、預測等服務(wù)。實驗虛擬了10 位消費者,即J=10。實驗平臺為一臺PC 主機,CPU 為i7-8700,主頻為3.20 GHz,內(nèi)存為32 GB,頻率為2 666 MHz。

實驗主要展示了消費者滿意度函數(shù)隨偏差的變化,POA 的收斂性、可擴展性及有效性驗證,偏差和隱私預算隨參與者選擇的變化,消費者與參與者的變化對平臺收益的影響及信譽模型的有效性驗證。

3.1 消費者滿意度函數(shù)隨偏差的變化

消費者的滿意度函數(shù)考慮了獲取的收益和需要支付的報酬,為了展示最終的滿意度、獲取的收益及需要支付的報酬隨偏差的變化,給出了消費者的滿意度、獲取的收益及需要支付的報酬隨偏差的變化,如圖3 所示。

圖3 消費者的滿意度、獲取的收益及需要支付的報酬隨偏差的變化

消費者是從10 位消費者中隨機選取一位。由圖3 可知,隨著偏差的增大,獲取的收益和需要支付的報酬都逐漸降低,但獲取的收益降低的速度逐漸加快,而需要支付的報酬降低的速度逐漸放緩。因此,消費者的滿意度呈現(xiàn)先增長后降低的趨勢。當偏差取2.4時,消費者的滿意度達到最高值14.32,此時消費者需要付出的報酬為6.17。

3.2 POA 的收斂性、可擴展性及有效性驗證

為展示算法的收斂情況,給出了平臺的收益隨迭代次數(shù)的變化,如圖4 所示。

圖4 平臺的收益隨迭代次數(shù)的變化

從圖4 可以看出,隨著迭代次數(shù)的增多,平臺的收益逐漸增長。當達到一定的迭代次數(shù)后,收益的增長速度逐漸放緩,并最終趨于穩(wěn)定。算法在120 次之內(nèi)可以達到穩(wěn)定狀態(tài)。

為了驗證算法的可擴展性,給出了迭代次數(shù)隨消費者和參與者數(shù)量增長的變化,如圖5 所示。

圖5 迭代次數(shù)隨消費者和參與者數(shù)量增長的變化

圖5 中標注的數(shù)字表示“消費者數(shù)量+參與者數(shù)量”,如“5+120”表示此次實驗中包含5 位消費者和120 位參與者。從圖5 可以看出,隨著消費者和參與者數(shù)量的增加,算法的迭代次數(shù)呈線性增加。這一結(jié)果驗證了POA 對大規(guī)模數(shù)據(jù)交易系統(tǒng)具有較高的可擴展性。

為進一步展示POA 的有效性,將其與VENUS、DPDT 以及窮舉法的實驗結(jié)果進行了對比,實驗結(jié)果如圖6 和圖7 所示。其中,VENUS 是Zheng 等[8]提出的一種基于貪婪策略的群體感知數(shù)據(jù)交易方案,以聯(lián)合優(yōu)化利潤最大化和支付最小化問題;DPDT 是Gao 等[34]提出的一種滿足差分隱私的群體感知數(shù)據(jù)交易機制,采用差分隱私拍賣的方法來實現(xiàn)數(shù)據(jù)定價和數(shù)據(jù)收集。

圖6 幾種算法在平臺的收益方面的對比

圖7 幾種算法在運行時間上的對比

從圖6 和圖7 可以看出,窮舉法具有最高的收益,但它的運行時間遠超其他3 種算法。相比于VENUS 和DPDT,POA 在平臺的收益方面分別提高了29.27%和20.45%,達到了窮舉法的98.15%,運行時間也僅略高于DPDT。從平臺的收益和運行時間綜合來看,本文方案取得了最好的效果。

3.3 偏差和隱私預算隨參與者選擇的變化

按照本文方案中構(gòu)建的參與者選擇與隱私預算和偏差的關(guān)系,對于相同的感知任務(wù),被選中的參與者越多,偏差越低,但同時會導致每個參與者有更高的隱私預算,從而泄露更多的隱私,為此,給出了偏差和隱私預算隨被選中的參與者數(shù)量的變化,如圖8 所示。

圖8 偏差和隱私預算隨被選中的參與者數(shù)量的變化

從圖8 可以看出,隨著被選中的參與者的數(shù)量增加,偏差逐漸減少,但每個參與者的隱私預算逐漸增多,且隨著參與者數(shù)量的增長,隱私預算的增長速度越來越快,這與前文的分析是一致的。參與者的信譽值也會對參與者的選取造成影響,為展示這種影響,給出了不同信譽值下偏差和隱私預算隨被選中的參與者數(shù)量的變化,如圖9 所示。

圖9 不同信譽值下偏差和隱私預算隨被選中的參與者數(shù)量的變化

圖9 中,高信譽值情況下,參與者的平均信譽值為0.9;低信譽值情況下,參與者的平均信譽值為0.7。在選取相同參與者數(shù)量的情況下,高信譽值的參與者具有更低的偏差,同時他們的隱私預算情況基本重合,都出現(xiàn)了隨著被選中的參與者數(shù)量增長隱私預算增長越來越快的現(xiàn)象。

為了展示隱私預算與數(shù)據(jù)效用之間的關(guān)系,給出了幾種算法數(shù)據(jù)效用隨隱私預算變化的對比,如圖10 所示。

圖10 幾種算法數(shù)據(jù)效用隨隱私預算變化的對比

圖10 中,READ 和AFTF(partial arbitrage free trading framework)分別是Cai 等[35]和Zheng 等[36]提出的基于差分隱私的數(shù)據(jù)交易算法。隱私預算可以用來表征隱私保護力度,兩者成反比,隱私預算越小表示隱私保護力度越強。數(shù)據(jù)效用是利用數(shù)據(jù)為消費者帶來的收益來計算的。從圖10 中可以看出,隨著隱私預算的逐漸增長,即隱私保護力度的逐漸減小,數(shù)據(jù)效用逐漸增加,并最終穩(wěn)定到最高值。從幾種算法的對比來看,在相同的隱私保護程度下,POA 可以帶來更高的數(shù)據(jù)效用。這是因為POA 采用的差分隱私聚合算法考慮了拉普拉斯分布的可分性,將拉普拉斯分布構(gòu)造為多個獨立同分布的伽馬分布的和,使每個參與者所添加的噪聲之和等于從拉普拉斯分布中得到的隨機噪聲。相比于取噪聲最大值的傳統(tǒng)拉普拉斯機制,對于每位參與者來說,可以使用更少的噪聲添加來提供更高的隱私保護力度。因此,相比于其余幾種算法,POA 在相同隱私保護力度情況下的參與者所需要添加的噪聲更少,從而帶來了更高的數(shù)據(jù)效用。

圖11 展示了平臺的收益隨隱私預算的變化。當隱私預算很小時,任務(wù)的偏差無法滿足消費者的需求,此時平臺無法承接消費者的任務(wù),因此收益為0。隨著隱私預算逐漸增大,可以達到的任務(wù)偏差會逐漸減少,當滿足任務(wù)需求時,平臺開始承接消費者的任務(wù)。隨著所承接任務(wù)數(shù)量的增長,平臺的收益急劇增長。此時,由于支付給參與者的隱私成本最小,平臺也可以獲取最大的利潤。隨著隱私預算繼續(xù)增大,平臺從消費者處獲取的任務(wù)報酬沒有變化,但支付給參與者的酬金逐漸增長,平臺的總收益與每筆任務(wù)的平均收益會逐漸減小,最終歸于零收益。因此,在收到消費者提交的偏差需求及報酬后,平臺會仔細挑選參與者,在滿足消費者偏差需求的基礎(chǔ)上,盡可能地減少隱私預算,以最優(yōu)化自身的收益。而減小隱私預算,則意味著對參與者隱私保護的增強。

圖11 平臺的收益隨隱私預算的變化

圖12 展示了高信譽值、低信譽值和不考慮信譽值的情況下平臺收益的變化。從圖12 可以看出,隨著迭代次數(shù)的增長,3 種情況下平臺的收益都逐漸增長,并最終達到穩(wěn)定狀態(tài)。當達到穩(wěn)定狀態(tài)時,高信譽值情況下的平臺取得了最高的收益,信譽值的考慮確實提升了平臺的收益,而且參與者的信譽值越高,提升的幅度越大。這也說明了平臺會更傾向于選擇具有高信譽值的參與者,從而督促參與者在任務(wù)中誠實表現(xiàn)以提升信譽值。

圖12 信譽對平臺的收益的影響

3.4 消費者與參與者的變化對平臺收益的影響

為展示消費者和參與者的數(shù)量變化對平臺的收益的影響,給出了平臺的收益及被選中的參與者數(shù)量隨消費者數(shù)量的變化和平臺的收益及完成的任務(wù)數(shù)隨參與者數(shù)量的變化,分別如圖13 和圖14 所示。

圖13 平臺的收益及被選中的參與者數(shù)量隨消費者數(shù)量的變化

圖14 平臺的收益及完成的任務(wù)數(shù)隨參與者數(shù)量的變化

從圖13 可以看出,隨著消費者數(shù)量的增長,被選中的參與者數(shù)量逐漸增加,所能完成的任務(wù)數(shù)隨之增加,最終導致平臺的收益也逐漸增加。從圖14可以看出,隨著參與者的數(shù)量增加,完成的任務(wù)數(shù)逐漸增多,當達到任務(wù)上限后,平臺會對選取的參與者進行進一步優(yōu)化,從而提高自身的收益。這說明消費者和參與者的增加都有利于提高平臺的收益,這成為平臺接受此模式并推動其發(fā)展的動機。

3.5 信譽模型的有效性驗證

為了驗證設(shè)計的信譽模型是否能夠反映參與者在任務(wù)中的表現(xiàn),本節(jié)設(shè)計了2 種參與者,一種是普通的參與者,他會正常完成任務(wù),并且在任務(wù)中逐步提升結(jié)果的精確度;另一種是惡意的參與者,他開始也像普通的參與者那樣表現(xiàn),但達到一定次數(shù)后會發(fā)動攻擊,即提供極差的結(jié)果,隨后,恢復正常。兩者的信譽值變化如圖15 所示。

圖15 信譽值變化對比

從圖15 可以看出,隨著結(jié)果精確度的逐漸提高,普通的參與者的信譽值隨參與任務(wù)的次數(shù)的增多而逐漸增長,最終達到穩(wěn)定。惡意的參與者的信譽值在他發(fā)起攻擊時急劇下降,當他恢復正常后,他的信譽值也恢復正常的增長。這表明信譽模型對參與者的行為是敏感的。參與者“壞”的行為會體現(xiàn)在其信譽值上,從而促使參與者采取“好”的行為來提高信譽。

4 結(jié)束語

為了保護參與者的隱私,本文提出了一種隱私保護的群體感知數(shù)據(jù)交易框架。在此框架下,本文提出了基于差分隱私的聚合方案。參與者收集數(shù)據(jù)并進行計算,隨后在計算結(jié)果中按照平臺分配的隱私預算添加噪聲,最后將分析結(jié)果發(fā)送給平臺。這既保證了對參與者的隱私保護,又保障了聚合結(jié)果的可用性。此外,本文還提出了參與者的信譽模型,以保障參與者的可信性。通過考慮消費者的偏差約束和對參與者的隱私補償,構(gòu)建了以平臺收益最大化為目標的交易優(yōu)化模型,并提出了POA 進行求解,從而激勵用戶參與數(shù)據(jù)交易。基于北京的天氣和空氣質(zhì)量數(shù)據(jù)的實驗表明,本文方案在實現(xiàn)參與者隱私保護的基礎(chǔ)上提升了平臺的收益。

猜你喜歡
消費者
消費者網(wǎng)上購物六注意
新車售前維修未告知消費者是否構(gòu)成欺詐
系無理取鬧?NO! 請為消費者擦干眼淚
人民交通(2019年16期)2019-12-20 07:03:52
論“知假買假”者的消費者身份認定
日化品牌怎樣才能吸引年輕消費者?
消費導刊(2018年22期)2018-12-13 09:19:00
只用一招 讓喊產(chǎn)品貴的消費者閉嘴
知識付費消費者
重新定義消費者
生活用紙(2016年5期)2017-01-19 07:36:14
悄悄偷走消費者的創(chuàng)意
消費者權(quán)益保護:讓人歡喜讓人憂
公民與法治(2016年5期)2016-05-17 04:09:48
主站蜘蛛池模板: 一本色道久久88| 国国产a国产片免费麻豆| 亚洲国产综合精品中文第一| 日韩高清一区 | 色天天综合| 国产视频一区二区在线观看| 日韩专区欧美| 日本草草视频在线观看| 欧美激情伊人| 亚洲精品制服丝袜二区| 曰韩人妻一区二区三区| 91在线视频福利| 欧美日韩中文国产| 国产91视频免费观看| 色一情一乱一伦一区二区三区小说| 国产精品成人AⅤ在线一二三四| 伊人精品成人久久综合| 在线国产91| 日韩AV无码一区| 18禁影院亚洲专区| 99久久精品免费视频| 在线看国产精品| 成人在线亚洲| 波多野结衣亚洲一区| 91青草视频| 在线观看国产小视频| 天天操天天噜| 天堂成人在线视频| 日韩精品毛片人妻AV不卡| 粉嫩国产白浆在线观看| 一本色道久久88综合日韩精品| 国产高清在线精品一区二区三区| 亚瑟天堂久久一区二区影院| 美女无遮挡被啪啪到高潮免费| 国产av一码二码三码无码| 国产视频一二三区| 国产欧美日韩另类精彩视频| 久久久噜噜噜| 中文字幕在线看视频一区二区三区| 亚洲欧美激情小说另类| 国产成人调教在线视频| 国产第二十一页| 国产一级小视频| 制服丝袜一区| 一级做a爰片久久免费| 国产亚洲男人的天堂在线观看| 99久久99视频| 99久久99这里只有免费的精品 | 91免费国产高清观看| 人妻无码一区二区视频| 一本大道AV人久久综合| 亚洲天堂视频在线观看| 国产成人91精品免费网址在线| 亚洲第一色网站| 亚洲天堂网2014| 在线观看亚洲人成网站| 久久美女精品国产精品亚洲| 日韩大片免费观看视频播放| 国产精品3p视频| 免费可以看的无遮挡av无码| 久久精品国产国语对白| 国产主播在线一区| 国产经典三级在线| 亚洲色图欧美在线| 国产在线八区| 在线毛片网站| 亚洲三级网站| 亚洲成人手机在线| 在线观看91精品国产剧情免费| 伊人激情综合网| 不卡色老大久久综合网| 久久午夜夜伦鲁鲁片不卡| 狠狠色综合网| 久久香蕉国产线看观| 国产乱人免费视频| 中文字幕无码制服中字| 亚洲狼网站狼狼鲁亚洲下载| 久久九九热视频| 老司机精品久久| 3D动漫精品啪啪一区二区下载| 婷婷六月在线| 亚洲三级色|