摘要:Web3.0是互聯(lián)網(wǎng)發(fā)展的第三個(gè)階段,標(biāo)志著互聯(lián)網(wǎng)從傳統(tǒng)的中心化模式向去中心化、安全透明的新階段轉(zhuǎn)變。人工智能(Artificial"Intelligence,AI)技術(shù)快速發(fā)展,并逐漸深入到各個(gè)領(lǐng)域,給生產(chǎn)生活帶來了巨大變化。然而,AI"技術(shù)的機(jī)遇與風(fēng)險(xiǎn)并存,確保"AI"安全、可靠、可控,增強(qiáng)"AI"使用者的信心,是關(guān)系到"AI"長(zhǎng)遠(yuǎn)發(fā)展的重要議題。目前,發(fā)展可信"AI"核心,需要關(guān)注"AI"的可解釋性、公平性、魯棒性、隱私保護(hù),以及以人為中心的"AI"等方面。主要針對(duì)人工智能生成內(nèi)容(Artificial"Intelligence"Generated"Content,AIGC)技術(shù)的內(nèi)容服務(wù)提供商在算力、數(shù)據(jù)和模型上的壟斷問題進(jìn)行分析,研究討論如何在Web3.0環(huán)境下實(shí)現(xiàn)多技術(shù)的深度融合與性能優(yōu)化,以充分發(fā)揮Web3.0的技術(shù)優(yōu)勢(shì)。
關(guān)鍵詞:Web3.0系統(tǒng)"""區(qū)塊鏈"""可信AI技術(shù)"""技術(shù)融合點(diǎn)
Research"on"Trusted"AI"Technology"Based"on"Blockchain"in"Web3.0"Environment
BAI"Xuehui
Baid"Dong"Culturale"and"Technology"Co.,"Ltd.,"Beijing,"100000"China
Abstract:"Web3.0"is"the"third"stage"of"Internet"development,"marking"the"transformation"of"the"Internet"from"the"traditional"centralized"modenbsp;to"a"new"stage"of"decentralization,"security"and"transparency."Artificial"intelligence"(AI)"technology"has"developed"rapidly"and"gradually"penetrated"into"various"fields,"bringing"great"changes"to"production"and"life."However,"opportunities"and"risks"of"AI"technology"coexist,."eEnsuring"the"safety,"reliability"and"controllabilitynbsp;of"AI"and"enhancing"the"confidence"of"AI"users"are"important"issues"related"to"the"long-term"development"of"AI."At"present,"the"development"of"credible"AI"core"needs"to"focus"on"AI's"interpretability,"fairness,"robustness,"privacy"protection"and"human"centered"AI.;"This"article"mainly"analyzes"the"monopoly"problem"of"the"content"service"provider"of"Artificial"Intelligence"Generated"Content"(AIGC)"technology"in"terms"of"computing"power,"data"and"models,"and"discusses"how"to"achieve"deep"integration"and"performance"optimization"of"multiple"technologies"in"the"Web3.0"environment,"so"as"too"give"fully"leverageplay"to"the"technical"technological"advantages"of"Web3.0.
Key"Wwords:"Web3.0"system;"Blockchain;"Trusted"AI"technology;"Technology"integration"point
Web3.0的內(nèi)容生成方式主要包括用戶生成內(nèi)容和專業(yè)生成內(nèi)容。人工智能生成內(nèi)容(Artificial"Intelligence"Generated"Content,AIGC)技術(shù)的訓(xùn)練和推理過程對(duì)計(jì)算資源和數(shù)據(jù)的需求量較大,因此會(huì)形成中心化的服務(wù)模式,容易引發(fā)單點(diǎn)故障、數(shù)據(jù)不可用、數(shù)據(jù)安全等問題。針對(duì)上述問題,本文提出了一種基于區(qū)塊鏈的可信AIGC技術(shù),該技術(shù)通過結(jié)合區(qū)塊鏈技術(shù)和聯(lián)邦擴(kuò)散模型,可以在Web3.0環(huán)境下去中心化地分發(fā)、實(shí)現(xiàn)AIGC任務(wù)。
1"Web3.0概述
Web3.0是依托可信式、透明化、去中心化協(xié)定的可信生態(tài)系統(tǒng),由大型組織共同參與設(shè)計(jì)和維護(hù),在Web3.0中,用戶不僅是內(nèi)容的消費(fèi)者,更是內(nèi)容的生產(chǎn)者、發(fā)布者和交易者。這種模式改變了互聯(lián)網(wǎng)的傳統(tǒng)運(yùn)作方式,使數(shù)據(jù)呈現(xiàn)出“可讀、可寫及確權(quán)”的三元穩(wěn)態(tài)格局[1]。人們可以通過Web3.0技術(shù)讀取、寫入和擁有數(shù)據(jù),能夠規(guī)避版權(quán)問題或數(shù)據(jù)被篡改的風(fēng)險(xiǎn)。Web3.0的應(yīng)用主要體現(xiàn)在區(qū)塊鏈、加密貨幣、去中心化金融(Decentralized"Finance,DeFi)和"數(shù)據(jù)訪問對(duì)象(Data"Access"Objects,DAO)等領(lǐng)域[2]。
2"Web3.0與AI的關(guān)系
2.1"AI是Web3.0存在的基礎(chǔ)
Web3.0不僅代表了技術(shù)發(fā)展的最新階段,更是對(duì)未來互聯(lián)網(wǎng)生態(tài)的全新構(gòu)想。在這個(gè)體系中,人工智能技術(shù)發(fā)揮著重要作用。在Web3.0的架構(gòu)下,人工智能技術(shù)將滲透到網(wǎng)絡(luò)的各個(gè)層面。只有二者相互融合、協(xié)同發(fā)展,才能構(gòu)建出透明、安全且用戶友好的互聯(lián)網(wǎng)新世界,從而滿足人們對(duì)互聯(lián)網(wǎng)多元化、個(gè)性化的需求,推動(dòng)整個(gè)社會(huì)的數(shù)字化進(jìn)程向前邁進(jìn)一大步。
熊文等人[3]指出,國(guó)外許多科研團(tuán)隊(duì)和實(shí)踐者已經(jīng)投身于“人工智能在Web3.0中的應(yīng)用”的探索,并取得了一系列成果。結(jié)合他人的成功經(jīng)驗(yàn)和自身對(duì)Web3.0技術(shù)及AI的認(rèn)知,其提煉出了3個(gè)設(shè)想。第一,關(guān)于創(chuàng)作者經(jīng)濟(jì)領(lǐng)域AIGC引發(fā)的版權(quán)保護(hù)問題。在Web3.0的框架下,利用區(qū)塊鏈技術(shù)為AI生成的數(shù)據(jù)提供溯源功能,使AI創(chuàng)作的內(nèi)容在產(chǎn)生、使用和傳播過程中的版權(quán)歸屬和權(quán)益分配得到公正、透明且不可篡改的記錄和管理。第二,AI的自主生成能力可以應(yīng)用于開源代碼領(lǐng)域,作為非同質(zhì)化代幣(Non-Fungible"Token,NFT)的一種創(chuàng)新形式。第三,在防止Deep"Fake領(lǐng)域,其認(rèn)為AI可以通過學(xué)習(xí)真實(shí)數(shù)據(jù)的特征和模式,識(shí)別出被篡改或偽造的內(nèi)容。不過,熊文等人[3]也明確指出,上述3個(gè)設(shè)想在實(shí)際研發(fā)和應(yīng)用過程中存在諸多阻礙。但是,通過前期的嘗試和創(chuàng)新實(shí)踐,才能獲得實(shí)質(zhì)性的成果。
呂瑞娟等人[4]從概念層面分析了Web3.0與人工智能之間的內(nèi)在聯(lián)系,指出Web3.0是宏觀概念,例如:AIGC、區(qū)塊鏈、虛擬現(xiàn)實(shí)等數(shù)據(jù)驅(qū)動(dòng)的技術(shù)共同構(gòu)成了支撐Web3.0發(fā)展的技術(shù)基礎(chǔ)。Web3.0的本質(zhì)是互聯(lián)網(wǎng)的升級(jí),基于此,虛擬世界被賦予了更強(qiáng)的交互性和智能性,盡可能逼近真實(shí)世界,為了做到這一點(diǎn),需要各項(xiàng)技術(shù)的共同支持。因此,Al與Web3.0之間并非簡(jiǎn)單的應(yīng)用與被應(yīng)用關(guān)系,而是相輔相成、共生共榮的結(jié)合體。
2.2"Al可以獨(dú)立于Web3.0之外
AI是研究和模擬人類智能的行為和過程,利用計(jì)算機(jī)算法和數(shù)據(jù)處理能力,通過編程來模擬人類大腦的某些部分或整個(gè)系統(tǒng)的運(yùn)作方式,賦予機(jī)器以類似于人類的智能行為表現(xiàn)。呂瑞娟等人[4]指出,雖然Web3.0的研究必然會(huì)牽涉到強(qiáng)人工智能,但是強(qiáng)人工智能可以在與Web3.0不相關(guān)的場(chǎng)景中發(fā)揮作用。進(jìn)一步解釋道,各項(xiàng)技術(shù)的發(fā)展往往具有不同的節(jié)奏和軌跡。以區(qū)塊鏈為例,這一技術(shù)在過去幾年內(nèi)的增長(zhǎng)速度相對(duì)較緩,這主要?dú)w因于其適合在金融領(lǐng)域應(yīng)用,但金融行業(yè)的法規(guī)制度和監(jiān)管要求極為嚴(yán)格,任何創(chuàng)新技術(shù)的應(yīng)用都要經(jīng)過反復(fù)的審查和測(cè)試,這在一定程度上延緩了區(qū)塊鏈技術(shù)在金融行業(yè)大規(guī)模落地應(yīng)用的速度。每種技術(shù)都有內(nèi)在的發(fā)展規(guī)律和節(jié)奏,重要的是要尊重并順應(yīng)它的節(jié)奏。
3"去中心化內(nèi)容的生成框架和機(jī)制
3.1"系統(tǒng)模型與任務(wù)分發(fā)機(jī)制
3.1.1"AIGC任務(wù)發(fā)布
防潛保護(hù)系統(tǒng)(Anti-Submarining"Protection"System,ASPS)可以利用區(qū)塊鏈上的智能合約發(fā)布任務(wù)。此外,ASPs還會(huì)設(shè)定合理的支付價(jià)格。但是,在實(shí)際操作中,由于邊緣服務(wù)器資源的異構(gòu)性突出,導(dǎo)致ASPs難以采用一刀切的支付價(jià)格。為了解決這一問題,本文提出了一種基于博弈論的資源分配機(jī)制[3]。
3.1.3"AIGC任務(wù)推理
AIGC任務(wù)訓(xùn)練結(jié)束后,ASPs通過區(qū)塊鏈技術(shù)獲取到已訓(xùn)練完成的聯(lián)邦擴(kuò)散模型。這個(gè)聯(lián)邦擴(kuò)散模型是在分布式數(shù)據(jù)上進(jìn)行學(xué)習(xí)而得到的,它具備從海量數(shù)據(jù)中提取有價(jià)值信息的能力,一旦這個(gè)模型部署到ASPs平臺(tái)上,它就可以根據(jù)用戶的各種輸入請(qǐng)求進(jìn)行智能推理[4]。在進(jìn)行推理的過程中,模型會(huì)根據(jù)自身的算法機(jī)制從輸入的數(shù)據(jù)中識(shí)別并過濾掉噪聲,從而提煉出有價(jià)值的信息,生成內(nèi)容[4]。
3.2"去中心化內(nèi)容的生成機(jī)制
3.2.1"本地?cái)U(kuò)散模型訓(xùn)練
邊緣設(shè)備在區(qū)塊鏈網(wǎng)絡(luò)中接收到AIGC任務(wù)后,會(huì)在本地執(zhí)行數(shù)據(jù)擴(kuò)散過程。具體來說,在多個(gè)擴(kuò)散步驟t,邊緣設(shè)備會(huì)對(duì)本地?cái)?shù)據(jù)進(jìn)行高斯噪聲添加操作,每一個(gè)擴(kuò)散步驟t產(chǎn)生的數(shù)據(jù)x都是由前一個(gè)擴(kuò)散步驟t-1的數(shù)據(jù)α經(jīng)過一定的噪聲影響而得到的。噪聲是通過一個(gè)隨機(jī)函數(shù)生成的符合高斯分布的噪聲數(shù)據(jù)[5]。這個(gè)過程是遞歸且連續(xù)的,每一個(gè)步驟都依賴前一個(gè)步驟的結(jié)果,直到數(shù)據(jù)最終變?yōu)榧冊(cè)肼暎溆萌缦鹿奖硎健?/p>
3.2.3"聯(lián)邦擴(kuò)散模型推理
AIGC任務(wù)發(fā)布者得到全局聯(lián)邦擴(kuò)散模型,生成隨機(jī)噪聲z,為調(diào)節(jié)添加噪聲程度等量減少的參數(shù),并利用擴(kuò)散模型f(w)來預(yù)測(cè)添加到原始數(shù)據(jù)x0上的噪聲[6]。接著,在當(dāng)前的擴(kuò)散步驟xt上應(yīng)用預(yù)測(cè)噪聲,并通過f(w)的逆過程xt中減去預(yù)測(cè)的噪聲,從而反推出上一個(gè)擴(kuò)散步驟的樣本xt-1,直到最終還原出最初的、未受任何擴(kuò)散影響的原始數(shù)x0,表示如下。
4"實(shí)驗(yàn)結(jié)果分析
4.1"實(shí)驗(yàn)環(huán)境
本次實(shí)驗(yàn)的部署環(huán)境為Ubuntu"20.04操作系統(tǒng),硬件配置包括AMD"Ryzen"Threadripper"PRO"3975WX"32-CoreCPU和NVIDIA"RTX"A5000"GPU。在區(qū)塊鏈配置方面,采用了Go-ipfs0.4.21作為分布式存儲(chǔ)系統(tǒng),支持星際文件系統(tǒng)(InterPlanetary"File"System,IPFS)協(xié)議并可以提供應(yīng)用程序編程接口(Application"Programming"Interface,API)。同時(shí),使用了Go-ipfa-api0.3.0庫,它是基于Go語言實(shí)現(xiàn)的IPFS"API的封裝,方便人們?cè)趨^(qū)塊鏈系統(tǒng)中進(jìn)行數(shù)據(jù)操作[7]。此外,為了保障系統(tǒng)的穩(wěn)定性和兼容性,選擇了Go-lang1.17.1作為區(qū)塊鏈系統(tǒng)的開發(fā)語言環(huán)境,將Xuperchain3.10.3作為底層區(qū)塊鏈框架。在聯(lián)邦擴(kuò)散模型的學(xué)習(xí)過程,使用Python3.9.13作為編程語言,并依賴PyTorch1.13.1構(gòu)建和訓(xùn)練模型。本地訓(xùn)練階段將進(jìn)行10輪迭代,全局訓(xùn)練階段包含100輪迭代。在擴(kuò)散步驟上,設(shè)置了1"000次迭代,參與訓(xùn)練的設(shè)備數(shù)量設(shè)定為20個(gè)。在資源分配機(jī)制方面,使用Python3.9.13作為編程語言。AIGC訓(xùn)練節(jié)點(diǎn)的數(shù)量設(shè)為10個(gè),按照均勻分布隨機(jī)從di[0.8,1.2]、ci[0.4,"0.5]、fi[0.1,0.2]內(nèi)采樣。
4.2"去中心化內(nèi)容生成實(shí)驗(yàn)
對(duì)比在獨(dú)立同分布和非獨(dú)立同分布條件下聯(lián)邦擴(kuò)散模型在多個(gè)數(shù)據(jù)集上進(jìn)行全局迭代100輪后的訓(xùn)練損失值和推理結(jié)果。實(shí)驗(yàn)結(jié)果顯示,在獨(dú)立同分布的條件下,訓(xùn)練損失值更低,且生成的圖片質(zhì)量更高。這主要是由于在獨(dú)立同分布(Independent"Identically"Distribution,IID)設(shè)置中,不同設(shè)備上的數(shù)據(jù)分布保持一致,使聯(lián)邦擴(kuò)散模型在訓(xùn)練過程中能夠更好地學(xué)習(xí)和適應(yīng)全局噪聲特征,因而可以降低訓(xùn)練過程中的損失函數(shù)值。相反,在非獨(dú)立同分布的條件下,由于各個(gè)設(shè)備上的數(shù)據(jù)分布各異,聯(lián)邦擴(kuò)散模型在訓(xùn)練時(shí)會(huì)傾向于擬合本地?cái)?shù)據(jù),導(dǎo)致對(duì)其他設(shè)備數(shù)據(jù)的利用不足,在訓(xùn)練噪聲方面的學(xué)習(xí)效果受限。聯(lián)邦擴(kuò)散模型對(duì)噪聲的預(yù)測(cè)準(zhǔn)確性直接影響到推理階段的解噪聲效果,具體來講,二者呈正相關(guān)的關(guān)系。
4.3"資源分配實(shí)驗(yàn)
以訓(xùn)練節(jié)點(diǎn)數(shù)量、數(shù)據(jù)量為變量,分析其對(duì)AIGC訓(xùn)練節(jié)點(diǎn)效用和動(dòng)態(tài)服務(wù)器頁面(Active"Server"Pages,ASP)效用的影響。本次實(shí)驗(yàn)選擇的訓(xùn)練節(jié)點(diǎn)數(shù)量、數(shù)據(jù)量為[5,50|5]和數(shù)據(jù)量[0.1,1|0.1]。實(shí)驗(yàn)結(jié)果顯示,隨著訓(xùn)練節(jié)點(diǎn)數(shù)量的增加,兩種效用都呈現(xiàn)上升趨勢(shì)。這是因?yàn)橛?xùn)練節(jié)點(diǎn)數(shù)量的增加意味著計(jì)算資源的增多,這些資源可以更充分地用于模型訓(xùn)練,從而提高訓(xùn)練效率和模型性能。在資源總量增大的情況下,算法能夠更好地學(xué)習(xí)數(shù)據(jù)特征,進(jìn)而提升泛化能力和預(yù)測(cè)精度。隨著數(shù)據(jù)量的增大,兩種效用呈現(xiàn)下降的變化趨勢(shì)[7]。
5"結(jié)語
綜上所述,在AIGC服務(wù)提供商的中心化模式存在單點(diǎn)故障風(fēng)險(xiǎn)高、AIGC任務(wù)執(zhí)行的數(shù)據(jù)、資源受限等問題,對(duì)此,本文提出了基于區(qū)塊鏈和智能合約技術(shù)的去中心化任務(wù)分發(fā)機(jī)制、基于區(qū)塊鏈和聯(lián)邦擴(kuò)散模型的去中心化內(nèi)容生成機(jī)制。此外,為了激勵(lì)節(jié)點(diǎn)積極參與AIGC任務(wù),本文還設(shè)計(jì)了基于博弈的資源分配機(jī)制。在未來的研究中,我們應(yīng)該繼續(xù)研究如何在Web3.0環(huán)境下實(shí)現(xiàn)多技術(shù)的深度融合與性能優(yōu)化,以充分發(fā)揮Web3.0的技術(shù)優(yōu)勢(shì)。
參考文獻(xiàn)
[1]"于千雯,王木亮,高玉潔,等.從PGC到AIGC:科技期刊內(nèi)容轉(zhuǎn)向、價(jià)值審視與應(yīng)對(duì)策略:基于學(xué)術(shù)期刊編輯視角[J].編輯學(xué)報(bào),2023,35(S2):161-164.
[2]"劉騰飛,郭洋,王菁菁.歐盟發(fā)布Web4.0和虛擬世界的倡議對(duì)我國(guó)的戰(zhàn)略啟示[J].新經(jīng)濟(jì)導(dǎo)刊,2023(7):73-78.
[3]"熊文,王岳華,孫翊.企業(yè)技術(shù)創(chuàng)新合作網(wǎng)絡(luò)的結(jié)構(gòu)及其演化:中國(guó)制造業(yè)國(guó)家標(biāo)準(zhǔn)研制的視角[J].標(biāo)準(zhǔn)科學(xué),2023(1):6-17.
[4]"呂瑞娟,張靜蓓,嚴(yán)丹,等.AIGC與GLAM創(chuàng)新發(fā)展綜述:基于“生成未來·AIGC與GLAM創(chuàng)新發(fā)展”前沿學(xué)術(shù)論壇[J].農(nóng)業(yè)圖書情報(bào)學(xué)報(bào),2023,35(5):27-36.
[5]"張春春,孫瑞英.如何走出AIGC的“科林格里奇困境”:全流程動(dòng)態(tài)數(shù)據(jù)合規(guī)治理[J].圖書情報(bào)知識(shí),2024,42(2):39-49,66.
[6]"于海林,王言偉.轉(zhuǎn)爐煙道氧槍口結(jié)構(gòu)改進(jìn)及應(yīng)用[J].工業(yè)加熱,"2023,52(10):22-24.
[7]"陳建兵,王明.負(fù)責(zé)任的人工智能:技術(shù)倫理危機(jī)下AIGC的治理基點(diǎn)[J].西安交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2024,44(1):111-120.