中圖分類號:J5 文獻標(biāo)識碼:A 文章編號:1004-9436(2025)16-0238-03
0引言
近年來,生成式人工智能(AIGC)在視覺藝術(shù)、影像創(chuàng)作及沉浸式體驗等領(lǐng)域得到深入應(yīng)用,推動藝術(shù)創(chuàng)作從單一媒介邁向跨模態(tài)融合。在交互藝術(shù)裝置實踐中,AIGC可生成批量素材、遷移風(fēng)格與合成動態(tài)內(nèi)容,為視覺與交互整合帶來新的可能。然而,在現(xiàn)有創(chuàng)作流程中,這一潛力尚未得到充分發(fā)揮。現(xiàn)有流程多將圖像制作、交互腳本與硬件部署分割為相對獨立的環(huán)節(jié),人工推進導(dǎo)致銜接遲滯、周期延長且視覺與交互難以匹配。團隊在近三年的實踐中發(fā)現(xiàn),視覺迭代與邏輯調(diào)試的重復(fù)性工作占據(jù)較大比重。
從國際研究看,ACMCHI、SIGGRAPH等會議及DigitalCreativity等期刊已有學(xué)者嘗試將AIGC融人交互裝置與沉浸式媒體創(chuàng)作[1],但多集中于單一環(huán)節(jié),或?qū)W⒁曈X輸出,或聚焦動畫渲染,或單獨探討互動方式,缺乏從需求到設(shè)計的全流程整合,難形成可借鑒經(jīng)驗。國內(nèi)研究多圍繞課堂教學(xué)或成果展示,側(cè)重素材生成與風(fēng)格控制,對多模態(tài)生成與實時交互系統(tǒng)的整體探討較少。總體而言,國內(nèi)外研究雖已起步,但在全鏈路整合、跨環(huán)節(jié)協(xié)同及復(fù)用方面仍有較大提升空間。因此,如何使AIGC潛能充分對接交互裝置的多感官需求,并在統(tǒng)一框架內(nèi)實現(xiàn)持續(xù)迭代,已成為亟待突破的核心議題。
本文提出AIGC賦能的“三階九步”創(chuàng)作流程模型,以“提示詞驅(qū)動一多工具協(xié)同一跨場景測試”為核心,貫通需求剖析、內(nèi)容產(chǎn)出與系統(tǒng)整合,旨在提高視覺與交互的一致性及軟硬件適配效率。流程為“需求解析一內(nèi)容生成一系統(tǒng)集成”,體現(xiàn)了交互裝置由創(chuàng)意到落地的漸進規(guī)律。正如王羽所言,數(shù)字媒體藝術(shù)創(chuàng)作路徑應(yīng)具備階段性與系統(tǒng)化特征,以確保創(chuàng)意到落地的連貫性[2]。本文以“脆弱性與內(nèi)心修復(fù)”主題裝置為例,驗證模型在多模態(tài)與實時交互融合中的可行性,并探討其在跨領(lǐng)域藝術(shù)與教育中的推廣潛力。
1AIGC賦能的創(chuàng)作流程模型
1.1模型概述
“三階九步”創(chuàng)作流程模型包含主題定位、受眾分析、技術(shù)評估、提示詞設(shè)計、多模態(tài)生成、結(jié)果優(yōu)化、交互邏輯構(gòu)建、硬件適配、跨場景測試九個環(huán)節(jié)。模型通過提示詞驅(qū)動的人機協(xié)同機制,將創(chuàng)意意圖轉(zhuǎn)化為多模態(tài)輸出,保持視覺與交互的一致性,并提高軟硬件的匹配效率。其構(gòu)建思路借鑒了唐納德·諾曼在《情感化設(shè)計》中提出的“本能層一行為層一反思層”理論,將生成工具作為連接“藝術(shù)意圖”(反思層)與“交互體驗”(行為層)的中介,使情緒符號能夠轉(zhuǎn)化為可感知的沉浸場景。例如,用“破碎鏡面”紋理對應(yīng)“脆弱性”情緒,并結(jié)合人工審美與生成工具,實現(xiàn)抽象情緒的可視化呈現(xiàn)與整體風(fēng)格的統(tǒng)一。
1.2模型整體流程
在創(chuàng)意規(guī)劃階段,創(chuàng)作者以主題為驅(qū)動,通過用戶調(diào)研與場景分析明確情感敘事主線。生成工具可快速生成多風(fēng)格的概念草圖與情緒板,完成創(chuàng)意發(fā)散與方向聚合。這一階段,人工審美與機器生成結(jié)合,確保審美取向與主題表達(dá)一致。馮穎瑜與趙軍指出,使用StableDiffusion等工具的圖像生成功能,能夠讓創(chuàng)作者在短時間內(nèi)獲得多樣化的參考,提高創(chuàng)意探索的效率與針對性[3]。
在生產(chǎn)生成階段,視覺元素與動態(tài)影像在同一創(chuàng)作鏈路整合。創(chuàng)作者在鎖定風(fēng)格的同時,將聲音、光影、粒子等素材并置,經(jīng)過多輪篩選與微調(diào),保持整體的情緒張力與細(xì)節(jié)品質(zhì)。何俊欽與劉欣悅在研究中強調(diào),融合媒介影像裝置的創(chuàng)作需要在視覺風(fēng)格與交互邏輯之間建立連貫關(guān)系,為本階段素材整合與敘事統(tǒng)一提供參考[4]。
在系統(tǒng)集成階段,創(chuàng)作重心轉(zhuǎn)向視覺輸出與交互硬件的協(xié)調(diào)。觀眾的行為被實時映射至影像反饋中,如靠近裝置時,畫面由“破碎”過渡到“修復(fù)”,形成漸進的情緒反應(yīng)。王普指出,人工智能可在影像裝置中強化感官反饋與情感表達(dá),使硬件與視覺內(nèi)容體驗一致,這與本階段對穩(wěn)定性和沉浸感的追求相契合[5]。
2模型驗證與案例實踐
2.1案例選題依據(jù)與實踐條件
本研究選取“脆弱性與內(nèi)心修復(fù)”作為模型驗證主題,旨在探討情緒狀態(tài)在交互藝術(shù)裝置中的多模態(tài)表達(dá)及其對沉浸體驗的影響。該主題基于藝術(shù)心理學(xué)與情緒交互設(shè)計理論:脆弱性常伴隨不安全感、創(chuàng)傷記憶與自我防御反應(yīng),而“內(nèi)心修復(fù)”通過情感體驗重建自我認(rèn)同與安全感。交互裝置既需精準(zhǔn)傳遞情緒張力,又要利用多感官營造沉浸氛圍,增強代入感。國際上已有以創(chuàng)傷療愈為核心的互動裝置,如TeamLab沉浸式花海,通過動態(tài)生成與實時交互展現(xiàn)生命循環(huán)。但此類作品多依賴手工建模,制作周期長、協(xié)作復(fù)雜。而本流程依托多模態(tài)生成與人機協(xié)同,其能縮短素材生產(chǎn)與調(diào)試時間,并在風(fēng)格控制與邏輯協(xié)調(diào)方面提供可復(fù)用路徑。
本案例實際部署于半封閉展廳,以穩(wěn)定光照與聲學(xué)條件。現(xiàn)場光照經(jīng)過優(yōu)化調(diào)控,保證投影亮度并減少強光干擾。感應(yīng)系統(tǒng)采用雙冗余紅外矩陣與光照補償算法,實現(xiàn)對觀眾位置與動作的實時捕捉和影像觸發(fā)。當(dāng)觀眾接近裝置時,畫面由“破碎”過渡到“修復(fù)”,形成漸進情緒鏈路。該條件為多模態(tài)交互奠定了技術(shù)基礎(chǔ),亦便于檢驗?zāi)P驮诳缒B(tài)生成、一致性控制及軟硬件協(xié)同上的表現(xiàn)。
2.2裝置構(gòu)建與流程應(yīng)用
為驗證模型在真實創(chuàng)作場景中的表現(xiàn),團隊依照“三階九步”流程,構(gòu)建一套融合視覺生成、動態(tài)投影與交互感應(yīng)的沉浸式裝置。在視覺呈現(xiàn)環(huán)節(jié),采用固定分辨率與隨機種子策略,確保色調(diào)、構(gòu)圖、紋理一致,并借助情緒交互模型將視覺符號對應(yīng)至情感意圖。基于沉浸體驗的連貫性需求,在動態(tài)生成與投影中引人關(guān)鍵幀補間,使動畫流暢度與情緒遞進曲線直接關(guān)聯(lián),保證交互穩(wěn)定性及敘事流暢性。
表1裝置核心參數(shù)

(測試環(huán)境:室內(nèi)自然光,光照強度 200-300lux )
裝置核心參數(shù)見表1,這些數(shù)據(jù)反映了生成策略與硬件優(yōu)化的對應(yīng)關(guān)系,并體現(xiàn)了保障交互穩(wěn)定性的措施。
2.3實踐效果與用戶反饋
為綜合評估模型的效率與表達(dá)成效,本研究對比了AIGC流程與傳統(tǒng)流程:傳統(tǒng)流程數(shù)據(jù)取自團隊2023一2024年三項同類裝置的平均值,AIGC流程數(shù)據(jù)則取自本次案例實測結(jié)果。
案例整體開發(fā)周期縮短約 43.4% ,各環(huán)節(jié)縮短比例見表2。
表2AIGC與傳統(tǒng)流程效率對比

在主觀評估中,5名有相關(guān)體驗背景的數(shù)字媒體藝術(shù)專業(yè)學(xué)生參與測試。評分維度包括主題傳達(dá)、視覺風(fēng)格、交互流暢度和藝術(shù)契合度。結(jié)果如下:主題傳達(dá)中, 85% 受試者評分 ?4 分;視覺風(fēng)格平均滿意度4.4分,交互流暢度4.2分。近八成參與者認(rèn)為“破碎一修復(fù)”動態(tài)符號與主題契合,低飽和色彩與裂紋紋理增強了代入感。部分建議增加分層聲場或觸覺反饋以提升沉浸深度。
結(jié)果表明,“三階九步”模型在本案例中具有顯著效率優(yōu)勢、良好的視覺一致性,并在交互穩(wěn)定性方面表現(xiàn)出高可靠性。
3模型局限與優(yōu)化建議
在本案例實踐中,“三階九步”模型雖在效率提高與藝術(shù)表達(dá)一致性上表現(xiàn)突出,但仍存在一定局限性。首先,在多輪提示詞生成過程中,部分圖像出現(xiàn)色彩飽和度波動及紋理細(xì)節(jié)缺失的情況,需人工篩選與修正,增加了批量生成的時間成本。其次,不同投影設(shè)備和播放系統(tǒng)在素材格式與分辨率兼容性上差異較大,導(dǎo)致跨設(shè)備適配過程復(fù)雜。最后,部分感應(yīng)設(shè)備在光照變化大時識別精度下降,影響了交互穩(wěn)定性與流暢度。
針對上述問題,可從算法、流程和硬件三方面進行優(yōu)化。在生成環(huán)節(jié),可開發(fā)基于色彩直方圖與紋理特征分析的自動篩選算法,檢測批量生成結(jié)果的色彩一致性與細(xì)節(jié)完整度,減少人工篩選量;在適配環(huán)節(jié),可建立統(tǒng)一的多分辨率自動導(dǎo)出模板,結(jié)合批處理腳本實現(xiàn)不同設(shè)備的一鍵適配;在交互硬件環(huán)節(jié),可引入雙波段紅外傳感器與動態(tài)光照補償算法,以降低強光干擾的誤觸率并保持響應(yīng)。
4結(jié)語
本研究以“脆弱性與內(nèi)心修復(fù)”為主題,提出并驗證了AIGC賦能的“三階九步”交互裝置創(chuàng)作流程模型,其在多模態(tài)生成與實時交互融合中展現(xiàn)出良好的整合能力與協(xié)作效率,有效解決了傳統(tǒng)流程中視覺與交互脫節(jié)、軟硬件適配效率低等問題,為交互裝置的系統(tǒng)化設(shè)計與流程優(yōu)化提供了可行路徑。與傳統(tǒng)模式相比,該模型在多環(huán)節(jié)協(xié)同與風(fēng)格一致性把控方面形成了可操作的方法,兼顧藝術(shù)表現(xiàn)與技術(shù)實現(xiàn)。
在教學(xué)實踐中,該模型已在鄭州西亞斯學(xué)院數(shù)字媒體藝術(shù)課程試點應(yīng)用,顯著降低學(xué)生技術(shù)門檻,使其在有限課時內(nèi)完成從概念到落地的全過程,作品完成率提升約 35% ,同時提升了自主探索與跨媒介整合能力。
未來研究可融合智能感知、生成式音效、實時渲染等新興技術(shù),提升交互藝術(shù)裝置的沉浸感、參與度與情感共鳴,并在更大規(guī)模、不同文化背景和多樣化場景中驗證普適性與穩(wěn)定性。隨著人工智能、混合現(xiàn)實與多模態(tài)計算的發(fā)展,藝術(shù)與科技的邊界將愈加模糊,創(chuàng)作者可在跨媒介協(xié)作環(huán)境中快速迭代,實現(xiàn)從個人創(chuàng)意到公共體驗的平滑轉(zhuǎn)化。這一趨勢有望拓展交互藝術(shù)在展覽、公共空間及數(shù)字遺產(chǎn)保護等領(lǐng)域的應(yīng)用,并推動面向教育、療愈及社會議題表達(dá)的新型創(chuàng)作模式,為藝術(shù)與科技的深度融合提供持續(xù)動力。
參考文獻:
[1]Li J, Sun G, Tang C,et al. Silk Road Journey:A Real-timeAI-basedInteractiveArtInstallationforSilkRoadCulturalReenactmentandExperienceC」//ExtendedAbstractsof the2024ACM CHI Conference on Human Factors in ComputingSystems.New York:Association for Computing Machinery,2024:1-5.
[2]王羽.AIGC技術(shù)賦能下的數(shù)字媒體藝術(shù)人才培養(yǎng)模式探究[J].新美域,2024(12):146-148.
[3]馮穎瑜,趙軍.基于人工智能(AI)繪畫在動畫課程中的教學(xué)改革探索:以StableDiffusion為例[J].新美域,2025(2):167-169.
[4]何俊欽,劉欣悅.基于數(shù)字媒體藝術(shù)的融合媒介影像交互裝置設(shè)計[J].絲網(wǎng)印刷,2023(22):83-85.
[5」王普.人工智能技術(shù)在影像裝置藝術(shù)設(shè)計中的應(yīng)用與實踐探索[J].鞋類工藝與設(shè)計,2025,5(9):84-86.