999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

細觀Diffusion隱空間里UNet的訓練流程(一)

2023-08-22 19:39:59高煥堂
電子產品世界 2023年8期
關鍵詞:模型

高煥堂

在上一期里,您已經領會Encoder 和Decoder 兩者的涵意和功能了。請您看看圖1 里,在兩者之間有個空間,通稱為:隱空間(latent space)。

本期以SD(Stable Diffusion) 模型為例,來欣賞其隱空間里的架構之美。由于Diffusion 隱空間里的主角是:UNet 模型。于是,先來細觀Diffusion 隱空間里UNet模型的訓練流程。

1 簡介UNet模型

在本專欄里,曾經詳細介紹過AE(autoencoder),相信您對AE 已經很熟悉了, 不再重復介紹AE模型。

UNet 是AE模型的延伸型式。由于典型AE 模型的特性是: 其前段的Encoder( 編碼器) 是特征提取的過程, 會過濾掉一些信息。這些被過濾掉的信息, 就沒有辦法傳遞到后段的Decoder( 解碼器) 了。

于是,UNet 就來延伸AE 模型,將原有的Encoder與Decoder 之間增加了一些連結,例如Encoder 的每一層輸出都與對映層級的譯碼器連接。因此使得編碼器每一層的信息,額外輸入到譯碼器的對映層,讓Decoder在重建的過程中,比較不會遺失掉重要的信息了。而Unet 模型的架構如其名呈現一個U 字形( 圖2)。

如此,UNet 使用對映層級的連接來保留小且精細尺度的特征。

2 Diffusion隱空間里的UNet角色

在AIGC 潮流中,SD(Stable Diffusion) 產品的推出是AIGC 圖像生成發展歷程中的一個里程碑,提供了高性能模型,能快速生成創意十足的圖像( 圖3)。

SD 提供兩項主要功能:輸入文本(Text) 提示來生成圖像( 即text2img);輸入圖像,然后根據文本描述來修改圖像( 即輸入text + img)。在SD 隱空間里,UNet 扮演關鍵性角色( 圖4)。

在SD 隱空間里, 使用了1 個UNet 模型, 并搭配1 個時間調度(scheduling) 器,來擔任圖像生成的核心任務。擴散(diffusion) 一詞描述了SD 隱空間里進行的圖像生成情形,整個過程都是在隱空間里逐步推進(stepby step) 的,每一步都會增加更多的噪音(noise)。例如,我們準備了一張圖像,接著產生隨機噪音加入到圖像中,然后將這含有噪音的圖像輸入給UNet,讓它來預測噪音。

為了加速圖像的生成效率,SD 使用VAE 的Encoder 先將原圖像壓縮為4×64×64型式的隱空間數組(array),然后才展開上述的擴散、生成過程。換句話說,整個擴散過程都是在隱空間里進行的。

3 認識噪音(Noise)

剛才提到了,我們將隨機噪音添加到原圖像里,成為含噪音圖像(noisyimage)。然后把它輸入給UNet 模型,讓它預測出此圖像所含的噪音。在SD里,使用數學運算,根據時間步數(timestep) 來決定將多少噪音量添加到原圖像里( 圖5)。

圖4 里的step-1 是: 準備1 張原圖像, 并使用VAE 的Encoder 將原圖壓縮為4x64x64 型式的數組。接著,step-2 是:產生1 張也是4x64x64 型式的隨機噪音數組;step-3 是:選取1 個隨機整數( 如圖里的0~3),即是時間步數(time step),并由此整數( 即時間步數)來決定欲添加的噪音量;step-4 是:將所決定的噪音量實際添加到原圖像的壓縮數組里,就成為含有噪音的圖像了。

4 訓練UNet模型

4.1 輸入1張訓練圖像

剛才提到:我們會根據時間步數(time step) 來計算出多少噪音量將添加到原圖像里。也就是,我們掌握了兩項數據:含噪音的圖像(noisy image) 數組;時間步數(time step)。我們就把這兩項數據輸入給UNet 模型,來訓練它,讓它學習預測所添加的噪音,所以它輸出是:預測噪音(predicted noise)。在訓練過程中,希望它輸出的預測噪音愈接近所添加的噪音就愈好,也就是預測誤差值(loss) 愈小愈好( 圖6)。

4.2 訓練很多回合

在實際訓練UNet模型時,把全部圖像的壓縮數組都輸入給UNet,讓它學習一遍,通稱為:訓練1 回合(epoch)。在每一回合里,都會為每一張圖像搭配1 個隨機整數( 即時間步數) 值。并根據時間步數值來計算出噪音量,于是得到兩項數據:含噪音的圖像數組和時間步數。然后,把這兩項數據輸入給UNet 模型,來訓練它,讓它學習預測噪音( 圖7)。

上述SD 的UNet 訓練方法比較特殊之處是:這UNet的功能是輸出是噪音,而不是去除噪音。

5 結束語

本期說明了SD 隱空間里UNet 模型的角色及其訓練步流程的起步。下一期,將繼續介紹及欣賞SD 隱空間的架構之美,也領會AIGC 生成藝術的源點。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 四虎永久在线精品国产免费| 午夜啪啪福利| 亚洲Av综合日韩精品久久久| 亚洲一区二区三区在线视频| 国产色爱av资源综合区| 久久99国产精品成人欧美| 99久久亚洲精品影院| 91无码网站| 免费精品一区二区h| 国产精品久久久久久搜索| 国产成人精品一区二区不卡| 亚洲男人天堂2020| 国产一级裸网站| 国产人前露出系列视频| 青青草综合网| 亚洲无码熟妇人妻AV在线| 午夜成人在线视频| 色丁丁毛片在线观看| 精品国产免费观看一区| 久久久久久久久18禁秘| 欧美α片免费观看| 88国产经典欧美一区二区三区| 国产成人区在线观看视频| 国产视频入口| 国产成人综合久久精品下载| 亚洲一区毛片| 国产v精品成人免费视频71pao| 中文字幕波多野不卡一区| 亚洲欧美成人网| 欧美黄网站免费观看| 欧美成人亚洲综合精品欧美激情| 国产熟睡乱子伦视频网站| 999精品免费视频| 精品国产Av电影无码久久久| 欧美午夜在线视频| www成人国产在线观看网站| 亚洲成人动漫在线观看| 亚洲视频无码| 韩日无码在线不卡| 亚洲第一色网站| 久久国产高清视频| 久久77777| 欧美亚洲一二三区| 日本AⅤ精品一区二区三区日| 日韩毛片基地| 久久久久青草大香线综合精品| 无码专区在线观看| 国产喷水视频| 日韩无码视频播放| 亚洲天堂网视频| 国产免费黄| 波多野结衣中文字幕一区二区| 国产欧美视频在线| 中文字幕在线日韩91| 综合网久久| 欧美精品v日韩精品v国产精品| 国产欧美日韩视频一区二区三区| 538精品在线观看| 国产精品999在线| 亚洲精品无码日韩国产不卡| 极品尤物av美乳在线观看| 99热6这里只有精品| 国产97公开成人免费视频| 亚洲无限乱码一二三四区| 亚洲αv毛片| 中文字幕中文字字幕码一二区| 国产成人盗摄精品| 乱人伦视频中文字幕在线| 成人福利一区二区视频在线| 波多野结衣在线一区二区| 国产一级精品毛片基地| 尤物精品视频一区二区三区| 国产精品成人AⅤ在线一二三四 | 超碰aⅴ人人做人人爽欧美| 在线观看免费人成视频色快速| 欧美精品亚洲日韩a| 婷婷综合在线观看丁香| 国内精自线i品一区202| 国产激情无码一区二区免费 | 国产在线精品99一区不卡| 久久毛片基地| 欧洲免费精品视频在线|