張恒志 李曉明
(太原科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 太原 030024)
圖像修復(fù)[1],又叫做inpainting,是由圖像的已知區(qū)域來(lái)推斷生成未知區(qū)域,未知區(qū)域處于圖像的內(nèi)部。現(xiàn)在絕大數(shù)的研究都是在人臉、街景、風(fēng)景圖等這種具有明顯的結(jié)構(gòu)和顏色區(qū)分的圖片上進(jìn)行的。本文首次提出了在海底圖像上進(jìn)行圖像修復(fù)工作,海底圖像整體顏色偏暗,而且在拍攝過(guò)程中還會(huì)造成光照不一致,所以對(duì)這類圖片的研究具有很大的價(jià)值。

圖1 海底圖像與現(xiàn)有數(shù)據(jù)集圖像的對(duì)比
現(xiàn)有圖像修復(fù)的方法主要分為傳統(tǒng)方法和基于深度學(xué)習(xí)的方法。傳統(tǒng)的方法主要又分為基于補(bǔ)丁[2~3]的方法和基于擴(kuò)散[4~5]的方法。基于補(bǔ)丁的方法是通過(guò)在圖像的已知區(qū)域中來(lái)進(jìn)行搜索找到匹配良好的候選塊。基于補(bǔ)丁的方法會(huì)使用已知區(qū)域的圖像塊信息來(lái)填充未知區(qū)域,而且需要很高的計(jì)算代價(jià)。PatchMatch[6]方法通過(guò)使用快速最近鄰場(chǎng)來(lái)解決這個(gè)問(wèn)題,但基于補(bǔ)丁的方法在重建未知區(qū)域的細(xì)節(jié)方面做的很差。基于擴(kuò)散的方法是利用未知區(qū)域的輪廓信息,確定擴(kuò)散的方向,向輪廓內(nèi)擴(kuò)散已知的信息。但是該方法在未知區(qū)域比較大時(shí)(如64*64,128*128 的矩形塊)或紋理結(jié)構(gòu)復(fù)雜時(shí),會(huì)存在生成區(qū)域模糊和結(jié)構(gòu)不一致的問(wèn)題。
最早的基于深度學(xué)習(xí)的方法之一是上下文編碼器[7],通過(guò)使用編碼器-解碼器結(jié)構(gòu)。編碼器具有將缺失區(qū)域的圖像映射到低維特征空間,并通過(guò)解碼器來(lái)構(gòu)建輸出的圖像。……