徐 文,楊曉梅,徐秋怡,田巧玉,劉 凱
(1.四川大學錦江學院 電氣與電子信息工程學院,四川 眉山 620860; 2.四川大學 電氣工程學院,成都610207;3.中央民族大學 信息工程學院,北京100081)
大數據信息時代,超分辨率圖像重建技術通過軟件編程的方式來提高圖像的分辨率,在沒有替換原有的成像設備前提下,從包含不同細節的低分辨圖像中采集有用信息融合成一幅高分辨圖像。其技術主要的思想是用同一場景的圖像序列的時間分辨率來換取更高的一個空間分辨率[1]。通過超分辨重建的方法處理視頻圖像就是從多個低分辨率圖像中連續幀之間的相關聯系來得到原始圖像中高分辨圖像的相關信息,獲得更清晰、分辨率更高、內容信息更加豐富的圖像視頻信息。超分辨率圖像和視頻重建在監控設備、衛星圖像和醫學影像等領域都有重要的應用價值。
20世紀80年代,Tsai和 Huang[2]首先發現了基于序列或多幀圖像的超分辨率重建問題,他們通過實驗分析且證明了從互相平移得到的圖像序列中能夠獲取到分辨率更高的靜態圖像,并且給出了在從時域轉換到頻域里解決問題的方法。近年來,壓縮感知增強技術和超分辨率圖像復原技術為圖像復原的研究注入了新的力量[3-9]。人工智能中深度學習的發展,突破了圖像的分割和分類的傳統技術,特別是基于卷積神經網絡(Convolutional Neural Network,CNN)的單幅圖像重建(Super-Resolution CNN,SRCNN)[10]算法能夠快速重建高分辨率的圖像。但SRCNN算法對網絡參數敏感,要求訓練參數稠密,減緩了訓練速度,對細節恢復效果欠佳。VDSR(Accurate Image Super-Resolution Using Very Deep Convolutional Networks)[11]算法提出只針對殘差進行訓練,減輕了網絡的負擔,又加速了學習速率。再之后的SRGAN(Super-Resolution GAN)[12]等算法將生成式對抗網絡(Generative Adversarial Network,GAN)用于SR問題,提升重建圖片的真實感。
從數學角度看,超分辨率重建是一個典型的病態不適應問題[13]。 對于不適應問題,正則化的求解方法是非常有效的。正則化的方法為保證求解過程的穩定性,通過加入性質不同的先驗信息來約束重建過程,從而將超分辨率圖像重建由病態轉為良態問題。相對于深度學習圖像處理問題,基于三層神經網絡SRCNN算法雖然通過使用較大的卷積核可以減少計算量,但卷積計算時大量丟失高頻信息,對于紋理的處理仍然出現過平滑,特征的提取不夠準確,重建質量受到影響。SRGAN算法能提升高頻圖像真實感,但仍存在放大細節部分的像素塊模糊[12]。 考慮到此類模型訓練的數據量龐大與研究設備費用高昂問題,本文仍堅持以傳統非深度學習的方法為研究重點,探討正則項的選取對于圖像高頻紋理細節重建保持問題,分析超分辨率圖像重建的過平滑現象根源,改善圖像重建質量。
本文提出基于傳統的全變分正則化(Total Variation,TV)模型引入了交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)[14]。 ADMM重建算法將有約束的問題轉化為無約束的問題,在求解模型中某一個變量的同時固定另一個變量,通過固定迭代的方式更新模型中的每一個變量達到求解目的。針對TV-ADMM重建效果中出現的問題,本文引入分數階全變分(Fractional Order Total Variation,FOTV)正則項約束的模型,同樣使用ADMM算法進行求解,改善超分辨率圖像重建效果。
ADMM算法是專門用于解決可分離凸規劃問題而被提出的一種方法,適用于各類優化問題。ADMM算法一般解決的問題形式如下[14]:
minf(x)+g(z)
(1)
s.t.A(x)+B(z)=C。
(2)
式中:x∈n,z∈m,A∈p×n,B∈p×m,C∈p,p、m、n分別為空間的維度;f(x)和g(z)表示的是凸函數;增廣拉格朗日(Lagrangian)函數用于求解凸優化問題,
Lρ(x,z,λ)=f(x)+g(z)+λT(Ax+Bz-C)+

(3)
式中:λ為Lagrangian 乘子,ρ>0為懲罰參數。
ADMM算法的迭代步驟如下:
xk+1=arg minxLρ(x,zk,λk) ,
(4)
zk+1=arg minzLρ(xk+1,z,λk),
(5)
λk+1=λk+ρ(Axk+1+Bzk+1-C) 。
(6)
式中:ρ>0是懲罰參數。ADMM迭代算法包括x、z變量極小化和一個對偶變量的迭代。為方便計算,將ADMM算法迭代步驟等價為下列式子,定義參量
r=Ax+Bz-C,
(7)
計算得到

(8)

(9)
(10)
uk+1=uk-Axk+1+Bzk+1-C。
(11)
乘子法和ADMM乘子法類似,把x、z兩個變量一起求解,而ADMM是將目標函數分離求解,和Gauss-Seidel方法迭代一步類似。和乘子法相似,只是用zk+1最小化式子:
(12)
其中用到了對偶式子

(13)
ADMM算法的有效性主要由選取的拉格朗日(Lagrange)乘子決定,可以從算法的收斂性分析中得出。
超分辨率圖像退化模型表示為[15]
Y=DHMu+n。
(14)
式中:u為高清圖像,Y為低分辨率圖像,D為下采樣因子,H為模糊因子,M為運動因子,n為隨機噪聲,μ為正則化參數,本文中沒有移位變換所以M不考慮為1。基于TV全變分約束的正則化圖像重建模型描述為以下形式:
(15)
模型由保真項和正則項組成,其中正則項φ(u)=TV(u)為全變分[16]可以表示為圖像像素離散梯度之和,即離散梯度的l1范數形式:
(16)

(17)
(18)
超分辨率圖像重建問題(15)是病態的逆問題,ADMM算法通過引入變量d替換原模型中的不可微項φ(u),可以得到與其等價的約束優化問題:
(19)
對于約束優化問題,其增廣拉格朗日乘子函數

(20)
式中:<>表示內積。從而將式(20)轉換為兩個子問題m、n。
(1)子問題m:固定u求d
(21)
子問題m可以通過收縮閾值方法求解:
(22)

(23)
(2)子問題n:固定d求u


(24)
問題(24)等價于
(25)
本文中φ(u)=u為正則項,其中Y是輸入的低分辨圖像。用快速傅里葉變換處理公式(25),得
μHTDT(DHu-T)+λT+βTu-βTd=0,
(26)
(27)
更新
λk+1=λ-γβ(dk+1-u) ,
(28)
Yk+1=Yk+(Y-DHuk+1) 。
(29)
L曲線是以(‖Axμ-b‖2,‖xμ‖2)為坐標所構成的一條單調遞減曲線,該項對應于本文模型(15)中的‖Y-DHu‖,這些點與正則化參數呈一一對應的關系。圖1為Tikhonov正則化的L曲線[17],其中圓圈表示TGSVD正則化的L曲線。

圖1 Tikhonov正則化的L曲線
‖Axμ-b‖2為殘差項,‖Lxμ‖2為正則化解,對于L曲線法來說,作為基本問題需要同時考慮到正則化解和殘差項。圖1中L曲線水平部分與垂直部分的相交處作為正則化最優參數解。由于正則化參數過大會引起正則化誤差主導水平位置對應的正則化解,過小則會使垂直部分對應的正則化解主要受到b中的誤差影響,而在相交處,均衡了都較小的一個,因此這個相交點就對應了一個最優的正則化參數。所以采用L曲線法,實際上就是為了求出曲線相交處的位置。
自適應的離散L曲線算法的關鍵之處就是適量的移除曲線上的點,來盡可能快速地找到該曲線的相交處。自適應算法的流程如下:
Step1 初始化處理,將所有殘差項和正則化解為0的點進行移除。
Step2 選出所有的轉折點。
Step3 選出真正的相交處。
本文基于L曲線曲率最大的規則即曲線是二次可微的,求解最大曲率點K(μ):
(30)
式中:ρ=‖Axu-b‖2,η=‖xμ‖2,ρ′表示的是對μ求導。但如果采用的正則化方法求得的正則化參數是非連續變動的,則該曲線不可微,所以不能直接求出曲率,需要利用一條曲線去擬合這些離散點去選取正則化參數,接著再尋找相交處的位置,然后從離散點中選擇離擬合曲線相交處最近的點,這個點就是最佳正則化參數。
分數階理論中出現了不同定義的分數階函數,利用其中的Grümwald-Letnikov(G-L)定義構造分數階梯度算子。一般意義下的二次項系數定義為
(31)
式中:
(32)

(33)

(34)

(35)
(36)
分數階可以表示為

(37)