席亮
(上海開放大學普陀分校信息工程系 上海市 200062)
近年來量子信息處理技術得到了較多關注,將量子力學理論中的假設和基本思想作為一種數學工具,引入到經典計算機中與現有算法相結合,可在特定領域中提供一種嶄新的解決方案,稱之為量子衍生算法。例如文獻[1]提出了量子衍生神經網絡、文獻[2]介紹了量子遺傳算法。Eldar 等率先提出了量子衍生信號處理算法[3],Tseng 等將量子衍生理論用于數字圖像處理領域,設計了圖像邊緣檢測、圖像加密等量子衍生圖像處理算法[4]。文獻[5]-[6]介紹了用量子比特來表示數字圖像的方法,并基于此設計了量子衍生自適應中值濾波和圖像邊緣檢測等算法,本文作者在文獻[7]-[9]中實現了量子衍生圖像融合以及量子半色調算法。
圖像分割是數字圖像處理學科研究的一個重要問題,目前圖像分割技術被廣泛應用于衛星遙感圖[10]、醫學影像分析[11]、道路交通監控等領域。基于圖論的圖像分割方法是近年來圖像分割領域研究的熱點,基本思想是把數字圖像轉化為圖,然后用圖的最小割算法實現圖像的分割。Boykov 等人提出了著名的圖割算法(GraphCut)[12],Rother 等人對GraphCut 算法做出改進,提出了GrabCut 算法[13],取得了較好的分割效果。本文基于量子衍生圖像處理方法和Grabcut 算法,設計了一種新的圖像分割方法,仿真實驗表明該方法在沒有人工控制的情況下,能夠實現圖像的有效分割,且耗時較少。
傳統的計算機是建立在比特的概念之上,每一個比特位都處于0 或1 的狀態,量子計算則是建立在量子比特概念之上。量子比特也是一個狀態,但它是由兩個基態|0〉和|1〉的線性組合構成,可稱之為量子線性疊加態。一個量子比特|ψ〉可表示為如下形式,其中|〉稱為狄拉克符號:

式(1)中的a 和b 是兩個復數,分別是基態|0〉和|1〉的概率幅。如果對量子比特|ψ〉進行測量,那么得到狀態|0〉的概率為|a|2,得到狀態|1〉的概率為|b|2,并且滿足歸一化|a|2+|b|2=1。
可以用如下方法將數字圖像表示成量子比特的形式:先將一幅灰度圖像f(m,n)做歸一化處理,f(m,n)∈[0,1]表示圖像在(m,n)處的灰度值,假設f(m,n)為點(m,n)處灰度值為1 的概率,1-f(m,n)為點(m,n)處灰度值為0 的概率,可以利用量子信息理論中的|0〉和|1〉對應數字圖像的灰度值0 和1,即數字圖像中的黑和白。由此可將一幅灰度圖像表示成量子比特的形式:


量子力學中的復合量子系統理論為數字圖像處理提供了一種新的思路,由于復合量子系統遵循量子態疊加的規律,若干個量子比特疊加組成了一個復合量子關聯系統,基于此量子疊加態,數字圖像f(m,n)中(m,n-1),(m,n),(m,n+1)三點的灰度值可表示成f(m,n-1),f(m,n),f(m,n+1),也可簡記成fm,n-1,fm,n,fm,n+1,圖像中這三個相鄰的像素形成了一個小鄰域灰度關聯系統,可看作是由三個量子比特構成的關聯系統,其狀態可由張量積表示:

其中ωi是態矢量|i〉的概率幅,它的平方是每一個可能狀態的概率,并滿足以下等式以ω2為例,對應的態矢量為|010〉,代表(m,n-1),(m,n),(m,n+1)三個相鄰點的灰度值出現黑、白、黑的概率,ω6對應態矢量|110〉,代表三個相鄰點的灰度值出現白、白、黑的概率,其它可類推。可以認為此復合量子系統表示了相鄰像素點之間的灰度關聯。式(4)可稱為量子比特圖像的關聯分解,其中八個態矢量系數的平方就是八個子圖的灰度值。
根據量子力學中的測量及坍縮理論,對公式(4)中表示的三量子位關聯系統的第二個量子位,即中間量子位進行測量,測得為1 的概率為并且測量后這個三量子位關聯系統坍縮為一個新的狀態:

顯然經過測量后,八個子圖坍縮為四個子圖,設為f1(m,n)、f2(m,n)、f3(m,n)、f4(m,n),這四個特征子圖的灰度值分別為|010〉、|011〉、|110〉、|111〉四項對應系數的平方,具體可以寫為:

經過關聯分解和測量坍縮后形成的四個子圖,均有特定意義。第一個子圖的灰度值是|010〉項對應系數的平方,可看作(m,n-1),(m,n),(m,n+1)三個相鄰像素出現黑白黑的可能性。第二個子圖對應|011〉項對應系數的平方,可看作(m,n-1),(m,n),(m,n+1)三個相鄰像素出現黑白白的可能性,可體現出圖像在(m,n)點產生灰度正跳變的程度,同理第三個子圖表示三個相鄰像素出現白白黑的概率,可反映在(m,n)處出現灰度負跳變的程度。因此上述三個子圖均表示在(m,n)處發生灰度跳變的程度,也就是圖像的邊緣信息。而第四個子圖可看作(m,n-1),(m,n),(m,n+1)三個相鄰像素出現白白白的可能性,反映的是圖像灰度局域分布的情況。
Grabcut 算法是對Graphcut 方法的改進,先將數字圖像表示成圖的形式,V 是指所有頂點的集合,E 是指所有邊的集合。圖像中的每一個像素點均是該圖的一個頂點,任意兩個相鄰的像素點相連接對應一條邊,記作n-links。然后再增加了兩個特殊的頂點S 和T,圖像中的每一個像素點均與它們連接也構成邊,這種邊稱為t-links。
如圖1所示,實線的邊是n-links,虛線的邊是t-links,分別表示普通頂點連接的邊和普通頂點與新增頂點S、T 相連接的邊,邊的權值可以看成是分割的代價。將圖中的一部分邊斷開,圖的頂點劃分為兩個不相交的子集s 和t(s∪t=V),即完成了圖像的分割。這個子集就是一個割,若分割后所有的邊權值之和最小,就是圖的最小割。可通過構建能量函數來確定邊的權值。圖1中的實線邊之權值是邊界平滑能量項,虛線邊是區域能量項。對背景與目標都采用包含K 個高斯分量的混合高斯模型構建能量函數,使用一個向量記錄每個像素采用哪個高斯分量。整個圖像的能量可記為區域能量項與邊界能量項的和[14]。

區域能量項U 表示一個像素分配背景標簽或目標標簽的懲罰,即該像素屬于標簽0 或1 的概率。顯然若給像素分配為概率最大的標簽,此時能量最小,所以一般取屬于背景或目標的概率的負對數。若圖像所有像素均被正確劃分至對應的背景區域或者目標區域,則能量是最小值。

取負對數之后則變成:

混合高斯模型的參數θ 有三個,分別是每個高斯分量的權重π、均值向量μ 和協方差矩陣∑,背景模型和目標模型的三個參數都需要通過學習確定。

邊界能量項V 表示相鄰像素之間不連續的懲罰,若兩相鄰像素差異很小,則很可能同屬于背景或目標,反之若差異很大,則屬于背景和目標的邊緣,即被分割的可能性很大。差異越大,能量越小。

式(15)中參數β 取決于圖像的對比度,若對比度較低則乘以一個較大的數放大差異,反之則乘以一個較小的數減小差異。經過多次迭代,背景GMM 和目標GMM 的參數不斷被優化,圖像分割的效果也更好。
Grab cut 算法引入了RGB 三通道的混合高斯模型(GMM),通過不斷進行參數學習和分割估計的迭代達到目標分割,雖然減少了人工交互,但仍然無法完全擺脫人工的干預,并且存在收斂較慢的缺點,本文基于量子衍生理論改進Grabcut 算法實現圖像的自動分割。
根據2.1 和2.2 的介紹,將灰度圖像歸一化后轉化為量子比特的形式,然后對其做量子關聯分解,根據量子測量和量子坍縮理論,得到四幅特征子圖。這四幅特征子圖分別具有特定的意義,第一幅子圖的灰度值表示原圖中三個相鄰像素出現黑白黑的概率,第二幅子圖表示原圖中三個相鄰像素出現黑白白的概率,第三幅子圖表示原圖中三個相鄰像素出現白白黑的概率。這三幅子圖反映了圖像中灰度值發生跳變的情況,記錄了圖像的邊緣信息。第四幅子圖表示相鄰像素出現白白白的概率,反映了圖像灰度局域分布的信息。通過這四幅特征子圖也可以還原出原圖[7]。
分別用含K 個高斯分量的全協方差混合高斯模型來對背景和目標建模,將四幅子圖代入四通道混合高斯模型,每個高斯分量的均值向量μ 為四元素向量,協方差矩陣為4×4 矩陣。背景和目標GMM 模型一旦有了部分樣本集后就可以得到參數的估計值,根據隸屬于某個高斯分量的像素個數與總的像素個數的比值可得到該高斯分量的權值。為減少人工干預,本文采用了文獻[15]的微分計盒算法生成目標的矩形輪廓。把輪廓外的部分看作背景,輪廓內的部分看作前景。經過若干次迭代,計算模型的每個參數,包括權重、均值向量和協方差矩陣。然后把分割得到的背景和目標像素再代入,訓練優化模型的參數。
迭代過程會使能量逐漸遞減,并趨于收斂,從而不斷優化GMM 模型的參數和分割結果。由于經過量子關聯分解和量子測量、坍縮的特征子圖分別反映了原始圖像中灰度跳變和局域分布的信息,從而大大提高了能量函數收斂的速度,一般通過三到四次迭代即可得到精準的目標,從而實現圖像的自動分割。

圖1:原始圖像轉化為圖
算法的具體流程如下:
(1)將歸一化后的灰度圖像轉化為量子比特的形式,經量子關聯分解和量子測量、坍縮后得到四幅特征子圖。
(2)運用微分計盒算法得到目標的精確矩形輪廓,以此作為類似graph cut 和grab cut 算法中需要手工干預的目標框。
(3)分別建立背景和目標的四通道混合高斯模型GMM,對每一個背景和目標像素分配高斯分量(將像素的灰度值代入對應的背景或目標模型中的每一個高斯分量,選取概率最大的分量)。
(4)計算混合高斯模型的參數,得到兩類邊的權值,使用最大流/最小割算法實現圖像分割。
(5)重復步驟(3)和(4),直到收斂。每次迭代后,混合高斯模型的參數和分割結果都將得到優化。

表1:兩種方法耗時及誤差比較
為了驗證本文提出算法的有效性,本文在公開標準數據集MSRA1000 中選擇了100 幅圖像進行仿真實驗,并將本文方法的分割結果與普通GrabCut 算法進行比較。仿真實驗環境的硬件為配備Intel i5-7300U 中央處理器以及8G 內存的普通PC 機,軟件為Matlab7.0。對于每一幅圖像,分別用本文提出的算法和普通Grab cut 算法進行目標分割。普通Grab cut 算法必須由人工繪制矩形框,本文提出的算法則無需人工干預。經過實驗測試,本文方法總體有效率達到97%,從主觀視覺感受上,本文方法與普通Grabcut 算法分割的結果非常接近。在100 幅圖像中僅有3 幅背景較為復雜的圖像未能達到理想的分割效果,這三幅圖像用普通Grabcut 算法分割效果也不佳。因此增強復雜背景下圖像分割的有效率將是后續研究的方向之一。
為了客觀評價使用本文方法進行分割的效果,選擇了其中三幅圖像采用Photoshop 軟件進行手動分割作為客觀評價的標準圖,分別計算兩種方法分割結果的誤差。誤差的計算公式為:

I 是手動分割后得到的標準圖,I0是使用算法自動分割得到的結果,M×N 是圖像的像素個數[16]。圖2是三幅圖像分別用本文方法和普通Grabcut 算法分割后的結果,其中圖2(a)是原始圖像,圖2(b)是本文方法分割后的結果,圖2(c)是普通GrabCut 算法分割后的結果。

圖2
表1中的數據是兩種分割方法所花費的時間以及利用公式(16)計算得到的誤差。表1中的實驗結果顯示本文提出的方法行之有效,準確分割出了目標對象,在實現整體分割的同時,幾乎能夠留存目標對象的全部信息。在沒有人工干預的情況下,分割效果略優于Grab Cut 算法,且消耗的時間更少。
本文借助量子衍生理論和Grabcut 算法,設計了一種的圖像分割方法。將灰度圖像轉化成量子比特的形式,通過量子關聯分解和量子測量、坍縮生成四幅特征子圖,分別構建背景和目標的四通道混合高斯模型,通過迭代不斷優化模型參數和圖像分割的結果。該方法不需要人工干預,能夠實現圖像的自動分割,擴大了傳統Grabcut 算法的使用范圍。實驗表明該算法不僅能夠實現目標圖像的準確分割,由于特征子圖反映了圖像的邊緣信息和局域分布情況,模型迭代的次數相對較少,提高了圖像分割的速度。基于量子衍生理論的數字圖像處理技術屬于新興交叉學科,在邊緣檢測、圖像融合、數字半色調等方面的應用證明了其有效性,后續研究將關注于提高復雜背景下目標對象的分割效果以及顯著性目標的檢測。