陳聰梅,都 政,井革新,趙曉惠,靳紹巍,陳遠磊,饒青雷,鄔 鴻
(國家超級計算深圳中心(深圳云計算中心),廣東 深圳 518055)
超級計算機的圖像結構相似度并行處理方法
陳聰梅,都 政,井革新,趙曉惠,靳紹巍,陳遠磊,饒青雷,鄔 鴻
(國家超級計算深圳中心(深圳云計算中心),廣東 深圳 518055)
隨著圖像信息量呈指數級的增長,圖像處理面臨效率低與質量差的雙重挑戰,圖像結構相似度作為圖像質量評價領域常用的一種方法也面臨著同樣的問題。為此,提出了一種基于超級計算機的數字圖像結構相似度并行處理方法。基于超算中心的高性能計算平臺實現圖像結構相似度的并行處理,采用分塊并行計算圖像的三種信息,通過與單機計算比較來評價并行處理的性能。實驗結果表明,針對數據量大的圖像,采用所提出的并行處理方案的耗時遠低于單機計算所耗費的時間,可獲得較大的加速比,并有效地提高計算效率。可見,所提出的基于超級計算機的圖像結構相似度并行處理方法有效可行,為實現圖像實時處理提供了可能性。
數字圖像;超級計算機;結構相似度;加速比
圖像是人類獲取和交換信息的主要來源,隨著計算機技術的不斷發展及廣泛應用,數字圖像作為承載信息的載體在社會生活中扮演著重要角色。然而,隨著應用需求的不斷擴大,數字圖像處理面臨著復雜化和實時性的重大挑戰。由于人們對圖像質量的要求不斷提高,從圖像中獲得的信息越來越多,相應的計算量也越來越大。圖像質量評價也成為圖像處理的重要環節,圖像質量評價方法主要包括主觀評價和客觀評價[1-2]。主觀評價方法取決于評價者,難有統一的標準,通常不適用于數字圖像處理領域。客觀評價方法通過采用一個或多個評價指標來評價圖像質量。
隨著圖像的數據量越來越大,對圖像的任何處理都需要計算機具有強大的計算性能。普通單處理機對圖像處理的效率已遠不能滿足生產對于圖像實時處理的要求。由于單機速度提升受制于設備物理的極限,很難滿足大數據量的圖像處理計算,隨著高性能并行處理系統的發展,基于高性能計算的圖像并行處理技術在提高圖像處理速度上提供了可能性[3-4]。高性能計算機是指運行速度非常快的計算機,也稱為超級計算機。
為驗證圖像大規模并行處理的可行性,將國家超級計算深圳中心的曙光6000超級計算機作為圖像結構相似度并行處理的試驗研究平臺,提出了基于結構相似度的超級計算機圖像并行處理方法,為建立基于高性能計算與云計算的數字圖像處理平臺提供指導性意見與寶貴參考。
1.1圖像并行處理
數字圖像處理是計算機應用領域中一個重要及廣泛的分支,隨著計算機和集成電路等技術的發展,圖像處理無論在算法上、系統結構上還是應用上均取得了長足進步。
圖像是連續圖像f(x,y)的一種近似表示,由采樣值組成矩陣表示,每一個采樣單元為一個像素。并行算法的設計是在有限的空間和時間上處理更多的圖像數據,從而提高了圖像處理速度。由于圖像處理過程中的數據量巨大,且各種算法中包含大量的矩陣乘法運算和卷積運算,為圖像處理的并行計算算法設計提供了可能。
圖像處理的并行計算的基本思路是借助多個節點協同解決算法問題,把算法分解成各個并行部分,每個并行部分由單獨的節點進行計算。對于超級計算機集群計算,一個重要的原則是減少計算過程中節點間的通信,加大計算時間。
1.2圖像結構相似度算法
在圖像質量評價領域,往往需要采用客觀的評價方法來量化圖像質量。傳統的圖像質量客觀評價方法主要有峰值信噪比(Peak Signal to Noise Rate,PSNR)和均方誤差(Mean Squared Error,MSE)[5]。這兩種方法在很多情況下與人的主觀感受不符合。因為圖像信息高度結構化,并具有紋理特征,圖像像素點之間存在很大的關聯性,人眼在觀察圖像時會特別注意圖像內容和結構的合理性,因此Wang Zhou等提出了圖像結構相似度(Structural SIMilarity,SSIM)[6]。SSIM方法通過比較待評價圖像與原圖像在亮度、對比度及結構信息的差異,得到評價圖像質量的綜合指標。
SSIM評價模型圖如圖1所示。

圖1 SSIM評價模型圖
假設x為原圖像信息,y表示待評價圖像信息。提取兩幅圖像的亮度信息l、對比度信息c和結構信息s,最后綜合三者信息得到圖像SSIM。
(1)亮度信息定義為:

(1)
其中,ux和uy分別表示參考圖像和待評價圖像的均值,計算公式為:
(2)
(3)
其中,N為圖像x的像素數;xi為圖像x第i個像素點的像素值;yi為圖像y第i個像素點的像素值。
(2)對比度信息定義為:

(4)
其中,σx、σy分別表示圖像x和圖像y的亮度標準差,計算公式為:
(5)
(6)
(3)結構信息定義為:

(7)
其中,σxy為圖像的協方差,計算公式為:
(8)
為避免分母出現等于零的情況,引入三個常量C1、C2、C3。C1=(K1L)2,C2=(K2L)2,C3=C2/2。綜合式(1)、式(4)和式(7),圖像的結構相似度定義為:
SSIM_map(x,y)=[l(x,y)]α*[c(x,y)]β* [s(x,y)]γ
(9)
其中,α、β和γ表示三者的權重,通常情況下α=β=γ=1。
1.3超級計算機基礎知識
超級計算機并行系統軟件包括超級計算機系統里的高速通信系統、并行程序運行支持系統、資源管理系統、并行文件系統等,是硬件系統與應用軟件對接的橋梁。國家超級計算深圳中心(深圳云計算中心)部署了由中科院和曙光公司聯合研制的曙光6000超級計算系統,該系統整體計算能力實測峰值為1.271千萬億次浮點運算;操作系統為64位SuSe Linux Enterprise Server 11SP1,采用IBM Platform LSF作業管理調度系統;節點間采用InfiniBand網絡進行通信。
深圳超算中心部署的超級計算機已為廣大科研院校及機構提供了便捷的計算平臺,可節約科學研究成本40%以上,縮短研發周期一半以上,囊括化學計算、生物計算、材料模擬、電磁學、流體力學計算、氣象預報等多個專業領域。在圖像處理領域,為提高圖像處理速度,有些研究者從事于并行圖像處理算法的設計與實驗研究,實驗表明通過搭建的集群系統設計圖像的并行處理算法可提高處理速度[7-10]。目前還沒有在超算平臺進行數字圖像處理的應用研究。為此,進行了相關探索,為后續在超算中心建立圖像處理云平臺打下基礎。
實現并行計算的原理是把一個大計算量的作業分解成多個子任務,分配到各個節點進行并行計算[11-12]。結構相似度算法主要針對兩幅圖像的圖像信息進行計算,在對大數據量的遙感圖像或紅外圖像進行質量評價時,采用并行計算,可以極大降低算法運行時間。
2.1算法并行原理與實現
根據Wang Zhou等提出的SSIM評價方法,考慮到圖像上不同區域的亮度信息、對比度信息和結構信息會隨著區域紋理的變化有所區別,因此對圖像進行分塊后在局部窗口求取SSIM的效果優于直接計算整幅圖像的SSIM。分塊計算圖像的亮度、對比度和結構信息是結構相似度算法中計算量最大的部分,涉及到對圖像像素的多項計算,對于數據量大的圖像需要耗費過長時間。SSIM算法并行計算的原理是把計算圖像三種信息的任務分解到多個計算節點上并行執行。實現過程為:啟動節點讀取參考圖像與待評價圖像,設置參與計算的節點數為3的倍數,分別在每個計算節點求取8×8局部窗口的均值、標準差和協方差;然后根據式(1)、式(4)和式(7)計算亮度、對比度和結構信息,得到最終的圖像平均結構相似度。
2.2并行處理性能評價標準
評價并行算法性能的指標有多種,主要選用運行時間、加速比,并行效率來說明并行處理的有效性[13],并用實驗數據加以驗證。
運行時間是指算法在超級計算并行機上從執行到結束的時間。加速比定義為[14]:
Sp=Ts/Tp
(10)
其中,Tp為在p個節點上的計算耗時;Ts為單機運算耗時。
并行效率是指在一個系統上的加速比與該系統上的進程數之比,并行效率定義為[12]:
Ep=Sp/P
(11)
其中,P為進程數;0 2.3并行計算結果與分析 單機測試環境為Intel Core i5-2450M 2.5 GHz CPU,4G內存;并行測試環境為曙光6000超級計算機。 選取圖像像素為256×256、2 048×2 048及5 184×3 456進行實驗,分別在單機電腦以及超算平臺進行計算,節點數分別為3、6、9。表1為實驗得到的測試結果數據。 表1 實驗數據 如表1所示,針對實驗選取的不同尺寸圖像,采用并行處理的加速比有明顯的優勢,驗證了圖像結構相似度算法采用并行計算的有效性。從加速比和效率可看出,當選用的節點數增加,加速比數值越來越大,效率隨節點數的增加呈上升趨勢,但并非無限上升,當節點數為6時達到最大值。為更直觀地描述并行處理與單機處理的時間對比,給出3種不同像素尺寸的圖像運行時間對比曲線,如圖2所示。 圖2 單機與多節點并行處理時間對比圖 結合表1的數據,從圖2中可知,對數據量256×256的圖像,并行計算的時間與單機比沒有太大優勢;而對于大數據量5 184×3 456圖像的運行時間隨著并行節點增加急劇減小,并逐漸趨于平緩。由此可得出,對于大數據量的圖像,SSIM算法并行計算具有很大優勢,并行計算的時間明顯低于單機處理所用時間。 圖3為并行處理加速比的對比圖。 圖3 并行處理加速比對比圖 從圖中可看出,隨著數據量的增加,加速比隨之增加,表明并行處理速度有所提升,加速比曲線的上升趨勢逐漸趨于平緩表明隨著并行節點數的提升,處理時間不能無限制上升,當多節點間通訊時間增長到大于圖像實際處理時間時,并行效率就無法提升。 圖4為并行效率對比圖 圖4 并行效率對比圖 由圖4可直觀看出,隨著圖像數據規模的增大,效率逐漸增大。當數據量較小時,如256×256,使用3節點效率高于更多節點的計算效率;但當數據量越大,多節點并行效率提高,當并行節點為6時,效率達到最大。從而進一步說明,并行處理并非采用節點數越多,并行效率就越高,需要考慮到圖像數據在節點間的通信及負載的均衡等。 為在超級計算平臺實現大數據容量圖像并行處理并提升運行速度和效率,提出了一種基于超級計算機的圖像結構相似度并行處理方法。該方法采用分塊并行計算圖像的三種信息,通過與單機計算比較來評價并行處理的性能。實驗結果表明,該算法適用于并行處理,對于處理大數據容量的圖像,可以有效降低時間消耗,同時合適的并行節點可有效提高圖像處理的計算效率。由分析可知,所設計的SSIM并行處理方法在6節點計算中具有較好的運算效率,且能夠隨著圖像數據量的增大通過增加節點數來提升運算速率;該方法可有效縮短運算時間,為實現圖像實時處理提供了可能性,為今后建立基于高性能計算與云計算的數字圖像處理平臺提供了指導性意見與寶貴參考。 [1] 龐璐璐,李從利,羅 軍.數字圖像質量評價技術綜述[J].航空電子技術,2011,42(2):31-35. [2] Xiong Xinghua.Digital image quality assessment[J].Science of Surveying and Mapping,2004,29(1):68-71. [3] 陳國良,毛 睿,蔡 曄.高性能計算及其相關新興計算技術[J].深圳大學學報:理工版,2015,32(1):25-31. [4] 唐少宇.高性能計算機體系結構綜述[J].計算機光盤軟件與應用,2010(15):51-52. [5] 李 航,路 羊,崔慧娟,等.基于頻域的結構相似度的圖像質量評價方法[J].清華大學學報:自然科學版,2009,49(4):559-562. [6] Wang Zhou,Bovik A C,Sheikh H R,et al.Image quality assessment:from error visibility to structural similarity[J].IEEE Transactions on Image Processing,2004,13(4):600-612. [7] 李金龍.高性能計算在圖像匹配中的應用研究[D].西安:西安建筑科技大學,2012. [8] 蔣利順,劉定生.遙感圖像K-Means并行算法研究[J].遙感信息,2008(1):27-30. [9] Klimeck G,McAuley M,Deen R,et al.Near real-time parallel image processing using cluster computers[C]//International conference on space mission challenges for information technology.Pasadena,CA:[s.n.],2003:13-16. [10] 林 鵬.基于集群系統的并行圖像處理算法的設計與實現[D].青島:中國海洋大學,2006. [11] 史鳳麗.基于集群計算機的圖像并行處理[D].西安:西安科技大學,2010. [12] Cwik T,Klimeck G,McAuley M,et al.Applications on high performance cluster computers production of mars panoramic mosaic images[C]//Proceedings of the 2001 AMOS technical conference.[s.l.]:[s.n.],2001. [13] 周益民.圖像處理并行算法的研究[D].成都:電子科技大學,2006. [14] 金 偉.基于云計算的數字圖像處理平臺[D].杭州:浙江大學,2011. Research on Image SSIM Paralleling Algorithm with Super Computer CHEN Cong-mei,DU Zheng,JING Ge-xin,ZHAO Xiao-hui,JIN Shao-wei,CHEN Yuan-lei,RAO Qing-lei,WU Hong (National Supercomputing Center in Shenzhen (Shenzhen Cloud Computing Center),Shenzhen 518055,China) With the exponential growth of image information,image processing is faced with the dual challenge of low inefficiencies and poor quality.Image Structural Similarity (SSIM),taken as a common method in the field of image quality assessment,is also faced with the identical problem.Therefore,a method of image SSIM parallel processing based on supercomputers is proposed.The image SSIM parallel processing is implemented based on High Performance Supercomputer Center with computing resources.The three kinds of image information are in the parallel calculation by blocking.The performance of the parallel processing is simulated compared with the serial calculation.The experimental results indicate that in allusion to massive image data,it is far lower in the operation time than serial calculation with larger accelerating ratio and higher efficiency,which is effective and feasible,and makes the real-time processing of image possible. digital image;supercomputing;SSIM;accelerating ratio 2016-10-28 :2017-02-17 < class="emphasis_bold">網絡出版時間 時間:2017-07-11 國家重點研發計劃(2016YFB0201401) 陳聰梅(1989-),女,助理工程師,碩士,研究方向為圖形圖像高性能計算處理;都 政,雙高級工程師,通訊作者,研究方向為超級計算機、高性能計算、云計算與大數據。 http://kns.cnki.net/kcms/detail/61.1450.TP.20170711.1457.082.html TP312 :A :1673-629X(2017)09-0022-04 10.3969/j.issn.1673-629X.2017.09.005



3 結束語