999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop的改進(jìn)聚類(lèi)算法在圖像修復(fù)上的應(yīng)用

2017-10-12 07:20:28郝惠惠
關(guān)鍵詞:信息

王 林,雷 佳,郝惠惠

(西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,陜西 西安 710048)

基于Hadoop的改進(jìn)聚類(lèi)算法在圖像修復(fù)上的應(yīng)用

王 林,雷 佳,郝惠惠

(西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,陜西 西安 710048)

針對(duì)模糊聚類(lèi)算法在運(yùn)算大數(shù)據(jù)量時(shí)性能差的問(wèn)題,提出基于Hadoop分布式平臺(tái)的改進(jìn)算法進(jìn)行圖像修復(fù)。對(duì)于受損圖像信息,首先將Canopy算法和模糊聚類(lèi)相結(jié)合在Hadoop平臺(tái)上進(jìn)行并行化,然后進(jìn)行字典訓(xùn)練獲得修復(fù)圖像。實(shí)驗(yàn)結(jié)果表明,該算法在均方誤差和峰值信噪比上均優(yōu)于改進(jìn)前的圖像修復(fù)算法,提高了圖像修復(fù)質(zhì)量并且減少了算法的運(yùn)行時(shí)間,適合修復(fù)海量圖像。

圖像修復(fù);聚類(lèi);Hadoop

Abstract: Aiming at the problem that the fuzzy clustering algorithm is poor in computing large data volume, an improved algorithm based on Hadoop distributed platform is proposed for image restoration. For the damaged image information, the Canopy algorithm and the fuzzy clustering are combined on the Hadoop platform for parallelization, and then the dictionary is trained to obtain the repaired image. The experimental results show that the algorithm is superior to the previous image restoration algorithm in terms of mean square error and peak signal to noise ratio, which improves the quality of image restoration and reduces the running time of the algorithm. It is suitable for repairing massive image.

Key words:image inpainting; clustering; Hadoop

0 引言

圖像技術(shù)在各個(gè)方面都得到廣泛應(yīng)用[1],但在圖像獲取過(guò)程中往往會(huì)造成圖像信息丟失。利用受損圖像信息恢復(fù)出原始圖像信息,即圖像復(fù)原技術(shù)。

2011年,SAHOO S K等人[2]利用局部圖像塊的稀疏近似來(lái)解決圖像修復(fù)問(wèn)題,提出了一個(gè)用于局部稀疏近似的自適應(yīng)窗口選擇步驟來(lái)影響底層圖像全局恢復(fù)的框架,此框架提供了一個(gè)基于選擇窗口大小的群集圖像,接著利用稀疏近似算法分別修復(fù)每一個(gè)群集,從而達(dá)到理想的修復(fù)結(jié)果。此外,研究學(xué)者在文獻(xiàn)[3-7]中都對(duì)圖像修復(fù)算法進(jìn)行改進(jìn),不同程度地提高了修復(fù)效果。但這些算法沒(méi)有考慮到圖像之間存在相似性,而且對(duì)于樣本數(shù)據(jù)大的情況,沒(méi)有提出有效地提高算法效率的解決方案。

針對(duì)以上缺陷,提出一種運(yùn)行在Hadoop分布式平臺(tái)上的改進(jìn)聚類(lèi)的字典學(xué)習(xí)算法。首先對(duì)圖像數(shù)據(jù)集中的多類(lèi)圖像運(yùn)用改進(jìn)的模糊聚類(lèi)算法(FCM)進(jìn)行分類(lèi),同時(shí)在Hadoop分布式平臺(tái)進(jìn)行并行化計(jì)算,然后對(duì)每一類(lèi)圖像數(shù)據(jù)進(jìn)行字典訓(xùn)練,得到每類(lèi)圖像的字典再指導(dǎo)圖像修復(fù)。

1 理論基礎(chǔ)

聚類(lèi)是一種數(shù)據(jù)挖掘算法,基于信息之間的相似性對(duì)數(shù)據(jù)進(jìn)行分類(lèi),與分類(lèi)算法不同的是,聚類(lèi)在算法開(kāi)始之前并不知道要將數(shù)據(jù)分為幾類(lèi)。Canopy算法和FCM都是聚類(lèi)算法,只是聚類(lèi)方式不同。兩個(gè)聚類(lèi)算法各有優(yōu)缺點(diǎn),本文將兩種算法結(jié)合,充分利用兩個(gè)聚類(lèi)的優(yōu)勢(shì)對(duì)圖像信息進(jìn)行聚類(lèi)分析。

1.1 Canopy-FCM算法

Canopy-FCM算法的思路是利用Canopy算法產(chǎn)生聚類(lèi)中心,從而彌補(bǔ)了 FCM聚類(lèi)算法對(duì)初始聚類(lèi)中心敏感的問(wèn)題。Canopy-FCM算法的基本思路是:首先使用Canopy算法產(chǎn)生若干個(gè)初始聚類(lèi)中心,然后再刪除那些聚類(lèi)中心中小于特定閾值的值;之后根據(jù)第一步已經(jīng)產(chǎn)生的聚類(lèi)中心,再進(jìn)行模糊C均值聚類(lèi)[7]。

因此可以先使用Canopy算法粗聚類(lèi),產(chǎn)生初始聚類(lèi)中心,再使用FCM算法細(xì)聚類(lèi),從而提高算法效率,改善模糊C均值算法的不足。

1.2基于K-SVD字典訓(xùn)練的圖像修復(fù)算法

基于K-SVD字典訓(xùn)練的圖像修復(fù)算法主要是從受損圖像中提取有用信息,然后選擇初始字典D,使用K-SVD算法對(duì)分塊后的圖像進(jìn)行訓(xùn)練,得到新的字典,并計(jì)算出稀疏系數(shù),再更新對(duì)應(yīng)的圖像,如此便能修復(fù)受損圖像。

具體步驟為:

(1)對(duì)圖像進(jìn)行稀疏編碼。

(2)更新第k類(lèi)圖像字典Dk。

(3)重復(fù)執(zhí)行步驟(1)和步驟(2),直到滿(mǎn)足迭代次數(shù),字典Dk更新完成。

(4)選擇對(duì)應(yīng)的字典Dk(k∈1,…,I)作為基字典,進(jìn)行K-SVD字典訓(xùn)練,計(jì)算稀疏系數(shù),并利用更新的字典乘以稀疏系數(shù),修復(fù)受損圖像。

2 本文算法

考慮到圖像之間的相似性,因此修復(fù)圖像之前,首先對(duì)圖像數(shù)據(jù)進(jìn)行聚類(lèi),然后將已聚類(lèi)的圖像進(jìn)行K-SVD字典訓(xùn)練。傳統(tǒng)FCM對(duì)初始值敏感[8],本文針對(duì)此問(wèn)題進(jìn)行了改進(jìn),應(yīng)用Hadoop分布式平臺(tái)并行化算法來(lái)提高聚類(lèi)速率。

Canopy-FCM算法的并行化過(guò)程分為兩個(gè)步驟:第一步是對(duì)Canopy算法進(jìn)行Map-Reduce化;第二步是對(duì)FCM算法進(jìn)行Map-Reduce化。

Canopy-FCM算法框架如圖1所示。

圖1 Canopy-FCM算法的Map-Reduce框架圖

(1)對(duì)Canopy算法進(jìn)行Map-Reduce化

Canopy算法的并行化分為map過(guò)程和reduce過(guò)程。Canopy算法的并行化首先將原始數(shù)據(jù)分為若干數(shù)據(jù)分片,并復(fù)制到執(zhí)行任務(wù)的map節(jié)點(diǎn)上,而且所有的map節(jié)點(diǎn)獨(dú)立完成分配的任務(wù)。map過(guò)程主要是使用Canopy算法思想對(duì)該節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行串行處理,然后獲得形式的Canopy中心集合。

在串行化的Canopy過(guò)程中,需要輸入兩個(gè)閾值T1和T2,因此在map階段和reduce階段要分別設(shè)置兩個(gè)閾值(T1,T2)和(T3,T4),且T3>T1,T4>T2,然后按照Canopy算法思想設(shè)置filter值。

(2)對(duì)FCM算法進(jìn)行Map-Reduce化

(1)

(2)

式中Nk表示第k個(gè)map節(jié)點(diǎn)的數(shù)量,在reduce階段計(jì)算聚類(lèi)中心,如公式(3)所示:

(3)

其中p表示map節(jié)點(diǎn)數(shù)。

FCM的Map-Reduce化分為五個(gè)階段,分別是map階段、combine階段、reduce階段、迭代過(guò)程及數(shù)據(jù)對(duì)象分類(lèi)的過(guò)程。

并行化的Canopy-FCM算法分為Canopy算法時(shí)間復(fù)雜度和FCM算法時(shí)間復(fù)雜度兩部分,設(shè)數(shù)據(jù)集的數(shù)據(jù)量為N,map階段的節(jié)點(diǎn)數(shù)量為m,reduce階段的節(jié)點(diǎn)數(shù)量為r,迭代次數(shù)用i表示,聚類(lèi)中心的數(shù)量用c表示,k表示對(duì)象維數(shù)。

map過(guò)程的執(zhí)行總時(shí)間為:

(4)

Combine過(guò)程執(zhí)行時(shí)間為:

(5)

reduce過(guò)程執(zhí)行時(shí)間為:

t3=mck

(6)

迭代過(guò)程的執(zhí)行時(shí)間為:

(7)

對(duì)象劃分過(guò)程是計(jì)算集合中的數(shù)據(jù)對(duì)簇中心的隸屬程度,并依據(jù)隸屬度的大小將數(shù)據(jù)數(shù)據(jù)對(duì)象歸到合適的類(lèi),所以時(shí)間復(fù)雜度與map過(guò)程同為:

(8)

綜上所述,并行化的FCM過(guò)程執(zhí)行時(shí)間為:

t6=(2ckN/m+mck)i+ckN/m

(9)

因此并行化的FCM算法復(fù)雜度約為O(ckNi/m)。

Canopy算法產(chǎn)生的Canopy個(gè)數(shù)與聚類(lèi)中心的個(gè)數(shù)同為c,則并行化的Canopy計(jì)算時(shí)間為:

(10)

則并行化的Canopy-FCM算法的總運(yùn)行時(shí)間為:

t8=(2ckN/m+mck)i+ckN/m+cN/m+cmc

(11)

因此Canopy-FCM算法時(shí)間復(fù)雜度為O(ckNi/m)。

單機(jī)模式下的FCM算法過(guò)程分為屬度計(jì)算過(guò)程、迭代過(guò)程和數(shù)據(jù)對(duì)象分類(lèi)三部分,數(shù)據(jù)對(duì)象分類(lèi)可以通過(guò)最后的模糊矩陣計(jì)算。因此總的計(jì)算時(shí)間為:

tsingle=ckNi+cN

(12)

由理論推導(dǎo)得出,單機(jī)模式的FCM算法復(fù)雜度為O(ckNi),是并行化的m倍。并行化的FCM是在計(jì)算機(jī)集群上并行運(yùn)行,所以加快了算法的運(yùn)行速度。

3 實(shí)驗(yàn)分析

仿真平臺(tái)是Apache Mahout,它是運(yùn)行在Hadoop平臺(tái)下的針對(duì)大數(shù)據(jù)集的一個(gè)機(jī)器學(xué)習(xí)庫(kù),通過(guò)MapReduce模型進(jìn)行實(shí)現(xiàn)。算法采用的數(shù)據(jù)集是由加州理工學(xué)院提供的Caltech 101,圖像修復(fù)過(guò)程采用其中5組數(shù)據(jù)。

3.1改進(jìn)聚類(lèi)算法實(shí)驗(yàn)

聚類(lèi)實(shí)驗(yàn)部分,使用查準(zhǔn)率(Precision)、查全率(Recall)和簇間距離評(píng)估結(jié)果。

(13)

(14)

TP是指在當(dāng)前簇中被正確聚類(lèi)的數(shù)據(jù)對(duì)象的個(gè)數(shù),F(xiàn)P是指在當(dāng)前簇中被誤聚到該簇的數(shù)據(jù),F(xiàn)N是指該簇實(shí)際包含的對(duì)象的數(shù)目。n表示整個(gè)數(shù)據(jù)集的類(lèi)別,則平均查準(zhǔn)率和平均查全率可以表示為:

(15)

(16)

從表1可以看出,Canopy-FCM算法不論是在聚類(lèi)效果上還是在運(yùn)算速度上都優(yōu)于FCM算法。如表2所示,該算法比FCM簇間最大距離、簇間最小距離和歸一化距離都降低,可見(jiàn)Canopy-FCM改善了FCM算法的聚類(lèi)質(zhì)量。

表1 算法的聚類(lèi)質(zhì)量

表2 簇間距離結(jié)果

3.2改進(jìn)的聚類(lèi)圖像修復(fù)算法

實(shí)驗(yàn)的圖像修復(fù)部分,采用均方誤差(MSE)和峰值信噪比(PSNR)評(píng)估算法。均方誤差的數(shù)值越小,說(shuō)明與原圖像越接近,修復(fù)效果越好;峰值信噪比越大,說(shuō)明圖像復(fù)原的效果越好。

分析三種不同算法在圖像隨機(jī)丟失50%和70%的信息時(shí)的仿真圖和評(píng)價(jià)指標(biāo)對(duì)比結(jié)果,驗(yàn)證算法的有效性和可行性,如表3和表4所示。

表3 實(shí)驗(yàn)圖像丟失50%信息

表4 實(shí)驗(yàn)圖像丟失70%信息

以上實(shí)驗(yàn)的分析結(jié)果表明,本文算法在均方誤差、峰值信噪比和運(yùn)行速度上均優(yōu)于DCT算法和K-SVD算法。

4 結(jié)論

本文提出一種基于Hadoop的改進(jìn)聚類(lèi)算法,并將其應(yīng)用于受損圖像,盡可能還原圖像信息。首先基于圖像相似性使用Canopy-FCM聚類(lèi)算法對(duì)圖像進(jìn)行分類(lèi),同時(shí)在Hadoop分布式平臺(tái)進(jìn)行并行化處理,然后對(duì)每類(lèi)圖像進(jìn)行字典訓(xùn)練,并使用獲得的字典來(lái)修復(fù)受損。實(shí)驗(yàn)結(jié)果證明,本文算法在速度、均方根誤差和峰值信噪比上,均優(yōu)于僅僅利用待修復(fù)圖像進(jìn)行字典訓(xùn)練的圖像修復(fù)算法。

[1] OLSHAUSEN B A, FIELD D J. Emergence of simple-cell receptive field properties by learning a sparse code for natural images[J]. Nature, 1996, 381(6583): 607-609.

[2] SAHOO S K, Lu Wenmiao. Image denoising using sparse approximation with adaptive window selection[C]. Information Communication Signal Processing, 2011: 1-4.

[3] ELAD M, AHARON M. Image denoising via sparse and redundant representations over learned dictionaries[J]. IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society, 2006, 15(12):3736-3745.

[4] 何埜,李光耀,肖莽,等.基于深度信息的圖像修復(fù)算法[J].計(jì)算機(jī)應(yīng)用,2015, 35(10): 2955-2958.

[5] 陳澤墅. 基于稀疏表示的圖像修復(fù)算法研究[D]. 杭州:浙江工業(yè)大學(xué), 2015.

[6] 常晨, 何建農(nóng). 改進(jìn)的基于樣本塊的圖像修復(fù)方法[J]. 微型機(jī)與應(yīng)用, 2015, 34(23):45-47.

[7] 楊茹, 秦振濤, 楊武年. 基于字典學(xué)習(xí)的古建筑圖像修復(fù)研究[J]. 電子技術(shù)應(yīng)用, 2016, 42(12):51-53.

[8] 余長(zhǎng)俊,張燃.云環(huán)境下基于Canopy聚類(lèi)的FCM算法研究[J].計(jì)算機(jī)科學(xué), 2014, 41(s2):316-31.

Application of improved clustering algorithm based on Hadoop in image inpainting

Wang Lin, Lei Jia, Hao Huihui

(School of Automation and Information Engineering, Xi’an University of Technology, Xi’an 710048, China)

TP391

A

10.19358/j.issn.1674- 7720.2017.18.015

王林,雷佳,郝惠惠.基于Hadoop的改進(jìn)聚類(lèi)算法在圖像修復(fù)上的應(yīng)用[J].微型機(jī)與應(yīng)用,2017,36(18):49-51.

2017-03-29)

王林(1963-),男,博士,教授,主要研究方向:復(fù)雜網(wǎng)絡(luò)、圖像處理。

雷佳(1991-),通信作者,女,碩士研究生,主要研究方向:圖像處理。E-mail:754438195@qq.com。

郝惠惠(1989-),女,碩士,主要研究方向:圖像處理。

猜你喜歡
信息
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會(huì)信息
信息超市
展會(huì)信息
展會(huì)信息
展會(huì)信息
展會(huì)信息
展會(huì)信息
信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 欧美一级大片在线观看| 91久久天天躁狠狠躁夜夜| 国产Av无码精品色午夜| 亚洲人成网7777777国产| 亚洲an第二区国产精品| 91久久精品日日躁夜夜躁欧美| 日韩精品高清自在线| 国产精品美人久久久久久AV| 亚洲国产无码有码| 热re99久久精品国99热| 国产成人一二三| 黄色网址手机国内免费在线观看| 99久久精品久久久久久婷婷| 亚洲第一天堂无码专区| 欧美精品成人一区二区在线观看| 国产一级α片| 亚洲香蕉在线| 国产美女自慰在线观看| 欧美黄网站免费观看| 日韩不卡高清视频| 亚洲一区二区黄色| 婷婷午夜天| 91小视频在线观看免费版高清| 亚洲三级成人| 日本不卡在线| 欧美中出一区二区| 日本不卡视频在线| 99人妻碰碰碰久久久久禁片| 久久综合色88| 中国黄色一级视频| 国产成人精品亚洲77美色| 日韩中文欧美| 亚洲欧美成人在线视频| 国产在线精彩视频二区| 国产精品无码在线看| 国产欧美精品一区二区| 国产毛片片精品天天看视频| 91一级片| 青草视频网站在线观看| 人妻夜夜爽天天爽| 色哟哟精品无码网站在线播放视频| 沈阳少妇高潮在线| 国产免费黄| 精品国产网| 亚洲综合经典在线一区二区| av手机版在线播放| 57pao国产成视频免费播放| 国产在线观看91精品| 久久视精品| 亚洲国产欧美国产综合久久 | 91最新精品视频发布页| 四虎国产永久在线观看| 国产成人一区免费观看| 久热这里只有精品6| 亚洲色精品国产一区二区三区| 国产综合日韩另类一区二区| 伊人AV天堂| 亚洲国产系列| 国产免费a级片| 国产午夜精品一区二区三| 国产成本人片免费a∨短片| 国产区人妖精品人妖精品视频| 欧美黄色网站在线看| 国产一级片网址| 亚洲欧洲日韩综合| 国产亚洲欧美在线中文bt天堂| 蜜臀AVWWW国产天堂| 九色在线观看视频| 国产在线无码av完整版在线观看| 99视频在线观看免费| 亚洲国产中文精品va在线播放 | 日本a∨在线观看| 免费人成网站在线高清| 一级毛片免费观看不卡视频| 99久久无色码中文字幕| 91精品最新国内在线播放| 97精品久久久大香线焦| 国产综合欧美| 亚洲成人在线免费| 浮力影院国产第一页| 欧美特级AAAAAA视频免费观看| 久久亚洲国产最新网站|