李勝旺 韓倩
摘要:隨著信息時(shí)代的不斷發(fā)展,深度學(xué)習(xí)已經(jīng)貫穿計(jì)算機(jī)各個(gè)領(lǐng)域,如人工智能、圖像識(shí)別、文字識(shí)別等領(lǐng)域的不斷優(yōu)化不斷發(fā)展都跟深度學(xué)習(xí)有聯(lián)系。事實(shí)證明,深度學(xué)習(xí)已經(jīng)成為促進(jìn)各個(gè)領(lǐng)域不斷向前進(jìn)步的必然趨勢(shì)。因此,本文就對(duì)深度學(xué)習(xí)以及在圖像處理上面的研究和應(yīng)用做一個(gè)簡(jiǎn)要的了解,首先學(xué)習(xí)圖像處理和深度學(xué)習(xí)技術(shù)的相關(guān)概念,然后闡述一下深度學(xué)習(xí)在圖像處理技術(shù)上的一些應(yīng)用,最后對(duì)深度學(xué)習(xí)在圖像處理領(lǐng)域的影響作用做一個(gè)總結(jié)。
關(guān)鍵詞:深度學(xué)習(xí);圖像處理;圖像去噪;圖像分類;圖像增強(qiáng)
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2018)09-0065-02
人工智能的發(fā)展促進(jìn)了現(xiàn)代化科技和智能化生活的發(fā)展,它最大的貢獻(xiàn)就是給人們生活和工作帶來(lái)了極大的方便。而深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)領(lǐng)域的一部分,在人工智能發(fā)展方面起著至關(guān)重要的作用。為此,加大對(duì)深度學(xué)習(xí)的研究,將深度學(xué)習(xí)與其它領(lǐng)域有機(jī)的結(jié)合起來(lái),為了人們的生活和社會(huì)的發(fā)展,去研發(fā)一些新產(chǎn)品和新技術(shù),顯然是很必要的。
1 圖像處理與深度學(xué)習(xí)
1.1 圖像處理技術(shù)
圖像處理是將圖像信息轉(zhuǎn)化成數(shù)字信息為計(jì)算機(jī)所識(shí)別并進(jìn)行相關(guān)數(shù)據(jù)處理的一門技術(shù),計(jì)算機(jī)進(jìn)行圖像處理包括圖像分類、壓縮、增強(qiáng)、編碼、特征提取等過(guò)程,為了保證圖像的清晰度和對(duì)有效信息的識(shí)別,圖像處理技術(shù)需要多方面技術(shù)的支持以提高圖像的分辨率和質(zhì)量。
圖像處理作為人工智能領(lǐng)域的一門交叉學(xué)科,它穿插在模式識(shí)別、機(jī)器視覺(jué)、多媒體技術(shù)等多個(gè)領(lǐng)域。隨著智能化時(shí)代的到來(lái),有關(guān)圖像處理技術(shù)的成果也應(yīng)用在人們的生活之中,比如,車輛檢測(cè)、二維碼支付、指紋識(shí)別等技術(shù)的應(yīng)用,方便了生活的同時(shí),也使得人們對(duì)圖像的質(zhì)量要求越來(lái)越高。
1.2 深度學(xué)習(xí)領(lǐng)域
深度學(xué)習(xí)本質(zhì)是模仿人腦的思考能力去分析解決問(wèn)題的神經(jīng)網(wǎng)絡(luò),運(yùn)用深度學(xué)習(xí)可對(duì)文字、圖像和文本等進(jìn)行信息提取和識(shí)別。深度學(xué)習(xí)的發(fā)展歸功于2006年一位來(lái)自加拿大的學(xué)者研究的人工神經(jīng)網(wǎng)絡(luò)模型,使得對(duì)信息處理的維度降低。至此,對(duì)深度學(xué)習(xí)的繼續(xù)研究成為了越來(lái)越多的學(xué)者追求的目標(biāo)。各大科技企業(yè)也競(jìng)相加入對(duì)深度學(xué)習(xí)的關(guān)注,如谷歌、Facebook等高科技企業(yè)。
深度學(xué)習(xí)貫穿計(jì)算機(jī)視覺(jué)領(lǐng)域的各個(gè)部分,用深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型模擬人腦工作的原理,在圖像識(shí)別領(lǐng)域取得了一些成果。
2 深度學(xué)習(xí)在圖像處理方面的應(yīng)用
2.1 深度學(xué)習(xí)在圖像去噪算法上的應(yīng)用
由于環(huán)境、人為等因素的影響,致使采集到的圖像在識(shí)別的時(shí)候并不能獲取有效的信息。這時(shí)候就需要將圖片進(jìn)行一定的優(yōu)化,基于神經(jīng)網(wǎng)絡(luò)模型設(shè)計(jì)的圖像去噪算法已經(jīng)很好的實(shí)現(xiàn)了對(duì)高噪聲圖片進(jìn)行有效的處理。其中,秦品樂(lè)等人研究出了一套利用深度學(xué)習(xí)模型進(jìn)行圖像去噪處理的技術(shù)方案,該方案通過(guò)含噪聲圖像與原圖像之間的非線性映射,結(jié)合卷積子網(wǎng)收集的特征信息,將這些特征信息再進(jìn)行恢復(fù)原圖像。實(shí)驗(yàn)證明,該項(xiàng)技術(shù)方案運(yùn)用卷積網(wǎng)絡(luò)進(jìn)行圖像去噪處理獲得了一定的成就,提取了大量的紋理信息;對(duì)于低信噪比圖像的處理,王純等人提出了兩種算法,一種算法是基于深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)對(duì)真實(shí)場(chǎng)景圖片進(jìn)行的去噪處理,另外一種算法是通過(guò)最小二乘法構(gòu)建非局部加權(quán)的圖像去噪算法。實(shí)驗(yàn)表明,兩種算法都有效的實(shí)現(xiàn)了對(duì)低信噪比圖片的有效去噪處理;相比低信噪比的研究技術(shù),高信噪比的研究領(lǐng)域難度更大一些。吳祥威等在多層感知器的基礎(chǔ)上,通過(guò)深度學(xué)習(xí)技術(shù)對(duì)隱藏層部分的參數(shù)進(jìn)行改進(jìn),實(shí)現(xiàn)了對(duì)多層感知器模型的優(yōu)化,研究出了一種高效的去噪能力的模型。實(shí)驗(yàn)表明,使用線形整流函數(shù)對(duì)激活函數(shù)的改進(jìn)能進(jìn)一步提高圖像尤其是高斯噪聲下的圖像的去噪處理能力。
圖像去噪是圖像處理領(lǐng)域的一個(gè)重要研究方向,進(jìn)行去噪的目的就是提高圖像識(shí)別信息的能力,是人類進(jìn)行信息識(shí)別的必要條件。尤其是在醫(yī)療和安檢領(lǐng)域,如何獲取清晰的圖像是進(jìn)行識(shí)別信息的前提。運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)圖像的特征信息非常容易,近幾年在圖像去噪技術(shù)上獲得了比較好的成果。
2.2 深度學(xué)習(xí)在圖像分類算法上的應(yīng)用
圖像分類算法一般包括區(qū)域劃分、特征提取和分類器識(shí)別分類三個(gè)步驟,其中特征提取是關(guān)鍵的一步,有效的特征提取關(guān)系著對(duì)下一步分類的結(jié)果,結(jié)合深度學(xué)習(xí)進(jìn)行圖像分類的算法設(shè)計(jì)能夠進(jìn)一步提高特征提取的性能。林妙真等人針對(duì)人臉識(shí)別的多姿態(tài)變化問(wèn)題提出一種基于深度網(wǎng)絡(luò)結(jié)構(gòu)的算法,實(shí)驗(yàn)表明該算法在圖像分辨率和識(shí)別多姿態(tài)變化方面提高了一定的性能;基于深度學(xué)習(xí)對(duì)人臉識(shí)別技術(shù)的研究問(wèn)題越來(lái)越受到業(yè)界人士的廣泛關(guān)注,陳瑞瑞等人運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了對(duì)人臉識(shí)別算法的改進(jìn),實(shí)現(xiàn)了對(duì)數(shù)據(jù)過(guò)擬合現(xiàn)象的有效抵制,實(shí)驗(yàn)證明了深度學(xué)習(xí)的卷積網(wǎng)絡(luò)模型具有很好的圖像分類效果;王爽等人分別從單標(biāo)記圖像和多標(biāo)記圖像兩個(gè)方面研究深度學(xué)習(xí)在圖像分類算法上的應(yīng)用,運(yùn)用PCA和LDA算法實(shí)現(xiàn)對(duì)單標(biāo)記圖像特征進(jìn)行降維處理,然后結(jié)合SVM和KNN分類器進(jìn)行分類,從而通過(guò)降維處理優(yōu)化圖像分類的性能,通過(guò)最小hausdorff和平均hausdorff兩種不同度量距離的方法的對(duì)比,實(shí)現(xiàn)了多標(biāo)記圖像復(fù)雜分類的特征提取。
基于深度神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分類的研究成果越來(lái)越實(shí)用化。我國(guó)著名的搜索引擎百度應(yīng)用神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行的圖像分類識(shí)別,它的精確度已經(jīng)達(dá)到了90%以上。百度引擎的廣泛應(yīng)用證明了基于深度學(xué)習(xí)的圖像分類算法是一個(gè)目前以及未來(lái)還會(huì)繼續(xù)研究的方向。
2.3 深度學(xué)習(xí)在圖像增強(qiáng)算法上的應(yīng)用
作為圖像處理的必須階段,圖像增強(qiáng)的結(jié)果能夠突出圖像中的特征區(qū)域,完善圖像的視覺(jué)效果,使得增強(qiáng)后的圖像能夠更好的為人類和機(jī)器進(jìn)行識(shí)別。崔盼盼等將圖像超分辨率技術(shù)結(jié)合深度學(xué)習(xí)理論進(jìn)行圖像增強(qiáng)處理,對(duì)卷積神經(jīng)網(wǎng)絡(luò)和快速卷積神經(jīng)網(wǎng)絡(luò)的超分辨率算法進(jìn)行改進(jìn),使得處理后的圖像更加滿足人們的視覺(jué)要求,實(shí)驗(yàn)表明,該算法的提出有效的增加了圖像重建的效果,對(duì)以后的圖像增強(qiáng)技術(shù)提供了一定的參考價(jià)值;丁雪妍等人運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖像進(jìn)行增強(qiáng)處理,采用白平衡方法有效的改善了對(duì)水下圖像顏色的修正問(wèn)題、運(yùn)用場(chǎng)景深度模型進(jìn)行去模糊操作、超分辨率模型細(xì)化了圖像的分辨率,實(shí)驗(yàn)證明了該項(xiàng)技術(shù)對(duì)水下圖像識(shí)別分辨率研究方面有了一定的提高;胡偉東等在氣象衛(wèi)星領(lǐng)域方面,首次運(yùn)用SRCNN算法證明了MMSI高溫?cái)?shù)據(jù)的有效性,但是由于深度學(xué)習(xí)需要大量的訓(xùn)練模型進(jìn)行實(shí)驗(yàn),所以僅僅證明了算法的可行性。
隨著近幾年科研成果的不斷涌現(xiàn),深度學(xué)習(xí)在圖像增強(qiáng)技術(shù)上面的應(yīng)用也越來(lái)越廣泛,為了增加圖像的視覺(jué)效果,不同的業(yè)界人士使用不同的算法進(jìn)行模型訓(xùn)練,圖像增強(qiáng)技術(shù)的進(jìn)步促進(jìn)了圖像識(shí)別的研究和發(fā)展。
3 結(jié)語(yǔ)
如何選取圖像有效的特征信息影響著圖像識(shí)別的準(zhǔn)確率和關(guān)系著圖像的分類結(jié)果,所以在圖像處理技術(shù)上面一定要提高專業(yè)性能,深度學(xué)習(xí)理論有效的學(xué)習(xí)了圖像的深層語(yǔ)義信息,使得圖像提取的特征具有很好的魯棒性,在保證圖像質(zhì)量和提高圖像識(shí)別的準(zhǔn)確率的同時(shí),很好的保持了圖像的完整性,使得圖像的有效信息不受損害。
參考文獻(xiàn)
[1]雷倩.基于深度學(xué)習(xí)的圖像超分辨率重構(gòu)[D].河北師范大學(xué),2015.
[2]王恒歡.基于深度學(xué)習(xí)的圖像識(shí)別算法研究[D].北京郵電大學(xué),2015.
[3]陳先昌.基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法與應(yīng)用研究[D].浙江工商大學(xué),2014.
[4]李傳朋,秦品樂(lè),張晉京.基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像去噪研究[J].計(jì)算機(jī)工程,2017,43(3):253-260.
[5]盧宏濤,張秦川.深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺(jué)中的應(yīng)用研究綜述[J].數(shù)據(jù)采集與處理,2016,31(1):1-17.
[6]吳洋威.基于深度學(xué)習(xí)的圖像去噪算法[D].上海交通大學(xué),2015.
[7]林妙真.基于深度學(xué)習(xí)的人臉識(shí)別研究[D].大連理工大學(xué),2013.
[8]杜騫.深度學(xué)習(xí)在圖像語(yǔ)義分類中的應(yīng)用[D].華中師范大學(xué),2014.
[9]王爽.深度學(xué)習(xí)在圖像分類中的應(yīng)用研究[D].山東師范大學(xué),2016.
[10]崔盼盼.基于深度學(xué)習(xí)的圖像超分辨率重建算法研究[D].山東科技大學(xué),2017.
[11]孫飛飛.水下圖像增強(qiáng)和復(fù)原方法研究[D].中國(guó)海洋大學(xué),2011.
[12]丁雪妍.基于卷積神經(jīng)網(wǎng)絡(luò)的水下圖像增強(qiáng)算法研究[D].大連海事大學(xué),2017.
[13]沈庭芝,王衛(wèi)江,閆雪梅.數(shù)字圖像處理及模式識(shí)別[M].北京理工大學(xué)出版社,2007.
[14]賈永紅.計(jì)算機(jī)圖像處理與分析[M].武漢大學(xué)出版社,2001.
[15]林杰,李如意.基于深度學(xué)習(xí)的圖像識(shí)別處理[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2017(11):65-67.
[16]劉涵,賀霖,李軍.深度學(xué)習(xí)進(jìn)展及其在圖像處理領(lǐng)域的應(yīng)用[J].中興通訊技術(shù),2017,23(4):36-40.