金瑋,孟曉曼,武益超
(華北水利水電大學(xué),河南 鄭州 450046)
圖像分類技術(shù)最早是在20世紀(jì)40年代提出的,那時(shí)候的技術(shù)能力不足,計(jì)算機(jī)設(shè)備不夠完善,所以圖像分類技術(shù)在那個(gè)時(shí)候沒(méi)有得到快速發(fā)展。隨著計(jì)算機(jī)的快速發(fā)展和計(jì)算能力的不斷提高,深度學(xué)習(xí)逐漸走入人們的視野,尤其是深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò),在圖像領(lǐng)域掀起一波熱潮。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)(Deep Learning)的重要算法之一,本文通過(guò)深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖像分類展開(kāi)分析和介紹。隨著科學(xué)技術(shù)的不斷更迭,卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展速度迅猛,應(yīng)用的領(lǐng)域也不斷擴(kuò)大,比如圖像識(shí)別、自然語(yǔ)言處理、語(yǔ)義分割等領(lǐng)域。能夠解決當(dāng)時(shí)遇到的CPU處理能力不足問(wèn)題,但也只能分析一些小規(guī)模的數(shù)據(jù),存在著對(duì)復(fù)雜圖片處理不到位等諸多問(wèn)題。對(duì)網(wǎng)絡(luò)模型采取一層一層的訓(xùn)練是由Hinton研究團(tuán)隊(duì)于2006年提出的,在此之后,卷積神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域得到了廣泛的應(yīng)用,并且推動(dòng)了機(jī)器學(xué)習(xí)任務(wù)準(zhǔn)確率的提高,目前它已經(jīng)成為一種強(qiáng)大且通用的深度學(xué)習(xí)模型。隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,有越來(lái)越多的圖像信息存儲(chǔ)在網(wǎng)上。在這種情況下,如何利用計(jì)算機(jī)對(duì)這些圖像進(jìn)行智能分類和識(shí)別,讓其更好地服務(wù)于人類就顯得尤為重要。
一些描述卷積神經(jīng)網(wǎng)絡(luò)模型的綜述,介紹了卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)以及神經(jīng)網(wǎng)絡(luò)的一些經(jīng)典網(wǎng)絡(luò)模型,講述了這些模型的優(yōu)缺點(diǎn)以及演進(jìn)過(guò)程?!?br>