999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CNN 的珠寶分類系統設計與實現

2022-09-14 06:53:26周涵慶柯圓圓
科海故事博覽 2022年25期

周涵慶 柯圓圓

(江漢大學人工智能學院,湖北 武漢 430056)

隨著生活水平的提高和人民對精神層面的需求,購買珠寶的消費者也越來越多。大多數消費者選購珠寶時會認為品牌店的珠寶有質量保證,因此會去珠寶品牌店購買。但是一段時間以來,珠寶市場上打折風愈刮愈烈,從而引發了一場消費者對珠寶經營者的信任危機。因此,我們迫切地需要對珠寶飾品價格進行透明的可信的價格評估。傳統的珠寶評估完全由人來完成,這使得用戶并不知道專家是如何評估的,形成了信息不對稱的局面。珠寶價格評估通過計算機來完成時就可以消除這種信息不對稱。其邏輯如下:(1)利用用戶輸入的珠寶圖片。(2)計算機將圖片與后臺大型數據庫中的圖片進行檢索。(3)輸出相似度在百分之八十以上的珠寶圖片與相關信息。本文基于第二點進行改進,在檢索之前將數據庫中珠寶圖片進行分類存儲,那么圖片檢索時就可以只檢索數據庫中相應類別的圖片,而不必檢索整個數據庫。基于此,本文提出基于CNN 的珠寶分類系統進行圖片識別。

1 CNN 相關操作詳解

基于深度學習的方法相比于傳統的方法提取特征點更快、更準確,因此越來越多的學者將深度學習引入圖像識別領域[1]。卷積神經網絡(CNN),一種用于處理圖像的神經網絡,從圖像中獲取輸入[2],并從圖像中提取特征,通過CNN 提取的特征適合用于珠寶圖片的分類[3],并提供可學習的參數以有效地進行分類,從而使圖像分類任務的準確率和準確率有顯著提升[4]。有關CNN 更多的研究內容見參考文獻[5-8]。

1.1 卷積

卷積神經網絡中最基礎的操作也是最重要的操作,也就是卷積操作,使用卷積核(過濾器)從圖像中提取特征,不同的過濾器可以從圖像中提取不同的特征。提取特征的過程就是卷積運算,卷積核與圖像像素矩陣局部做點積運算。卷積核一般大小采用3×3。卷積運算中一些參數有:步幅(stride),步幅也就是與卷積核進行運算的像素矩陣上的矩陣窗口移動的單位。步幅分為水平步幅與垂直步幅,一般默認垂直步幅為1,水平步幅可以為1,也可以為2。步幅一般是指水平步幅。此外,還考慮到有時候進行卷積時不希望圖像大小發生變化,或者當圖片的重要信息在圖片邊緣時,為了保護邊緣信息不丟失,此時采用零填充(zero-padding)的方式來保護邊緣信息不丟失或者維持圖像大小不變,所謂零填充即在圖像矩陣的四周補上一圈或者幾圈的0。

例如,當用一個3×3 的卷積核對一個6×6 的像素矩陣進行卷積,第一次運算時,第一行到第三行,第一列到第三列組成的3×3 矩陣窗口與卷積核進行點乘,輸出結果為17,隨后矩陣窗口以水平步幅為1 向右滑動1 個位置,將新的矩陣窗口與卷積核再次進行點乘運算,輸出結果為12。當完成水平方向的滑動到最后三列時,垂直位移一個單位,進行第二行到第四行,第一列到第三列的卷積,并不斷進行水平方向的位移。卷積核不斷滑過像素矩陣,最終得到特征圖。

一個n×n 的像素矩陣與一個m×m 的卷積核做卷積運算,通過公式((n-m)/stride)+1 可以計算得出特征圖的維度,但是當輸入圖片的像素矩陣為32×32,卷積核為4×4,stride 為3 時,(32-4)/3+1 不是整數,這時候可以引入零填充(padding)的方式,即在圖像像素矩陣添一圈0,這樣輸出特征圖的維度就變成了(32+1*2-4)/3+1=11,在神經網絡中必須要掌握每一層輸入輸出的維度。

一般而言,用戶輸入的都是彩色照片,彩色照片的深度為3,也就是RGB 三通道,每一個像素點由3個值組成,我們的卷積核的通道應該和輸入圖片的通道一致,例如照片的圖像像素矩陣為32×32×3,卷積核可以設置為3×3×3,將卷積核的每一層和像素矩陣的每一層做卷積運算,最后再組成一個深度為3的輸出,這里stride 設置為1,padding 為0,所以輸出的shape為30 * 30 * 3。

卷積的時候是用多個卷積核完成的,一般經過卷積之后的特征圖的通道為卷積核的數量。

1.2 激活與池化

卷積完成之后,下一步引入非線性激活函數,給神經網絡加入一些非線性因素,使得神經網絡可以更好地解決較為復雜的問題,激活函數有很多種,本文使用ReLU,對于輸入的負值,輸出全為0,對于正值,原樣輸出,優點是收斂快,求梯度簡單。

激活的下一步就是池化,池化可以將實現精簡特征圖縮小[9],降低計算量同時又保留其中的重要信息,池化分為平均池化和最大池化,本文選擇最大池化(max-pooling,也叫下采樣)保留了每一個小塊內的最大值,相當于保留了這一塊最佳的結果。對于一個n×n 的像素矩陣,保存每個2×2 的矩陣內最大值來替代這個2×2 矩陣,就可以使得其規模縮小至(n/2)×(n/2)。

2 CNN 結構

上面我們介紹了卷積、激活與池化,而一個神經網絡就是不斷地進行卷積、激活與池化的過程。圖1所示為本文CNN 結構圖。

圖1 本文CNN 結構圖

其中,Rescaling 為對模型做歸一化處理,將像素矩陣值在0-255 處理到0-1 之間。Convolution 為卷積操作,激活函數使用ReLU,隨后進行max-pooling,再進行兩次卷積、激活、池化。Flatten 將二維輸出展開成一維,隨后接入全連接層。損失函數使用交叉熵損失函數。

數據集通過爬蟲免費獲取,共七類珠寶圖片,分別為:“藍寶石戒指”“藍寶石項鏈”“鉆石戒指”“銀吊墜”“黃金吊墜”“黃金戒指”“黃金手鐲”,共599 張圖片。按照0.8:0.2 的比例劃分為訓練集與測試集,在劃分數據集之前切記對原始數據集進行檢查,因為爬蟲獲取的圖片可能存在壞圖,這會導致網絡訓練過程異常。

3 網絡實現

訓練輪數epoch 設為10 輪,訓練完成后得到模型訓練過程圖如圖2。

圖2 模型訓練過程圖的準確率和損失率

從模型訓練過程圖2 可以看到隨著訓練輪數的增加訓練集和測試集上的準確率均在增加,隨著訓練輪數的增加訓練集和測試集上的損失函數均在減小。

實驗結果為藍寶石戒指的預測成功率為百分之九十四,藍寶石項鏈的預測成功率為百分之八十二,鉆石戒指的預測成功率為百分之八十八,銀吊墜的預測成功率為百分之八十七,黃金戒指的預測成功率為百分之八十三,對黃金吊墜的分類達到百分百的成功率。其中對黃金手鐲的預測成功率僅為百分之七十二,并且對于黃金手鐲的預測將有百分之二十八的概率錯誤的識別為黃金戒指。對于黃金戒指的預測有百分之十七的概率預測為黃金手鐲。因此在進行數據庫的珠寶圖片分類時,需要對分類結果進行核查。

實驗結果表明最終可以實現對珠寶圖片的自動化識別。以提前對圖像數據庫進行分類,在圖像檢索的過程中,識別出具體珠寶類別,就可以指定檢索某一類圖像,而不用對全部圖像進行檢索,大大節省了計算機資源。

主站蜘蛛池模板: 欧美激情伊人| 久草视频中文| 色综合久久88| 亚洲色图另类| 极品国产一区二区三区| 国产毛片不卡| 三上悠亚一区二区| 亚洲视频在线网| 久久综合婷婷| 国产精品亚洲一区二区三区z| 欧美五月婷婷| 91精品在线视频观看| 亚洲国产精品不卡在线| 色综合天天操| 波多野结衣一区二区三区88| 久久人与动人物A级毛片| 日本在线国产| 国产成人精品视频一区二区电影| 永久免费无码日韩视频| 麻豆精品视频在线原创| 成人亚洲天堂| 国产天天色| 亚洲无码视频图片| 国产产在线精品亚洲aavv| 亚洲欧洲日产国码无码av喷潮| 久久性视频| 亚洲高清资源| 国产午夜福利亚洲第一| 国产理论一区| 亚卅精品无码久久毛片乌克兰| 国产欧美精品一区二区| 亚洲中文字幕无码爆乳| 国产精品无码作爱| 亚洲一区二区在线无码| 综合亚洲网| 综合网天天| 女同国产精品一区二区| 中文字幕欧美日韩高清| 国产jizz| 中文字幕不卡免费高清视频| 在线色国产| 国产在线一区二区视频| 国产亚洲欧美日韩在线一区二区三区| 国产人成乱码视频免费观看| 天天色天天综合网| 免费毛片网站在线观看| 狠狠色成人综合首页| 久久黄色影院| 台湾AV国片精品女同性| 午夜国产小视频| 亚洲综合九九| 亚洲高清免费在线观看| 成人日韩精品| 亚洲中文字幕无码mv| 亚洲国产系列| 激情午夜婷婷| 久久精品电影| 国产激情在线视频| 国产综合无码一区二区色蜜蜜| 亚洲最猛黑人xxxx黑人猛交| 国产菊爆视频在线观看| 2019国产在线| 久久综合亚洲鲁鲁九月天| 全部免费特黄特色大片视频| 狠狠亚洲五月天| 91午夜福利在线观看精品| 日韩在线欧美在线| 国产亚洲欧美在线专区| 欧美日本在线| 热99精品视频| 2022国产无码在线| 国产尹人香蕉综合在线电影| 青青操视频在线| 亚洲成人播放| 亚洲精品第五页| 国内嫩模私拍精品视频| 中文字幕永久在线看| 国产欧美高清| 日韩欧美国产三级| 亚洲区一区| 91精品国产情侣高潮露脸| 欧美综合激情|