汪家琦 郭源


摘? ?要:現如今,市場上商品數量不斷增加,想要實現商品的高效流通就要對商品圖像識別技術進行分析,以此切實提高服務質量。本文在簡單了解商品圖像特征的基礎上,對深度學習技術進行了全面的了解,在此基礎上,設計了商品圖像識別平臺,并且結合實際案例,具體分析這一平臺的應用情況,以供參考。
關鍵詞:深度學習? 商品圖像? 識別方式? 準確性
中圖分類號:TP391? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ?文章編號:1674-098X(2020)01(b)-0129-02
零售店作為大型商超的有效補充,滿足了互聯網時代消費者的需求和偏好,在實際發展過程中,便利店占據了巨大的市場,但在發展過程中,運營成本不斷增加,尤其是門店租金、人工成本等方面均呈現出上漲趨勢。開發出基于深度學習的商品圖像識別方法,可以讓商品流通速度加快,為顧客提供優質的服務。
1? 商品圖像特征和深度學習技術
1.1 商品圖像特征
商品在設計過程中,為了刺激消費者購買欲,同時保證商品的辨識度,商品圖像特征非常豐富,常見的圖像特征可以分為兩大類,一種是底層視覺特征,也就是商品的全局特征和局部特征,另一種是商品的中間語義特征,在進行商品識別的過程中,主要應用的是底層視覺特征。也就是,商品的圖像特征,可以具體分為以下幾種,具體包括:顏色特征、形狀特征、紋理特征、點特征、語義特征等多個方面。這幾個特征中,顏色特征是最為直接的方式,利用顏色直方圖就可以獲取得到商品圖像的顏色分布,而形狀區域和輪廓邊界都可以進行區分,通過具體的檢測算法就能夠有效提取出商品的特征點。圖1是實體零售圖像識別的一種過程。
1.2 深度學習技術
深度學習技術是建立在神經網絡上的一種感知技術,常見的神經網絡包括:神經元模型、感知機、BP算法、卷積神經網絡等。以卷積神經網絡為例,這是目前應用范圍最廣的一種神經網絡,在人臉識別、語音識別、車牌識別、物體檢測等方面得到了廣泛應用。卷積神經網絡和BP神經網絡較為相似,都是由輸入層、中間層、輸出層形式,但相比較而言,前者的中間層更為復雜。在實際應用過程中,這種神經網絡具有巨大的優勢,尤其是在網絡深度、巨量圖像數據處理上,最為重要的是,利用這種神經網絡可以更好地完成學習訓練。在確定具體的神經網絡后,就可以開展深度學習,利用海量的數據,借助網絡模型進行學習,數據中的特征學習是非常重要的內容,可以保證模型預測準確度得到提高。經過對目前幾種主流深度學習框架進行對比分析后,選擇了MXNet作為實驗框架[1]。
2? 基于深度學習的商品圖像識別平臺設計
想要真正開發出符合零售店發展的商品圖像識別技術,就要設計出合理的平臺和數據庫,在實際發展過程中,使用平臺進行圖像采集、圖像預處理,建立圖像數據庫,為后續的圖像識別分析奠定良好的基礎。
2.1 實驗平臺設計
所謂實驗平臺就是要搭建出一個自動識別平臺,主要硬件設備包括:相機鏡頭、光源、置物臺、機械支架、計算機等,以此完成商品圖像獲取,并且商品圖像數據庫和模型訓練等工作也會在該平臺上完成。軟件部分則采用了VS013和Python IDLE這兩個軟件作為主要開發環境,圖像處理工具上則選擇了OpenCV軟件,這一軟件具有完善的計算機視覺和圖像處理算法。通過二者結合,就能夠實現圖像采集、處理、數據集構建等功能。
2.2 圖像預處理
由上可知,商品外包裝千姿百態,尤其是商品結構、形狀都存在一定區別,想要確保商品被準確識別,就要對商品圖像進行全面的收集,每個商品的拍攝總數必須要在50張以上,每個面都要拍攝圖像。以長方體商品為例,要拍攝6個面商品圖像,因此每個面至少要拍9~10張圖片;如果是塑料包裝商品,一般可以選擇正反兩個面進行拍攝,每個面至少25張圖片。完成圖片收集后,就可以進行圖像預處理,通過閾值分割、提取關鍵區域,繼而就可以生成預處理圖像。
2.3 擴充數據集
在此基礎上,對預處理后的圖像加入椒鹽噪聲、高斯噪聲、泊松噪聲等方式,讓模型訓練更加準確,并且變換圖形幾何,利用鏡面翻轉、多角度旋轉等角度,對預處理數據進行進一步數據擴展,以此滿足深度學習模型訓練對大量樣本熟練的要求,從而提高基于深度學習的商品圖像識別準確性。
3? 基于深度學習的商品圖像識別實際應用
由上可知,深度學習在圖像分類識別上具有較大優勢,現如今,在多個領域中都得到了廣泛的應用,將其應用在商品圖像識別領域中,可以進一步降低人工成本,跳脫出時間、空間的限制。由上可知,利用基于深度學習的商品圖像識別平臺,可以讓商品運輸水平、效率得到提高。在實際應用過程中可以分為五個階段,分別為:Alex Net網絡結構、數據庫準備、數據迭代器生成、訓練過程、商品識別過程的實際應用[2]。
第一,神經網絡。根據上文設計的平臺情況來看,Alex Net網絡結構可以為后續的計算訓練奠定良好的基礎,這種模型具有6000萬個參數和6.5萬個神經元,其神經網絡采用的是卷積運算,不僅運算效率較快,準確性也相對較高。需要注意的是,Alex Net網絡結構中涉及了多個參數項目,包括:網絡層數、內核數量、內核尺寸、步長、填充、輸出尺寸等。第二,數據庫準備。根據軟件所在的環境系統,最終選擇利用Python語言開發數據庫,所有商品圖像的命名都用字母和數字代替[3]。第三,數據迭代器的生成。基于深度學習的商品圖像識別方法在實際應用過程中必須要進行大數據學習,在這個過程中,可能會應用到幾十GB的數據,因此訓練學習的時間也相對較大。通過設計數據迭代器,都可以提高訓練學習效率,節約成本。本文使用的MXNet框架就具有數據迭代器功能。第四,實際訓練。在創建網絡模型的基礎上,就可以正式進行訓練,直到正確率趨于穩定后,訓練模型就可以保存,最終將訓練好的網絡模型應用在商品識別系統中。根據實際應用情況來看,基于深度學習的商品圖像識別方法的準確率較高,可以持續訓練商品識別系統,并且更新網絡模型的參數文件。最為重要的是,其可以滿足多個不同零售點的識別要求。如圖2商品畫像識別示意圖,就是利用這種識別方法完成的識別,可以一次性精準識別所有商品。
4? 結語
綜上所述,深度學習技術作為一種高效、新型的圖像分類技術,在實際應用中,具有高效率、低成本、高準確率的特點,可以推動“無人零售”這一概念得到真正的實現。通過本文分析設計,開發出了一款全新的商品圖像識別系統,準確率較高,但還需要對這一系統中的缺陷進行進一步的完善,擴大其應用范圍。
參考文獻
[1] 李玫潔,溫昕,蔣娜.基于深度學習的圖像識別研究[J].科技廣場,2017(10):178-180.
[2] 胡正委.基于深度學習的超市商品圖像識別方法研究[D].中國科學技術大學,2018.
[3] 梅啟成,呂文閣.基于深度學習的商品識別方法研究[J].機電工程技術,2018,47(9):41-44,164.