譚剛林 長沙民政職業技術學院
2015 年,國家提出“中國制造2025”的國家戰略,制造業的產業升級已經成為大勢所趨。智能物流作為智能制造的一個重要組成部分,受到越來越多的關 注,AGV物流運輸車作為智能物流的核心環節,也成為國內外眾多廠商角逐發力的重點,未來中國將成為機器人和物流設備自動化的主要市場。從圖2中可以看出我國AGV市場規模在迅速擴大,AGV在“中國制造2025”中扮演越來越重要的角色。
隨著深度學習的技術進步,深度學習已在語音識別、自然語言處理、計算機視覺、圖像與視頻分析、多媒體等諸多領域的應用取得了巨大成功。深度學習作為目標檢測已成為一個主流的研究方向,可以通過端到端訓練自動學習任務,實現多層的非線性變換,獲取圖像高層抽象描述。
全國職業院校技能大賽是中華人民共和國教育部發起,聯合國務院有關部門、行業和地方共同舉辦的一項年度全國性職業教育學生競賽活動。為充分展示職業教育改革發展的豐碩成果,集中展現職業院校師生的風采,努力營造全社會關心、支持職業教育發展的良好氛圍,促進職業院校與行業企業的產教結合,更好地為中國經濟建設和社會發展服務。是專業覆蓋面最廣、參賽選手最多、社會影響最大、聯合主辦部門最全的國家級職業院校技能賽事。
全國職業院校技能大賽“嵌入式技術應用開發”賽項是集單片機技術、傳感器技術、嵌入式技術、無線通信技術、語音識別、圖像處理、Android智能設備與控制技術于一體的綜合性賽項,賽項重點考察軟、硬件結合,可充分培養學生對嵌入式相關技術的綜合應用能力。
深度學習根據其解決問題、應用領域的不同分為多種深度神經網絡模型。目前較為熱門的是卷積神經網絡(Convolutional Neural Network,CNN)和 深 度 置 信 網 絡(Deep Belief Networks,DBN)。深度置信網絡DBN是一種貪婪的逐層學習的算法,可以使深度置信網絡的權重達到最優化。DBN由若干層神經元組成,其組成元件是限制玻爾茲曼機(Restricted Boltzmann Machine,RBM)。 RBM是一種神經感知器,有兩層網絡組成,一層叫“顯層(”visible layer),用于輸入訓練數據。一層叫“隱層”(hidden layer),用于做特征檢測器。 將若干個RBM進行“串聯”,則上一個RBM的隱層即為下一個RBM的顯層,上一個RBM的輸出即為下一個RBM 的輸入。
卷積神經網絡CNN是一種熱門的深層深度學習模型,卷積神經網絡核心的關鍵思想是局部連接、權值共享、池化和多層堆疊。權值共享是CNN相較于其他模型具有獨特優越性的關鍵。它減少了神經網絡中參數的個數,從而降低了網絡的復雜度,使其更類似現實的生物神經網絡。CNN模型一般來說含有三個部分:卷積層、池化、全連接層。卷積層中神經網絡不再對圖片中的每個像素對處理,而是通過一個濾波器(即卷積核)對圖片中每一小塊像素區域進行掃描,提取局部特征和其位置關系。在獲取了這些特征后,再進一步對這些特征進行分類。
本課題將CNN和DBN兩種深度學習模型應用到AGV的視覺導引中,對比兩種模型的應用效果,確定一種優化后的網絡結構模型,提高AGV視覺識別的準確性和抗干擾能力。
圖像識別是深度學習最早嘗試的應用領域。早在1989年,LeCun和他的同事發表了卷積神經網絡。在很長時間里,CNN雖然在小規模的問題上,比如說手寫數字,取得當時世界最好的結果,但一直沒有取得巨大成功。主要原因是CNN在大規模圖像上效果不好,比如像素很多的自然圖片內容理解,所以沒有得到計算機視覺領域的足夠重視。這種情況一直持續到2012年10月,Hinton和他的兩個學生在著名的ImageNet問題上,用更深的CNN取得世界最好結果,使得圖像識別大踏步前進。在Hinton的模型里,輸入就是圖像的像素,沒有用到任何的人工特征。為什么在之前沒有發生?原因當然包括算法的提升,比如dropout 等防止過擬合技術,但最重要的是GPU帶來的計算能力提升和更多的訓練數據。2012年,百度將深度學習技術成功應用于自然圖像OCR識別和人臉識別等問題上,并推出相應的桌面和移動搜索產品。2013年,深度學習模型被成功應用于一般圖片的識別和理解。深度學習應用于圖像識別不但大大提升了準確性,而且避免了人工特征抽取的時間消耗,從而大大提高了在線計算效率。深度學習將取代人工特征加機器學習的方法,逐漸成為主流圖像識別方法。
圖1為競賽需要識別的圖像。由于圖像旋轉角度不一致,加大了識別難度,不能采用傳統的圖像分割來進行識別。為了增加競賽難度,拉開隊伍的競賽成績,2017年識別的圖像中又增加了星形,難度就更大了。
只要圖像是規則的,理論上來說傳統的識別方法還是可以很好地完成識別任務的,但實際情況并不如此,因為競賽場所的光線強弱不同及干擾,拍出來的圖片達不到理想的識別效果。采用卷積神經網絡來進行深度學習處理,處理后結果比傳統的方法準確率提高了20%。
深度學習所運用的知識遠遠超出高等職業院校的教學范疇,學生難以理解接收,怎樣將深度學習模型模塊化,學生直接調用,是后期加強和繼續研究的方向。采用CNN學習模型,準確率還達不到理想的效果,更達不到商用的要求。深度學習技術在日新月異地演進、提高,深度學習在機器學習上會處于主導地位。