(浙江美濃世紀集團有限公司,浙江杭州 311100)
自2013 年國家煙草專賣局發布了有關煙草包裝材料回收的文件以來,煙草行業的工商企業都加強了煙草瓦楞包裝箱的回收利用。2018年,煙草行業商業企業共向工業企業返還卷煙包裝11473.92百萬次(不包括非相鄰省份主要品牌的收益),總收益率為94.2%,比上年同期高0.72個百分點[1-2]。隨著中國將人工智能推向國家戰略水平,工業自動化程度不斷提高,工業企業的生產方式正在發生變化,并逐漸從傳統模式向自動化智能模式轉變[3]。在過去的兩年中,已經在人工智能領域開發和應用了許多技術,并且圖像識別技術是基于人工智能的代表性技術之一。卷煙紙箱通常專用于某種產品,因此回收必須梳理產品分類,以實現逆向物流并返回源頭的工業公司復用。對于如此龐大而瑣碎的回收業務,我們需要根據公司的實際需要提高分揀效率和速度,減少人工判斷并降低回收成本[4]。
當前,大多數人工智能的學習準確性需要大量投資,而自動機器學習(AutoML)是減少數據預處理,特征提取,模型選擇,參數調整等方面的新興方向。它使企業可以低成本采用人工智能。通過比較百度的EasyDL,阿里云視覺智能中的圖像識別,亞馬遜的Amazon SageMaker Ground Truth,谷歌的Google Cloud AutoML,微軟的Custom Vision Services以及其他自動化機器學習系統[5],百度EasyDL提供了簡單的界面和便捷的訪問。因此,在本文中,我們將把百度的EasyDL用作圖形深度學習工具,以實現在卷煙包裝回收中的價值,并初步探討在其他工業生產環節中的實現前景。
分類識別系統的整體結構如圖1所示。傳送帶將要分類的產品運送到識別和檢測位置。光電傳感器檢測紙箱的入口,工業相機自動捕獲延遲的貼標位置,以獲取目標瓦楞箱貼標區域的原始圖像。離線SDK 通過本地PC 分發(離線SDK由百度EasyDL平臺生成),以識別和判斷所拍攝的圖片并獲得相關的控制指令。發送控制指令至變速箱分類控制模塊,對相關的異常包裝進行分類,并根據瓦楞箱上的條形碼執行產品分類信息收集,并為再次分揀提供信息依據。

圖1 分類識別系統的整體結構Fig.1 The overall structure of the classification and recognition system
分揀識別系統硬件平臺主要包括:PC一體機、光感應模塊、工業相機、條碼識別模塊、分揀控制模塊、聲光報警模塊、傳送帶、電源等[6]。
其中,PC一體機是本地部署的核心,負責收集圖像信息和生成控制命令,報警異常并顯示實時結果,并可以根據實際情況計算塊內的對齊數量。光電傳感器模塊主要用于裝配線上,以檢查盒子是否已進入圖像識別區域并觸發通知信號。工業相機主要用于收集圖像信息。條形碼識別模塊用于在進入前端識別和分類鏈接后對不同的產品包裝進行重新分類。分類控制模塊用于對未貼標簽的產品進行分類或對產品進行分類,聲光報警模塊用于在系統異常時產生報警。
分揀識別系統因為考慮到很多工廠實際情況不具備上網條件,所以軟件基于C#和百度EasyDL的離線SDK進行開發。后期基于百度開放平臺飛槳(PaddlePaddle)以及Python做了部分深度學習模型的進一步嘗試,用來改進和提升異常外觀的判斷和學習效率提升。
整個過程可視化且易于操作。訓練用的圖片和測試數據準備就緒后,您可以在幾分鐘內獲得自定義模型。它分為四個階段。(1)數據準備;(2)模型創建;(3)模型訓練;(4)模型發布。
我們使用百度EasyDL定制的培訓平臺對瓦楞箱圖像進行深度學習。該平臺現在支持深度學習,例如:圖像分類、對象檢測、聲音分類和文本分類。因為它在圖像中被識別,所以本文使用“對象檢測”模型。對象檢測模型可以識別圖像中對象的名稱,數量和位置,并且可以識別圖像中具有多個對象的場景。當平臺用戶進入平臺時,它首先創建一個模型和數據集,上傳一個紙板箱的圖像,并在數據集管理中顯示該圖像。其次,訓練模型并測試其有效性。最后,在線模型獲取API或離線SDK。
創建模型后,在“數據中心”中創建一個數據集,在“數據集管理”中找到剛創建的數據集,然后上傳捕獲的靜止圖像。使用EasyDL平臺的標記工具拖移框架,以構圖框。
在為所有照片添加注釋后,通過在“模型中心”中選擇“訓練模型”來訓練模型。EasyDL平臺將使用模型數據中70%照片進行訓練,其余30%照片用于測試模型的有效性,培訓大約需要3個小時。
mAP是EasyDL培訓平臺中衡量模型效果的指標。對于物體檢測任務,每一類檢測目標都可以計算出精確率和召回率,在不同閾值下多次計算或試驗,每個類都可以得到一條P-R曲線,曲線下的面積就是AP的值。“mean”的意思是對每個類的AP再求平均,得到的就是mAP值,mAP值越接近于1,模型效果越好。精確率為正確識別的物體數與識別物體總數之比,召回率為正確識別的物體數與真實物體數之比。
在物體檢測模型中,我們發現使用百度超大規模預訓練模型的YOLOv3_DarkNet 相比普通模型在各類數據集上平均提升5.12%,使用百度超大規模預訓練模型的Faster_RCNN,相比于普通預訓練模型,平均提升1.11%。并且,在物體檢測方向,新增了Cascade_Rcnn_ResNet50_FPN模型、YOLOv3_ResNet50vd_DCN模型、YOLOv3_MobileNetv1網絡,以及基于百度超大規模預訓練模型訓練出來的YOLOv3_Darknet、Faster_R-CNN_ResNet50_FP,其中,Cascade_Rcnn_ResNet50_FPN通過級聯多個檢測器以及設置不同IOU 的重采樣機制,使得檢測器的精度、和定位的準確度進一步提升。因增加了可形變卷積,對不規則紙箱和破損的檢測效果也有一定的正向提升。
在AI產業化過程中,新興IT企業已經積累了大量優質的算法框架、模型和數據,這些優質的AI技術正是產業AI化過程中行業用戶所需要的,聚合AI最強算力平臺、最優質的算法模型開發能力和最優質的集成、部署和服務能力,從而支撐和加速各行業、各產業與人工智能的融合,讓各個行業、各個產業具備可感知、自學習、可進化的能力,最終幫助用戶完成業務智能轉型升級。自動化學習平臺在卷煙包裝箱循環回收環節取消不必要的工序、合并工序、減少搬運、安排最佳的順序、找出最經濟的移動方法、盡可能地減少在制品的貯存供應鏈壓力。
EasyDL將EasyDL圖形開發的易用性及編程的靈活性結合在一起。在提供了很多便利的同時,又將控制權交給了客戶,讓客戶可以更加靈活和簡便的使用深度學習技術,激發人工智能+的無限可能,而PaddlePaddle是百度主推的開源機器深度學習平臺。它是Parallel Asynchronous Distributed Deep Learning的簡稱,也為我們提供了大量的深度學習模型庫。數字化和機器學習是現代網絡信息技術不斷發展的產物,該技術如果在印刷包裝行業得到良好的應用,不僅可以大大提高印刷包裝產品的整體質量和水平,而且也可以大大減少印刷包裝整個過程的時間消耗,提升效率實現降本增效,從而帶動整個印刷包裝行業的良性發展。因此,我們可以大膽地預料,在印刷包裝行業的未來發展中,人工智能作為未來工廠的數字印刷包裝技術之一將發揮舉足輕重的作用,更加適合當前的市場和技術發展需求。
卷煙包裝箱回收是供應鏈包裝逆向物流的一種,由于涉及到工商企業與其他單位,因此整個流程比較復雜,需要考慮各方的工作任務,并權衡各方的利益。對于卷煙箱的回收工作,一方面需要結合企業自身的特點,選擇合適的運行管理機制,做好各機構的分工和工序之間的銜接,保證整個系統的順暢運行。另外,對于煙箱回收利用的作業方式也要進行改善,保證紙箱在經歷所有的環節之后還能保持完好的狀態,相關設備也要適應循環使用的紙箱的作業要求。