999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于正常樣本學習的真偽卷煙小盒膠痕鑒別方法

2023-10-12 12:59:12梁洲源馬慧宇李海燕王春瓊張榆鋒
煙草科技 2023年9期
關鍵詞:分類檢測模型

李 鄲,梁洲源,馬慧宇,李海燕,王春瓊,張 軻,張榆鋒*

1. 云南省煙草質量監督檢測站,昆明市高新技術開發區科醫路41 號 650104

2. 云南大學信息學院,昆明市呈貢區大學城東外環南路 650500

鑒別檢驗卷煙真偽對于加強煙草專賣管理、防止假冒卷煙流入市場具有重要意義。鑒別卷煙真偽最常用的方法是感官檢驗法,主要依賴檢測人員自身的經驗知識,從包裝、煙支、煙絲和吸味等多個方面對卷煙產品進行鑒定[1-2]。該方法對檢測人員的專業技能要求較高,且存在主觀性強等問題。因此,利用機器視覺技術和物化檢驗設備代替人類感官功能進行卷煙真偽鑒定成為當前研究熱點。鐘宇等[3]和肖楠等[4]基于卷煙外包裝圖像,分別通過傳統機器學習和深度學習對真偽包裝圖像進行了鑒別。魏中華[5]基于煙支的總通風率、硬度和濾嘴通風率3個物理指標構建了SVM(Support Vector Machine)真偽預測模型。張靈帥等[6]采集真偽煙絲的近紅外光譜數據,并通過主成分分析結合馬氏距離方法建立了判別模型。田耀偉等[7]、聶磊等[8]和高莉等[9]分別利用電子嗅覺系統、頂空-氣相色譜-質譜技術和頂空-離子分子反應質譜技術對卷煙的揮發性和半揮發性成分進行分析,以此區分真假卷煙。檢驗儀器的使用在很大程度上提高了卷煙真偽鑒別工作的客觀性,但隨著卷煙仿制技術水平的提升,真假煙的外觀和內在結構差異極小,并且卷煙的包裝樣式繁多、理化特性復雜,從外包裝和煙支、煙絲物化參數等方面進行卷煙真偽鑒別難度大且耗時費力,需要選擇更加有效的鑒別方法。卷煙小盒(以下簡稱煙盒)內部的粘膠痕跡是反映卷煙包裝機型的重要特征,由于制假者大多使用簡單的包裝設備和粗劣的包裝工藝,因而真煙和假煙的膠痕形態存在顯著差異[10]。目前,卷煙工業企業使用的主流包裝機型有14種,對應14類真品膠痕,類別數量少,并且相較于不斷推陳出新的包裝樣式和卷煙配方,卷煙包裝工藝相對穩定,粘膠痕跡長期保持不變。因此,將膠痕作為檢測對象可有效降低鑒別問題的復雜度,使鑒別方法具有更廣泛、更長期的通用性。由于膠痕在自然光下人眼難以辨識,需要在特殊光照環境下采集圖像再進行真偽鑒別處理。此外,考慮到假煙的辨別、收集、標定工作困難,并且制假者的生產工藝參差不齊,使得假樣本具有數量少、特征不穩定等特點,因而引入異常檢測技術,僅通過正常(真品)樣本構建鑒別模型。異常檢測作為機器學習領域的重要分支,主要解決機器學習模型在面對未知樣本時的安全問題,對于保證機器學習系統的可靠性至關重要,被廣泛應用于網絡入侵檢測[11]、欺詐行為檢測[12]、農作物病害檢測[13]和工業產品缺陷檢測[14]等多個領域。深度學習通過深層神經網絡自動獲取數據的語義信息和潛在模式,無需人工設計特征,可提高異常檢測的效率、準確率和魯棒性[15]。為此,提出一種基于膠痕圖像深度學習的卷煙真偽鑒別方法,通過構建適用于多種卷煙規格的卷煙真偽鑒別模型,以期利用機器視覺代替人眼視覺進行鑒別,提高卷煙真偽鑒別準確率。

1 材料與方法

1.1 材料

收集10 種常見包裝機型生產的煙盒(硬盒卷煙包裝機型5種,軟盒卷煙包裝機型5種);假冒硬盒和軟盒卷煙來源于云南省煙草質量監督檢測站。拆解所有煙盒并去除內襯紙后得到平整的煙盒樣品,包裝機型類別、卷煙規格和煙盒樣品數量見表1。

表1 包裝機型類別和煙盒樣品數量Tab.1 Packer types and number of cigarette packet samples

1.2 方法

如圖1 所示,基于膠痕圖像深度學習的卷煙真偽鑒別方法包括煙盒膠痕圖像采集、膠痕圖像樣本產生、基于深度學習異常檢測的真偽鑒別3 個主要步驟。

1.2.1 煙盒膠痕圖像采集

煙盒包裝過程中主要使用熱熔膠或白乳膠作為粘接劑,產生的粘膠痕跡呈無色透明狀或白色半透明狀,主要分布于硬煙盒內部的正面和反面以及軟煙盒內部的側邊。由于煙盒包裝紙內部多為白色,使得膠痕在自然光或普通熒光燈照射下人眼辨識度低,難以通過普通拍攝或掃描方式采集到清晰的膠痕圖像。借鑒刑偵學中的分色攝影技術[16],利用特殊光譜成分的可見光對煙盒樣品進行照射,以增強膠痕與內部包裝紙的區分度,并以此設計了一種膠痕圖像采集裝置,見圖2。該裝置主體為密閉的遮光箱(長29.2 cm,寬25.5 cm,高32.3 cm),以避免外界環境光干擾。頂部的LED燈帶可提供均勻的光照,燈帶額定電壓5 V,3 條燈帶間隔2.5 cm。中間為白光燈帶,波長400~760 nm;兩側為藍光燈帶,波長400~450 nm。裝置下方的抽拉式鐵質底板配備限位器和磁條,便于快速放置煙盒樣品。拍攝手機型號為iPhone 11 Pro Max,拍攝軟件為Lightroom,選擇廣角鏡頭,快門時間1/100 s,白平衡6 000 K,感光度250,畫幅縮放200%。利用該裝置采集煙盒膠痕圖像,圖像尺寸為2 000 px×1 500 px,圖像存儲格式為JPG。

圖2 膠痕圖像采集裝置結構示意圖Fig.2 Structure of glue line image capturing device

1.2.2 膠痕圖像樣本產生

采集到的煙盒膠痕圖像仍有大部分與檢測無關的背景,需要通過圖像處理技術剔除這些背景,以突出圖像中的膠痕信息。如圖3所示,硬煙盒與軟煙盒的圖像處理流程:①讀取煙盒膠痕圖像;②通過二值化生成黑白圖像;③對黑白圖像進行開操作,先通過腐蝕操作去除煙盒外部的噪點和狹長突起部分,再通過膨脹操作還原煙盒外輪廓;④基于處理后的黑白圖像,得到膠痕分布區域的煙盒外輪廓點;⑤根據相鄰輪廓點之間的位置關系篩選得到4 個關鍵點;⑥獲取4 個關鍵點的最大外接矩形;⑦基于最大外接矩形,對原始圖像進行裁剪得到膠痕圖像樣本。圖4展示了各包裝機型膠痕圖像樣本,經過圖像處理后,圖像中的膠痕特征更加顯著。

圖3 煙盒圖像處理流程Fig.3 Process flow of cigarette packet images

圖4 不同包裝機型的煙盒膠痕圖像樣本Fig.4 Glue line image samples from different packers

1.2.3 基于深度學習異常檢測的真偽鑒別

機器學習模型在面對訓練期間未見過的樣本時難以做出準確判別,這將嚴重干擾機器學習系統在實際應用中的安全性和可靠性。異常檢測可以有效解決此類問題,該方法通過正常樣本構建檢測模型,檢測與正常模式存在差異的異常樣本[17]。Hendrycks 等[18]的研究表明,由于正常樣本與異常樣本的分布不同,由正常樣本訓練得到的分類模型,通常會對同樣來自正常分布的樣本產生較大的最大預測概率值,而對來自異常分布的樣本產生較小的最大預測概率值。為此,本研究中將數量多、膠痕特征穩定的真品膠痕樣本視作正常樣本,而將數量少、膠痕特征不穩定的假樣本視作異常樣本,基于深度學習異常檢測方法對膠痕圖像樣本進行真偽鑒別。

1.2.3.1 模型訓練數據集的建立和劃分

使用包裝機型表示膠痕類別,按類別整理膠痕圖像樣本后,得到膠痕圖像數據集。從該數據集的10 個真品類別中,每類隨機選取300 個樣本組成模型訓練數據集,樣本總量為3 000 個,各類真品樣本分別對應于0~9 的數值標簽。然后按7∶2∶1 的比例將模型訓練數據集隨機劃分為訓練集、驗證集和測試集。

1.2.3.2 模型分類訓練

卷積神經網絡(Convolutional Neural Networks,簡稱CNN)作為重要的深度學習網絡架構,被廣泛應用于圖像分類任務[19]。通過模型訓練數據集對CNN進行分類訓練,訓練目標是使模型能夠準確識別真樣本的膠痕類別。圖5展示了CNN分類模型的一般架構,將圖像樣本調整為指定大小后輸入模型,通過一系列操作自動提取圖像的深層語義信息,并通過softmax層對網絡輸出層進行處理,產生多個預測概率值p1,p2,…,pc,softmax層的計算公式可表示為:

圖5 卷積神經網絡分類模型Fig.5 Convolutional neural network classification model

式中:zi表示輸出層第i個節點的輸出值;c表示節點個數,即類別數量;將最大預測概率值記為pmax,該值所對應的類別即為模型預測樣本的類別。

選擇AlexNet[20]、VGG11[21]、ResNet18[22]、DenseNet121[23]、InceptionV1[24]這5個經典的CNN作為分類模型,各模型通過不同結構改進方式提升自身性能,見表2。

表2 不同卷積神經網絡模型的特點Tab.2 Characteristics of different convolutional neural network models

1.2.3.3 模型真偽鑒別

模型真偽鑒別流程見圖6。首先,加載完成訓練的分類模型,將測試集中所有樣本調整為指定大小后輸入模型,得到各樣本的最大預測概率值。然后,基于最大預測概率值計算判別閾值R,選擇兩種閾值計算方式進行對比:①將所有最大預測概率值由大到小排列,選取第95個百分位點對應的最大預測概率值作為閾值[25-26],記為R_0.95;②計算所有最大預測概率值的平均值作為閾值[27],記為R_mean。最后,將待測樣本調整為指定大小后輸入分類模型,通過模型對待測樣本產生的最大預測概率值pmax與閾值R進行比較,若pmax≥R,則將該待測樣本判別為真,否則判別為假,以此實現模型真偽鑒別。

圖6 真偽鑒別流程Fig.6 Authentication process flow

2 實驗與結果分析

2.1 實驗環境

硬件環境:Intel Core i7-10700 CPU @ 2.90 GHz,32 GB 內存,NVIDIA GeForce GTX 1650 圖形處理器。軟件環境:Windows 10 操作系統,Python 3.9.7 開發語言,圖像處理操作基于OpenCV-Python 4.5.5.64實現,深度學習框架基于PyTorch 1.10.2實現。

2.2 參數設置

訓練過程中超參數的設定值見表3。為避免模型訓練過擬合,采用提前終止的訓練策略,若模型的驗證集損失值在連續5個訓練周期內無下降,則終止訓練。

表3 超參數設置Tab.3 Setting values of hyperparameters

2.3 模型分類性能

訓練后模型的分類性能見表4。可見,AlexNet的測試集準確率約為94%,表明該模型能夠較好地區分真品膠痕類型,其訓練集和驗證集準確率相差約3 百分點,說明模型存在輕微的過擬合。VGG11的測試集準確率在97%以上,其訓練集和驗證集準確率的差值在2百分點以內,表明模型具有良好的分類精度和泛化性。ResNet18、DenseNet121、InceptionV1的測試集準確率均能夠達到99%,并且其訓練集和驗證集準確率的差值均在2百分點以內,表明這3 個模型的分類性能優異,精度高且泛化性好。

表4 不同卷積神經網絡模型的分類性能Tab.4 Classification performance of different convolution neural network models

2.4 模型鑒別性能

將未參與模型訓練的974 個真樣本和320 個假樣本作為待測樣本進行真偽鑒別,結果見圖7。基于混淆矩陣使用準確率、召回率和特異性[28]對模型的鑒別性能進行評估,結果見表5。可見,不同判別閾值對ResNet18、DenseNet121、InceptionV1 的鑒別性能影響較小,但會顯著影響AlexNet 和VGG11 對假樣本的判別能力。當閾值R=R_0.95 時,AlexNet 和VGG11 的特異性分別約為32%和52%,表明這兩個模型對假樣本的判別能力較差;當R=R_mean 時,AlexNet 和VGG11 的召回率分別約為82%和92%,特異性分別約為61%和68%,表明這兩個模型能夠準確判別大部分真樣本,并且具有一定的假樣本判別能力。因此,相較于R_0.95,選擇R_mean 作為判別閾值能夠保證所有模型對真偽樣本均具備一定的鑒別能力。當閾值R=R_mean 時,ResNet18、DenseNet121、InceptionV1 的鑒別準確率約為94%,召回率和特異性分別約為93%~94%和93%~95%,表明這3個模型能夠對絕大部分的真樣本和假樣本做出準確判別,表現出優異的鑒別性能。5 個模型的檢測時間均在10 ms左右,鑒別速度快,檢測效率高。

圖7 不同卷積神經網絡模型的混淆矩陣Fig.7 Confusion matrixes of different convolution neural network models

表5 不同卷積神經網絡模型的鑒別性能Tab.5 Identification performance of different convolution neural network models

本研究中還引入受試者工作特性曲線(ReceiverOperating Characteristic Curve,簡稱ROC 曲線)和曲線下面積(Area Under Curve,簡稱AUC)[29]進一步評估模型的鑒別性能,結果見圖8。可見,AlexNet 的AUC 約為0.82,表明模型的鑒別性能較好。VGG11的AUC 約為0.92,表明模型具有良好的鑒別能力。ResNet18、DenseNet121、InceptionV1 的AUC 約為0.98,表明這3 個模型的鑒別性能優異。結合2.3 節模型分類性能進行對比可以看出,模型在訓練過程中獲得的分類性能越好,其真偽鑒別性能越好。

圖8 不同卷積神經網絡模型的ROC曲線Fig.8 ROC curves of different convolution neural network models

3 結論

提出了一種基于正常樣本學習的真偽卷煙膠痕鑒別方法,將卷煙包裝外觀檢測轉換為包裝痕跡檢測,將真偽鑒別問題由一般分類任務轉換為異常檢測任務。使用1 294個真偽樣本進行鑒別測試,結果表明:采用本方法構建的鑒別模型能夠在完全不使用假樣本訓練的前提下對待測樣本進行真偽判別,因而無需進行大量的假樣本收集和標定工作,并且保證了模型在面對未知假樣本時的判別能力。AlexNet、VGG11、ResNet18、DenseNet121、InceptionV1 這5 個CNN分類模型中,ResNet18、DenseNet121、InceptionV1的鑒別性能優異,考慮到InceptionV1 的參數量比其他兩個模型更少,有利于將來在移動端設備進行應用部署,因而可以優先使用InceptionV1 構建判別模型。本方法簡單、準確、高效,適用于多種常見規格的卷煙產品。未來工作重點是收集其他包裝機型生產的足量煙盒樣品,構建更加完備的膠痕圖像數據集,在新的數據集上進一步驗證方法的有效性,并對鑒別模型進行優化,為建立高效、可靠的卷煙真偽智能鑒別方法提供支撐。

猜你喜歡
分類檢測模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
主站蜘蛛池模板: 91午夜福利在线观看精品| 久热中文字幕在线观看| 日韩美毛片| 亚洲精品不卡午夜精品| 国内精自视频品线一二区| 亚洲精品欧美日本中文字幕 | 免费国产不卡午夜福在线观看| 久久精品只有这里有| 免费在线a视频| 精品一区二区三区自慰喷水| 欧美a级在线| 国产精欧美一区二区三区| 国产女人在线视频| 国产色婷婷| 国产黑丝一区| 最近最新中文字幕在线第一页 | 中文国产成人精品久久| 久久综合色视频| 欧美亚洲国产精品第一页| 日本国产在线| 天天综合色天天综合网| 干中文字幕| 国产正在播放| 91人妻日韩人妻无码专区精品| 亚洲国产一成久久精品国产成人综合| 免费国产一级 片内射老| 国产精品偷伦在线观看| 天天综合网亚洲网站| 亚洲成a人片在线观看88| 欧美成人午夜在线全部免费| 国产一区二区三区在线观看视频| 青青草原偷拍视频| 亚洲人成色77777在线观看| 久久国产拍爱| 2022国产无码在线| 国产精品流白浆在线观看| 欧美国产日韩在线| 国产幂在线无码精品| 国产精品国产三级国产专业不| 日本久久久久久免费网络| 毛片基地视频| 在线观看国产黄色| 91视频区| 99热国产这里只有精品无卡顿"| 欧美劲爆第一页| 久草视频福利在线观看 | 欧美成人一级| 欧美特黄一免在线观看| 91午夜福利在线观看| 萌白酱国产一区二区| 国产91av在线| 欧美国产日本高清不卡| 欧美精品啪啪一区二区三区| 欧美色亚洲| 国产香蕉国产精品偷在线观看| 黄片在线永久| 国产亚洲现在一区二区中文| 亚洲天堂网在线播放| 又黄又爽视频好爽视频| 久久无码av三级| 99手机在线视频| 欧美a在线看| 精品国产一区二区三区在线观看| 久夜色精品国产噜噜| 91免费国产高清观看| 中美日韩在线网免费毛片视频| 毛片久久久| 国产成人免费视频精品一区二区| 五月天综合婷婷| 国产不卡在线看| 老司机精品一区在线视频| 久久成人免费| 亚洲午夜天堂| 成人免费一区二区三区| 无码专区在线观看| 在线观看欧美精品二区| 国产粉嫩粉嫩的18在线播放91| 福利在线一区| 欧美性精品| 亚洲中文字幕国产av| 免费高清a毛片| 99热这里只有成人精品国产|