999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學(xué)習(xí)的植物果實(shí)重量正態(tài)分布檢驗(yàn)設(shè)計(jì)與實(shí)現(xiàn)

2022-06-07 03:36:42曾祥潘吳俊杰孫麗君
中國(guó)信息技術(shù)教育 2022年11期
關(guān)鍵詞:文本檢測(cè)模型

曾祥潘 吳俊杰 孫麗君

正態(tài)分布是自然界中最常見(jiàn)和最重要的一種分布,如某地區(qū)一個(gè)月降雨量的分布、一個(gè)公園里樹(shù)木高度的分布等。在其他的一些數(shù)據(jù)分析中,如T檢驗(yàn)、回歸分析等,都要求先對(duì)數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)。學(xué)生在種植活動(dòng)中收獲植物的果實(shí),果實(shí)重量分布是否符合正態(tài)分布呢?如果只預(yù)設(shè)總體的正態(tài)性,直接套用計(jì)算公式進(jìn)行計(jì)算,可能會(huì)影響統(tǒng)計(jì)效果。我們可以用計(jì)算機(jī)采集數(shù)據(jù),再用統(tǒng)計(jì)軟件進(jìn)行計(jì)算分析,驗(yàn)證果實(shí)的重量是否符合正態(tài)性。

本實(shí)驗(yàn)研究使用電子稱測(cè)量在種植園采摘的小番茄重量。首先對(duì)小番茄逐個(gè)稱重、拍照記錄;然后利用深度學(xué)習(xí)框架訓(xùn)練的AI模型識(shí)別照片中電子秤顯示的數(shù)值,采集所有小番茄的重量數(shù)據(jù);最后通過(guò)R語(yǔ)言進(jìn)行數(shù)據(jù)正態(tài)分布檢驗(yàn)。通過(guò)活動(dòng)讓學(xué)生體驗(yàn)利用人工智能項(xiàng)目解決實(shí)際問(wèn)題的一般路徑,為今后制作通用的儀表數(shù)據(jù)收集工具提供必要的訓(xùn)練數(shù)據(jù)和技術(shù)路線。

● 設(shè)計(jì)思路

通過(guò)本實(shí)驗(yàn)活動(dòng),實(shí)現(xiàn)小番茄稱重?cái)?shù)值的識(shí)別采集,并檢測(cè)重量數(shù)據(jù)是否符合正態(tài)分布。實(shí)驗(yàn)項(xiàng)目需經(jīng)歷AI數(shù)據(jù)集制作、訓(xùn)練AI模型、使用AI模型推理這一過(guò)程,能夠從小番茄稱重圖片中識(shí)別和保存重量數(shù)據(jù);利用R語(yǔ)言工具進(jìn)行數(shù)據(jù)分析,繪制統(tǒng)計(jì)圖,驗(yàn)證數(shù)據(jù)是否符合正態(tài)分布。

在圖片中識(shí)別稱重?cái)?shù)據(jù),這在人工智能領(lǐng)域?qū)儆贠CR文字識(shí)別技術(shù),需要兩方面的功能——文本檢測(cè)和文字識(shí)別,識(shí)別過(guò)程如圖1所示。

文本檢測(cè)和文字識(shí)別都有非常成熟的算法可以使用,如DBNet場(chǎng)景文本檢測(cè)算法、CRNN文字識(shí)別算法等。這些算法經(jīng)過(guò)不斷改進(jìn),已經(jīng)廣泛地在各種文字識(shí)別項(xiàng)目中應(yīng)用。PaddleOCR是一個(gè)開(kāi)源文字識(shí)別工具庫(kù),整合了多種優(yōu)秀算法,其基于PaddlePaddle深度學(xué)習(xí)框架開(kāi)發(fā),具有識(shí)別率高、識(shí)別速度快的優(yōu)點(diǎn),能滿足本次實(shí)驗(yàn)的需求。

PaddleOCR有多種語(yǔ)言通用識(shí)別模型,可以直接用于文本檢測(cè)和文字識(shí)別,但這些模型不能用于本實(shí)驗(yàn)項(xiàng)目,因?yàn)檫@些模型會(huì)把電子秤上印有的商標(biāo)文字、功能說(shuō)明文字識(shí)別出來(lái),識(shí)別結(jié)果會(huì)出現(xiàn)大量與數(shù)值無(wú)關(guān)的文字。此外,電子稱顯示屏的數(shù)字并不是印刷體文字,在使用通用文字識(shí)別模型時(shí),識(shí)別結(jié)果的正確率會(huì)偏低,導(dǎo)致數(shù)據(jù)不準(zhǔn)確。所以,使用PaddleOCR必須訓(xùn)練出符合實(shí)驗(yàn)項(xiàng)目需要的文本檢測(cè)和文字識(shí)別模型。

● 實(shí)驗(yàn)過(guò)程

實(shí)驗(yàn)過(guò)程由三個(gè)環(huán)節(jié)組成,分別是制作模型訓(xùn)練樣本集、訓(xùn)練文字識(shí)別模型和使用模型進(jìn)行推理,如圖2所示。

1.準(zhǔn)備訓(xùn)練樣本

訓(xùn)練樣本的準(zhǔn)備是人工智能項(xiàng)目首先要完成的部分,也是最耗費(fèi)人力的工作。樣本的數(shù)量和質(zhì)量直接影響模型的訓(xùn)練效果,因此要有足夠的耐心,認(rèn)真完成。

首先用電子稱給小物件稱重,小物件可以是U盤(pán)、筆、硬幣等,并在稱重時(shí)拍照。通過(guò)給單個(gè)物件或者兩個(gè)、三個(gè)等不同組合的物件稱重,采集不少于500張圖片,再用圖片處理軟件將圖片處理為960×960像素。所有圖片復(fù)制兩份,分別放入兩個(gè)文件夾,一份用于制作文本檢測(cè)樣本,另一份用于制作文字識(shí)別樣本。

(1)文本檢測(cè)樣本制作

打開(kāi)圖片標(biāo)注工具PaddleOCRLabel,點(diǎn)擊“矩形標(biāo)注”,給每張圖片中顯示屏里面的數(shù)字進(jìn)行標(biāo)注。標(biāo)注框要緊貼數(shù)字邊緣,不要隨意擴(kuò)大或縮小范圍。標(biāo)注完畢,導(dǎo)出結(jié)果保存在圖片文件夾內(nèi),文件名為L(zhǎng)abel.txt。

(2)文字識(shí)別樣本準(zhǔn)備

用圖片處理軟件把液晶屏的數(shù)字裁剪出來(lái),注意控制裁剪范圍,僅保留數(shù)字。然后在圖片文件夾內(nèi)創(chuàng)建一個(gè)文本文件List.txt,內(nèi)容是圖片文件名和數(shù)字內(nèi)容,中間用“Tab”鍵隔開(kāi)。此文檔作為標(biāo)注文件使用。

此外,還要?jiǎng)?chuàng)建一個(gè)詞典文件。在文件夾PaddleOCR/ppocr/utils內(nèi)創(chuàng)建文本文件lcdnumber_dict.txt,內(nèi)容是數(shù)字“0~9”以及小數(shù)點(diǎn)“.”,每個(gè)數(shù)字占一行。

2.訓(xùn)練AI模型

訓(xùn)練AI模型需要耗費(fèi)很長(zhǎng)的時(shí)間,根據(jù)計(jì)算機(jī)配置的不同,以及樣本數(shù)量、訓(xùn)練次數(shù)設(shè)置等影響因素,訓(xùn)練時(shí)長(zhǎng)從一兩個(gè)小時(shí)到幾十個(gè)小時(shí)不等。

(1)文本檢測(cè)模型訓(xùn)練

文本檢測(cè)模型訓(xùn)練使用的配置文件為PaddleOCR/configs/det/det_mv3_db.yml。修改配置文件,把epoch_num設(shè)置為100,其他各項(xiàng)根據(jù)計(jì)算機(jī)配置等實(shí)際情況修改。

樣本圖片和標(biāo)注文件Label.txt放入文件夾PaddleOCR/train_data/det/。

文件準(zhǔn)備妥當(dāng),開(kāi)始訓(xùn)練模型,命令如下:

python tools/train.py -c configs/det/det_mv3_db.yml

訓(xùn)練開(kāi)始后觀察Loss的變化,正常情況下Loss數(shù)值下降速度從快到慢。除了觀察數(shù)字變化外,還可以使用VisualDL工具用圖形方式觀察Loss變化曲線(如圖3)。

當(dāng)發(fā)現(xiàn)Loss曲線下降平穩(wěn)后,可以考慮終止訓(xùn)練,避免模型訓(xùn)練出現(xiàn)過(guò)擬合,導(dǎo)致訓(xùn)練效果下降。訓(xùn)練得出的模型保存在PaddleOCR/output/det。

(2)文字識(shí)別模型訓(xùn)練

文字識(shí)別模型訓(xùn)練使用的配置文件為PaddleOCR/configs/rec/PP-OCRv3/en_PP-OCRv3_rec.yml。修改配置文件,把epoch_num設(shè)置為100;詞典文件路徑character_dict_path設(shè)置為./ppocr/utils/lcdnumber_dict.txt;其他各項(xiàng)根據(jù)計(jì)算機(jī)配置等實(shí)際情況修改。

樣本圖片和標(biāo)注文件List.txt放入文件夾PaddleOCR/train_data/rec/。

開(kāi)始訓(xùn)練模型,命令如下:

python tools/train.py -c configs/rec/PP-OCRv3/en_PP-OCRv3_rec.yml

訓(xùn)練開(kāi)始后除了要觀察Loss的變化外,還要留意acc的變化。正常情況下訓(xùn)練一段時(shí)間后acc數(shù)值才開(kāi)始上升,最后穩(wěn)定在1附近,如圖4所示。

當(dāng)acc上升到1附近,而loss下降并穩(wěn)定后就可以終止訓(xùn)練,避免模型過(guò)擬合。模型文件可在文件夾PaddleOCR/output/rec內(nèi)找到。

3.使用AI模型推理

訓(xùn)練完成,可以先用幾張圖片測(cè)試效果。測(cè)試用圖片可以從訓(xùn)練樣本里挑選,也可以重新拍攝或者使用小番茄稱重圖片。

文本檢測(cè)測(cè)試圖放入PaddleOCR/train_data/det/test/文件夾;文字識(shí)別測(cè)試圖放入PaddleOCR/train_data/rec/test文件夾。

(1)文本檢測(cè)模型推理

測(cè)試命令如圖5所示。識(shí)別結(jié)果可在./output/det/det_results文件夾內(nèi)查看。

(2)文字識(shí)別模型推理

測(cè)試命令如圖6所示。識(shí)別結(jié)果將顯示在終端屏幕上。

(3)文本檢測(cè)文字識(shí)別串聯(lián)推理

以上模型只能實(shí)現(xiàn)單一的文本檢測(cè)或者文字識(shí)別,要實(shí)現(xiàn)小番茄稱重?cái)?shù)據(jù)的采集,還需要將兩個(gè)模型轉(zhuǎn)化為推理模型,然后串聯(lián)使用。首先將兩個(gè)模型轉(zhuǎn)為推理模型。文本檢測(cè)模型轉(zhuǎn)換推理模型命令如圖7所示,文字識(shí)別模型轉(zhuǎn)換推理模型命令如圖8所示。

把小番茄稱重圖片放在PaddleOCR/doc/imgs/,用兩個(gè)模型串聯(lián)起來(lái)推理,命令如圖9所示。

識(shí)別結(jié)果保存在PaddleOCR/inference_results文件夾內(nèi)。

● 數(shù)據(jù)分析

檢驗(yàn)小番茄的重量是否符合正態(tài)分布,這里使用了R語(yǔ)言進(jìn)行檢驗(yàn)。比較直觀的方式是用R語(yǔ)言繪制圖像,如頻數(shù)分布直方圖(如下頁(yè)圖10)和QQ圖(如下頁(yè)圖11)。

1.繪制檢驗(yàn)圖形

導(dǎo)入小番茄稱重?cái)?shù)據(jù)后,先繪制頻數(shù)分布直方圖,命令如下頁(yè)圖12所示。

從圖10可見(jiàn),數(shù)據(jù)呈現(xiàn)了中間高兩邊低的鐘形曲線,基本符合整體分布的特征。接著,再繪制QQ圖,命令如下頁(yè)圖13所示。

圖11中的紅色區(qū)域?yàn)?5%置信區(qū)間,藍(lán)色散點(diǎn)為實(shí)際數(shù)據(jù)。大部分?jǐn)?shù)據(jù)分布在置信區(qū)內(nèi),雖然有少部分?jǐn)?shù)據(jù)在置信區(qū)外,但實(shí)際中很少有完美的分布圖,可以認(rèn)為數(shù)據(jù)符合正態(tài)分布。

2.正態(tài)性檢驗(yàn)

除了通過(guò)觀察圖形的方式判斷數(shù)據(jù)的正態(tài)性以外,還可以通過(guò)Shapiro-Wilk正態(tài)檢驗(yàn)來(lái)判斷。

命令:shapiro.test

(tomato$weight)

檢驗(yàn)結(jié)果如圖14所示,從結(jié)果得知P值大于0.05,可認(rèn)為數(shù)據(jù)符合正態(tài)分布。

● 總結(jié)

在這一實(shí)驗(yàn)中,筆者花了大量的時(shí)間準(zhǔn)備樣本和訓(xùn)練模型,訓(xùn)練出來(lái)的模型除了識(shí)別小番茄的稱重?cái)?shù)據(jù)就沒(méi)有其他用途了嗎?能不能借助這種方法進(jìn)行數(shù)據(jù)采集呢?答案是肯定的。在工廠等生產(chǎn)環(huán)境中,利用人工智能技術(shù)識(shí)別儀器數(shù)值已經(jīng)普及。如果多采集一些儀器的儀表盤(pán)圖片,做成樣本,重新訓(xùn)練出模型,這樣的模型能夠識(shí)別出更多類型的儀器讀數(shù)。把模型部署到手機(jī)、攝像頭等設(shè)備,就能夠?qū)崿F(xiàn)拍照、錄像自動(dòng)記錄數(shù)據(jù)的功能了。至于怎樣進(jìn)一步深入使用基于深度學(xué)習(xí)的OCR技術(shù),在后續(xù)的學(xué)習(xí)中再探討研究。

猜你喜歡
文本檢測(cè)模型
一半模型
“不等式”檢測(cè)題
“一元一次不等式”檢測(cè)題
“一元一次不等式組”檢測(cè)題
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識(shí)別
電子制作(2018年18期)2018-11-14 01:48:06
3D打印中的模型分割與打包
小波變換在PCB缺陷檢測(cè)中的應(yīng)用
主站蜘蛛池模板: 亚洲中文字幕精品| 深夜福利视频一区二区| Aⅴ无码专区在线观看| 国产正在播放| 国产成人无码AV在线播放动漫| 国产精品一区不卡| 亚洲丝袜中文字幕| 久久无码高潮喷水| 9丨情侣偷在线精品国产| 日本a∨在线观看| 国产精品嫩草影院av| 国产流白浆视频| 日韩视频福利| 在线不卡免费视频| 婷婷色在线视频| 久久久成年黄色视频| 亚洲人人视频| 国产91小视频| 亚洲第一网站男人都懂| 国产全黄a一级毛片| 二级毛片免费观看全程| 一级毛片基地| 亚洲成人动漫在线观看| 一级香蕉视频在线观看| 99在线视频免费| 为你提供最新久久精品久久综合| 中文成人在线| 国产在线91在线电影| 亚洲精品午夜无码电影网| 午夜爽爽视频| 精品无码专区亚洲| 色哟哟国产精品| 美女裸体18禁网站| 亚洲精选无码久久久| 亚洲第一成年人网站| 国产va在线| 国产在线98福利播放视频免费| 热99精品视频| 久久久久亚洲精品无码网站| 亚洲综合色吧| 亚洲第一香蕉视频| 三上悠亚精品二区在线观看| 久久免费成人| 69精品在线观看| 免费高清毛片| 怡红院美国分院一区二区| 狠狠色成人综合首页| 日韩a级毛片| 中文字幕人成人乱码亚洲电影| 制服丝袜一区| 亚洲av无码牛牛影视在线二区| 久久这里只有精品免费| 日韩欧美视频第一区在线观看| 久久semm亚洲国产| 国产精品综合久久久| 99re热精品视频国产免费| 激情午夜婷婷| 亚洲美女高潮久久久久久久| 91po国产在线精品免费观看| 四虎永久在线视频| 日韩毛片在线播放| 国产18页| 免费99精品国产自在现线| 久久精品人人做人人综合试看| 人妻丰满熟妇αv无码| 自慰网址在线观看| 伊人91在线| 18禁高潮出水呻吟娇喘蜜芽| 日韩麻豆小视频| 亚洲成人精品久久| 国产毛片片精品天天看视频| 亚洲日韩国产精品综合在线观看| 国产色网站| 国产伦精品一区二区三区视频优播 | 四虎精品免费久久| 色婷婷在线影院| 国产青青操| 国产成a人片在线播放| 青青国产成人免费精品视频| 国产成人1024精品下载| 黄色福利在线| 最新日本中文字幕|