999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TINYYOLO2神經網絡視覺翻譯棒

2021-07-19 21:11:42劉瀟元任釗婷楊晨
電腦知識與技術 2021年15期

劉瀟元 任釗婷 楊晨

摘要:2015年10月,AlphaGo在沒有任何讓子的情況下,以5:0的懸殊比分擊潰歐洲圍棋冠軍樊麾二段。隨即第二年六月戰勝第一圍棋手柯潔。人工智能初露鋒芒,而在當今人工智能的發展下各個產業出現了新的轉變,人臉識別,視網膜識別,虹膜識別,掌紋識別,專家系統,無人駕駛,智能搜索,定理證明,博弈等人工智能逐漸改變著人們的生活,神經網絡在圖像處理的運用上更加廣泛,常應用于車輛檢測、目標分類識別。本項目意在通過YOLO2的剪枝算法TINY yolo2實現在嵌入式soc上進行目標檢測達到圖像轉文字的目的。再爾,通過云服務實現文字轉語音的服務。完成整個項目的目的,即圖像轉文字的過程,適用于幼兒教學市場。

關鍵詞:TINY YOLO2;云服務;視覺翻譯

中圖分類號:TP311? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)15-0182-02

1 神經網絡單元TPU介紹

在芯片集成度方面,勘智K210采用視聽一體化設計。在機器視覺上,芯片基于自主研發的神經網絡加速器KPU,可完成基于神經網絡的圖像分類任務,進行人臉識別與檢測,以及實時獲取被檢測目標的分類。在聽覺能力上,芯片自帶APU語音處理單元,最高可支持8路音頻數據及16個方向,無須占用CPU即可實現聲源定向、聲場成像、波束形成、語音識別與喚醒等功能。

在算法定制化方面,勘智K210在可編程能力上呈現出更高的靈活性。首先,相比ARM等架構,勘智K210采用RISC-V架構,擁有更強的可定制化能力,便于開發者根據具體應用場景定制算法。其次,芯片搭載FPIOA現場可編程IO陣列,支持TensorFlow、Keras、Darknet、PaddlePaddle和Caffe等主流AI編程框架,以及全面的開發文檔,對開發者十分友好。

2 攝像頭

OV7670,本設計采用自帶FiFo的模組,使用FIFO模組可以大大減少K210的計算量,數字攝像頭的構成主要是由鏡頭、基座、紅外濾波片、圖像傳感器。部分數字攝像頭可能帶有馬達用以調節像距。本設計中為了提高處理速度,使用CIF格式的圖像格式傳輸到K210中進行計算,經過實際的測試,空載的幀率可以達到80FPS。在實際加載上TINY YOLO2的程序測試可以達到60FPS左右,達到了實際使用的需求。

3 識別算法TINY YOLO2

相較于RCNN系列算法,YOLO算法最大的創新在于將物體檢測作為回歸問題來求解,而RCNN系列算法是將目標檢測用一個region proposal + CNN來作為分類問題求解。 如下圖所示,YOLO通過對輸入圖像進行推測,得到圖中所有物體的位置及其所屬類別的相應概率。

YOLO的網絡模型結構包含有24個卷積層和2個全鏈接層,其具體結構如下:

4 百度云語音合成API

為了減小內存的使用,本項目采用了百度語音合成python接口,只需要使用http請求的REST API接口,將文本轉換為可以播放的音頻文件。再通過K210的播放器進行輸出。由于k210的性能限制,本項目使用內存占用極小的PCM編碼,聲音經過采集和處理裝置的抽樣、量化和編碼就實現了脈沖編碼調制。本系統中使用K210的I2S總線連接麥克風模塊,模擬聲音信號經過麥克風抽樣采集。傳送到K210端口,經過K210通過DAC發送音頻放大器,最后由揚聲器將PCM編碼的聲音量播報出來,實現了語音播報。

PCM以采樣技術為定理。采樣定理:如果在規定的時間內,以有效信號最高頻率的二倍或二倍以上的速率對該信號進行采樣,則這些采樣信息值中包含了全部原始信號信息。再進行實際實驗時 Tiny yolo2在k210平臺上幀率能達到60fps+。

5 系統菜單設計

為了完成該項目的多個功能需要設計一個菜單搭配按鍵進行功能的選擇,這里我們采用了有限狀態機。也稱為FSM,其特點是任意狀態在任意時刻都有對應的下一狀態。每個狀態具有同樣的屬性,當其屬性進行轉移時,FSM將一直保持消亡狀態。狀態轉移圖中還有兩個特殊狀態:狀態1狀態被稱為“起始狀態”,表示FSM的初始化狀態,狀態6稱為“結束狀態”。表示成功識別了所有屬性而后進入下一流程。使用編程思維理解,建立結構體數組成員變量使用UP、DOWN、ENTER,來表示每個狀態對應的屬性操作。建立Index成員表示當前的序列號,函數指針表示當前狀態所需要執行的函數。通過Index序號根據用戶的操作UP、DOWN或是ENTER來進入下一個所需要執行的函數。達到邏輯清晰、代碼量簡潔高效的目的。

然后我們開始程序設計。CurrerIndex表示當前標號,UpIndex表示按下上鍵跳入的菜單標號,DnIndex表示按下下鍵跳入的菜單標號,EnterIndex表示按下確認鍵跳入的菜單標號,(*CurOperate)表示這個菜單對應的函數指針。

Encoder_EC11_Scan()函數這個本來是編碼器EC11的掃描函數,由于體積大小原因,將旋轉編碼器替換成了三個按鍵。AA代表上鍵,BB代表下鍵,Keyenter鍵代表確認鍵。當按鍵按下對應引腳接地,引腳電平為0。為了消除抖動使用了Delay5ms()這個函數延遲5ms如果這時按鍵還是低電平,就說明不是因為抖動而是人為按下。置ScanResult返回值為0,1,2,3分別代表按鍵沒有按下,上鍵,下鍵,確認鍵的按下標志位并作為函數的返回值返回。

狀態機從0開始,通過Encoder_EC11_Scan()函數來返回用戶的操作鍵碼,通過Switch語句跳轉到各個鍵碼對應的操作中去。如按下上鍵Encoder_EC11_Scan()函數會返回1。并把此時菜單上鍵對應的鍵碼賦值給Fun_index全局變量。然后將對應的函數指針賦值給CurOperate_Ptr。而后執行函數完成函數的跳轉。

6基本流程

1)k210通過攝像頭獲取圖像;

2)圖像輸入變換進入模型比對;

3)圖像中是否存在目標物體;

4)存在物體,文本信息送入百度云api進行轉化然后送入揚聲器進行播報。否則返回獲取圖像繼續搜索目標物體。

7 項目總結

本項目將神經網絡識別技術與物聯網技術結合在一起。意在通過圖像得到語音的輸出,適用于早教市場,幼兒外語的學習。項目的不足,因為是通過網絡進行語音轉化,所以本項目離不開網絡,必須通過手機開啟熱點或連接家中wifi使用,本項目將會繼續研究離線的文字語音轉化技術。

參考文獻:

[1] Real-Time Pattern-Recognition of GPR Images with YOLO v3 Implemented by Tensorflow. 10.3390/s20226476.

[2] 謝兄,楊金鵬.YOLO-wLU:考慮定位不確定性的目標檢測算法[J]. 計算機工程與應用.

[3] 黃鳳琪,陳明,馮國富,基于可變形卷積改進的yolo目標檢測算法[J].計算機工程.https://doi.org/10.19678/j.issn.1000-3428.0059096.

【通聯編輯:李雅琪】

主站蜘蛛池模板: V一区无码内射国产| 婷婷成人综合| 日韩精品一区二区三区swag| 国产农村1级毛片| 国产精品自在自线免费观看| 久久美女精品国产精品亚洲| 国产97视频在线观看| 国产一区成人| 中文字幕有乳无码| 伊人五月丁香综合AⅤ| 国产成人免费高清AⅤ| 91综合色区亚洲熟妇p| 免费精品一区二区h| 久久久久免费精品国产| 亚洲人成网站在线观看播放不卡| 国产在线视频欧美亚综合| 国产无码制服丝袜| 97se亚洲综合| 国产黑人在线| 黄色在线网| 国产亚洲欧美日本一二三本道| 亚洲天堂高清| 国产白浆在线| 久久综合丝袜长腿丝袜| 人人妻人人澡人人爽欧美一区| 天天综合色网| 国产香蕉97碰碰视频VA碰碰看| 国产情侣一区二区三区| 红杏AV在线无码| 99久久精品美女高潮喷水| 欧美福利在线观看| a国产精品| 亚洲免费毛片| 人妻精品久久无码区| 亚洲最大看欧美片网站地址| 中文天堂在线视频| 亚洲日韩每日更新| 国产免费a级片| 国产精品一区在线观看你懂的| 最新国产你懂的在线网址| 国产精品成人免费综合| AV片亚洲国产男人的天堂| 一边摸一边做爽的视频17国产| 最新国语自产精品视频在| 91青草视频| 久久青草视频| 国产美女无遮挡免费视频| 亚洲 欧美 偷自乱 图片| 伊人色综合久久天天| 午夜爽爽视频| 性激烈欧美三级在线播放| 日本高清免费一本在线观看| 女人爽到高潮免费视频大全| 亚洲男人天堂久久| 97在线公开视频| 热久久综合这里只有精品电影| 国产成人免费高清AⅤ| 国产后式a一视频| 日韩少妇激情一区二区| 亚洲人在线| 91无码视频在线观看| 久久综合成人| 手机精品视频在线观看免费| 日本三级欧美三级| 成年人福利视频| 色国产视频| 国产精品女主播| 暴力调教一区二区三区| 丁香亚洲综合五月天婷婷| 丁香五月亚洲综合在线| 午夜小视频在线| 天天干天天色综合网| 无码乱人伦一区二区亚洲一| 5388国产亚洲欧美在线观看| 国产成人无码综合亚洲日韩不卡| 99视频全部免费| 欧美国产综合色视频| 日韩av无码精品专区| 国产靠逼视频| 浮力影院国产第一页| 国产剧情国内精品原创| 日本一区二区三区精品国产|