馮韶文 楊晨 黃良帥 鞏秀鋼



【摘要】目前,市場上訓練青少年專注度的產品較少且功能單一,市場缺口已然很大。本研究突破了傳統訓練方法的局限性,設計了一種基于腦電波的青少年專注度訓練系統。本系統主要由腦電波模塊、圖像模塊、專注度訓練模塊和云平臺構成。首先使用腦電波模塊對訓練者的專注度進行監測,讓訓練者與訓練模塊進行語音交互,配合圖像模塊的識別結果,分析訓練者的興趣點,然后使用網頁進行興趣視頻實時切換,吸引訓練者的注意力,從而提高訓練者的專注度。訓練結果表明:該專注度訓練系統設計能夠實現對青少年專注度的逐步提高,系統穩定可靠,數據可視化便于觀察。本系統的應用領域廣泛,為進一步發展打下了基礎。
【關鍵詞】計算機應用腦電波專注度訓練圖像識別
引言
青少年教育是一個國家教育體系的基礎工作,怎樣培養一個性格樂觀向上、行為習慣良好、具備初步探索社會形態能力的下一代已經成為國家戰略的有機組成部分[1]。而在青少年教育中,青少年專注度的高低直接影響青少年對外界的認知能力,專注度差不僅會對青少年的日常生活有影響,還會影響青少年以后的學習生活,甚至對青少年的一生都有影響。因此訓練并提高青少年專注度具有一定社會意義。現有專注度訓練方法有很多,但普遍存在訓練效果緩慢、效果不穩固等缺陷。而隨著科學家對大腦的不斷研究,腦電波作為一種直接映射大腦內部活動狀態和人們思維狀態的生物電信號,在神經心理學、腦疾病診斷、腦機接口、認知科學等領域中被廣泛運用[2]。所以使用腦電波改善現有訓練方法具有一定研究價值。
本文設計研發了一種基于腦電波的青少年專注度訓練系統,以益智性為出發點,從興趣點入手對青少年進行專注度訓練,引導青少年在快樂中集中注意力。父母可以通過腦電波數據實時反饋了解到孩子的訓練效果,便于與孩子更好的溝通。
1 系統整體設計方案
青少年專注度訓練系統方案設計如圖1所示。系統主要由腦電波模塊、圖像模塊、專注度訓練模塊和云平臺構成。其中,腦電波模塊主要由腦電波傳感器Neurosky和ThinkGear芯片組成,通過采集訓練者的原始腦電波信號,用來計算訓練者的專注度指數,實現對整個訓練過程的專注度監測;圖像模塊主要由樹莓派微處理器作為控制器,通過接受攝像頭采集的圖像信息,通過數據傳輸發送到服務器端,進行機器視覺圖像識別;專注度訓練模塊是由Arduino微處理器、語音識別模塊、語音合成模塊和上位機組成,訓練模塊通過與訓練者進行語音交互,配合圖像模塊的識別結果,分析訓練者的興趣點,然后使用上位機進行興趣視頻實時切換,吸引訓練者的注意力,從而達到對訓練者的專注度提高;云平臺主要由服務器和上位機網站構成,通過記錄分析訓練者的訓練過程和結果,不斷迭代更新個性興趣矩陣,進一步完善本訓練系統。
2 系統硬件設計
2.1 腦電波模塊
本系統腦電波模塊是由腦電波傳感器和藍牙模塊組成。本模塊的主要功能是實現對整個訓練過程的的專注度監測。腦電波模塊使用的是neurosky腦電波傳感器,傳感器通過對訓練者的原始腦電波數據進行濾波去噪、頻譜分析,結合神念腦電算法[3],由不同頻率腦電波占比關系計算出eSense專注度指數,不同類型腦電波如圖2所示,表明訓練者的專注度水平的強烈程度,從而作為本系統的專注度衡量指標。為滿足高速率、低功率的數據傳輸,使用藍牙模塊建立無線連接,優化了腦電波模塊和云平臺之間的數據交互,實現了信息傳遞。
2.2 圖像模塊
本系統的圖像模塊是由攝像頭和樹莓派微處理器組成。本模塊的主要功能是完成對訓練過程所需的圖像信息采集及傳輸。攝像頭選用的是KS8A17AF高清800萬像素攝像頭模組,使用USB3.0數據傳輸,支持標準的UVC傳輸協議,分辨率高且反應迅速。主控器采用的是樹莓派Raspberry Pi 4,是一款基于4核心64位ARM Cortex-A72 CPU的高性能微處理器,工作頻率高達1.5GHz,具有非常高的運算能力和處理性能[4]。該處理器還具有千兆以太網接口、兩個USB 3.0和兩個USB 2.0接口,滿足系統低延遲、高速率的圖片流傳輸要求。當收到服務器發送的拍照命令時,樹莓派控制攝像頭進行圖像采集,存儲并等待服務器響應,最后以圖片流的形式將圖像信息發送至服務器端。
2.3 專注度訓練模塊
本系統的專注度訓練模塊由語音識別模塊、Arduino單片機和語音合成模塊組成。本模塊的主要功能是通過青少年與訓練系統之間簡單的語音交互,從而進一步控制圖像采集、興趣分析和視頻切換等功能,實現專注度持續訓練。語音識別模塊采用的是基于SI-ASR技術的LD3320芯片,集成了高精度A/D和D/A接口,不需要用戶進行錄音訓練,可動態編輯識別關鍵詞列表[5]。本模塊的主控器采用的是Arduino單片機,具有豐富的接口和片上資源,支持多種串口通信協議,搭配Wifi模塊,可快速傳輸和響應操作命令。語音合成模塊使用的是XFS5152C芯片,使用簡單的文本命令便可以自動合成語音,操作便捷靈活。
具體實現流程如圖3所示,當訓練者與訓練模塊進行語音交互時,語音識別模塊將接受的語音信息進行預處理和特征向量轉化,通過Arduino將語音數據處理為文本標簽,經Wifi模塊將數據發送到服務器。等待服務器對數據做出響應之后,Arduino將接受的答復命令發送給語音合成模塊,完成語音播報。同時,服務器根據語音信號和采集的圖像信號,進行興趣分析,實時視頻切換,吸引訓練者注意力,從而達到專注度訓練。
3 系統軟件設計
本訓練系統的軟件設計主要包括基于腦電波的專注度監測、基于機器視覺的目標檢測算法、平臺網頁設計3部分。接下來,將分別介紹每一部分的設計。
3.1 基于腦電波的專注度監測
為實現對整個訓練過程的的專注度監測,設計了基于腦電波的專注度監測,青少年在專注度訓練期間一直佩戴腦電波模塊,采集訓練者的原始腦電波信號。首先對采集的腦電波信號進行預處理,使用ICA算法[6]進行偽跡去除,減少周圍環境的噪聲干擾。然后對腦電波信號進行頻段劃分,按照不同頻率范圍提取Delta、Theta、Alpha、Beta、Gamma波段。之后使用NeuroSky公司的eSense腦電算法進行信號分類,由不同頻率腦電波占比關系計算出eSense專注度指數,作為本系統的專注度訓練衡量指標,并在Web端實時顯示。
3.2 基于機器視覺的目標檢測算法
3.2.1 RetinaNet算法
為了利用攝像頭進行目標檢測,達到物品種類識別以及后期興趣分析的目的,在這里設計了基于機器視覺的目標檢測算法,選取了RetinaNet網絡進行圖像識別。RetinaNet是在深度殘差網絡(Deep Residual Network,ResNet)的基礎上進行改進,增加了一層特征金字塔網絡(Feature Pyramid Networks,FPN)和兩層全卷積神經網絡(Fully Convolutional Networks,FCN)。主要效果是改進了標準的交叉熵(Cross-entropy,CE)loss,解決了類別不平衡的問題。具體實現原理如下:
標準的交叉熵loss如下所示:
(1)
稍微變換一下如式(2):
(2)
得出:
(3)
式中,越大,代表越容易實現分類目標。而RetinaNet提出了Focal loss[7]改進CE loss:
(4)
最終,為了使不同類別更加平衡,補充了常數項正負樣本平衡因子,如下:
(5)
Focal loss最大的特點是解決了正負樣本分布不平衡的問題,減少了數量較大的無關信息對loss的影響。RetinaNet不僅提高了識別準確率,而且在單階段目標檢測網絡實現了與雙階段目標檢測網絡近似的速率。
3.2.2 訓練數據集
本算法的訓練數據采用COCO標準數據集和網絡爬蟲獲取。COCO數據集是一個由微軟團隊提供的,以環境感知為目標的圖像識別數據集。提供80類圖像,20萬張標注圖片,主要通過圖像分割來進行目標標定。為了進一步提高識別率,本系統還通過網絡爬蟲從搜索引擎等圖片網站爬取了20類,共6萬張圖片。對圖片數據打上標簽、進行目標標注,并按照VOC2007格式將數據按比例隨機抽樣切分訓練集、驗證集和測試集樣本。
3.2.3 目標檢測結果
通過使用本算法進行目標檢測時,可以濾除大部分背景等無用信息對識別結果的影響。如圖4所示,拍攝圖片中大量背景物體的識別權重較低,對居中明顯的物體進行優先篩選識別。
3.3 平臺網頁設計
3.3.1 實時切換興趣視頻
在通過語音交互和機器視覺目標檢測之后,服務器會根據識別的結果,結合興趣分類,在Web端進行興趣視頻實時切換,吸引訓練者的注意力,從而提高訓練者的專注度。具體實現過程為:當服務器完成物體識別之后,向Web監聽器發送post請求,監聽器進行解析,一方面將解析數據存入數據庫中保存,另一方面將數據對應的視頻文件通過WebSockets協議推送到瀏覽器端,實現視頻的切換。
3.3.2 記錄成長歷程
云平臺通過數據庫記錄每一次的識別結果,不斷迭代更新個性興趣矩陣,同時Web實時顯示訓練者的專注度變化,可以通過歷史記錄瀏覽專注度訓練效果。
圖5中,通過對某一訓練者訓練效果連續記錄,將日平均專注度展示。結果表明,這一訓練者的訓練效果有較為平穩的提高。
4 結論
青少年專注度問題是一個值得注意的問題,隨著腦電波技術的不斷發展,結合腦電波技術提高青少年專注度是一個重要的研究方向。本文設計了一套基于腦電波的青少年專注度訓練系統,利用腦電波分析對整個訓練過程進行專注度監測,直觀反映訓練效果,通過語音交互和圖像識別分析青少年興趣點,以視頻互動的方式吸引青少年的注意力,從而不斷提高青少年的專注度。該系統經過前期測試,在設計成本、測量方法、測量效果等方面都達到了設計要求,可以通過不斷改進,進一步應用到各個領域。
【參考文獻】
[1]和超, 龐峰. 兒童教育空間趣味性的營造[J]. 大眾文藝, 2017(21):137.
[2]謝宗豹, 林蕙青. 醫學思維與創新[M]. 上海科學技術出版社, 2009.
[3]Zhang L, Lv Q, Xu Y. Single channel brain-computer interface control system based on TGAM module[C]. International Congress on Image & Signal Processing. IEEE, 2018.
[4]劉繼元. 基于樹莓派的物聯網應用[J]. 電子世界, 2016, No.494(08):26-27.
[5]李艷霞. 智能化電梯控制系統設計與實現[D]. 2013.
[6]Chen J L , Ros T , Gruzelier J H . Dynamic changes of ICA-derived EEG functional connectivity in the resting state[J]. Human Brain Mapping, 2013, 34(4).
[7]Lin T Y , Goyal P , Girshick R , et al. Focal Loss for Dense Object Detection[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, PP(99):2999-3007.
作者簡介:馮韶文(1995—),男,漢族,山東青島市人,碩士研究生,單位:山東理工大學計算機科學與技術學院計算機技術專業,研究方向:嵌入式應用。
通訊作者:*鞏秀鋼(1970—),男,漢族,山東淄博市人,副教授,博士,單位:山東理工大學計算機科學與技術學院計算機技術專業,研究方向:計算機測控、嵌入式應用、儀器儀表智能化等。
基金項目:國家級大學生創新創業訓練計劃項目(201910433024)