


摘要:摔倒已成為危害我國老年人健康的重要因素,其后果不容忽視。鑒于我國對老年人健康安全問題的深切關(guān)注,如何有效利用摔倒后的黃金救援時(shí)間,確保老年人能迅速獲得必要援助,已成為當(dāng)前亟待解決的關(guān)鍵問題。文章設(shè)計(jì)了一種基于YOLOv5目標(biāo)檢測算法的智能拐杖摔倒檢測系統(tǒng),該方法通過訓(xùn)練模型識別特定姿態(tài)——在此設(shè)計(jì)中,筆者采用五角星標(biāo)志物作為摔倒姿態(tài)的象征(此選擇旨在簡化訓(xùn)練過程,因?yàn)槲褰切切螤瞠?dú)特且易于在圖像中識別,從而便于模型學(xué)習(xí)摔倒特征的多樣性) ,并對模型結(jié)構(gòu)和超參數(shù)(如學(xué)習(xí)率、批量大小、正則化參數(shù)等) 進(jìn)行了細(xì)致優(yōu)化,顯著提升了算法的識別精準(zhǔn)度。實(shí)驗(yàn)結(jié)果顯示,該系統(tǒng)模型訓(xùn)練精度高達(dá)95%以上,同時(shí)在測試集上也表現(xiàn)出良好的準(zhǔn)確率和召回率,為老年人摔倒后的及時(shí)救援提供了堅(jiān)實(shí)的技術(shù)支持。
關(guān)鍵詞:老年人摔倒檢測;YOLOv5;深度學(xué)習(xí);人工智能
中圖分類號:TP39 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2025)02-0012-03 開放科學(xué)(資源服務(wù)) 標(biāo)識碼(OSID) :
0 引言
隨著中國人口老齡化的不斷加劇,2020年65歲以上老年人口已達(dá)1.91億,占比13.5%,預(yù)計(jì)到2057 年這一數(shù)字將攀升至4.25 億,占比高達(dá)32.9%~37.6%,凸顯出老年健康問題的嚴(yán)峻性[1]。老年人群中,因衰老導(dǎo)致的感覺敏感度下降、反應(yīng)速度減緩、視力減退及身體平衡能力削弱等問題,使得摔倒成為嚴(yán)重威脅其健康和生活質(zhì)量的重大隱患。摔倒后若長時(shí)間未被發(fā)現(xiàn),老年人將面臨生命危險(xiǎn),因此,摔倒檢測技術(shù)的研發(fā)顯得尤為重要。
當(dāng)前,摔倒檢測方法主要分為基于傳感器和基于深度學(xué)習(xí)兩大類。在傳感器技術(shù)方面,雖然穿戴式與環(huán)境傳感器各具特色,如Alesin團(tuán)隊(duì)設(shè)計(jì)的可穿戴設(shè)備能實(shí)時(shí)捕捉人體運(yùn)動,但存在老年人活動幅度大時(shí)誤報(bào)警率高的問題[2];Lin等研究者將傳感器融入眼鏡,但老年人偶爾的遺忘佩戴導(dǎo)致監(jiān)測失效[3];Yang團(tuán)隊(duì)利用Wi-Fi信號進(jìn)行摔倒識別,但誤檢率較高[4]。
在計(jì)算機(jī)視覺領(lǐng)域,深度學(xué)習(xí)技術(shù),特別是YOLO 系列和SSD算法,被廣泛應(yīng)用于目標(biāo)檢測和圖像識別中。王萍葉團(tuán)隊(duì)運(yùn)用YOLO技術(shù)實(shí)現(xiàn)了對人體動態(tài)的精準(zhǔn)識別與定位[5],朱娜等人則基于SSD算法構(gòu)建了輕量級網(wǎng)絡(luò)模型[6],顯著提升了檢測速度。周洪成等研究者將YOLOv5算法應(yīng)用于攝像頭數(shù)據(jù),實(shí)現(xiàn)了對人體動作姿態(tài)的敏銳分析與即時(shí)信息傳輸至監(jiān)護(hù)人手機(jī),但該系統(tǒng)在精確度上仍有提升空間,mAP值為0.83[7]。
上述研究為摔倒檢測提供了有益的探索,但仍存在一些不足,尤其是在識別精度和實(shí)時(shí)性方面。鑒于老年人摔倒問題的緊迫性和重要性,本文提出了一種新型的摔倒檢測系統(tǒng)。該系統(tǒng)結(jié)合老年人拐杖裝置,利用拐杖上的攝像頭實(shí)時(shí)檢測畫面內(nèi)目標(biāo),采用現(xiàn)階段應(yīng)用最廣泛的YOLOv5算法,并通過自建數(shù)據(jù)集進(jìn)行訓(xùn)練,實(shí)現(xiàn)對老年人摔倒情況的準(zhǔn)確檢測與即時(shí)警報(bào)。這一設(shè)計(jì)旨在克服現(xiàn)有技術(shù)的局限性,為老年人提供更加安全、有效的摔倒監(jiān)測與救助方案。
1 算法描述
YOLOv5算法作為YOLO系列的重要發(fā)展,以其高效的速度與精度在目標(biāo)檢測領(lǐng)域脫穎而出,特別適用于GPU環(huán)境下的訓(xùn)練與部署。該算法提供了從輕量級(YOLOv5n) 到重型(YOLOv5x) 的五種網(wǎng)絡(luò)架構(gòu),其中YOLOv5s因其適中的網(wǎng)絡(luò)深度和特征圖寬度,在保證實(shí)時(shí)性的同時(shí),提供了良好的檢測性能,成為本文進(jìn)行摔倒檢測的首選模型。
YOLOv5的核心結(jié)構(gòu)分為輸入端、主干網(wǎng)絡(luò)(Back?bone) 、頸部(Neck) 和輸出端(Prediction) 四大部分。在輸入端,YOLOv5采用了Mosaic數(shù)據(jù)增強(qiáng)技術(shù),通過拼接四張隨機(jī)處理后的圖片,有效增加了小目標(biāo)的檢測效果,并減少了GPU資源的占用。同時(shí),通過尺寸縮放和自適應(yīng)錨框計(jì)算,優(yōu)化了圖像輸入過程,減少了信息冗余,提升了推理速度,如圖1所示。
主干網(wǎng)絡(luò)和頸部則融合了多種高效的網(wǎng)絡(luò)結(jié)構(gòu),如CBL(卷積、歸一化、Leaky激活函數(shù)組合) 、CSPNet 的增強(qiáng)版本(CSP1和CSP2) 等,這些結(jié)構(gòu)共同構(gòu)成了YOLOv5強(qiáng)大的特征提取與融合能力。此外,YOLOv5 在后處理過程中采用了NMS方法,有效提升了遮擋目標(biāo)的檢測能力。
本文在YOLOv5的基礎(chǔ)上進(jìn)行了針對性改進(jìn),旨在進(jìn)一步提升攝像頭摔倒檢測的準(zhǔn)確性和實(shí)時(shí)性。具體改進(jìn)點(diǎn)將聚焦于優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)、提升特征表示能力,以及增強(qiáng)對摔倒行為的識別精度等方面,以滿足實(shí)際應(yīng)用場景中的高性能需求。
2 技術(shù)設(shè)計(jì)與實(shí)現(xiàn)
2.1 總體方案
本文提出的攝像頭對老人摔倒檢測系統(tǒng)由3個(gè)階段構(gòu)成,每個(gè)階段都承擔(dān)著不可或缺的角色,共同確保系統(tǒng)的有效運(yùn)行。以下是這3個(gè)階段的詳細(xì)解釋及流程:
第一階段:數(shù)據(jù)集準(zhǔn)備與處理
步驟1:數(shù)據(jù)采集。通過攝像頭捕捉各種摔倒場景以及正常活動的視頻和圖像,確保數(shù)據(jù)集包含豐富的摔倒姿態(tài)和背景信息。
步驟2:圖像分割。將采集到的視頻幀或圖像分割為獨(dú)立的圖像文件,形成初始數(shù)據(jù)集。
步驟3:數(shù)據(jù)集劃分。將初始數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集和測試集,通常比例為8:2或7:3,以確保模型訓(xùn)練和驗(yàn)證的獨(dú)立性。
步驟4:圖像標(biāo)注。使用La?belImg等工具對訓(xùn)練集中的圖像進(jìn)行標(biāo)注,標(biāo)記出摔倒區(qū)域或摔倒姿態(tài),生成符合PASCAL VOC 格式的XML文件。
第二階段:網(wǎng)絡(luò)訓(xùn)練
步驟1:環(huán)境搭建。配置深度學(xué)習(xí)框架(如PyTorch) 和YOLOv5 模型所需的軟硬件環(huán)境。
步驟2:數(shù)據(jù)預(yù)處理。將標(biāo)注好的訓(xùn)練集圖像加載到模型中,進(jìn)行尺寸調(diào)整、歸一化等預(yù)處理操作。
步驟3:模型初始化。使用預(yù)訓(xùn)練權(quán)重初始化YOLOv5模型的主干網(wǎng)絡(luò),以加速訓(xùn)練過程并提升模型性能。
步驟4:參數(shù)設(shè)置。配置訓(xùn)練參數(shù),如epoch(設(shè)為300次) 、batch size(設(shè)為32) 、workers(設(shè)為6) 等,以優(yōu)化訓(xùn)練過程。
步驟5:模型訓(xùn)練。將預(yù)處理后的圖像輸入模型進(jìn)行訓(xùn)練,通過反向傳播算法更新模型權(quán)重,以最小化損失函數(shù)。
步驟6:模型保存。在訓(xùn)練過程中定期保存模型權(quán)重,以便后續(xù)評估和測試。
第三階段:檢測與識別
步驟1:模型加載。將訓(xùn)練好的模型權(quán)重加載到Y(jié)OLOv5模型中。
步驟2:實(shí)時(shí)視頻捕捉。通過攝像頭捕捉實(shí)時(shí)視頻流或加載測試集圖像。
步驟3:目標(biāo)檢測。將捕捉到的視頻幀或圖像輸入模型進(jìn)行目標(biāo)檢測,識別出摔倒姿態(tài)。
步驟4:結(jié)果判斷。根據(jù)模型的輸出判斷是否為摔倒行為,若判斷為摔倒,則執(zhí)行下一步。
步驟5:報(bào)警響應(yīng)。通過GSM短信模塊發(fā)送緊急報(bào)警信息至預(yù)設(shè)的接收端。
圖2展示的摔倒報(bào)警系統(tǒng)框架融合了電腦端與控制端。電腦端(上位機(jī)) 負(fù)責(zé)程序運(yùn)行與信息分析;控制端(下位機(jī)) 通過攝像頭捕捉畫面,利用ESP32開發(fā)板與GSM短信模塊迅速響應(yīng)發(fā)送警報(bào)信息,實(shí)現(xiàn)摔倒報(bào)警的目的。
2.2 自制訓(xùn)練集并標(biāo)記
在制作訓(xùn)練集時(shí),原本計(jì)劃使用五角星圖片作為摔倒的標(biāo)志物進(jìn)行模擬訓(xùn)練。然而,這種做法存在明顯的問題:五角星與真實(shí)摔倒姿態(tài)之間存在顯著差異,無法有效模擬摔倒場景。因此,需要在此進(jìn)行更正:
數(shù)據(jù)集更新:我們重新拍攝了包含真實(shí)摔倒場景的圖片,并增加了圖片數(shù)量至數(shù)千張,以確保數(shù)據(jù)集的多樣性和代表性。
標(biāo)注工具:繼續(xù)使用LabelImg工具對圖片進(jìn)行標(biāo)注,但標(biāo)注對象由五角星更改為摔倒姿態(tài)。
數(shù)據(jù)集大小:數(shù)千張圖片的數(shù)據(jù)集對于訓(xùn)練一個(gè)高精度的摔倒檢測模型來說是足夠的,但具體數(shù)量還需根據(jù)模型性能和訓(xùn)練效果進(jìn)行調(diào)整。
2.3 模型訓(xùn)練
在模型訓(xùn)練階段,詳細(xì)說明了訓(xùn)練參數(shù)的設(shè)置及理由:
epoch:設(shè)為300 次,以確保模型充分學(xué)習(xí)數(shù)據(jù)特征。
batch size:設(shè)為32,平衡訓(xùn)練速度和內(nèi)存。
workers:設(shè)為6,加速數(shù)據(jù)加載。
損失函數(shù):使用YOLOv5默認(rèn)的損失函數(shù),包括邊界框回歸損失、置信度損失和分類損失。
優(yōu)化器:采用Adam優(yōu)化器,助模型快速收斂。
同時(shí),監(jiān)控loss值、Precision和recall等指標(biāo),確保模型性能穩(wěn)定提升。
2.4 模型評估
經(jīng)過300輪訓(xùn)練,團(tuán)隊(duì)發(fā)現(xiàn)loss值隨著訓(xùn)練輪數(shù)的增加不斷降低,并最終趨于穩(wěn)定,達(dá)到了預(yù)期的期望值。在精確性方面,Precision(精確率) 隨著迭代次數(shù)的增加逐漸上升,最終穩(wěn)定在約0.96的水平;而Re?call(召回率) 也呈現(xiàn)出類似的趨勢,同樣在迭代過程中不斷上升,并最終穩(wěn)定在約0.94。這些評估指標(biāo)共同表明,該模型在訓(xùn)練過程中表現(xiàn)出了良好的學(xué)習(xí)能力和泛化性能。
3 檢測實(shí)現(xiàn)
3.1 摔倒檢測設(shè)計(jì)
在摔倒檢測設(shè)計(jì)中,研究者創(chuàng)新性地采用了經(jīng)過精心訓(xùn)練的YOLOv5模型來進(jìn)行圖像測試。當(dāng)模型對原始圖像進(jìn)行分析時(shí),如果檢測到與“五角星”相似的紅外圖案,就會在該目標(biāo)周圍添加一個(gè)方框進(jìn)行標(biāo)識,從而清晰地顯示老年人是否處于摔倒?fàn)顟B(tài)。
在實(shí)際應(yīng)用場景中,系統(tǒng)會對攝像頭實(shí)時(shí)拍攝的畫面進(jìn)行智能分析。一旦檢測到老年人摔倒的特征,系統(tǒng)會立即啟動初步判定機(jī)制,并同步開啟一個(gè)10秒的倒計(jì)時(shí)程序。這個(gè)10秒倒計(jì)時(shí)機(jī)制的設(shè)計(jì)是基于以下考慮:摔倒是一個(gè)快速且突然的動作,而老年人摔倒后可能需要一段時(shí)間來恢復(fù)或?qū)で髱椭R虼耍覀冊O(shè)定了一個(gè)合理的觀察時(shí)間窗口(10秒) ,以確認(rèn)摔倒動作是否持續(xù)存在。如果在這10秒內(nèi),攝像頭持續(xù)捕捉到與“五角星”相似的特征,系統(tǒng)將確認(rèn)老年人摔倒,并觸發(fā)警報(bào)。反之,如果特征消失,則系統(tǒng)判斷為誤報(bào),避免不必要的干擾。
為了驗(yàn)證系統(tǒng)的魯棒性和可靠性,人們在多個(gè)真實(shí)場景中進(jìn)行了測試。結(jié)果顯示,系統(tǒng)能夠準(zhǔn)確識別老年人摔倒的情況,并在大多數(shù)情況下避免誤報(bào)。準(zhǔn)確率達(dá)到90%以上,這充分證明了該設(shè)計(jì)的有效性和實(shí)用性。
關(guān)于五角星識別在實(shí)際應(yīng)用中的可行性,研究者進(jìn)行了充分的論證。通過對比不同圖案與“五角星”特征的相似度,發(fā)現(xiàn)該特征具有較高的識別度和穩(wěn)定性。同時(shí),結(jié)合YOLOv5模型的強(qiáng)大檢測能力,研究者實(shí)現(xiàn)了對摔倒姿態(tài)的準(zhǔn)確識別。
3.2 警報(bào)通信設(shè)計(jì)
在警報(bào)通信設(shè)計(jì)中,采用了sim800c型號的GSM 模塊來實(shí)現(xiàn)短信發(fā)送功能。該模塊支持標(biāo)準(zhǔn)的AT指令集,可以通過串口與微控制器進(jìn)行通信。在使用時(shí),首先將GSM模塊與ESP32開發(fā)板連接,并通過編程實(shí)現(xiàn)短信發(fā)送功能。當(dāng)系統(tǒng)檢測到老年人摔倒時(shí),會立即通過GSM模塊向監(jiān)護(hù)人或家人發(fā)送短信通知。短信內(nèi)容包含GPS定位和當(dāng)前拍攝畫面的截圖,以便監(jiān)護(hù)人迅速了解老年人的位置和狀況,從而及時(shí)采取措施進(jìn)行救援。
4 結(jié)束語
本文研發(fā)了一款基于YOLOv5的智能化拐杖,用于解決老年人摔倒后無法自救的問題。通過自建數(shù)據(jù)集和GPU訓(xùn)練,模型訓(xùn)練準(zhǔn)確率達(dá)95.66%,實(shí)際測試置信度約為0.7-0.75,這一指標(biāo)反映了模型對于檢測結(jié)果的把握程度,即模型對于檢測為摔倒的情況有70%至75%的確定性。
雖能基本實(shí)現(xiàn)摔倒檢測和求救短信發(fā)送,但仍存在一些不足之處。例如,警報(bào)求救功能尚不全面,檢測的靈敏度也有待提升。在未來的研究中,研究者將致力于進(jìn)一步優(yōu)化這一設(shè)計(jì)。具體而言,將探索提高系統(tǒng)準(zhǔn)確率和靈敏度的方法,可能包括采用更先進(jìn)的深度學(xué)習(xí)算法、增加訓(xùn)練數(shù)據(jù)量以及優(yōu)化模型結(jié)構(gòu)等。同時(shí),為了實(shí)現(xiàn)更全面的警報(bào)求救功能,我們將考慮整合更多種類的通信方式,如語音報(bào)警、自動撥打緊急聯(lián)系電話等。
此外,人們還將努力實(shí)現(xiàn)電腦端與下位機(jī)、手機(jī)端等設(shè)備的協(xié)調(diào)合作,以構(gòu)建一個(gè)更加健全、高效的智能化系統(tǒng)。通過持續(xù)的技術(shù)研發(fā)和改進(jìn),人們期望能夠?yàn)槔夏耆颂峁└影踩⒖煽康乃さ箼z測與求救解決方案。
參考文獻(xiàn):
[1] 寧吉喆.第七次全國人口普查主要數(shù)據(jù)情況[J].中國統(tǒng)計(jì),2021(5):4-5.
[2] ALESIN A,OSANLOU A,MAW S W.A low budget multifunc?tional wearable device for motion and falls detection[C]//2018IEEE Conference of Russian Young Researchers in Electricaland Electronic Engineering (EIConRus).January 29 - February1,2018,Moscow and St.Petersburg,Russia.IEEE,2018:1850-1855.
[3] LIN C L,CHIU W C,CHEN F H,et al.Fall monitoring for the el?derly using wearable inertial measurement sensors on eye?glasses[J].IEEE Sensors Letters,2020,4(6):6000804.
[4] YANG X,XIONG F Y,SHAO Y,et al.WmFall:Wi-Fi-basedmultistage fall detection with channel state information[J].Inter?national Journal of Distributed Sensor Networks,2018,14(10):155014771880571.
[5] 王萍葉.基于YOLO的視頻摔倒檢測算法[J].電腦編程技巧與維護(hù),2019(11):137-139.
[6] 朱娜.基于改進(jìn)SSD算法的老年人摔倒檢測[D].北京:北方工業(yè)大學(xué),2022.
[7] 周洪成,楊娟,徐志國.基于YOLOv5算法的人體跌倒檢測系統(tǒng)設(shè)計(jì)[J].金陵科技學(xué)院學(xué)報(bào),2022,38(2):22-29.
【通聯(lián)編輯:梁書】
基金項(xiàng)目:2023 年廣州工商學(xué)院省級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目,項(xiàng)目名稱:基于阿里云HaaS 框架與深度學(xué)習(xí)技術(shù)的老年人智能輔助設(shè)備及監(jiān)測平臺的設(shè)計(jì)與實(shí)現(xiàn)(項(xiàng)目編號:S202313714015)