楊 娟 寧珂雪 蒲華秀 龔海燕
(四川廣播電視大學(xué) 成都 610000) (四川大學(xué)錦城學(xué)院 成都 610000)
人口老齡化現(xiàn)已成為我國極為嚴(yán)峻的社會問題。截至2018年我國60歲及以上人口已達(dá)2.49億,失能老人超過4 000萬。四川省是人口大省,60歲及以上老年人數(shù)超過2 000萬,失能老年人超過300萬;另一方面,作為勞務(wù)輸出大省,四川空巢老人較多,對于專業(yè)護(hù)理服務(wù)呈現(xiàn)龐大而剛性的需求。傳統(tǒng)基于問卷調(diào)查收集老年人護(hù)理需求的方式存在信息滯后、信息散亂、護(hù)理項(xiàng)目不合理、服務(wù)價(jià)格隨意性大、護(hù)理效果無法跟蹤等諸多問題,亟需利用新興技術(shù)全面分析老年人健康狀態(tài)、優(yōu)化護(hù)理方案、預(yù)測護(hù)理需求。本文通過人工智能與機(jī)器學(xué)習(xí)等技術(shù)分析四川省基層醫(yī)療機(jī)構(gòu)信息系統(tǒng)中2014-2019年老年人海量健康數(shù)據(jù),構(gòu)建護(hù)理需求預(yù)測模型。
通過分析四川省基層醫(yī)療機(jī)構(gòu)信息管理系統(tǒng)中海量公共衛(wèi)生服務(wù)數(shù)據(jù),全面掌握全省55歲以上人群健康狀態(tài)與護(hù)理需求時(shí)空分布,利用機(jī)器學(xué)習(xí)和人工智能技術(shù)揭示健康狀態(tài)的發(fā)展態(tài)勢,構(gòu)建四川省老年人護(hù)理需求預(yù)測模型,為整體描述全省未來老年人護(hù)理需求數(shù)量與類別分布、個(gè)性化護(hù)理服務(wù)定制、引導(dǎo)社會要素流入護(hù)理供給側(cè)和構(gòu)建老年護(hù)理市場化機(jī)制提供參考。
2.2.1 刻畫2014-2019年55歲以上人群“三間分布” 根據(jù)全省21個(gè)地市州 55歲以上人群的生活自理能力、認(rèn)知功能、抑郁量化以及隨訪體檢數(shù)據(jù)對其健康狀態(tài)指標(biāo)進(jìn)行描述性分析,刻畫老年人健康狀態(tài)的時(shí)空分布。
2.2.2 分析健康指標(biāo)變化,構(gòu)建具有護(hù)理需求的人群畫像 研究2014-2019年之間55歲以上人群公共衛(wèi)生健康數(shù)據(jù),基于機(jī)器學(xué)習(xí)算法設(shè)計(jì)開發(fā)全省老年人健康指標(biāo)演進(jìn)模型,根據(jù)模型系統(tǒng)構(gòu)建未來需要護(hù)理的老年人群畫像。
2.2.3 預(yù)測未來護(hù)理需求分布 結(jié)合老齡化進(jìn)程、主要健康指標(biāo)變化以及基于專家知識的護(hù)理方法,利用人工智能和機(jī)器學(xué)習(xí)技術(shù)構(gòu)建護(hù)理需求模型,從整體水平上預(yù)測未來1年四川省老年護(hù)理市場總需求和個(gè)性化需求,有效促進(jìn)老年人護(hù)理服務(wù)市場化發(fā)展水平。
首先進(jìn)行數(shù)據(jù)清洗和多元數(shù)據(jù)融合,其次描述健康狀態(tài)指標(biāo)分布特征,再次分析四川省健康狀態(tài)主要指標(biāo)的變化趨勢,最后通過機(jī)器學(xué)習(xí)預(yù)測未來1年全省護(hù)理需求態(tài)勢。所涉及的關(guān)鍵技術(shù)包括:多源數(shù)據(jù)融合、健康指標(biāo)分布統(tǒng)計(jì)學(xué)研究、基于機(jī)器學(xué)習(xí)構(gòu)建預(yù)測模型、效果評價(jià)指標(biāo)。
護(hù)理需求要素的日常變化以及由各種疾病引起的病源性護(hù)理需求等與養(yǎng)老護(hù)理運(yùn)營及其效率密切相關(guān),且隨著經(jīng)濟(jì)發(fā)展,行業(yè)管理精細(xì)化水平逐步提升,對按需護(hù)理服務(wù)精度的要求也越來越高,需要多源數(shù)據(jù)的監(jiān)測和匯總。多源數(shù)據(jù)融合,見圖1。現(xiàn)階段護(hù)理需求要素收集和評價(jià)手段都是單一化的,如何聯(lián)合這些單一化的手段得到一項(xiàng)綜合性、具有市場反饋機(jī)制的多源數(shù)據(jù)融合采集技術(shù),是提供按需護(hù)理的重要手段。

圖1 多源數(shù)據(jù)融合
在實(shí)際中由于健康指標(biāo)的復(fù)雜性,研究對象往往表現(xiàn)為多指標(biāo)數(shù)據(jù)。多指標(biāo)數(shù)據(jù)的結(jié)構(gòu)更加復(fù)雜,嚴(yán)格上應(yīng)用三維表來表示,在平面上可以將其轉(zhuǎn)換為一個(gè)二級二維表的形式,見表1。研究總體共有N個(gè),每個(gè)樣本的特征用p個(gè)指標(biāo)表示(X1,X2,…,Xj,…,Xp),時(shí)間長度為T,則Xij(t、N)表示第 個(gè)樣本第j個(gè)指標(biāo)在t時(shí)間。

表1 健康指標(biāo)分布統(tǒng)計(jì)學(xué)研究
3.4.1 概述 隨著機(jī)器學(xué)習(xí)廣泛應(yīng)用,受益于各種算法,研究如何高效地將訓(xùn)練好的機(jī)器學(xué)習(xí)模型部署到生產(chǎn)環(huán)境。從數(shù)據(jù)采集開始,經(jīng)歷數(shù)據(jù)分析、變形、驗(yàn)證、拆分、訓(xùn)練、模型創(chuàng)建、模型驗(yàn)證、大規(guī)模訓(xùn)練、模型發(fā)布、提供服務(wù)、監(jiān)控和日志,再到構(gòu)建完整機(jī)器學(xué)習(xí)預(yù)測模型,見圖2。根據(jù)健康指標(biāo)特征(長期趨勢、季節(jié)性和自相關(guān)性),采用機(jī)器學(xué)習(xí)算法預(yù)測未來健康指標(biāo)的演進(jìn)趨勢。擬采用的機(jī)器學(xué)習(xí)方法主要有長短期記憶網(wǎng)絡(luò)、誤差反傳算法神經(jīng)網(wǎng)絡(luò)和最小二乘支持向量機(jī),對其預(yù)測效果進(jìn)行評價(jià)。

圖2 機(jī)器學(xué)習(xí)預(yù)測模型
3.4.2 長短期記憶網(wǎng)絡(luò)(Long-Short Term Memory, LSTM) 循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neutral Network, RNN)的一種。神經(jīng)網(wǎng)絡(luò)是一種節(jié)點(diǎn)定向連接成環(huán)的人工神經(jīng)網(wǎng)絡(luò)(Artificial Neutral Networks,ANNs)。循環(huán)神經(jīng)網(wǎng)絡(luò)內(nèi)部狀態(tài)可以展示動態(tài)時(shí)序行為,與其他網(wǎng)絡(luò)的不同之處在于其隱含層是能夠跨越時(shí)間點(diǎn)的自連接含層,隱含層的輸出不僅進(jìn)入輸出端,還進(jìn)入下一個(gè)時(shí)間步驟的隱含層,所以能夠持續(xù)保留信息,根據(jù)之前狀態(tài)推出后面的狀態(tài)[1]。RNN 每個(gè)時(shí)間狀態(tài)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)相同,在任意t時(shí)間下包含輸入層、隱含層、輸出層。RNN隱含層的輸出一分為二,一份傳給輸出層,一份與下一時(shí)刻輸入層的輸出一起作為隱含層的輸入。
3.4.3 誤差反傳算法(Back-Propagation,BP)神經(jīng)網(wǎng)絡(luò) ANNs作為智能信息處理的工具之一,是模仿人的大腦神經(jīng)系統(tǒng)信息處理功能的智能化系統(tǒng),具有并行處理、容錯(cuò)性、自學(xué)習(xí)功能,已在模擬識別、自動化控制、知識處理及運(yùn)輸與通行等領(lǐng)域取得很好的效果。BP神經(jīng)網(wǎng)絡(luò)是 ANNs 中最具代表性和應(yīng)用最廣泛的一種。通常由具有多個(gè)節(jié)點(diǎn)的輸入層、隱含層和多個(gè)或一個(gè)輸出節(jié)點(diǎn)的輸出層組成[2],見圖3。

圖3 BP神經(jīng)網(wǎng)絡(luò)原理
3.4.4 最小二乘支持向量機(jī)(Least Squares Support Vector Machine, LSSVM) 是一種簡單的支持向量機(jī)(Support Vector Machine, SVM)。在支持向量機(jī)的基礎(chǔ)上,通過最小二乘法,利用誤差平方和選擇超平面,構(gòu)造平方損失函數(shù)最小二乘支持向量機(jī),同時(shí)將SVM的不等式約束條件轉(zhuǎn)換為線性等式,將二次規(guī)劃問題轉(zhuǎn)化為線性求解,其求解速度比SVM更快、效率更高[3]。四川省老年人護(hù)理需求特征的 LSSVM 預(yù)測模型基于該省基層醫(yī)療機(jī)構(gòu)信息化系統(tǒng)(以下簡稱系統(tǒng))采集的數(shù)據(jù)建立,同時(shí)還要考慮到系統(tǒng)所采集老年人群的變化,因此選取的輸入因子包括:前i(i=1,2,3,4,5)年的5年數(shù)據(jù)。根據(jù)四川省 5 年(2014-2019 年)的資料作預(yù)測研究,得出仿真結(jié)果,再將試預(yù)報(bào)值與實(shí)測值進(jìn)行對比分析。LSSVM 建模的關(guān)鍵在于參數(shù)γ和核函數(shù)參數(shù)δ的確定。研究表明由于徑向基核函數(shù)(Radial Basis Function, RBF)對數(shù)值限值條件相對較少,模型復(fù)雜度降低,從而大大提高訓(xùn)練速度。采用 RBF 作為模型的核函數(shù),其算法實(shí)現(xiàn)過程如下:(1)確定參數(shù)γ和δ的取值范圍。(2)在參數(shù)最大取值范圍內(nèi)構(gòu)建參數(shù)對(γ i,δ i)的二維網(wǎng)格平面。(3)輸入每個(gè)網(wǎng)格節(jié)點(diǎn)的參數(shù)對(γ i,δ i)到 LSSVM 中,采用學(xué)習(xí)樣本進(jìn)行學(xué)習(xí),并輸出學(xué)習(xí)誤差。取最小誤差對應(yīng)的節(jié)點(diǎn)值(γ i,δ i)為最優(yōu)參數(shù)對。(4)以(γ i,δ i)E min 為中心,構(gòu)建新的二維網(wǎng)格平面,選取數(shù)值相近的參數(shù)值進(jìn)行學(xué)習(xí),可獲得更高精度的學(xué)習(xí)結(jié)果。
3.4.5 預(yù)測評價(jià)指標(biāo) 依次為:平均絕對誤差(Mean Absolute Error, MAE),平均絕對百分比誤差(Mean Absolute Percentage Error, MAPE),均方根誤差(Root Mean Square Error, RMSE)和 R2,其計(jì)算公式為:
其中Yt為t年度護(hù)理需求的老年人群,yt為機(jī)器學(xué)習(xí)算法預(yù)測的t年達(dá)到護(hù)理需求的老年人群。Ymean為需要護(hù)理的老年人的年均值線。

圖4 技術(shù)路線
本研究計(jì)劃在全省范圍內(nèi)系統(tǒng)、全面分析55歲以上人群的健康狀態(tài),從數(shù)據(jù)層面揭示整體健康狀態(tài)主要指標(biāo)的變化軌跡,為政府相關(guān)部門制定養(yǎng)老助老政策、構(gòu)建護(hù)理服務(wù)市場化機(jī)制提供參考依據(jù)。嘗試將大數(shù)據(jù)、機(jī)器學(xué)習(xí)等新興技術(shù)應(yīng)用到老年人健康狀態(tài)與護(hù)理需求預(yù)測,彌補(bǔ)傳統(tǒng)問卷調(diào)查、樣本統(tǒng)計(jì)、專家知識等研究方式的不足,進(jìn)一步提升護(hù)理需求評估全面性、需求信息發(fā)布集中性、護(hù)理行為規(guī)范性。該技術(shù)經(jīng)產(chǎn)品化后,如果在全省范圍內(nèi)實(shí)施,既是對四川省基層醫(yī)療機(jī)構(gòu)信息化管理系統(tǒng)功能的有力擴(kuò)展,也能從全省整體水平上預(yù)測未來全省老年人護(hù)理需求態(tài)勢和智能生成個(gè)性化護(hù)理方案,幫助護(hù)理需求側(cè)與供給側(cè)在一定約束條件下交易成本更低、護(hù)理效果更好。根據(jù)未來發(fā)展態(tài)勢,一方面能夠指導(dǎo)老年人加強(qiáng)自身鍛煉,避免或減少未來高費(fèi)用的護(hù)理項(xiàng)目,控制晚年生活成本,提高生活質(zhì)量;另一方面引導(dǎo)社會資源根據(jù)護(hù)理項(xiàng)目的發(fā)展態(tài)勢提前布局投入,為未來護(hù)理需求儲備技術(shù)和人力。