999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于AE-LSTM 改進(jìn)模型的高齡人口死亡率預(yù)測

2022-11-05 01:43:22楊剛易艷萍孫超
關(guān)鍵詞:效果模型

楊剛 易艷萍 孫超

(湖南工商大學(xué)理學(xué)院,長沙,410205)

1 引言

根據(jù)1956 年聯(lián)合國《人口老齡化及其社會經(jīng)濟(jì)后果》確定的劃分標(biāo)準(zhǔn),當(dāng)一個國家或地區(qū)65歲及以上老年人口數(shù)量占總?cè)丝诒壤^7%時,則意味著這個國家或地區(qū)進(jìn)入老齡化. 1982 年維也納老齡問題世界大會,確定60 歲及以上老年人口占總?cè)丝诒壤^10%,意味著這個國家或地區(qū)進(jìn)入嚴(yán)重老齡化. 按照這個國際標(biāo)準(zhǔn),我國早在1999 年就已經(jīng)進(jìn)入老齡化社會. 2020 年第七次全國人口普查結(jié)果顯示,我國60 歲及以上人口達(dá)到26402 萬人,占總?cè)丝诘?8.70%,說明我國人口老齡化程度很高. 國務(wù)院預(yù)計2035 年前后,我國老年人口占比將超過30%,意味著我國將進(jìn)入重度老齡化階段,這將對經(jīng)濟(jì)運(yùn)行全領(lǐng)域、社會建設(shè)各環(huán)節(jié)、社會文化多方面產(chǎn)生深遠(yuǎn)影響.

在2020 年10 月十九屆五中全會《中共中央關(guān)于制定國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和二〇三五年遠(yuǎn)景目標(biāo)的建議》綱領(lǐng)性文件中,我國提出要實(shí)施積極應(yīng)對人口老齡化的國家戰(zhàn)略.而在應(yīng)對人口老齡化帶來的多重挑戰(zhàn)中,最為艱巨的是老齡化社會面臨的長壽風(fēng)險. 當(dāng)人口未來的平均實(shí)際壽命高于預(yù)期壽命時,就會產(chǎn)生長壽風(fēng)險,它將給政府的養(yǎng)老金保險,商業(yè)年金的負(fù)債評估和償付能力管理以及國家老齡事業(yè)和產(chǎn)業(yè)的發(fā)展帶來一定的挑戰(zhàn)[1]. 因此,對人口死亡率尤其是高齡人口死亡率的預(yù)測分析具有十分重要的理論價值和現(xiàn)實(shí)意義.

常用的死亡率預(yù)測模型分為靜態(tài)死亡率預(yù)測模型和動態(tài)死亡率預(yù)測模型[2]. 靜態(tài)死亡率模型是基于死亡率歷史數(shù)據(jù)和生命表模擬歷史死亡率的變化,對歷史死亡率進(jìn)行擬合. 該方法只考慮了死亡率和年齡之間的關(guān)系,無法刻畫死亡率隨時間的動態(tài)變化,因此難以進(jìn)行死亡率外推預(yù)測. 隨后,國內(nèi)外學(xué)者相繼在靜態(tài)死亡率模型的基礎(chǔ)上考慮了時間、出生年和日歷年等因素,建立了以Lee-Carter 模型為代表的動態(tài)死亡率預(yù)測模型. 由于動態(tài)死亡率預(yù)測模型可廣泛應(yīng)用于長壽風(fēng)險度量、壽險產(chǎn)品定價與長壽風(fēng)險管理等領(lǐng)域,因此現(xiàn)在大多數(shù)學(xué)者都采用動態(tài)死亡率預(yù)測模型對人口死亡率進(jìn)行預(yù)測.

動態(tài)死亡率預(yù)測模型很好地解決了靜態(tài)死亡率模型無法刻畫死亡率隨時間動態(tài)改善的缺陷,但其往往基于人口死亡率線性動態(tài)變化的假設(shè),通過在Lee-Carter 模型的基礎(chǔ)上增加影響人口死亡率的因素,或者減少模型的參數(shù)來進(jìn)行推廣和改進(jìn),因此動態(tài)死亡率預(yù)測模型只能刻畫影響因素與人口死亡率之間的線性關(guān)系,對人口死亡率的非線性結(jié)構(gòu)研究還存在一定的限制條件. 而在機(jī)器學(xué)習(xí)算法中,核函數(shù)以及激活函數(shù)的非線性可以實(shí)現(xiàn)數(shù)據(jù)的非線性映射,從而讓機(jī)器學(xué)習(xí)算法具備優(yōu)秀的數(shù)據(jù)非線性學(xué)習(xí)能力. 目前已有應(yīng)用機(jī)器學(xué)習(xí)算法進(jìn)行人口死亡率建模和預(yù)測的相關(guān)工作,并取得了不錯的效果.

機(jī)器學(xué)習(xí)主要通過間接方式、直接方式兩種途徑應(yīng)用于人口死亡率預(yù)測. 間接方式是以動態(tài)死亡率預(yù)測模型為基礎(chǔ),利用機(jī)器學(xué)習(xí)算法提升人口死亡率的擬合效果和預(yù)測效果. Deprez 等(2017)[3]首先使用Lee-Carter 和RH 模型擬合瑞士人口死亡率數(shù)據(jù),然后使用回歸樹算法提升兩個隨機(jī)死亡率模型的擬合度,并對各年齡段死因進(jìn)行分析. Susanna 和Virginia(2019)[4]在回歸樹的基礎(chǔ)上,增加了隨機(jī)森林和梯度提升算法,發(fā)現(xiàn)隨機(jī)森林算法能夠更有效地提升人口死亡率的擬合度. 汪志偉(2021)[5]將長短記憶神經(jīng)網(wǎng)絡(luò)(LSTM)算法與其它擬合精度算法進(jìn)行比較,研究表明LSTM 算法擬合效果提升更大. 在此類研究中,機(jī)器學(xué)習(xí)算法雖然能夠在隨機(jī)死亡率模型的基礎(chǔ)上提升人口死亡率擬合效果,但對人口死亡率的研究依然局限于死亡率線性動態(tài)的假設(shè).

而直接方式是利用機(jī)器學(xué)習(xí)算法建立死亡率預(yù)測模型對人口死亡率數(shù)據(jù)直接進(jìn)行擬合預(yù)測.Hainaut(2018a)[6],張連增等(2020)[7]用非線性時變函數(shù)替代隨機(jī)死亡率Lee-Carter 模型中線性交互部分,提出了神經(jīng)網(wǎng)絡(luò)死亡率模型,并通過帶漂移項(xiàng)的隨機(jī)游走模型進(jìn)行預(yù)測,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)死亡率模型性能優(yōu)于Lee-Carter 模型. 陳寧(2019)[8]通過在輸入的人口死亡率數(shù)據(jù)中加入噪聲建立降噪自編碼器,對我國人口死亡率數(shù)據(jù)進(jìn)行擬合預(yù)測,研究發(fā)現(xiàn)降噪自編碼器的預(yù)測結(jié)果整體上優(yōu)于Lee-Carter 模型. 機(jī)器學(xué)習(xí)算法主要通過提高人口死亡率的擬合優(yōu)度提升人口死亡率模型預(yù)測的整體性能,但對時間因子進(jìn)行預(yù)測依然停留在傳統(tǒng)的時間序列模型.

綜上所述,目前針對人口死亡率的預(yù)測模型仍可以進(jìn)一步優(yōu)化. 首先,人口死亡率非線性結(jié)構(gòu)的刻畫仍需進(jìn)一步深化. 目前國內(nèi)外對人口死亡率神經(jīng)網(wǎng)絡(luò)算法研究相對欠缺,且大多數(shù)神經(jīng)網(wǎng)絡(luò)算法基于自編碼器進(jìn)行研究. 機(jī)器學(xué)習(xí)算法發(fā)展迅猛,一些新興的算法目前還沒有應(yīng)用于人口死亡率預(yù)測的研究領(lǐng)域. 其次,在神經(jīng)網(wǎng)絡(luò)構(gòu)建中,神經(jīng)元個數(shù)、網(wǎng)絡(luò)深度、激活函數(shù)以及目標(biāo)函數(shù)等這些超參數(shù)的選擇決定了神經(jīng)網(wǎng)絡(luò)對人口死亡率的擬合效果,而超參數(shù)選擇的主觀性和隨意性,容易導(dǎo)致研究結(jié)論過于片面. 針對人口死亡率神經(jīng)網(wǎng)絡(luò)的超參數(shù)選擇目前還沒有形成相對成熟的方法.

由于人口死亡率數(shù)據(jù)屬于多元時間序列,人口死亡率預(yù)測為多變量時間序列預(yù)測. 受許奕杰等(2020)[9]工作的啟發(fā),本文建立一個AE-LSTM 改進(jìn)模型,利用自編碼器(AE)模型自我學(xué)習(xí)的特性,在AE-LSTM 模型的基礎(chǔ)上增加AE 模型的解碼過程,使得該模型能夠?qū)崿F(xiàn)從單一變量預(yù)測到多元時間序列預(yù)測的轉(zhuǎn)換. 相對于全人口死亡率模型,高齡人口死亡率預(yù)測的研究對我國積極應(yīng)對人口老齡化風(fēng)險具有更加重要的戰(zhàn)略意義,因此,本文選取我國大陸1994-2018 年60-89 歲高齡人口總體死亡率作為樣本數(shù)據(jù)進(jìn)行實(shí)證分析.

2 模型建立

2.1 CBD 模型

CBD 模型又稱雙因素死亡率模型,在Lee-Carter 模型中,不同年齡之間的死亡率完全相關(guān),因此Currie 等(2006)[10]提出了CBD 模型彌補(bǔ)這一缺陷,其表達(dá)形式為:

其中,φi為回歸參數(shù),Li表示i階滯后算子,Δdkt表示對kt作d次一階差分,p為自相關(guān)項(xiàng)數(shù),α是漂移項(xiàng),θi為滑動平均參數(shù),q為滑動平均項(xiàng)數(shù),μt表示均值為零、方差確定的白噪聲過程.

2.2 AE-LSTM 改進(jìn)模型

2.2.1 AE-LSTM 模型

Rumelhart 等(1986)[12]提出自動編碼器的概念,并將其用于高維復(fù)雜數(shù)據(jù)處理. AE 模型是以輸入信息為學(xué)習(xí)目標(biāo),旨在將輸入信息復(fù)制到輸出,其常用于高維數(shù)據(jù)的非線性降維和特征學(xué)習(xí).AE 模型主要分為編碼和解碼兩個部分,各層神經(jīng)元通過權(quán)重和激活函數(shù)連接. 編碼過程就是通過兩次非線性轉(zhuǎn)換將原數(shù)據(jù)的維數(shù)減少. 解碼過程則是通過兩次非線性轉(zhuǎn)換將低維數(shù)據(jù)映射到原高維數(shù)據(jù),實(shí)現(xiàn)降維數(shù)據(jù)到原數(shù)據(jù)的還原. AE 模型的提出促進(jìn)了人工神經(jīng)網(wǎng)絡(luò)的發(fā)展.

循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一類用來處理時間序列的機(jī)器學(xué)習(xí)算法. Hochreiter 等(1997)[13]對一般RNN 進(jìn)行改進(jìn),提出了LSTM 模型. LSTM 模型的基本單元為記憶模塊,相對于一般RNN 只有簡單的tanh 層的重復(fù)模塊,LSTM 包含了四個神經(jīng)網(wǎng)絡(luò)層,包括細(xì)胞狀態(tài)、忘記門、輸入門和輸出門. LSTM 模型的提出解決了一般RNN 存在的長期依賴問題,它可以處理和預(yù)測事件序列中時間間隔和延遲比較長的重要事件,將遠(yuǎn)距離的上下文信息運(yùn)用到當(dāng)前時刻.

AE-LSTM 模型是一個混合神經(jīng)網(wǎng)絡(luò),由上述兩部分組成. 第一部分為AE 模型的編碼部分,其主要作用是對原始數(shù)據(jù)進(jìn)行特征提取. 第二部分為LSTM 模型,其主要作用是對AE 模型提取的特征數(shù)據(jù)進(jìn)行時間序列預(yù)測,并通過在LSTM 網(wǎng)絡(luò)最后一層加入SoftMax 層,實(shí)現(xiàn)分類數(shù)據(jù)的預(yù)測,AE-LSTM 模型的結(jié)構(gòu)如圖1 所示.

圖1 AE-LSTM 模型結(jié)構(gòu)示意圖

設(shè)Xi(t) 表示第i個屬性在時間t時的取值, 則樣本矩陣可以表示為:X(t) =(X1(t),X2(t),··· ,Xn(t))T. AE-LSTM 模型通過以下步驟實(shí)現(xiàn).

第一步: 將原始數(shù)據(jù)X(t)輸入AE 模型進(jìn)行訓(xùn)練,利用編碼過程計算得到編碼數(shù)據(jù):

其中,fdec(·)為解碼函數(shù),fenc(·)為編碼函數(shù), ?X(t)表示AE 模型對原始數(shù)據(jù)的擬合結(jié)果.

第二步: 將編碼數(shù)據(jù)輸入到LSTM 模型中得到因變量輸出值?y(t):

其中,fLST M(·) 為LSTM 函數(shù), 最終通過比較模型輸出值?y(t) 和實(shí)際值y(t) 之間的差距, 評價AE-LSTM 模型的性能.

2.2.2 AE-LSTM 改進(jìn)模型

在上述的AE-LSTM 模型中,主要利用AE 模型對多維自變量降維,LSTM 模型實(shí)現(xiàn)對單一因變量的精準(zhǔn)預(yù)測. 由于在本研究中死亡率數(shù)據(jù)屬于多元時間序列,自變量和因變量的數(shù)據(jù)集相同,對人口死亡率的預(yù)測不再是對單一因變量預(yù)測,而是對多變量預(yù)測. 因此,本文提出一個AE-LSTM改進(jìn)模型,在原AE-LSTM 模型的基礎(chǔ)上,增加AE 模型的解碼過程,在完成單一時間序列預(yù)測的基礎(chǔ)下,實(shí)現(xiàn)多變量預(yù)測. 改進(jìn)后的AE-LSTM 模型具體結(jié)構(gòu)如圖2 所示:

圖2 AE-LSTM 改進(jìn)模型結(jié)構(gòu)示意圖

本文的輸入變量X(t)表示對數(shù)死亡率,具體形式為:

其中,lnmx,t表示在第t年x歲的人群的對數(shù)死亡率. AE-LSTM 改進(jìn)模型的實(shí)現(xiàn)步驟如下:

第一步: 與式(2.1)相同,首先輸入歸一化處理之后的對數(shù)死亡率數(shù)據(jù)對AE 模型進(jìn)行訓(xùn)練,通過編碼過程得到潛在時間因子K(t).

第二步: 假設(shè)上一步驟得到的潛在時間因子K(t)滯留時間步長為q,將其輸入LSTM 模型中進(jìn)行擬合預(yù)測,得到預(yù)測值?K(t):

第三步: 將LSTM 的預(yù)測值?K(t)輸入到第一步AE 模型訓(xùn)練得到的解碼過程,得到人口死亡率的預(yù)測值?X(t):

上述改進(jìn)的AE-LSTM 改進(jìn)人口死亡率模型主要具有以下優(yōu)點(diǎn):

①AE 部分是一個輸入和學(xué)習(xí)目標(biāo)相同的神經(jīng)網(wǎng)絡(luò),這種學(xué)習(xí)特性使得該模型能夠應(yīng)用于多元時間序列數(shù)據(jù)預(yù)測,即通過解碼器對時間序列模型得到的預(yù)測值進(jìn)行解碼可以實(shí)現(xiàn)未來的人口死亡率預(yù)測;

②LSTM 部分能夠處理時間序列數(shù)據(jù)的長記憶性,可以對潛在時間因子進(jìn)行更加精準(zhǔn)地擬合和外推;

③AE-LSTM 改進(jìn)模型中非線性激活函數(shù)以及神經(jīng)網(wǎng)絡(luò)的多層設(shè)計可以替代傳統(tǒng)隨機(jī)動態(tài)死亡率預(yù)測模型中的線性交互部分,捕捉到人口死亡率中的非線性部分,同時又解除隨機(jī)動態(tài)死亡率預(yù)測模型中對系數(shù)的約束,能夠更多地學(xué)習(xí)到人口死亡率的變化.

2.3 數(shù)據(jù)描述

2.3.1 數(shù)據(jù)來源

本文選取中國大陸1994-2018 年60-89 歲高齡人口分年齡總體死亡率數(shù)據(jù)進(jìn)行實(shí)證分析,選取日本1947-2018 年60-89 歲高齡人口分年齡死亡率數(shù)據(jù)對本文提出的模型進(jìn)行魯棒性檢驗(yàn). 其中中國大陸人口死亡率數(shù)據(jù)來源于《中國人口統(tǒng)計年鑒》和《中國人口和就業(yè)統(tǒng)計年鑒》. 中國大陸的死亡率數(shù)據(jù)是由人口抽樣得到,其中2000 年和2010 年為普查數(shù)據(jù),2005 年和2015 年為1%人口抽樣調(diào)查,其余各年為1‰人口抽樣調(diào)查. 日本死亡率數(shù)據(jù)來源于人類死亡率數(shù)據(jù)庫HMD(Human Mortality Database)1人類死亡數(shù)據(jù)庫由美國加州大學(xué)伯克利分校人口系和德國羅斯托克普朗克人口研究所于2002 年共同建立, 網(wǎng)址https://www.mortality.org.

2.3.2 數(shù)據(jù)處理

針對中國大陸1996 年85-89 歲人群的死亡率缺失數(shù)據(jù),本文運(yùn)用鄰近線性插值法對暴露人數(shù)和死亡率人數(shù)缺失值進(jìn)行數(shù)據(jù)補(bǔ)充,間接獲取死亡率數(shù)據(jù). 考慮到數(shù)據(jù)的可比性,本文通過對非普查年份的暴露人數(shù)和死亡人數(shù)進(jìn)行線性變換,暴露人數(shù)的線性變換公式為:

本文對中國大陸死亡率數(shù)據(jù)和日本死亡率數(shù)據(jù)進(jìn)行對數(shù)化處理. 為了提高模型的預(yù)測精度和收斂速度,對數(shù)死亡率需要進(jìn)一步歸一化處理,將每一年的對數(shù)死亡率線性轉(zhuǎn)換至0-1. 對于每一年t,其歸一化公式為:

2.3.3 描述性分析

本文給出了經(jīng)過數(shù)據(jù)處理之后的中國大陸1994-2018 年60-89 歲高齡人口風(fēng)險暴露人數(shù)、死亡人數(shù)和死亡率分布情況,如圖3 所示.

圖3(a)給出了各個年齡在不同年份中風(fēng)險暴露人數(shù)的分布情況. 可以發(fā)現(xiàn),隨著年齡的增加,風(fēng)險暴露人數(shù)越來越少,符合社會人類生存規(guī)律. 對于同一年齡的風(fēng)險暴露人數(shù)雖然隨著時間的變化會出現(xiàn)不同程度的波動,但總體趨勢還是在不斷地增加. 圖3(b)給出了死亡人數(shù)的分布情況. 可以發(fā)現(xiàn),在75 歲左右死亡人數(shù)出現(xiàn)高峰,60 歲到75 歲之前,死亡人數(shù)隨著年齡的增加而增加,75歲之后,死亡人數(shù)隨著年齡的增加而下降,主要原因?yàn)?5 歲以后風(fēng)險暴露人數(shù)的減少,使得死亡人數(shù)減少. 從時間維度看,不同年齡的死亡人數(shù)隨著時間的推移呈現(xiàn)波動式增加的趨勢. 圖3(c)展示了死亡率的分布規(guī)律. 可以看到,60-75 歲死亡率波動較小,75-89 歲死亡率波動較大,其波動主要是因?yàn)轱L(fēng)險暴露人數(shù)的數(shù)量少以及一些不可抗拒的環(huán)境因素發(fā)生等影響,如2003 年SARS 盛行導(dǎo)致人口死亡率出現(xiàn)小高峰. 圖3(d)分別給出了60 歲、70 歲和80 歲老年人死亡率隨時間推移的變化趨勢. 從圖中可以看出,三個年齡死亡率都呈現(xiàn)下降的趨勢,其中年齡越高,死亡率下降的速度越快,波動性也越大,從中也可以看出對高年齡段死亡率的預(yù)測是建立死亡率預(yù)測模型的重點(diǎn).

圖3 中國大陸1994-2018 年60-89 歲人口數(shù)據(jù)分布

3 實(shí)證分析

3.1 AE 模型與CBD 模型擬合效果對比分析

本文樣本數(shù)據(jù)量相對較少,對死亡率模型的建立具有一定的挑戰(zhàn)性. 對于神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)節(jié)點(diǎn)的增加可以增加神經(jīng)網(wǎng)絡(luò)的擬合效果. 就AE 模型而言,網(wǎng)絡(luò)太深使得特征壓縮過多,會損失更多的原始信息,且容易出現(xiàn)過度擬合現(xiàn)象,因此本文借鑒張連增等(2020)[7]的研究成果,建立五層自編碼神經(jīng)網(wǎng)絡(luò)對中國高齡死亡率數(shù)據(jù)進(jìn)行擬合. 由于每一年存在30 個死亡率數(shù)據(jù),所以輸入層神經(jīng)元個數(shù)為30,輸出層神經(jīng)元個數(shù)也為30. 設(shè)隱藏層一和隱藏層三的神經(jīng)元個數(shù)都為15;為與CBD 模型進(jìn)行對比,隱藏層二的神經(jīng)元個數(shù)設(shè)為2. 該AE 模型中連接五層神經(jīng)元之間的激活函數(shù)分別設(shè)定為tanh 函數(shù)、linear 函數(shù)、tanh 函數(shù)和sigmoid 函數(shù).

選取1994-2014 年60-89 歲分年齡死亡率數(shù)據(jù)作為訓(xùn)練集對五層AE 模型進(jìn)行訓(xùn)練, 利用2015-2018 年60-89 歲分年齡死亡率數(shù)據(jù)作為測試集檢驗(yàn)?zāi)P偷姆€(wěn)定性. 本文借鑒棧式自編碼器訓(xùn)練權(quán)重的方法,首先通過對單個三層AE 模型預(yù)訓(xùn)練獲取各層網(wǎng)絡(luò)的初始權(quán)重,再對整個五層AE 模型微調(diào)得到最終最優(yōu)模型. 步驟如下.

第一步: 訓(xùn)練第一個自編碼器. 首先建立輸入層和輸出層神經(jīng)元個數(shù)都為30,隱藏層神經(jīng)元個數(shù)為20 的三層自編碼器. 將對數(shù)死亡率輸入該模型進(jìn)行訓(xùn)練,通過觀察訓(xùn)練集和測試集的模型損失曲線,最終確定當(dāng)樣本數(shù)據(jù)對模型訓(xùn)練次數(shù)epoch=5000 時,訓(xùn)練集和測試集的擬合效果最佳,同時將得到的各層之間權(quán)重作為輸入層到隱藏層一和隱藏層四到隱藏層五之間的初始權(quán)重;

第二步: 訓(xùn)練第二個自編碼器. 將步驟一的降維結(jié)果輸入到輸入層和輸出層神經(jīng)元個數(shù)都為20,隱藏層神經(jīng)元個數(shù)為2 的三層自編碼器,對其訓(xùn)練5000 次,得到隱藏層二到隱藏層三和隱藏層三到隱藏層四之間的初始權(quán)重.

第三步: 微調(diào). 利用前兩個步驟得到的初始權(quán)重代入五層AE 模型訓(xùn)練500 次,得到最終訓(xùn)練完成的五層AE 模型.

此次訓(xùn)練均將均方誤差(MSE) 作為評價模型損失的關(guān)鍵指標(biāo). 所用的優(yōu)化算法是結(jié)合AdaGrad 和RMSProp 方法最佳屬性的Adam 算法,通過python3.7 軟件,在TensorFlow2.1 平臺實(shí)現(xiàn). 圖4 為微調(diào)過程中訓(xùn)練集和測試集的模型損失隨訓(xùn)練次數(shù)增加的變化. 可以看到,訓(xùn)練集和測試集的損失下降幅度幾乎相同且接近于0. 訓(xùn)練集的損失接近于0,說明該自編碼器都能很好地學(xué)習(xí)到我國高齡人口死亡率的數(shù)據(jù)特征. 測試集的損失接近于0,說明該模型具有很強(qiáng)的魯棒性和泛化性,能夠?qū)λ劳雎蔬M(jìn)行預(yù)測.

圖4 AE 模型損失

CBD 模型是目前應(yīng)用范圍最廣的高齡人口死亡率模型. 本文根據(jù)高齡人口死亡率訓(xùn)練集數(shù)據(jù)建立相應(yīng)的CBD 模型,并用最大似然估計法對模型參數(shù)進(jìn)行估計. 圖5 和圖6 分別展示了AE 模型和CBD 模型對1994-2014 年60 歲、70 歲和80 歲死亡率數(shù)據(jù)的擬合效果. 兩個模型都可以很好擬合低年齡段的死亡率變化趨勢. 隨著年齡的升高,死亡率波動越來越頻繁,擬合效果越來越不理想. 對比兩個模型的擬合效果發(fā)現(xiàn)AE 模型相對于CBD 模型能夠反應(yīng)死亡率隨時間的波動,CBD模型則能夠較好地反應(yīng)死亡率的平均趨勢.

圖5 CBD 模型擬合圖

圖6 AE 模型擬合圖

表1 展示了對兩個模型判斷擬合效果的絕對評價指標(biāo)MSE 和相對評價指標(biāo)平均百分比誤差(MAPE)的比較結(jié)果. 可以看出,兩個模型都具有較好的擬合效果,但無論從MSE 還是MAPE 的結(jié)果都可以發(fā)現(xiàn),AE 模型的兩個評價指標(biāo)都小于CBD 模型對應(yīng)的評價指標(biāo),說明AE 模型的擬合效果相對較優(yōu).

表1 CBD 模型和AE 模型擬合指標(biāo)

3.2 LSTM 模型與ARIMA 模型預(yù)測效果對比分析

在前人的研究中,大多數(shù)學(xué)者使用隨機(jī)游走過程對時間因子進(jìn)行擬合和外推,以達(dá)到對未來死亡率進(jìn)行預(yù)測的目的. 在機(jī)器學(xué)習(xí)算法中,循環(huán)神經(jīng)網(wǎng)絡(luò)也常用于處理時間序列數(shù)據(jù). 本文建立LSTM 模型對時間因子進(jìn)行擬合和預(yù)測.

本文使用三層LSTM 模型對死亡率進(jìn)行預(yù)測,其中隱藏神經(jīng)元個數(shù)分別為20,50,30. 第一層的輸出作為第二層神經(jīng)網(wǎng)絡(luò)的輸入,第二層神經(jīng)網(wǎng)絡(luò)的輸出作為第三層網(wǎng)絡(luò)的輸入,各層激活函數(shù)分別使用linear 函數(shù)、sigmoid 函數(shù)以及tanh 函數(shù),模型損失使用MSE 衡量,優(yōu)化算法使用Adam算法.

通過AE 模型的編碼過程可以得到兩個潛在時間因子的訓(xùn)練集和測試集. 在利用LSTM 模型分別對時間因子進(jìn)行預(yù)測之前,先對訓(xùn)練集數(shù)據(jù)進(jìn)行整理. 由于整體數(shù)據(jù)量較少,因此,本文設(shè)定時間因子滯留時間步長q= 2,即利用前兩個數(shù)據(jù)來預(yù)測第三個數(shù)據(jù)的數(shù)值,其K1(t)劃分結(jié)構(gòu)如表2 所示,K2(t)劃分結(jié)構(gòu)與K1(t)相同.

表2 時間因子樣本劃分

為得到LSTM 模型的初始權(quán)重,本文先對LSTM 模型進(jìn)行預(yù)訓(xùn)練,選出預(yù)訓(xùn)練損失最小的權(quán)重作為模型的初始權(quán)重,最后對LSTM 模型進(jìn)行微調(diào)得到最終最優(yōu)模型,其步驟如下.

第一步: 確定預(yù)訓(xùn)練參數(shù)epoch. 這里,epoch 為全部樣本數(shù)據(jù)對模型進(jìn)行完整訓(xùn)練的次數(shù). 因?yàn)長STM 模型計算復(fù)雜度較高,耗時較長,對其進(jìn)行預(yù)訓(xùn)練時,應(yīng)在保證模型效果的同時盡量減小epoch 的數(shù)值. 將時間因子輸入LSTM 模型,通過觀察訓(xùn)練集的模型損失曲線,發(fā)現(xiàn)訓(xùn)練次數(shù)epoch=10 時,損失曲線最終趨于0 且逐漸平穩(wěn),能夠較好地保證LSTM 模型的擬合效果.

第二步: 獲取最優(yōu)初始權(quán)重. 將時間因子K1(t)輸入對LSTM 模型訓(xùn)練重復(fù)500 次,epoch 設(shè)定為步驟一得到的數(shù)值10,選取模型損失最小的權(quán)重作為LSTM 模型的初始權(quán)重.

第三步: 微調(diào). 基于對神經(jīng)網(wǎng)絡(luò)訓(xùn)練充足,同時避免過擬合現(xiàn)象的原則,確定利用步驟二得到的權(quán)重對LSTM 訓(xùn)練100 次,得到最終LSTM 模型.

對于時間因子K2(t)的LSTM 模型采用相同的步驟訓(xùn)練得到. 最終K1(t)和K2(t)模型損失程度隨模型訓(xùn)練次數(shù)變化如圖7 和圖8 所示. 可以看到整體模型的損失越來越小,且接近于0,說明模型能夠很好地擬合數(shù)據(jù).

圖7 K1-LSTM 模型損失

圖8 K2-LSTM 模型損失

本文使用傳統(tǒng)的ARIMA 模型對相同的訓(xùn)練集和測試集進(jìn)行擬合和預(yù)測, 使用R 軟件對兩個時間因子分別建立隨機(jī)游走模型,利用MSE 和MAPE 評價兩個模型的擬合和預(yù)測情況. 對比結(jié)果如表3 所示. 可以看到,無論是K1(t)還是K2(t),LSTM 模型各個擬合效果指標(biāo)都低于傳統(tǒng)的ARIMA 模型相應(yīng)的指標(biāo),說明LSTM 模型的擬合精度高于ARIMA 模型. 從預(yù)測的結(jié)果來看,LSTM 模型的預(yù)測誤差依然比ARIMA 模型更小,預(yù)測結(jié)果更加準(zhǔn)確. 從整體情況來看,LSTM 模型優(yōu)于ARIMA 模型.

表3 ARIMA 模型和LSTM 模型指標(biāo)對比

3.3 AE-LSTM 改進(jìn)模型與CBD 模型預(yù)測效果對比分析

利用訓(xùn)練后五層AE 模型的解碼器對LSTM 模型輸出的K1(t)和K2(t)預(yù)測值進(jìn)行解碼,得到我國大陸高齡人口死亡率的預(yù)測值. 同時本文基于傳統(tǒng)CBD 模型和ARIMA 模型對我國大陸高齡人口死亡率進(jìn)行預(yù)測,選取MSE 和MAPE 評價指標(biāo)對比AE-LSTM 改進(jìn)模型與CBD 模型的預(yù)測效果.

表4 為CBD 模型和AE-LSTM 改進(jìn)模型預(yù)測效果評價指標(biāo)對比. 可以看到,AE-LSTM 改進(jìn)模型的均方誤差為0.000023,小于CBD 模型的均方誤差0.000184,且AE-LSTM 改進(jìn)模型的平均百分比誤差與CBD 模型相比下降幅度更大,下降了65%,說明AE-LSTM 改進(jìn)模型的預(yù)測效果優(yōu)于CBD 模型.

表4 CBD 模型和AE-LSTM 改進(jìn)模型預(yù)測效果對比

圖9 展示了2015-2018 年AE-LSTM 改進(jìn)模型和CBD 模型的預(yù)測效果. 可以很明顯地看到, CBD 模型預(yù)測曲線較為平滑, 無法捕捉到死亡率的波動, 并高估了高齡人口的死亡率; 而AE-LSTM 改進(jìn)模型可以捕捉死亡率隨時間變化的波動, 且更加精準(zhǔn)地預(yù)測未來死亡率的數(shù)值.因此: AE-LSTM 改進(jìn)模型較傳統(tǒng)的人口死亡率CBD 模型預(yù)測精度有顯著提高,說明本文建立的AE-LSTM 改進(jìn)模型具有實(shí)際意義.

圖9 CBD 模型和AE-LSTM 改進(jìn)模型預(yù)測效果對比圖

3.4 AE-LSTM 改進(jìn)模型魯棒性檢驗(yàn)

本文選取日本1947-2018 年60-89 歲高齡人口分年齡死亡率數(shù)據(jù)對AE-LSTM 改進(jìn)模型進(jìn)行魯棒性檢驗(yàn),并與CBD 模型的魯棒性進(jìn)行對比. 將1947-2009 年60-89 歲高齡人口死亡率數(shù)據(jù)作為訓(xùn)練集,2010-2018 年60-89 歲高齡人口死亡率數(shù)據(jù)作為測試集對兩個模型進(jìn)行訓(xùn)練,其中評價指標(biāo)差值是基于日本死亡率數(shù)據(jù)集得到的評價指標(biāo)與基于中國大陸死亡率數(shù)據(jù)集的評價指標(biāo)之差.

表5 為AE-LSTM 改進(jìn)模型和CBD 模型魯棒性檢驗(yàn)的對比結(jié)果. 可以看出,無論是擬合效果還是預(yù)測效果,AE-LSTM 改進(jìn)模型的MSE 和MAPE 兩個評價指標(biāo)都要低于CBD 模型相應(yīng)的評價指標(biāo),表明AE-LSTM 改進(jìn)模型在日本高齡人口死亡率數(shù)據(jù)的基礎(chǔ)上擬合效果和預(yù)測效果依然優(yōu)于CBD 模型. 與中國大陸人口死亡率的擬合效果和預(yù)測效果相比,AE-LSTM 改進(jìn)模型的評價指標(biāo)差值皆為負(fù)數(shù),說明該模型對日本高齡人口死亡率數(shù)據(jù)擬合預(yù)測效果更好,而CBD 模型的評價指標(biāo)差值都為正數(shù),說明CBD 模型對日本高齡人口死亡率的適應(yīng)能力相對較差. 對比兩個模型的評價指標(biāo)差值的絕對值,發(fā)現(xiàn)AE-LSTM 改進(jìn)模型的相對CBD 模型絕對值相對較低,擬合和預(yù)測效果更加穩(wěn)定. 通過魯棒性檢驗(yàn)結(jié)果可以看出,AE-LSTM 改進(jìn)模型能夠?qū)W習(xí)到不同地區(qū)的數(shù)據(jù)特點(diǎn),并進(jìn)行更加精準(zhǔn)的人口死亡率預(yù)測,且預(yù)測效果更加穩(wěn)定.

表5 AE-LSTM 改進(jìn)模型和CBD 模型魯棒性檢驗(yàn)對比結(jié)果

4 結(jié)論

本文基于人口死亡率數(shù)據(jù)的多元時間序列結(jié)構(gòu),建立了一個AE-LSTM 改進(jìn)模型,對高齡人口死亡率進(jìn)行擬合和預(yù)測. 通過實(shí)證分析發(fā)現(xiàn),AE-LSTM 改進(jìn)模型對死亡率的擬合和預(yù)測精度比傳統(tǒng)CBD 模型更高,且魯棒性更強(qiáng). 在人口老齡化背景下,從國家戰(zhàn)略層面上來看,本研究可以為政府制定養(yǎng)老金體系改革相關(guān)政策提供一定的決策參考. 從保險公司運(yùn)營層面來看,本研究有助于保險公司有效度量和管理長壽風(fēng)險,推動整個保險行業(yè)可持續(xù)發(fā)展.

在后期研究中,我們可以進(jìn)一步完善人口死亡率預(yù)測模型. 首先可以嘗試采用其他類型的機(jī)器學(xué)習(xí)算法探究人口死亡率的非線性結(jié)構(gòu);其次可以嘗試增加收入、就業(yè)、地區(qū)等人口壽命影響因素,提升對人口死亡率的預(yù)測效果.

猜你喜歡
效果模型
一半模型
按摩效果確有理論依據(jù)
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
迅速制造慢門虛化效果
抓住“瞬間性”效果
中華詩詞(2018年11期)2018-03-26 06:41:34
3D打印中的模型分割與打包
模擬百種唇妝效果
Coco薇(2016年8期)2016-10-09 02:11:50
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
3D—DSA與3D—CTA成像在顱內(nèi)動脈瘤早期診斷中的應(yīng)用效果比較
主站蜘蛛池模板: 亚洲国内精品自在自线官| 久久婷婷色综合老司机| 国产精品jizz在线观看软件| 日韩无码白| 一区二区日韩国产精久久| 久青草网站| 国产高清自拍视频| 欧美日韩国产成人在线观看| 精品视频福利| 欧美福利在线播放| 69综合网| 国产不卡国语在线| 日韩麻豆小视频| 青草视频免费在线观看| 成人福利在线看| 亚洲色图在线观看| 青青草综合网| 呦系列视频一区二区三区| 91精品福利自产拍在线观看| 亚洲精品色AV无码看| 国产精品美女自慰喷水| a天堂视频在线| 97超碰精品成人国产| 国模粉嫩小泬视频在线观看| 99久久这里只精品麻豆| 香蕉色综合| 99久久人妻精品免费二区| 中文字幕永久视频| 亚洲国产天堂久久综合| 国产综合网站| 99免费视频观看| 国产色爱av资源综合区| 国产99免费视频| 成人免费一区二区三区| 成人午夜亚洲影视在线观看| 欧美日韩综合网| 无码精品国产dvd在线观看9久 | 亚洲综合专区| 中国丰满人妻无码束缚啪啪| 麻豆精选在线| 久久狠狠色噜噜狠狠狠狠97视色| 美女无遮挡拍拍拍免费视频| 欧美日韩国产精品综合| 欧美成人午夜在线全部免费| 午夜在线不卡| 美女免费黄网站| 91蝌蚪视频在线观看| 色婷婷国产精品视频| 亚洲国产AV无码综合原创| 久久久精品久久久久三级| 第一页亚洲| 色妞www精品视频一级下载| 国产美女主播一级成人毛片| 国产精品一区二区久久精品无码| 婷婷开心中文字幕| 久久频这里精品99香蕉久网址| 精品色综合| 毛片久久久| 国产尤物jk自慰制服喷水| 天天综合网站| 国产精品一区二区国产主播| 免费观看男人免费桶女人视频| 国产办公室秘书无码精品| 日韩欧美国产区| 无码中文字幕精品推荐| 国产午夜小视频| 伊人久久精品亚洲午夜| 欧美亚洲国产精品第一页| 色综合中文字幕| 国产主播在线一区| 亚洲天堂视频网| 午夜福利免费视频| 国产亚洲一区二区三区在线| 2021国产乱人伦在线播放| 亚洲av日韩av制服丝袜| 天天摸夜夜操| 亚洲一级色| 凹凸国产熟女精品视频| 精品国产一区二区三区在线观看| 凹凸国产熟女精品视频| 九九热精品在线视频| 色视频国产|