楊剛 易艷萍 孫超
(湖南工商大學(xué)理學(xué)院,長沙,410205)
根據(jù)1956 年聯(lián)合國《人口老齡化及其社會經(jīng)濟(jì)后果》確定的劃分標(biāo)準(zhǔn),當(dāng)一個國家或地區(qū)65歲及以上老年人口數(shù)量占總?cè)丝诒壤^7%時,則意味著這個國家或地區(qū)進(jìn)入老齡化. 1982 年維也納老齡問題世界大會,確定60 歲及以上老年人口占總?cè)丝诒壤^10%,意味著這個國家或地區(qū)進(jìn)入嚴(yán)重老齡化. 按照這個國際標(biāo)準(zhǔn),我國早在1999 年就已經(jīng)進(jìn)入老齡化社會. 2020 年第七次全國人口普查結(jié)果顯示,我國60 歲及以上人口達(dá)到26402 萬人,占總?cè)丝诘?8.70%,說明我國人口老齡化程度很高. 國務(wù)院預(yù)計2035 年前后,我國老年人口占比將超過30%,意味著我國將進(jìn)入重度老齡化階段,這將對經(jīng)濟(jì)運(yùn)行全領(lǐng)域、社會建設(shè)各環(huán)節(jié)、社會文化多方面產(chǎn)生深遠(yuǎn)影響.
在2020 年10 月十九屆五中全會《中共中央關(guān)于制定國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和二〇三五年遠(yuǎn)景目標(biāo)的建議》綱領(lǐng)性文件中,我國提出要實(shí)施積極應(yīng)對人口老齡化的國家戰(zhàn)略.而在應(yīng)對人口老齡化帶來的多重挑戰(zhàn)中,最為艱巨的是老齡化社會面臨的長壽風(fēng)險. 當(dāng)人口未來的平均實(shí)際壽命高于預(yù)期壽命時,就會產(chǎn)生長壽風(fēng)險,它將給政府的養(yǎng)老金保險,商業(yè)年金的負(fù)債評估和償付能力管理以及國家老齡事業(yè)和產(chǎn)業(yè)的發(fā)展帶來一定的挑戰(zhàn)[1]. 因此,對人口死亡率尤其是高齡人口死亡率的預(yù)測分析具有十分重要的理論價值和現(xiàn)實(shí)意義.
常用的死亡率預(yù)測模型分為靜態(tài)死亡率預(yù)測模型和動態(tài)死亡率預(yù)測模型[2]. 靜態(tài)死亡率模型是基于死亡率歷史數(shù)據(jù)和生命表模擬歷史死亡率的變化,對歷史死亡率進(jìn)行擬合. 該方法只考慮了死亡率和年齡之間的關(guān)系,無法刻畫死亡率隨時間的動態(tài)變化,因此難以進(jìn)行死亡率外推預(yù)測. 隨后,國內(nèi)外學(xué)者相繼在靜態(tài)死亡率模型的基礎(chǔ)上考慮了時間、出生年和日歷年等因素,建立了以Lee-Carter 模型為代表的動態(tài)死亡率預(yù)測模型. 由于動態(tài)死亡率預(yù)測模型可廣泛應(yīng)用于長壽風(fēng)險度量、壽險產(chǎn)品定價與長壽風(fēng)險管理等領(lǐng)域,因此現(xiàn)在大多數(shù)學(xué)者都采用動態(tài)死亡率預(yù)測模型對人口死亡率進(jìn)行預(yù)測.
動態(tài)死亡率預(yù)測模型很好地解決了靜態(tài)死亡率模型無法刻畫死亡率隨時間動態(tài)改善的缺陷,但其往往基于人口死亡率線性動態(tài)變化的假設(shè),通過在Lee-Carter 模型的基礎(chǔ)上增加影響人口死亡率的因素,或者減少模型的參數(shù)來進(jìn)行推廣和改進(jìn),因此動態(tài)死亡率預(yù)測模型只能刻畫影響因素與人口死亡率之間的線性關(guān)系,對人口死亡率的非線性結(jié)構(gòu)研究還存在一定的限制條件. 而在機(jī)器學(xué)習(xí)算法中,核函數(shù)以及激活函數(shù)的非線性可以實(shí)現(xiàn)數(shù)據(jù)的非線性映射,從而讓機(jī)器學(xué)習(xí)算法具備優(yōu)秀的數(shù)據(jù)非線性學(xué)習(xí)能力. 目前已有應(yīng)用機(jī)器學(xué)習(xí)算法進(jìn)行人口死亡率建模和預(yù)測的相關(guān)工作,并取得了不錯的效果.
機(jī)器學(xué)習(xí)主要通過間接方式、直接方式兩種途徑應(yīng)用于人口死亡率預(yù)測. 間接方式是以動態(tài)死亡率預(yù)測模型為基礎(chǔ),利用機(jī)器學(xué)習(xí)算法提升人口死亡率的擬合效果和預(yù)測效果. Deprez 等(2017)[3]首先使用Lee-Carter 和RH 模型擬合瑞士人口死亡率數(shù)據(jù),然后使用回歸樹算法提升兩個隨機(jī)死亡率模型的擬合度,并對各年齡段死因進(jìn)行分析. Susanna 和Virginia(2019)[4]在回歸樹的基礎(chǔ)上,增加了隨機(jī)森林和梯度提升算法,發(fā)現(xiàn)隨機(jī)森林算法能夠更有效地提升人口死亡率的擬合度. 汪志偉(2021)[5]將長短記憶神經(jīng)網(wǎng)絡(luò)(LSTM)算法與其它擬合精度算法進(jìn)行比較,研究表明LSTM 算法擬合效果提升更大. 在此類研究中,機(jī)器學(xué)習(xí)算法雖然能夠在隨機(jī)死亡率模型的基礎(chǔ)上提升人口死亡率擬合效果,但對人口死亡率的研究依然局限于死亡率線性動態(tài)的假設(shè).
而直接方式是利用機(jī)器學(xué)習(xí)算法建立死亡率預(yù)測模型對人口死亡率數(shù)據(jù)直接進(jìn)行擬合預(yù)測.Hainaut(2018a)[6],張連增等(2020)[7]用非線性時變函數(shù)替代隨機(jī)死亡率Lee-Carter 模型中線性交互部分,提出了神經(jīng)網(wǎng)絡(luò)死亡率模型,并通過帶漂移項(xiàng)的隨機(jī)游走模型進(jìn)行預(yù)測,發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)死亡率模型性能優(yōu)于Lee-Carter 模型. 陳寧(2019)[8]通過在輸入的人口死亡率數(shù)據(jù)中加入噪聲建立降噪自編碼器,對我國人口死亡率數(shù)據(jù)進(jìn)行擬合預(yù)測,研究發(fā)現(xiàn)降噪自編碼器的預(yù)測結(jié)果整體上優(yōu)于Lee-Carter 模型. 機(jī)器學(xué)習(xí)算法主要通過提高人口死亡率的擬合優(yōu)度提升人口死亡率模型預(yù)測的整體性能,但對時間因子進(jìn)行預(yù)測依然停留在傳統(tǒng)的時間序列模型.
綜上所述,目前針對人口死亡率的預(yù)測模型仍可以進(jìn)一步優(yōu)化. 首先,人口死亡率非線性結(jié)構(gòu)的刻畫仍需進(jìn)一步深化. 目前國內(nèi)外對人口死亡率神經(jīng)網(wǎng)絡(luò)算法研究相對欠缺,且大多數(shù)神經(jīng)網(wǎng)絡(luò)算法基于自編碼器進(jìn)行研究. 機(jī)器學(xué)習(xí)算法發(fā)展迅猛,一些新興的算法目前還沒有應(yīng)用于人口死亡率預(yù)測的研究領(lǐng)域. 其次,在神經(jīng)網(wǎng)絡(luò)構(gòu)建中,神經(jīng)元個數(shù)、網(wǎng)絡(luò)深度、激活函數(shù)以及目標(biāo)函數(shù)等這些超參數(shù)的選擇決定了神經(jīng)網(wǎng)絡(luò)對人口死亡率的擬合效果,而超參數(shù)選擇的主觀性和隨意性,容易導(dǎo)致研究結(jié)論過于片面. 針對人口死亡率神經(jīng)網(wǎng)絡(luò)的超參數(shù)選擇目前還沒有形成相對成熟的方法.
由于人口死亡率數(shù)據(jù)屬于多元時間序列,人口死亡率預(yù)測為多變量時間序列預(yù)測. 受許奕杰等(2020)[9]工作的啟發(fā),本文建立一個AE-LSTM 改進(jìn)模型,利用自編碼器(AE)模型自我學(xué)習(xí)的特性,在AE-LSTM 模型的基礎(chǔ)上增加AE 模型的解碼過程,使得該模型能夠?qū)崿F(xiàn)從單一變量預(yù)測到多元時間序列預(yù)測的轉(zhuǎn)換. 相對于全人口死亡率模型,高齡人口死亡率預(yù)測的研究對我國積極應(yīng)對人口老齡化風(fēng)險具有更加重要的戰(zhàn)略意義,因此,本文選取我國大陸1994-2018 年60-89 歲高齡人口總體死亡率作為樣本數(shù)據(jù)進(jìn)行實(shí)證分析.
CBD 模型又稱雙因素死亡率模型,在Lee-Carter 模型中,不同年齡之間的死亡率完全相關(guān),因此Currie 等(2006)[10]提出了CBD 模型彌補(bǔ)這一缺陷,其表達(dá)形式為:

其中,φi為回歸參數(shù),Li表示i階滯后算子,Δdkt表示對kt作d次一階差分,p為自相關(guān)項(xiàng)數(shù),α是漂移項(xiàng),θi為滑動平均參數(shù),q為滑動平均項(xiàng)數(shù),μt表示均值為零、方差確定的白噪聲過程.
2.2.1 AE-LSTM 模型
Rumelhart 等(1986)[12]提出自動編碼器的概念,并將其用于高維復(fù)雜數(shù)據(jù)處理. AE 模型是以輸入信息為學(xué)習(xí)目標(biāo),旨在將輸入信息復(fù)制到輸出,其常用于高維數(shù)據(jù)的非線性降維和特征學(xué)習(xí).AE 模型主要分為編碼和解碼兩個部分,各層神經(jīng)元通過權(quán)重和激活函數(shù)連接. 編碼過程就是通過兩次非線性轉(zhuǎn)換將原數(shù)據(jù)的維數(shù)減少. 解碼過程則是通過兩次非線性轉(zhuǎn)換將低維數(shù)據(jù)映射到原高維數(shù)據(jù),實(shí)現(xiàn)降維數(shù)據(jù)到原數(shù)據(jù)的還原. AE 模型的提出促進(jìn)了人工神經(jīng)網(wǎng)絡(luò)的發(fā)展.
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一類用來處理時間序列的機(jī)器學(xué)習(xí)算法. Hochreiter 等(1997)[13]對一般RNN 進(jìn)行改進(jìn),提出了LSTM 模型. LSTM 模型的基本單元為記憶模塊,相對于一般RNN 只有簡單的tanh 層的重復(fù)模塊,LSTM 包含了四個神經(jīng)網(wǎng)絡(luò)層,包括細(xì)胞狀態(tài)、忘記門、輸入門和輸出門. LSTM 模型的提出解決了一般RNN 存在的長期依賴問題,它可以處理和預(yù)測事件序列中時間間隔和延遲比較長的重要事件,將遠(yuǎn)距離的上下文信息運(yùn)用到當(dāng)前時刻.
AE-LSTM 模型是一個混合神經(jīng)網(wǎng)絡(luò),由上述兩部分組成. 第一部分為AE 模型的編碼部分,其主要作用是對原始數(shù)據(jù)進(jìn)行特征提取. 第二部分為LSTM 模型,其主要作用是對AE 模型提取的特征數(shù)據(jù)進(jìn)行時間序列預(yù)測,并通過在LSTM 網(wǎng)絡(luò)最后一層加入SoftMax 層,實(shí)現(xiàn)分類數(shù)據(jù)的預(yù)測,AE-LSTM 模型的結(jié)構(gòu)如圖1 所示.

圖1 AE-LSTM 模型結(jié)構(gòu)示意圖
設(shè)Xi(t) 表示第i個屬性在時間t時的取值, 則樣本矩陣可以表示為:X(t) =(X1(t),X2(t),··· ,Xn(t))T. AE-LSTM 模型通過以下步驟實(shí)現(xiàn).
第一步: 將原始數(shù)據(jù)X(t)輸入AE 模型進(jìn)行訓(xùn)練,利用編碼過程計算得到編碼數(shù)據(jù):

其中,fdec(·)為解碼函數(shù),fenc(·)為編碼函數(shù), ?X(t)表示AE 模型對原始數(shù)據(jù)的擬合結(jié)果.
第二步: 將編碼數(shù)據(jù)輸入到LSTM 模型中得到因變量輸出值?y(t):

其中,fLST M(·) 為LSTM 函數(shù), 最終通過比較模型輸出值?y(t) 和實(shí)際值y(t) 之間的差距, 評價AE-LSTM 模型的性能.
2.2.2 AE-LSTM 改進(jìn)模型
在上述的AE-LSTM 模型中,主要利用AE 模型對多維自變量降維,LSTM 模型實(shí)現(xiàn)對單一因變量的精準(zhǔn)預(yù)測. 由于在本研究中死亡率數(shù)據(jù)屬于多元時間序列,自變量和因變量的數(shù)據(jù)集相同,對人口死亡率的預(yù)測不再是對單一因變量預(yù)測,而是對多變量預(yù)測. 因此,本文提出一個AE-LSTM改進(jìn)模型,在原AE-LSTM 模型的基礎(chǔ)上,增加AE 模型的解碼過程,在完成單一時間序列預(yù)測的基礎(chǔ)下,實(shí)現(xiàn)多變量預(yù)測. 改進(jìn)后的AE-LSTM 模型具體結(jié)構(gòu)如圖2 所示:

圖2 AE-LSTM 改進(jìn)模型結(jié)構(gòu)示意圖
本文的輸入變量X(t)表示對數(shù)死亡率,具體形式為:

其中,lnmx,t表示在第t年x歲的人群的對數(shù)死亡率. AE-LSTM 改進(jìn)模型的實(shí)現(xiàn)步驟如下:
第一步: 與式(2.1)相同,首先輸入歸一化處理之后的對數(shù)死亡率數(shù)據(jù)對AE 模型進(jìn)行訓(xùn)練,通過編碼過程得到潛在時間因子K(t).
第二步: 假設(shè)上一步驟得到的潛在時間因子K(t)滯留時間步長為q,將其輸入LSTM 模型中進(jìn)行擬合預(yù)測,得到預(yù)測值?K(t):

第三步: 將LSTM 的預(yù)測值?K(t)輸入到第一步AE 模型訓(xùn)練得到的解碼過程,得到人口死亡率的預(yù)測值?X(t):

上述改進(jìn)的AE-LSTM 改進(jìn)人口死亡率模型主要具有以下優(yōu)點(diǎn):
①AE 部分是一個輸入和學(xué)習(xí)目標(biāo)相同的神經(jīng)網(wǎng)絡(luò),這種學(xué)習(xí)特性使得該模型能夠應(yīng)用于多元時間序列數(shù)據(jù)預(yù)測,即通過解碼器對時間序列模型得到的預(yù)測值進(jìn)行解碼可以實(shí)現(xiàn)未來的人口死亡率預(yù)測;
②LSTM 部分能夠處理時間序列數(shù)據(jù)的長記憶性,可以對潛在時間因子進(jìn)行更加精準(zhǔn)地擬合和外推;
③AE-LSTM 改進(jìn)模型中非線性激活函數(shù)以及神經(jīng)網(wǎng)絡(luò)的多層設(shè)計可以替代傳統(tǒng)隨機(jī)動態(tài)死亡率預(yù)測模型中的線性交互部分,捕捉到人口死亡率中的非線性部分,同時又解除隨機(jī)動態(tài)死亡率預(yù)測模型中對系數(shù)的約束,能夠更多地學(xué)習(xí)到人口死亡率的變化.
2.3.1 數(shù)據(jù)來源
本文選取中國大陸1994-2018 年60-89 歲高齡人口分年齡總體死亡率數(shù)據(jù)進(jìn)行實(shí)證分析,選取日本1947-2018 年60-89 歲高齡人口分年齡死亡率數(shù)據(jù)對本文提出的模型進(jìn)行魯棒性檢驗(yàn). 其中中國大陸人口死亡率數(shù)據(jù)來源于《中國人口統(tǒng)計年鑒》和《中國人口和就業(yè)統(tǒng)計年鑒》. 中國大陸的死亡率數(shù)據(jù)是由人口抽樣得到,其中2000 年和2010 年為普查數(shù)據(jù),2005 年和2015 年為1%人口抽樣調(diào)查,其余各年為1‰人口抽樣調(diào)查. 日本死亡率數(shù)據(jù)來源于人類死亡率數(shù)據(jù)庫HMD(Human Mortality Database)1人類死亡數(shù)據(jù)庫由美國加州大學(xué)伯克利分校人口系和德國羅斯托克普朗克人口研究所于2002 年共同建立, 網(wǎng)址https://www.mortality.org.
2.3.2 數(shù)據(jù)處理
針對中國大陸1996 年85-89 歲人群的死亡率缺失數(shù)據(jù),本文運(yùn)用鄰近線性插值法對暴露人數(shù)和死亡率人數(shù)缺失值進(jìn)行數(shù)據(jù)補(bǔ)充,間接獲取死亡率數(shù)據(jù). 考慮到數(shù)據(jù)的可比性,本文通過對非普查年份的暴露人數(shù)和死亡人數(shù)進(jìn)行線性變換,暴露人數(shù)的線性變換公式為:

本文對中國大陸死亡率數(shù)據(jù)和日本死亡率數(shù)據(jù)進(jìn)行對數(shù)化處理. 為了提高模型的預(yù)測精度和收斂速度,對數(shù)死亡率需要進(jìn)一步歸一化處理,將每一年的對數(shù)死亡率線性轉(zhuǎn)換至0-1. 對于每一年t,其歸一化公式為:

2.3.3 描述性分析
本文給出了經(jīng)過數(shù)據(jù)處理之后的中國大陸1994-2018 年60-89 歲高齡人口風(fēng)險暴露人數(shù)、死亡人數(shù)和死亡率分布情況,如圖3 所示.
圖3(a)給出了各個年齡在不同年份中風(fēng)險暴露人數(shù)的分布情況. 可以發(fā)現(xiàn),隨著年齡的增加,風(fēng)險暴露人數(shù)越來越少,符合社會人類生存規(guī)律. 對于同一年齡的風(fēng)險暴露人數(shù)雖然隨著時間的變化會出現(xiàn)不同程度的波動,但總體趨勢還是在不斷地增加. 圖3(b)給出了死亡人數(shù)的分布情況. 可以發(fā)現(xiàn),在75 歲左右死亡人數(shù)出現(xiàn)高峰,60 歲到75 歲之前,死亡人數(shù)隨著年齡的增加而增加,75歲之后,死亡人數(shù)隨著年齡的增加而下降,主要原因?yàn)?5 歲以后風(fēng)險暴露人數(shù)的減少,使得死亡人數(shù)減少. 從時間維度看,不同年齡的死亡人數(shù)隨著時間的推移呈現(xiàn)波動式增加的趨勢. 圖3(c)展示了死亡率的分布規(guī)律. 可以看到,60-75 歲死亡率波動較小,75-89 歲死亡率波動較大,其波動主要是因?yàn)轱L(fēng)險暴露人數(shù)的數(shù)量少以及一些不可抗拒的環(huán)境因素發(fā)生等影響,如2003 年SARS 盛行導(dǎo)致人口死亡率出現(xiàn)小高峰. 圖3(d)分別給出了60 歲、70 歲和80 歲老年人死亡率隨時間推移的變化趨勢. 從圖中可以看出,三個年齡死亡率都呈現(xiàn)下降的趨勢,其中年齡越高,死亡率下降的速度越快,波動性也越大,從中也可以看出對高年齡段死亡率的預(yù)測是建立死亡率預(yù)測模型的重點(diǎn).

圖3 中國大陸1994-2018 年60-89 歲人口數(shù)據(jù)分布
本文樣本數(shù)據(jù)量相對較少,對死亡率模型的建立具有一定的挑戰(zhàn)性. 對于神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)節(jié)點(diǎn)的增加可以增加神經(jīng)網(wǎng)絡(luò)的擬合效果. 就AE 模型而言,網(wǎng)絡(luò)太深使得特征壓縮過多,會損失更多的原始信息,且容易出現(xiàn)過度擬合現(xiàn)象,因此本文借鑒張連增等(2020)[7]的研究成果,建立五層自編碼神經(jīng)網(wǎng)絡(luò)對中國高齡死亡率數(shù)據(jù)進(jìn)行擬合. 由于每一年存在30 個死亡率數(shù)據(jù),所以輸入層神經(jīng)元個數(shù)為30,輸出層神經(jīng)元個數(shù)也為30. 設(shè)隱藏層一和隱藏層三的神經(jīng)元個數(shù)都為15;為與CBD 模型進(jìn)行對比,隱藏層二的神經(jīng)元個數(shù)設(shè)為2. 該AE 模型中連接五層神經(jīng)元之間的激活函數(shù)分別設(shè)定為tanh 函數(shù)、linear 函數(shù)、tanh 函數(shù)和sigmoid 函數(shù).
選取1994-2014 年60-89 歲分年齡死亡率數(shù)據(jù)作為訓(xùn)練集對五層AE 模型進(jìn)行訓(xùn)練, 利用2015-2018 年60-89 歲分年齡死亡率數(shù)據(jù)作為測試集檢驗(yàn)?zāi)P偷姆€(wěn)定性. 本文借鑒棧式自編碼器訓(xùn)練權(quán)重的方法,首先通過對單個三層AE 模型預(yù)訓(xùn)練獲取各層網(wǎng)絡(luò)的初始權(quán)重,再對整個五層AE 模型微調(diào)得到最終最優(yōu)模型. 步驟如下.
第一步: 訓(xùn)練第一個自編碼器. 首先建立輸入層和輸出層神經(jīng)元個數(shù)都為30,隱藏層神經(jīng)元個數(shù)為20 的三層自編碼器. 將對數(shù)死亡率輸入該模型進(jìn)行訓(xùn)練,通過觀察訓(xùn)練集和測試集的模型損失曲線,最終確定當(dāng)樣本數(shù)據(jù)對模型訓(xùn)練次數(shù)epoch=5000 時,訓(xùn)練集和測試集的擬合效果最佳,同時將得到的各層之間權(quán)重作為輸入層到隱藏層一和隱藏層四到隱藏層五之間的初始權(quán)重;
第二步: 訓(xùn)練第二個自編碼器. 將步驟一的降維結(jié)果輸入到輸入層和輸出層神經(jīng)元個數(shù)都為20,隱藏層神經(jīng)元個數(shù)為2 的三層自編碼器,對其訓(xùn)練5000 次,得到隱藏層二到隱藏層三和隱藏層三到隱藏層四之間的初始權(quán)重.
第三步: 微調(diào). 利用前兩個步驟得到的初始權(quán)重代入五層AE 模型訓(xùn)練500 次,得到最終訓(xùn)練完成的五層AE 模型.
此次訓(xùn)練均將均方誤差(MSE) 作為評價模型損失的關(guān)鍵指標(biāo). 所用的優(yōu)化算法是結(jié)合AdaGrad 和RMSProp 方法最佳屬性的Adam 算法,通過python3.7 軟件,在TensorFlow2.1 平臺實(shí)現(xiàn). 圖4 為微調(diào)過程中訓(xùn)練集和測試集的模型損失隨訓(xùn)練次數(shù)增加的變化. 可以看到,訓(xùn)練集和測試集的損失下降幅度幾乎相同且接近于0. 訓(xùn)練集的損失接近于0,說明該自編碼器都能很好地學(xué)習(xí)到我國高齡人口死亡率的數(shù)據(jù)特征. 測試集的損失接近于0,說明該模型具有很強(qiáng)的魯棒性和泛化性,能夠?qū)λ劳雎蔬M(jìn)行預(yù)測.

圖4 AE 模型損失
CBD 模型是目前應(yīng)用范圍最廣的高齡人口死亡率模型. 本文根據(jù)高齡人口死亡率訓(xùn)練集數(shù)據(jù)建立相應(yīng)的CBD 模型,并用最大似然估計法對模型參數(shù)進(jìn)行估計. 圖5 和圖6 分別展示了AE 模型和CBD 模型對1994-2014 年60 歲、70 歲和80 歲死亡率數(shù)據(jù)的擬合效果. 兩個模型都可以很好擬合低年齡段的死亡率變化趨勢. 隨著年齡的升高,死亡率波動越來越頻繁,擬合效果越來越不理想. 對比兩個模型的擬合效果發(fā)現(xiàn)AE 模型相對于CBD 模型能夠反應(yīng)死亡率隨時間的波動,CBD模型則能夠較好地反應(yīng)死亡率的平均趨勢.

圖5 CBD 模型擬合圖

圖6 AE 模型擬合圖
表1 展示了對兩個模型判斷擬合效果的絕對評價指標(biāo)MSE 和相對評價指標(biāo)平均百分比誤差(MAPE)的比較結(jié)果. 可以看出,兩個模型都具有較好的擬合效果,但無論從MSE 還是MAPE 的結(jié)果都可以發(fā)現(xiàn),AE 模型的兩個評價指標(biāo)都小于CBD 模型對應(yīng)的評價指標(biāo),說明AE 模型的擬合效果相對較優(yōu).

表1 CBD 模型和AE 模型擬合指標(biāo)
在前人的研究中,大多數(shù)學(xué)者使用隨機(jī)游走過程對時間因子進(jìn)行擬合和外推,以達(dá)到對未來死亡率進(jìn)行預(yù)測的目的. 在機(jī)器學(xué)習(xí)算法中,循環(huán)神經(jīng)網(wǎng)絡(luò)也常用于處理時間序列數(shù)據(jù). 本文建立LSTM 模型對時間因子進(jìn)行擬合和預(yù)測.
本文使用三層LSTM 模型對死亡率進(jìn)行預(yù)測,其中隱藏神經(jīng)元個數(shù)分別為20,50,30. 第一層的輸出作為第二層神經(jīng)網(wǎng)絡(luò)的輸入,第二層神經(jīng)網(wǎng)絡(luò)的輸出作為第三層網(wǎng)絡(luò)的輸入,各層激活函數(shù)分別使用linear 函數(shù)、sigmoid 函數(shù)以及tanh 函數(shù),模型損失使用MSE 衡量,優(yōu)化算法使用Adam算法.
通過AE 模型的編碼過程可以得到兩個潛在時間因子的訓(xùn)練集和測試集. 在利用LSTM 模型分別對時間因子進(jìn)行預(yù)測之前,先對訓(xùn)練集數(shù)據(jù)進(jìn)行整理. 由于整體數(shù)據(jù)量較少,因此,本文設(shè)定時間因子滯留時間步長q= 2,即利用前兩個數(shù)據(jù)來預(yù)測第三個數(shù)據(jù)的數(shù)值,其K1(t)劃分結(jié)構(gòu)如表2 所示,K2(t)劃分結(jié)構(gòu)與K1(t)相同.

表2 時間因子樣本劃分
為得到LSTM 模型的初始權(quán)重,本文先對LSTM 模型進(jìn)行預(yù)訓(xùn)練,選出預(yù)訓(xùn)練損失最小的權(quán)重作為模型的初始權(quán)重,最后對LSTM 模型進(jìn)行微調(diào)得到最終最優(yōu)模型,其步驟如下.
第一步: 確定預(yù)訓(xùn)練參數(shù)epoch. 這里,epoch 為全部樣本數(shù)據(jù)對模型進(jìn)行完整訓(xùn)練的次數(shù). 因?yàn)長STM 模型計算復(fù)雜度較高,耗時較長,對其進(jìn)行預(yù)訓(xùn)練時,應(yīng)在保證模型效果的同時盡量減小epoch 的數(shù)值. 將時間因子輸入LSTM 模型,通過觀察訓(xùn)練集的模型損失曲線,發(fā)現(xiàn)訓(xùn)練次數(shù)epoch=10 時,損失曲線最終趨于0 且逐漸平穩(wěn),能夠較好地保證LSTM 模型的擬合效果.
第二步: 獲取最優(yōu)初始權(quán)重. 將時間因子K1(t)輸入對LSTM 模型訓(xùn)練重復(fù)500 次,epoch 設(shè)定為步驟一得到的數(shù)值10,選取模型損失最小的權(quán)重作為LSTM 模型的初始權(quán)重.
第三步: 微調(diào). 基于對神經(jīng)網(wǎng)絡(luò)訓(xùn)練充足,同時避免過擬合現(xiàn)象的原則,確定利用步驟二得到的權(quán)重對LSTM 訓(xùn)練100 次,得到最終LSTM 模型.
對于時間因子K2(t)的LSTM 模型采用相同的步驟訓(xùn)練得到. 最終K1(t)和K2(t)模型損失程度隨模型訓(xùn)練次數(shù)變化如圖7 和圖8 所示. 可以看到整體模型的損失越來越小,且接近于0,說明模型能夠很好地擬合數(shù)據(jù).

圖7 K1-LSTM 模型損失

圖8 K2-LSTM 模型損失
本文使用傳統(tǒng)的ARIMA 模型對相同的訓(xùn)練集和測試集進(jìn)行擬合和預(yù)測, 使用R 軟件對兩個時間因子分別建立隨機(jī)游走模型,利用MSE 和MAPE 評價兩個模型的擬合和預(yù)測情況. 對比結(jié)果如表3 所示. 可以看到,無論是K1(t)還是K2(t),LSTM 模型各個擬合效果指標(biāo)都低于傳統(tǒng)的ARIMA 模型相應(yīng)的指標(biāo),說明LSTM 模型的擬合精度高于ARIMA 模型. 從預(yù)測的結(jié)果來看,LSTM 模型的預(yù)測誤差依然比ARIMA 模型更小,預(yù)測結(jié)果更加準(zhǔn)確. 從整體情況來看,LSTM 模型優(yōu)于ARIMA 模型.

表3 ARIMA 模型和LSTM 模型指標(biāo)對比
利用訓(xùn)練后五層AE 模型的解碼器對LSTM 模型輸出的K1(t)和K2(t)預(yù)測值進(jìn)行解碼,得到我國大陸高齡人口死亡率的預(yù)測值. 同時本文基于傳統(tǒng)CBD 模型和ARIMA 模型對我國大陸高齡人口死亡率進(jìn)行預(yù)測,選取MSE 和MAPE 評價指標(biāo)對比AE-LSTM 改進(jìn)模型與CBD 模型的預(yù)測效果.
表4 為CBD 模型和AE-LSTM 改進(jìn)模型預(yù)測效果評價指標(biāo)對比. 可以看到,AE-LSTM 改進(jìn)模型的均方誤差為0.000023,小于CBD 模型的均方誤差0.000184,且AE-LSTM 改進(jìn)模型的平均百分比誤差與CBD 模型相比下降幅度更大,下降了65%,說明AE-LSTM 改進(jìn)模型的預(yù)測效果優(yōu)于CBD 模型.

表4 CBD 模型和AE-LSTM 改進(jìn)模型預(yù)測效果對比
圖9 展示了2015-2018 年AE-LSTM 改進(jìn)模型和CBD 模型的預(yù)測效果. 可以很明顯地看到, CBD 模型預(yù)測曲線較為平滑, 無法捕捉到死亡率的波動, 并高估了高齡人口的死亡率; 而AE-LSTM 改進(jìn)模型可以捕捉死亡率隨時間變化的波動, 且更加精準(zhǔn)地預(yù)測未來死亡率的數(shù)值.因此: AE-LSTM 改進(jìn)模型較傳統(tǒng)的人口死亡率CBD 模型預(yù)測精度有顯著提高,說明本文建立的AE-LSTM 改進(jìn)模型具有實(shí)際意義.

圖9 CBD 模型和AE-LSTM 改進(jìn)模型預(yù)測效果對比圖
本文選取日本1947-2018 年60-89 歲高齡人口分年齡死亡率數(shù)據(jù)對AE-LSTM 改進(jìn)模型進(jìn)行魯棒性檢驗(yàn),并與CBD 模型的魯棒性進(jìn)行對比. 將1947-2009 年60-89 歲高齡人口死亡率數(shù)據(jù)作為訓(xùn)練集,2010-2018 年60-89 歲高齡人口死亡率數(shù)據(jù)作為測試集對兩個模型進(jìn)行訓(xùn)練,其中評價指標(biāo)差值是基于日本死亡率數(shù)據(jù)集得到的評價指標(biāo)與基于中國大陸死亡率數(shù)據(jù)集的評價指標(biāo)之差.
表5 為AE-LSTM 改進(jìn)模型和CBD 模型魯棒性檢驗(yàn)的對比結(jié)果. 可以看出,無論是擬合效果還是預(yù)測效果,AE-LSTM 改進(jìn)模型的MSE 和MAPE 兩個評價指標(biāo)都要低于CBD 模型相應(yīng)的評價指標(biāo),表明AE-LSTM 改進(jìn)模型在日本高齡人口死亡率數(shù)據(jù)的基礎(chǔ)上擬合效果和預(yù)測效果依然優(yōu)于CBD 模型. 與中國大陸人口死亡率的擬合效果和預(yù)測效果相比,AE-LSTM 改進(jìn)模型的評價指標(biāo)差值皆為負(fù)數(shù),說明該模型對日本高齡人口死亡率數(shù)據(jù)擬合預(yù)測效果更好,而CBD 模型的評價指標(biāo)差值都為正數(shù),說明CBD 模型對日本高齡人口死亡率的適應(yīng)能力相對較差. 對比兩個模型的評價指標(biāo)差值的絕對值,發(fā)現(xiàn)AE-LSTM 改進(jìn)模型的相對CBD 模型絕對值相對較低,擬合和預(yù)測效果更加穩(wěn)定. 通過魯棒性檢驗(yàn)結(jié)果可以看出,AE-LSTM 改進(jìn)模型能夠?qū)W習(xí)到不同地區(qū)的數(shù)據(jù)特點(diǎn),并進(jìn)行更加精準(zhǔn)的人口死亡率預(yù)測,且預(yù)測效果更加穩(wěn)定.

表5 AE-LSTM 改進(jìn)模型和CBD 模型魯棒性檢驗(yàn)對比結(jié)果
本文基于人口死亡率數(shù)據(jù)的多元時間序列結(jié)構(gòu),建立了一個AE-LSTM 改進(jìn)模型,對高齡人口死亡率進(jìn)行擬合和預(yù)測. 通過實(shí)證分析發(fā)現(xiàn),AE-LSTM 改進(jìn)模型對死亡率的擬合和預(yù)測精度比傳統(tǒng)CBD 模型更高,且魯棒性更強(qiáng). 在人口老齡化背景下,從國家戰(zhàn)略層面上來看,本研究可以為政府制定養(yǎng)老金體系改革相關(guān)政策提供一定的決策參考. 從保險公司運(yùn)營層面來看,本研究有助于保險公司有效度量和管理長壽風(fēng)險,推動整個保險行業(yè)可持續(xù)發(fā)展.
在后期研究中,我們可以進(jìn)一步完善人口死亡率預(yù)測模型. 首先可以嘗試采用其他類型的機(jī)器學(xué)習(xí)算法探究人口死亡率的非線性結(jié)構(gòu);其次可以嘗試增加收入、就業(yè)、地區(qū)等人口壽命影響因素,提升對人口死亡率的預(yù)測效果.
數(shù)學(xué)理論與應(yīng)用2022年3期