999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于KP-RBF神經網絡的人口平均壽命預測

2018-09-04 07:51:40趙欣彤楊燕綏
統計與決策 2018年15期
關鍵詞:方法

趙欣彤,楊燕綏

(1.中國人民大學 勞動人事學院,北京 100000;2.清華大學 公共管理學院,北京 100084)

0 引言

人口平均預期壽命(以下簡稱“人均壽命”)是反映一個國家、地區的人口狀況,預測人口發展趨勢、分析人口結構、評估人口質量的重要指標,為各國政府所重視。準確、及時的人均壽命預測有助于政府決策部門科學制定養老金、醫療保障、養老服務等社會政策。人均壽命不僅受到人口出生、死亡等狹義人口學因素的影響,還是經濟、衛生、環境、教育、就業、福利等廣義人口學變量綜合作用的結果,具有高度非線性、高噪聲、低精度、低穩健性等特點,預測難度較大。基于國家大規模人口普查的人均壽命預測雖然結果準確,卻存在更新周期長、滯后性嚴重等缺陷,且需要耗費大量的人力和物力[1];傳統的標準生命表法依賴有限參數設定且受制于基礎數據來源的有限性和缺失性,且計算過程較為繁瑣;多元回歸分析法模型較為單一,尤其是當自變量因素較為復雜時,多元回歸分析法的處理難度將大大增加,導致預測精度有限。

神經網絡是常用的數據預測方法之一,具有較好的分類能力、泛化能力和逼近性能,近年來被廣泛應用于函數逼近、模式識別、數據分類等研究中[2]。羅榮桂等[3]利用BP算法實現了長江流域人口數量的預測。黃建元等[4]基于BP算法對我國人口平均壽命進行了預測研究。本文在傳統神經網絡方法的基礎上,提出了一種基于模糊K-Prototypes算法的改進RBF神經網絡方法,提高了對人口預測中復雜自變量因素的處理能力,并將KP-RBF神經網絡預測方法應用于人口平均壽命預測。對比分析了KP-RBF神經網絡與傳統BP神經網絡和CNN神經網絡的性能,發現所設計的KP-RBF方法在預測精度和穩健性方面均優于其他方法。

1 RBF神經網絡原理

經典的RBF神經網絡結構由輸入層、隱藏層和輸出層三部分組成,其本質是一個映射過程:f(x) ∶Rm→Rn,設x∈Rm為輸入向量,Ci∈Rm為基函數第i個中心節點,則每個基函數輸出值為:

其中,‖‖表示歐式距離。通常選用高斯函數作為中心點的激活函數,其函數形式為:

其中,σi為第i個中心點的寬度。RBFNN的第 j個輸出 yj(x)為:

其中,l為RBF網絡節點個數,φi(x)為第 i個輸出偏差,ω(j, i)為第 j個中心點到第i個點的權重。整體的網絡結構如圖1所示。

圖1 RBF神經網絡示意圖

2 基于K-Prototypes算法的改進RBF神經網絡

2.1 K-Prototypes算法

K-Prototypes 算法是由 Huang(1998)提出的聚類方法。傳統的神經網絡方法如RBF神經網絡、BP神經網絡等方法在進行數據預測時,對變量之間不相關或弱耦合的假設會導致樣本信息利用不充分;同時神經網絡基函數中心點選取敏感性較高,使得預測精度和穩健性容易受到影響[5,6];且傳統的聚類分析屬于硬劃分,將每個樣本強制劃分到某一類當中。這種算法并未考慮在實際情況下樣本并沒有嚴格的形態和屬性,而是存在不同程度的中介性。與傳統的聚類算法相比,K-prototypes算法最大的特點在于對非數值型屬性的距離量測改為相異度表示,能夠更好地處理混合型數據集。進一步地,模糊K-Prototypes算法是對K-Prototypes算法的有效擴展[7]。模糊K-Prototypes算法通過隸屬度函數確定聚類中心的核心對象和邊緣對象,對聚類中心進行迭代更新并進行矩陣劃分,使得目標函數最小化,進而得到較好的聚類處理效果。該方法通過擴大捕捉有效信息的方式提高處理類中邊緣對象的估計效度,以此提高模型處理異常值和缺失數據的能力。

模糊K-Prototypes算法的原理為:假定樣本 X=[x1,x2,…,xn],其中 xi=[ ]xi1,xi2,…,xim,m為屬性值個數。在對樣本X進行聚類時,需要將n個對象劃分到K個不同的類別中,聚類準則為使以下目標函數最小:

其中,α為模糊指數。當α>1時該聚類為模糊聚類,當 α=1時該聚類為硬聚類。d(xi, Ck)為數據對象 xi的差異測度,其定義如下:

此時,代價函數的函數形式變為:

進一步地,劃分矩陣的更新方法如下:

同樣地,聚類中心的更新方法如下:

對于屬性Aj( )1≤j≤p :模糊K-Prototypes算法的定義可用如下定義來描述:假定樣本是有m個屬性A1,A2,…,Am描述的一組數據對象X=[x1,x2,…,xn] ,其中 xi=[xi1,xi2,…,xim]表示數據對象xi的m個屬性值。在對xi進行聚類時,使用以下代價函數將n個對象劃分到K個不同的類別中:

上 式 中 ,C=[C1,C2,…,CK] ,其 中 Ck=[ck1,ck2,…,ckm]表示聚類k的以向量形式表示的聚類中心,是 K×n的矩陣,元素 ξki為對象xi劃分到聚類k的隸屬度,滿足以下條件:

其中,α是模糊指數。當α>1時該聚類為模糊聚類,當α=1時該聚類為硬聚類。d(xi, Ck)為數據對象xi的差異測度,其定義如下:

此時,代價函數的函數形式變為:

進一步地,劃分矩陣的更新方法如下:

同樣地,聚類中心的更新方法為:

2.2 劃分矩陣?及聚類中心Ci的確定

由于人口平均壽命預測中所涉及的自變量因素多為社會經濟因素,各變量之間存在強非線性關系。因此,在確定RBF第二層(隱藏層)中各結點的聚類中心Ci及劃分矩陣?時,使用模糊K-Prototypes算法進行聚類運算。具體算法如下:

(1)初始化聚類個數K、聚類中心C0和誤差ε,算出劃分矩陣?0;

(2)確定 Ci+1,若 | F(?t, Ct+1)-F(?t, Ct) |< ε,算法停止,返回 ?i,Ci+1;

(3)確定Ci+1,若 | F(?t+1, Ct+1)-F(?t, Ct+1) |< ε,算法停止,返回 ?i+1,Ci+1;

(4)令 i=i+1,返回第(2)步。

2.3 初始聚類中心C0的確定

在確定初始聚類中心C0時,既有研究的做法是從全樣本中隨機選取K個樣本向量作為然后進行迭代運算。由于使用K-Prototypes算法計算得出的聚類結果對C0的選取較為敏感,在運算過程中可能會導致聚類結果偏離實際[8],為提高算法估計結果的信度,本文使用一種新的挑選方法確定初始聚類中心C0。

(1)將各因素變量按如下方式進行標準化,使它們的取值變為[0 , 1]之間,從而消除不同屬性取值由量綱不同造成的差異:

其中,maxj為第 j個屬性的最大值,minj為第 j個屬性的最小值。

(3)將所有屬性分為K組,每組包含[ ]N K個數據。將剩余數據歸入最后一組中。設定初始聚類中心C0為每組中出現頻次最高的屬性值;結合(2)中得到的初始值,本文得到K個初始聚類中心為

通過上述方法,能夠確保選取的初始聚類中心的選取具有較好代表性,可以有效反映原始樣本的分布情況。

2.4 中心點寬度σi的確定

在確定初始聚類中心C0之后,中心點寬度σi可根據各聚類中心之間的歐氏距離計算確定。第i個中心點的寬度為 σi=κdi,其中,κ 為重疊系數;di=mind(Cj-Ci),其含義為第i個點中心與其他最近的點中心之間的距離。

2.5 權重值W的確定

經上述方法確定RBF各中心點的聚類中心Ci及寬度σi之后,對于任意的輸入值Pi,得到第 j個輸出值yj為:

將其寫成矩陣的形式:

給定 R∈Ru×n以及 T=(T1, T2,…,Tn)T∈ Rs×n,n 為樣本個數,T為目標矩陣,s為RBFNN的輸出維度。則權重值W*應使)達到最小,由線性最小二乘法( )LLS可求得:

其中,RT表示R的轉置,R+=(RTR )-1RT為R的偽逆。

3 實例分析

本文使用KP-RBF神經網絡方法,選取1990年、2000年、2010年我國31個省份的92組數據作為研究樣本進行實證應用。人均壽命數據來自三次全國人口普查。隨著我國經濟的增長、醫療技術的普及、營養水平的提升和公共衛生的發展,廣義的人口學變量,如社會經濟水平、經濟發展的不平衡性、文化教育水平、醫療衛生條件等社會因素,對地區人均壽命具有綜合影響。因此,參考相關研究,遵循目標性、精簡性、系統性和針對性的原則,選取人均GDP、城鄉比、文盲率、千人床位數、老年人口撫養比、性別比作為影響人口平均壽命的主要因素。由于所選數據的采樣時間跨度比較大,各因素方差較大,導致樣本分布比較合理,能夠很好地反映影響人口平均壽命的不同情況,因此所選取的各項指標構成的數據集對于檢驗人口平均壽命預測數據模型是一個很好的示例。

在數據處理時,本文隨機抽取不同組別數據中的2/3作為訓練集、1/3作為檢驗集,對省級人口平均壽命進行了擬合和檢驗。由于訓練集和檢驗集均為真實數據,因此可以認為對方法的檢驗具有較高的信度。表1給出了三種方法的預測結果的平均值對比。圖2給出了檢驗集預測結果對比圖,圖3(見下頁)為檢驗集預測殘差對比圖。從預測結果中可以看出,在相同數據支持下,三種方法的預測精度排序為KP-RBF神經網絡>CNN神經網絡>BP神經網絡,預測誤差排序為CNN神經網絡>BP神經網絡>KP-RBF神經網絡。這說明,與CNN神經網絡和BP神經網絡相比,KP-RBF方法在進行人均壽命預測時,預測精度較高,預測殘差較低。也就是說,KP-RBF的預測結果擬合度和穩健性都最高,在進行人口壽命預測時,比其他方法具有更好的穩健性。

表1 預測結果平均值對比

圖2不同算法預測結果對比圖

圖3預測殘差對比圖

得到檢驗結果并驗證其穩健性之后,本文對2016—2030年全國人口平均壽命進行了預測。自變量變化率采用過去五年平均變化率進行線性估計。基于KP-RBF神經網絡的未來15年人口平均壽命的預測結果表明,中國人口平均壽命將在2030年達到79.2歲。

4 結束語

本文基于模糊K-Prototypes算法提出了改進RBF神經網絡,將其用于人均壽命預測的研究中,并利用中國1990年以來的省級數據進行測算,給出了未來15年中國人口平均預期壽命的趨勢預測,其研究結果對于政府決策部門預測人口平均壽命、提高社會政策有效性和前瞻性具有很好的應用價值。隨著大數據和人工智能在社會科學研究中的深入和推廣,RBF神經網絡算法有望在人口預測等多個交叉學科研究中得到更為廣泛的應用,從而為社會政策的制定和優化提供更加科學的決策支持。

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 成人精品午夜福利在线播放| h视频在线播放| 国产自在线播放| 亚洲床戏一区| 国产打屁股免费区网站| 18禁高潮出水呻吟娇喘蜜芽| 伊人久久婷婷五月综合97色| 一级爱做片免费观看久久| 无码人中文字幕| 免费jjzz在在线播放国产| 自拍偷拍一区| 国产va在线| 无码一区18禁| 男女猛烈无遮挡午夜视频| 伊人婷婷色香五月综合缴缴情| 国产97区一区二区三区无码| 国产va视频| 色视频国产| 永久在线精品免费视频观看| 久久久久国产精品熟女影院| 国产精品无码久久久久AV| 国产精品主播| 日韩欧美视频第一区在线观看| 亚洲爱婷婷色69堂| 另类综合视频| 国产精品福利在线观看无码卡| 最新国产你懂的在线网址| 国产精品美女网站| 999国内精品久久免费视频| 在线免费a视频| 国语少妇高潮| 综合亚洲网| 国产精品漂亮美女在线观看| 国产69精品久久| 日本精品视频一区二区| 在线免费亚洲无码视频| 亚洲日韩精品无码专区97| 高清不卡毛片| 欧美亚洲综合免费精品高清在线观看| 国产精品女同一区三区五区| 免费网站成人亚洲| 综合久久久久久久综合网| 国产黄色片在线看| 激情五月婷婷综合网| 欧美a在线看| 人人91人人澡人人妻人人爽| 最新国产精品鲁鲁免费视频| 丁香五月激情图片| 国产精品三区四区| 国产乱人伦AV在线A| 亚洲一区二区日韩欧美gif| 小说区 亚洲 自拍 另类| 国产真实乱人视频| 亚洲专区一区二区在线观看| 日本高清在线看免费观看| 日本伊人色综合网| 国模视频一区二区| 国产亚洲精品资源在线26u| 88av在线| 国产精品刺激对白在线| 九九香蕉视频| 精品国产女同疯狂摩擦2| 日本黄色a视频| 国产黑丝一区| 中文字幕亚洲乱码熟女1区2区| 日韩成人在线网站| 国产浮力第一页永久地址| 久久久久人妻精品一区三寸蜜桃| 国产成本人片免费a∨短片| 精品国产乱码久久久久久一区二区| 超清无码熟妇人妻AV在线绿巨人| 亚洲欧美日韩另类| 国产SUV精品一区二区| 国产亚洲成AⅤ人片在线观看| 久久精品人人做人人综合试看| 国产高清在线观看91精品| 99精品免费欧美成人小视频 | 一本大道香蕉高清久久| 国产噜噜噜视频在线观看| 亚洲国产一区在线观看| 91香蕉视频下载网站| 国产a v无码专区亚洲av|