張 浩,侯麗艷,馬 萍,邱紅燕
(1.寧夏醫(yī)科大學(xué)公共衛(wèi)生與管理學(xué)院,銀川 750004;2.大連醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,大連 116044)
為應(yīng)對老齡化問題,2016年國家實(shí)施“全面二孩”政策。2016—2019年全國出生率依次為12.95%、12.43%、10.94%、10.48%[1],并未達(dá)到政策預(yù)期。經(jīng)濟(jì)收入[2]、文化程度[3]及幸福感[4]等都可影響生育行為。目前,基于數(shù)據(jù)挖掘的機(jī)器學(xué)習(xí)方法已廣泛應(yīng)用于自然科學(xué)及社會科學(xué)領(lǐng)域,其對于分類數(shù)據(jù)的判斷和預(yù)測具有良好的效果。相關(guān)研究表明,基于隨機(jī)森林算法建立的預(yù)測模型其準(zhǔn)確率、預(yù)測價(jià)值均優(yōu)于當(dāng)前所使用的其他方法[5]。因此,本文選擇隨機(jī)森林算法對生育行為進(jìn)行建模和預(yù)測,以期為二孩政策的完善與實(shí)施提供科學(xué)依據(jù)。
采用現(xiàn)況研究設(shè)計(jì),綜合考慮單位性質(zhì)、員工構(gòu)成及研究的可及性,于2016年11月—2017年11月在銀川市、大連市和北京市分別選擇5家事業(yè)單位和5家企業(yè)共10家單位作為研究現(xiàn)場,共發(fā)放問卷3988份,回收3665份,應(yīng)答率為91.9%,其中有效問卷3454份,有效率為94.24%。排除非“80后”、未婚、調(diào)查問卷關(guān)鍵信息填寫不全及實(shí)際生育數(shù)量超過兩個者,最終共納入1857例調(diào)查對象,均為已婚、育1~2個孩子,所有調(diào)查對象均經(jīng)寧夏醫(yī)科大學(xué)醫(yī)學(xué)倫理委員會批準(zhǔn)(寧醫(yī)大倫理第2016-166號),并自愿簽署知情同意書。
本研究采用自行設(shè)計(jì)的調(diào)查問卷進(jìn)行現(xiàn)場調(diào)查,內(nèi)容主要包括個人及家庭基本情況、生育行為相關(guān)情況、生育意愿相關(guān)情況、生育計(jì)劃相關(guān)情況、物質(zhì)主義價(jià)值觀、社會支持、工作壓力、生活滿意度以及主觀幸福感經(jīng)濟(jì)等信息。采用現(xiàn)場發(fā)放、當(dāng)場填寫、當(dāng)場回收問卷的方式(部分不能集中填寫的單位,則現(xiàn)場發(fā)放問卷,約定時間收回)。調(diào)查問卷盡量當(dāng)場審核,不足或遺漏的部分及時補(bǔ)充。調(diào)查結(jié)束后對問卷再次進(jìn)行核查,以保證調(diào)查結(jié)果的準(zhǔn)確性和真實(shí)性。
1.3.1 物質(zhì)價(jià)值觀 采用Richins和Dawson編制的物質(zhì)價(jià)值觀量表(material values scale,MVS)測量,該量表共有13個條目,包括以財(cái)物定義成功、以獲取財(cái)物為中心、以獲得財(cái)物來追求幸福3個維度。每題分為5個等級:非常不同意、不同意、不確定、比較同意、非常同意。得分越高,表明物質(zhì)主義水平越高[6]。本研究中物質(zhì)價(jià)值觀量表的克朗巴哈系數(shù)(Cronbach'sα)為0.764,Kaiser-Meyer-Olkin(KMO)值為0.805。
1.3.2 工作壓力 采用工作內(nèi)容問卷(job content questionnaire,JCQ)和付出-回報(bào)失衡問卷(effort reward imbalance questionnaire,ERIQ)。JCQ量表共22個條目,包括工作要求、工作自主和社會支持3個維度,每題4個等級,分別為非常不同意、不同意、同意和非常同意,本文在評估職業(yè)人群工作壓力時,以三個模塊得分的均數(shù)為臨界點(diǎn)將它們劃分成高低水平組[7]。
ERIQ量表共23個條目,包括付出、回報(bào)和超負(fù)荷3個維度,每題分為5個等級:不同意、完全不困擾、有點(diǎn)困擾、困擾和非常困擾。計(jì)算付出-獲得不平衡指數(shù)(ERI ratio),ERI ratio=付出因子得分/(回報(bào)因子得分×C),C為付出項(xiàng)目個數(shù)與獲得項(xiàng)目個數(shù)的比值,即6/11。如果研究對象的ERI ratio>1.00,則認(rèn)為其存在職業(yè)緊張;若ERI ratio≤1.00,則表示其無職業(yè)緊張[8]。本研究中工作內(nèi)容量表的Cronbach'sα為0.890,KMO值為0.893;付出-回報(bào)失衡量表的Cronbach'sα為0.886,KMO值為0.896。
1.3.3 社會支持 采用肖水源和楊德森(1987)編制的社會支持評定量表(SSRS)進(jìn)行測量,評估個體所獲得的社會支持水平。量表共10個條目,包括客觀支持、主觀支持和對社會支持的利用度3個維度。量表總分?jǐn)?shù)越高,表示獲得的社會支持度越高[9]。本研究中社會支持量表的KMO值為0.892。
1.3.4 生活滿意度 采用生活滿意度量表(satisfaction with life scale,SWLS)中文版,量表包括5個題目,每個項(xiàng)目有7個判斷等級,從“非常不符合”到“非常符合”分別用數(shù)字1~7表示。被調(diào)查者在回答量表題目時按照每個題目與自己實(shí)際情況相符合的程度選擇1個等級選項(xiàng),計(jì)算量表題目的得分均數(shù),高于均數(shù)為生活滿意度高水平,低于均數(shù)為低水平[10]。本研究中生活滿意度量表的Cronbach'sα為0.807,KMO值為0.821。
1.3.5 主觀幸福感 采用Campbell幸福感指數(shù)量表(index of well-being,index of general affect)來評估個體幸福的狀態(tài)。該量表共9個條目,分為總體情感指數(shù)和生活滿意度兩部分,前者由8個情感項(xiàng)目組成,后者由1個滿意度項(xiàng)目組成,為7級計(jì)分。總體情感指數(shù)的平均得分與生活滿意度得分(權(quán)重為1.1)相加即為總體幸福感指數(shù),其范圍為2.1(最不幸福)~14.7(最幸福)。得分越高,表明越幸福[11]。本研究中總量表的KMO值為0.860。
1.4.1 數(shù)據(jù)處理方法采用Epi Data 3.1軟件對所有調(diào)查問卷進(jìn)行雙錄入核查,采用SPSS 24.0進(jìn)行異常值的刪除及缺失值的填補(bǔ);采用R-4.0.2進(jìn)行統(tǒng)計(jì)分析,建立隨機(jī)森林模型,以3∶1的比例將數(shù)據(jù)集分為訓(xùn)練集和測試集,采用訓(xùn)練集建立預(yù)測模型并進(jìn)行變量重要性排序,采用測試集檢驗(yàn)?zāi)P偷念A(yù)測效果,采用十折交叉驗(yàn)證篩選最優(yōu)變量數(shù);采用多因素Logistic回歸分析最優(yōu)變量對生育行為的影響及程度。檢驗(yàn)水準(zhǔn)α=0.05。
1.4.2方法說明 隨機(jī)森林算法:隨機(jī)森林是由很多決策樹組成的,每一棵決策樹之間沒有關(guān)聯(lián)。決策樹的數(shù)量并非越多越好,應(yīng)先設(shè)置一個較大的決策樹進(jìn)行試探,根據(jù)結(jié)果進(jìn)行調(diào)試,找出多少棵樹時模型最優(yōu)。在得到森林之后,當(dāng)對一個新的樣本進(jìn)行判斷或預(yù)測時,讓森林中的每一棵分類樹分別進(jìn)行判斷,并看這個樣本應(yīng)該屬于哪一類(分類算法),根據(jù)分類樹的投票結(jié)果確定測試樣本的分類結(jié)果;根據(jù)袋外誤差評價(jià)分類的準(zhǔn)確性;根據(jù)基尼(Gini)指數(shù)判斷變量對分類樹中每個節(jié)點(diǎn)觀測值的異質(zhì)性。平均Gini值下降越多,說明變量越重要[12]。
十折交叉驗(yàn)證:十折交叉驗(yàn)證將樣本數(shù)據(jù)隨機(jī)分為10份,每次隨機(jī)選擇9份作為訓(xùn)練集,剩下的1份作為測試集。當(dāng)這一輪完成后,重新隨機(jī)選擇9份來訓(xùn)練數(shù)據(jù)。若干輪(<10次)之后,選擇損失函數(shù)評估最優(yōu)的模型和參數(shù)[13]。
模型評價(jià):采用混淆矩陣和ROC曲線評價(jià)生育行為預(yù)測模型的預(yù)測價(jià)值,計(jì)算特異度、靈敏度、預(yù)測準(zhǔn)確率、約登指數(shù)及ROC曲線下面積(AUC)。AUC值越高,表明模型預(yù)測價(jià)值越大。
本次研究共納入調(diào)查對象1857例,平均年齡為(32.7+3.3)歲。其中男性占27.4%;漢族占87.6%;本地人口占70.4%;文化程度以本科學(xué)歷者比例最高,為47.4%;月收入以3000~5000元者最多,占56.1%;非獨(dú)生子女者占55.1%;事業(yè)單位職工占52.2%;工勤技能崗職工占49.4%,見表1。

表1 調(diào)查對象一般人口學(xué)特征描述
對人口學(xué)特征、生育行為及相關(guān)變量進(jìn)行賦值,見表2。
利用訓(xùn)練集建立基于隨機(jī)森林模型的生育行為風(fēng)險(xiǎn)預(yù)測模型,利用隨機(jī)森林分類器獲得變量重要性排名,由高到低分別為:生育計(jì)劃、一孩經(jīng)歷對生活的影響、一孩經(jīng)歷是否符合預(yù)期、主觀幸福感、年齡、社會支持、照顧孩子時間、文化程度、意愿子女?dāng)?shù)、性別偏好、孩子三歲前由誰照顧、一孩年撫養(yǎng)支出、理想子女性別構(gòu)成、工作單位、獨(dú)生子女、工作崗位、月收入、戶籍、工作要求、性別、生活滿意度、以獲取財(cái)物為中心、工作支持、以財(cái)物定義成功、工作自主、ERI ratio、民族、通過獲取財(cái)物追求幸福,見圖1。
2.4.1 混淆矩陣 利用混淆矩陣評價(jià)模型效果。結(jié)果顯示,預(yù)測為“一個孩子”錯誤的概率為0.03,預(yù)測為“兩個孩子”錯誤的概率為0.17,見表3。根據(jù)混淆矩陣結(jié)果計(jì)算,模型整體判斷準(zhǔn)確率為95.4%,預(yù)測準(zhǔn)確率為97.3%,靈敏度為97.4%,特異度為82.2%。

表2 變量賦值情況表

圖1 變量重要性排序

表3 混淆矩陣情況
2.4.2 ROC曲線 采用隨機(jī)森林算法在訓(xùn)練集建立二孩生育行為預(yù)測模型對測試集進(jìn)行預(yù)測,AUC值為0.913,特異度為0.981,靈敏度為0.845,預(yù)測一致率為0.949,約登指數(shù)為0.826,見圖2。

圖2隨機(jī)森林模型ROC曲線
采用十折交叉驗(yàn)證篩選最佳變量個數(shù)。結(jié)果顯示,變量個數(shù)為4~9時交叉驗(yàn)證錯誤率最低。根據(jù)變量重要性排序,選擇前9個變量作為最佳變量,依次為生育計(jì)劃、一孩經(jīng)歷對生活的影響、一孩經(jīng)歷是否符合預(yù)期、主觀幸福感、年齡、社會支持、照顧孩子時間、文化程度和意愿子女?dāng)?shù),見圖3。

圖3 十折交叉驗(yàn)證
由于生育計(jì)劃、一孩經(jīng)歷對生活的影響和一孩經(jīng)歷是否符合預(yù)期這3個變量分布的差異過大,導(dǎo)致進(jìn)入Logistic回歸后OR值過大,因此不考慮納入。進(jìn)一步根據(jù)隨機(jī)森林變量重要性排序順次選擇主觀幸福感、社會支持、年齡、照顧孩子時間、文化程度、意愿子女?dāng)?shù)作為自變量,生育行為作為因變量進(jìn)行多因素Logistic回歸(賦值:一個孩子=0,兩個孩子=1)。結(jié)果顯示,社會支持、文化程度、意愿子女?dāng)?shù)對生育行為的影響均有統(tǒng)計(jì)學(xué)意義(P均<0.05),社會支持得分越高,生育二孩的可能性越大,OR值為1.03(95%CI=1.01~1.05);大專、本科、研究生及以上學(xué)歷者生育二孩的可能性分別是高中及以下學(xué)歷者的0.56倍(95%CI=0.37~0.85)、0.45倍(95%CI=0.33~0.62)和0.25倍(95%CI=0.12~0.52);意愿子女?dāng)?shù)為兩個孩子以上者生育二孩的可能性是不要孩子者的7.89倍(95%CI=2.29~27.15),見表4。
生育行為直接反映了二孩政策的實(shí)施效果,提高育齡人群的生育行為是解決我國老齡化問題的最根本途徑。關(guān)于生育行為影響因素的研究,目前應(yīng)用最廣泛的方法是多因素Logistic回歸分析。由于影響因素很多,某些不顯著因素的綜合作用可能對生育行為產(chǎn)生較大影響,但只有顯著變量才可以引入Logistic回歸模型中,因此Logistic回歸方法不一定能夠準(zhǔn)確地對生育行為進(jìn)行判別和預(yù)測。本研究運(yùn)用隨機(jī)森林算法建立模型對生育行為進(jìn)行預(yù)測,找出影響生育行為的最主要因素,為政策的制定和完善提供更為準(zhǔn)確的方向和依據(jù),從而促進(jìn)人口出生率的提高。

表4 生育行為影響因素的多因素Logistic回歸分析
隨機(jī)森林算法作為一種以決策樹為基學(xué)習(xí)器的集成學(xué)習(xí)算法,簡單、易于實(shí)現(xiàn),本身精度明顯優(yōu)于大多數(shù)單一算法,優(yōu)于其“兩個隨機(jī)性”,能夠很好地避免過擬合問題,解決了描述性統(tǒng)計(jì)分析難以避免的變量間的相互作用。本次研究對隨機(jī)森林模型的評價(jià)采用混淆矩陣和ROC曲線兩種方法。混淆矩陣結(jié)果顯示,模型預(yù)測一個孩子和兩個孩子的分類錯誤均較低,模型整體判斷準(zhǔn)確率、預(yù)測準(zhǔn)確率、靈敏度及特異度均較高。ROC曲線結(jié)果顯示,模型的靈敏度、預(yù)測一致率、約登指數(shù)均達(dá)到滿意程度,AUC值為0.913。兩種評價(jià)方法評價(jià)結(jié)果差別不大,均顯示模型預(yù)測精度較高。李冬領(lǐng)等[14]比較了隨機(jī)森林模型與Logistic回歸模型對二孩生育意愿的預(yù)測效果,發(fā)現(xiàn)隨機(jī)森林模型的正確率、查準(zhǔn)率、查全率、AUC值均高于Logistic回歸模型。另外,隨機(jī)森林算法無法解釋變量的作用方向及其影響程度,因此,結(jié)合多因素Logistic回歸模型進(jìn)行分析,可以得到更加準(zhǔn)確和完善的結(jié)果。
本次研究結(jié)果顯示,社會支持、文化程度和意愿子女?dāng)?shù)是二孩生育行為的主要影響因素。首先,獲得的社會支持越高,二孩生育率越高。一項(xiàng)探討有妊娠經(jīng)歷育齡青年女性二孩生育意愿的研究顯示,主觀社會支持對有妊娠經(jīng)歷的年經(jīng)女性的二孩生育意愿具有正向影響,該人群的心理彈性對生育意愿的影響則受社會支持利用度的調(diào)節(jié)[15]。另一項(xiàng)研究[16]表明,女性選擇生育二孩的原因可以分為主要選擇和被動選擇兩種。無論是主動還是被動,女性選擇生育二孩都受到良好的夫妻感情、較好家庭的經(jīng)濟(jì)情況、長輩的幫助及親朋好友支持的影響,生育二孩的女性絕大多數(shù)都獲得了較高的社會支持,與本文研究結(jié)論一致。其次,文化程度越高,二孩生育率越低。一項(xiàng)針對廣西省不同職業(yè)婦女生育水平的研究[17]顯示,隨著女性文化程度的提升,初婚、初育年齡產(chǎn)生了明顯的后移,這可能是導(dǎo)致高文化程度伴隨低生育水平的主要原因。另外一項(xiàng)研究[18]認(rèn)為,文化程度較高的女性擁有較高的職業(yè)追求和精神生活追求,主觀上并不希望多生、多育,此外職業(yè)追求勢必造成晚婚及晚育,推遲了初育年齡,錯過了生育旺盛期,降低了生育二孩的機(jī)會。因此,文化程度通過不同方面的作用對生育行為產(chǎn)生間接影響。最后,意愿子女?dāng)?shù)高的人群更有可能生育二孩。意愿子女?dāng)?shù)是個人對生育子女?dāng)?shù)量的理想態(tài)度,反映人群的生育意愿。研究[19]表明,二孩政策實(shí)施后,生育意愿與生育行為產(chǎn)生了明顯的悖理現(xiàn)象,較高的生育意愿與較低的生育行為,表明了我國正在面臨低生育率陷阱的高度風(fēng)險(xiǎn)[20]。主觀的生育意愿對生育行為的影響不可忽視。本文研究中,已生育二孩的人群,其意愿子女?dāng)?shù)為兩個以上者所占的比例最高。
隨機(jī)森林算法對大樣本量的數(shù)據(jù)具有更好的預(yù)測效果。本次研究存在一定局限性,即樣本量相對較少,導(dǎo)致某些變量的分布存在一定的偏差,下一步增加樣本量可有效提高模型的準(zhǔn)確率和精確度。