高揚(yáng)揚(yáng) 張昂麗 李佳慧


摘要:[目的]分析在“全面二孩”政策下微博女性用戶的生育意愿及影響因素,可以為政府政策提供理論依據(jù)。[方法]利用Python網(wǎng)絡(luò)爬蟲爬取微博數(shù)據(jù),數(shù)據(jù)預(yù)處理后用KNN算法進(jìn)行情感預(yù)測(cè),最后利用TextRank算法自動(dòng)抽取關(guān)鍵詞,歸納原因。[結(jié)論]影響因素主要為經(jīng)濟(jì)壓力、女性就業(yè)、教育壓力以及生育觀念。
關(guān)鍵詞:全面二孩;微博女性;網(wǎng)絡(luò)爬蟲;KNN;情感預(yù)測(cè);TextRank
中圖分類號(hào):TP312? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)16-0236-03
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Abstract: [objective] to analyze the fertility intention and influencing factors of female weibo users under the "universal two-child" policy, so as to provide theoretical basis for government policies. [methods] Python web crawler was used to crawl the microblog data. After data preprocessing, KNN algorithm was used to predict emotions. Finally, TextRank algorithm was used to automatically extract keywords and summarize the reasons. [conclusion] the main influencing factors are economic pressure, female employment, educational pressure and fertility concept.
Key words: universal two-child; weibo female; web crawler; KNN; emotion prediction;TextRank
1 引言
隨著經(jīng)濟(jì)和社會(huì)的發(fā)展,年輕人結(jié)婚時(shí)間越來越晚,大齡生育等人群越來越多,逐漸出現(xiàn)了老齡化速度加快、勞動(dòng)年齡人口下降、人口發(fā)展不平衡等問題。為了更好地解決這些問題,我國提出了“單獨(dú)二孩”政策,隨后,我國進(jìn)一步調(diào)整了生育政策,實(shí)行了全面放開二孩政策。要想更好地推廣二胎政策,提高人口出生率,人們對(duì)二胎政策的想法和關(guān)注是重要的,特別是正處于育齡階段的女性和即將處于育齡階段的女性。且當(dāng)下時(shí)代隨著人們思想的不斷開放和女性地位的不斷提高,在教育,醫(yī)療,科技,科學(xué),軍事,服務(wù)等各個(gè)領(lǐng)域都少不了當(dāng)代中國女性的身影,而且女性作為生育的主要參與者和承擔(dān)者,她們對(duì)于生育也具有一定的決定權(quán),因此了解她們對(duì)于二胎政策是支持或不支持的看法和態(tài)度也至關(guān)重要。新浪微博作為目前最大的社交平臺(tái),越來越多的人通過它來分享和交流信息,從而產(chǎn)生了巨大的數(shù)據(jù)量,由此可以從中挖掘出大量的有用信息。本項(xiàng)目通過對(duì)微博女性用戶評(píng)論的分析,探討二胎政策下微博女性用戶的生育意愿及影響因素。
2 研究理論與假設(shè)
生育意愿是人們關(guān)于生育行為的態(tài)度及看法。近幾年,由于國家在生育政策上的接連調(diào)整,使得生育意愿在生育政策的實(shí)施中變得日益重要。Becke[1]認(rèn)為對(duì)于女性有工作的家庭來說,生育將會(huì)占用女性大量的時(shí)間,影響她們的工作進(jìn)而影響家庭收入,另一方面,他將孩子視為特別的耐用消費(fèi)品。家庭的生育意愿不僅取決于對(duì)子女的需求和成本,也取決于撫養(yǎng)孩子的能力,家庭收入越高對(duì)孩子的需求也越大。家庭收入對(duì)生育意愿具有正向影響。潘丹[2]等人研究發(fā)現(xiàn)家庭收入較低的育齡婦女為了不增加家庭的負(fù)擔(dān),更偏向于少生育孩子。隨著社會(huì)的發(fā)展,撫養(yǎng)孩子所需要考慮的因素不再是吃飽穿暖,而是教育的經(jīng)濟(jì)投入和人格培養(yǎng)的精力投入。很多符合條件的家庭因難以承受高額的撫養(yǎng)費(fèi)用而打消生二胎的想法。張曉玲[3]的研究結(jié)果表明不想生二胎的最大原因是經(jīng)濟(jì)壓力。
在全面實(shí)施二孩政策的背景下,女性在其中所扮演的角色較為特殊,她們既要撫育孩子,還要參加工作。在撫養(yǎng)孩子和家務(wù)勞動(dòng)付出更多時(shí)間及精力的同時(shí),就意味著女性將不得不減少參與市場(chǎng)勞動(dòng)的時(shí)間和精力,這將會(huì)對(duì)女性的職業(yè)生涯發(fā)展、職位晉升、工資收入都帶來不利的影響。[4]而隨著生育政策的放寬,女性用于生育的時(shí)間增加,這加劇了女性就業(yè)歧視。不少企業(yè)在招人時(shí),會(huì)將是否生育作為錄用的一項(xiàng)指標(biāo),甚至有的企業(yè)要求女性員工輪流懷孕,有時(shí)懷孕的女員工會(huì)被單方面逼著休職、退職。在職場(chǎng)上,幾乎所有企業(yè),都對(duì)生育期女性充滿戒心,導(dǎo)致女性就業(yè)更加艱難,從而導(dǎo)致越來越多的女性不愿生孩子。
從年齡因素來看,不同年齡段的人對(duì)二胎的態(tài)度也不同。根據(jù)王修亮[5]等人的研究發(fā)現(xiàn)35周歲以下的人群不想生育二胎的人居多,而36周歲以上的女性想生育二胎的意愿比較強(qiáng)烈 。這可能與其受教育程度、經(jīng)濟(jì)壓力、生活環(huán)境、個(gè)人認(rèn)知等有關(guān)。有些人擔(dān)心年齡越大,生育的風(fēng)險(xiǎn)越高,考慮到年齡對(duì)生育的影響,因而選擇在合適的年齡生育。
受中國傳統(tǒng)生育文化影響,祈求家族人丁興旺,子嗣綿延,是每一個(gè)家庭所共同的愿望。因此,開放“全面二孩”政策后,不少希望兒女雙全的獨(dú)生子女家庭積極響應(yīng)國家政策,開始備孕二胎。人們希望通過生育二胎來改善獨(dú)生子女教育問題和養(yǎng)育風(fēng)險(xiǎn)。此外,生育二胎可以在一定程度上滿足老年人的情感需求、降低養(yǎng)老壓力,并且分擔(dān)養(yǎng)老成本。[5]除此之外,生育意愿還受伴侶、父母或朋友等身邊人對(duì)全面二胎政策的態(tài)度影響。如果身邊人積極響應(yīng)二胎政策,就會(huì)增強(qiáng)她們的生育意愿,反之就會(huì)降低生育意愿。根據(jù)上述分析,做出如下假設(shè):
假設(shè)一:經(jīng)濟(jì)壓力越大的人不想生二胎的意愿較強(qiáng)烈。
假設(shè)二:受勞動(dòng)市場(chǎng)對(duì)女性就業(yè)歧視的影響,職場(chǎng)中女性就業(yè)的生育意愿較低。
假設(shè)三:對(duì)于年輕女性來說,她們更傾向于不生二胎。
假設(shè)四:受生育觀念以及身邊人的影響,生育意愿隨之變化。
3 數(shù)據(jù)和模型設(shè)計(jì)
3.1數(shù)據(jù)概括
本研究所用數(shù)據(jù)來自新浪微博。利用Python爬取與指定關(guān)鍵字有關(guān)的博文、評(píng)論、評(píng)論者的id以及評(píng)論者的性別,共抓取了458條博文、48991條評(píng)論,其中,女性評(píng)論數(shù)為24795條。
3.2算法模型
為了得到女性生育意愿的態(tài)度,本研究通過KNN算法構(gòu)建了情感預(yù)測(cè)模型。
3.2.1 算法描述
鄰近算法又稱K最近鄰分類算法,說的是每個(gè)樣本的類別都可以用它最接近的k個(gè)鄰居的類別來代表。
3.2.2 三個(gè)重要特征
(1) 距離度量公式:KNN算法中常用歐式距離和曼哈頓距離度量公式,相應(yīng)公式如下所示。
歐式距離:
曼哈頓距離:
本項(xiàng)目選取了曼哈頓距離度量公式
(2) K值的選取:K值較小容易過擬合,K值較大雖然可以減小泛化誤差,但使得預(yù)測(cè)誤差會(huì)增大。為了使精確度更高,本項(xiàng)目選取了范圍為5-20的K值,利用10倍交叉驗(yàn)證的方法可以發(fā)現(xiàn),當(dāng)K值為11時(shí),精確度最準(zhǔn)確。
(3) KNN的分類決策規(guī)則一般為多數(shù)表決法。
3.2.3 實(shí)現(xiàn)流程
4 實(shí)證結(jié)果分析
4.1 模型預(yù)測(cè)結(jié)果
本項(xiàng)目通過KNN算法,選取部分?jǐn)?shù)據(jù)人工標(biāo)注情感值作為訓(xùn)練集,剩余數(shù)據(jù)通過模型預(yù)測(cè)結(jié)果。預(yù)測(cè)結(jié)果顯示,有85%的人不支持二胎,僅15%的人支持二胎。部分結(jié)果如下,其中0代表微博女性用戶對(duì)二胎持不支持態(tài)度,1代表支持。
4.2 結(jié)果分析
(1) 經(jīng)濟(jì)壓力(假設(shè)1)得到部分證實(shí)。不支持人群中,家庭收入較低,經(jīng)濟(jì)壓力大,國家所給的補(bǔ)貼少,無力承擔(dān)二胎的撫養(yǎng)費(fèi)用。在支持人群中,生二胎的意愿與其家庭經(jīng)濟(jì)狀況無顯著相關(guān)。
(2) 職場(chǎng)中女性大多不愿生二胎(假設(shè)2)得到證實(shí)。生育二胎無疑會(huì)花費(fèi)女性更多的時(shí)間、精力,且女性會(huì)因婚姻以及生育而長(zhǎng)時(shí)間休婚假、產(chǎn)假導(dǎo)致用人單位不愿意招錄女性員工,這也加劇了女性不愿生二胎的現(xiàn)象。其中,企業(yè)對(duì)孕期女性員工安排各種奇葩工作變相逼女性離職、女性員工剛過試用期就懷孕等現(xiàn)象更是引發(fā)了全社會(huì)的廣泛討論。二胎時(shí)代,女性就業(yè)形勢(shì)更加嚴(yán)峻。
(3) 大多數(shù)95后表示不想生二胎(假設(shè)3)得到證實(shí)。在抓取的評(píng)論中,大多數(shù)95后及00后表示不想結(jié)婚,不想生孩子。
(4) 通過所得數(shù)據(jù)分析,家長(zhǎng)承擔(dān)了過多的家庭作業(yè)壓力。在現(xiàn)在的教育體制下,學(xué)校倡導(dǎo)陪伴式教育,家長(zhǎng)需要給孩子布置、批改、輔導(dǎo)作業(yè),但由于家長(zhǎng)白天工作以及受教育水平程度有限,導(dǎo)致家長(zhǎng)在輔導(dǎo)孩子的過程中力不從心,進(jìn)而導(dǎo)致家長(zhǎng)生二胎的意愿降低。
(5) 一胎順產(chǎn)的人大多支持二胎(假設(shè)4)得到部分證實(shí)。通過數(shù)據(jù)分析,大多數(shù)一胎順產(chǎn)的人都支持生二胎。且很多人希望兒女雙全,有生二胎的意愿。
即使在生育政策允許生育兩個(gè)孩子的情況下,但由于經(jīng)濟(jì)壓力、女性就業(yè)歧視、教育壓力等因素抑制了女性生二胎的意愿。
5 結(jié)束語
通過本次研究,得到了微博女性用戶對(duì)二胎生育意愿的態(tài)度及影響因素。研究分析結(jié)果可以反映當(dāng)前社會(huì)中國婦女真實(shí)的生育觀及影響因素,可以為研究人員和政府政策制定提供客觀依據(jù),具有較強(qiáng)的實(shí)用價(jià)值。此外,在項(xiàng)目研究實(shí)施過程中,采集整理到的大量微博用戶信息及文章又是寶貴的大數(shù)據(jù)資源,可以為其他研究項(xiàng)目開展奠定基礎(chǔ)。研究也存在不足之處,在原因歸納時(shí)受人工影響較大,有待進(jìn)一步的改進(jìn)與完善。
參考文獻(xiàn):
[1] Becker G.S.An Economic Analysis of Fertility.In Demographic and Economic Change in Developed Countries,a Conference of the universities-National Bureau Committee for Economic Research 209-231
[2] 潘丹,寧滿秀.收入水平、收入結(jié)構(gòu)與中國農(nóng)村婦女生育意愿——基于CHNS數(shù)據(jù)的實(shí)例分析[J].南方人口,2010,3:45-50.
[3] 張曉玲,戈祥.“全面兩孩”政策下居民生育意愿調(diào)查與分析報(bào)告[J].四川職業(yè)技術(shù)學(xué)院學(xué)報(bào),2016,3:21-25.
[4] 張雨萌,楊翠芬.生育對(duì)職業(yè)女性就業(yè)的影響及對(duì)策[J].勞動(dòng)保障世界,2019,2.62-63.
[5] 王修亮,周維,趙東霞.我國城市適齡婦女生育二胎意愿及其影響因素的實(shí)例研究[J].遼寧經(jīng)濟(jì),2017,4:50-51.
[6] 梁愛玉.全面兩孩政策下已育育齡婦女生育意愿的影響因素及其對(duì)策研究[J].國際生殖健康/計(jì)劃生育雜志,2019,1:5-10.
[7] 張亮.城市居民的二胎生育意愿及影響因素[J].湖南師范大學(xué)社會(huì)科學(xué)學(xué)報(bào),2011,5:92-96.
[8] 鄭偉,王若怡,馬林,李明,王喆.KNN算法在輿情領(lǐng)域中的應(yīng)用研究[J].中國管理信息化,2019,6:157-158.
【通聯(lián)編輯:梁書】