曹程澤



摘要:人民幸福感的提升是社會發展與進步的一個重要方面,因此不斷提升國民的幸福感尤為重要。本文基于2015年度中國綜合社會調查的相關數據,利用決策樹和隨機森林的模型,對城鎮居民的主觀幸福感影響因素進行預測,并分析影響城鎮居民主觀幸福感的因素,發現隨機森林模型的預測結果更好。研究分析表明,公共服務滿意度對城鎮居民主觀幸福感的影響最大;全年家庭總收入,平均空閑時間,政府工作滿意度以及心情抑郁或沮喪的頻繁程度對城鎮居民主觀幸福感的影響也較為顯著。因此國家應該努力發展經濟,提高人均收入水平,應該堅持為人民服務的工作原則,以人為本,從而提高城鎮居民主觀幸福感。
關鍵詞:城鎮居民 主觀幸福感 決策樹 隨機森林 Python
一、引言
新中國建立后,在中國共產黨的領導下,經過全體人民的共同努力及奮斗,中國取得了舉世矚目的成績,我國社會主要矛盾已經轉化為人民日益增長的美好生活需要和不平衡不充分的發展之間的矛盾。2016年,習近平總書記在全民國家安全教育日上強調,要不斷提高人民群眾的安全感和幸福感。可見,幸福感作為反映民生的指標,在理論研究和實踐中都值得關注。隨著中國城鎮化不斷提升,城鎮居民以及居住在城鎮的居民比例逐步提升,其主觀幸福感對全體社會的穩定、和諧發展起著至關重要的作用。城鎮居民的主觀幸福感的影響因素的研究對于宏觀政策的制定、實施,不斷提升國民的幸福感具有非常重要、積極的社會意義。
主觀幸福感是個體對目前生活總體質量進行積極評價的程度,即個體對自己生活的喜歡程度。自Easterlin提出“收入一幸福悖論”以來,個體主觀幸福感的影響因素及幸福感提升問題引起了眾多經濟學家的興趣。不同國家與地區的學者針對某一集合范圍內的幸福感進行了大量的研究,由于發展階段不同,某一區域貧富分布不同,居民的文化背景、宗教影響的巨大差異,同樣一個重要因素,比如收入對幸福感的影響,不同的研究對象群體,得出的結論往往是相互矛盾的。Biswas-Diener和Diener研究發現,印度加爾各答貧民窟居民的主觀幸福感通常要比富裕的對照群體強。Binder和Coad發現,英國居民家庭的絕對收入對其主觀幸福感具有顯著的正向提升作用,但對幸福程度較高居民的影響則不顯著。國內針對幸福感的研究從絕度收入、相對收入以及收入結構逐步發展到關注家庭收入,養老收入對個體幸福感的研究。萬佳樂和李超偉等人認為中國居民的幸福感不僅存在著顯著的相對收入效應與絕對收入結構效應,而且具有顯著的城鄉異質性,兩種效應存在著顯著不同。從絕對收入結構效應來講,起關鍵作用的是經營性收入、轉移性收入和財產性收入,三種收入的增加,可以顯著提升居民家庭的幸福感。閏靜,彭代彥等人認為家庭養老顯著降低了中國居民的幸福感,且這種負面影響隨家庭人均收入的增加而減弱,家庭養老對中年群體的負面影響最大。
主觀幸福感常常與多種復雜因素有關,中國正處于城鎮化劇烈碰撞過程中,二十年來改革開放物質生活的快速提升與文化生活的固有規律之間的不平衡:南北東西區域發展的不均衡:社會階層形成初步固化趨勢,中國居民的傳統家國天下文化與實用文化之間的不平衡;網絡文化的迅速擴張等等因素,都對居民的個體幸福感有著重要的影響,因此不能只用經濟收入和生活質量衡量。本文通過調查數據,全面考慮多種因素,通過建立決策樹模型和隨機森林模型等數學模型的方法對預測城鎮居民主管幸福感進行預測,然后尋找影響主觀幸福感的因子,從而為國家提高人民的幸福感提出更好的建議。
二、模型介紹
(一)決策樹模型
決策樹是一種基本的分類方法,該方法通常包含三個步驟:特征選擇、決策樹的生成和決策樹的剪枝。決策樹的算法的本質是遞歸選擇最優特征,并根據該特征進行分割。這一過程對應著決策樹的構建,也對應著特征空間的劃分,使得劃分之后的各個子集能夠被基本分類,那么構建葉節點;否則繼續遞歸劃分。其具體步驟為:
第一,確定根節點,求出對應的熵,從而得到信息熵,計算信息增益或信息增益率,從而確定根節點;信息熵的具體公式為:
第二,重復第一步計算信息增益的計算公式,遞歸算法構造出決策樹;
第三,決策樹構造完成后,進行剪枝,然后評價決策樹的好壞。
(二)隨機森林模型
隨機森林的核心思想是就是由多棵決策樹構成的集成模型。對于任意一棵樹,該樹的訓練集是從總的訓練集中有放回隨機采樣得到的。訓練過程可以總結如下:
第一,給定訓練集s,測試集T,確定所需要的樹的個數t和每棵樹的深度d。
第二,從s中有放回的抽取訓練集,訓練集的個數t,從根節點開始訓練。
第三,根據回歸樹的思想構建決策樹,對每棵樹進行評價。
第四,所以決策樹都被訓練過,根據少數服從多數的思想進行投票分類。
三、數據獲取
本文分析數據選取中國綜合社會調查(CGSS)2015年度調查得到的城鎮居民的樣本(http://cgss ruc edu cn/),樣本為2391個。通過從多方面多角度對影響城鎮居民主觀幸福感因素的分析,在社區內進行調查,以及從網上查閱資料,本文選取了以下指標作為參考因素:性別、最高教育程度、身體健康狀況、心情抑郁或沮喪的頻繁程度、戶口登記狀況、空閑時間、生活是否幸福、社會保障項目、全年家庭總收入、家庭經濟狀況在所在地屬于哪一檔、幾處房產、社會經濟地位、關于社會公平的討論、政府工作滿意度以及公共服務滿意度等指標,統計結果如表1。
性別不僅僅是生理劃分,其也是社會發展過程中非常重要的角色定義。男性和女性對于幸福感的判斷具有相當大的主觀差異,是幸福感衡量的一個重要因子。身體健康,心理健康是居民幸福感衡量的基礎因素。全年家庭總收入、家庭經濟狀況在所在地屬于哪一檔、幾處房產、社會經濟地位等因素都是居民幸福感的重要的經濟基礎因素以及由此而帶來的社會認知因素。關于社會公平的討論、政府工作滿意度以及公共服務滿意度等指標是居民對社會生活滿意度的反映,隨著我國人民物質生活水平的不斷提升,居民參政議政的意愿也逐步增強,這也符合馬斯洛的需求層次理論。休閑時間在某種程度上是個體之所以為個體的一個表現。戶口登記情況則關系到居民的社區歸屬感以及在當前情況下同居民子女的教育強相關,同樣是其主觀幸福感的重要因素。而居民不同的教育程度對上述物質的、精神方面以及社會責任實現等方面的權重,有著顯而易見的影響。