申冰可 邵林芳



摘要:培養(yǎng)和吸收優(yōu)秀大學生入黨是高校黨建工作的需要。為了分析大學生入黨意愿自身影響因素和動機,基于首都大學生成長基線報告,通過二元邏輯回歸,進行[χ2]檢驗和t檢驗,從而獲得影響力較大的因子。利用決策樹CHAID模型,預測大學生是否打算在大學期間入黨。實驗結(jié)果顯示,政治面貌是大學生是否入黨的第一要素,其次是日后期望工作單位。成績排名與是否取得獎勵和榮譽也是重要的影響因素,成績排名越靠前或已經(jīng)取得榮譽或獎勵意愿入黨的概率越高。CHAID模型通過交叉測試的預測準確率為73.3%,高于隨機的50%,具有現(xiàn)實性意義。另外,除了自身相關因素外,還有家庭、學校、社會等環(huán)境影響。在大學生自身意愿的前提下,外界的積極引導同樣重要。
關鍵詞:決策樹;數(shù)據(jù)挖掘;入黨意愿;影響因素;二元邏輯回歸
中圖分類號:G642? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)08-0000-03
1 引言
教育的改革和發(fā)展使得大學生的人數(shù)日益增加。大學是青春的一個重要階段,大學生的入黨意愿反映了他們對黨的領導的堅定程度。探究影響大學生入黨意愿的因素,從而引導大學生入黨,是推動高校黨建的保障。此前,已有部分研究根據(jù)理論分析大學生入黨意愿影響因素。例如,張銳[1]從社會、家庭和學校方面分析入黨意愿動機影響的原因;另張銳[2]將入黨意愿分類并從社會、學校、個人、家庭和宗教四個方面,分析此類因素對高校教師與大學生入黨意愿的影響;姚斌[3]用計劃行為理論驗證其主觀因素對入黨意愿的直接和間接影響;王君濤[4]采用結(jié)構化方程,對大學生入黨意愿影響路徑分析。但是以上研究大多從消減大學生入黨意愿的影響因素探究,并且沒有進行相關的預測分析。本文采用logistic回歸,獲得高置信度的因子,建立卡方自交互偵測決策樹(CHAID)模型,深入全面探究影響大學生入黨意愿自身因素并預測分析實驗結(jié)果,為提高大學生入黨意愿提供充分的理論依據(jù)。
2 數(shù)據(jù)及其初步統(tǒng)計分析
2.1 數(shù)據(jù)
本文的數(shù)據(jù)來自中國人民大學中國調(diào)查數(shù)據(jù)中心的常規(guī)項目——首都大學生成長跟蹤調(diào)查(2009)的基線數(shù)據(jù)。數(shù)據(jù)基于概率抽樣的原則選取調(diào)查對象,隨機從北京市15所高校的2008級(大一)和2006級(大三)抽取5100個樣本進行調(diào)查。其中,4771人參與調(diào)查,應答率為93.55%。調(diào)查內(nèi)容包括大學生在校時的基本情況、心理量表、高中情況、大學學業(yè)、大學政治、家庭情況等諸多信息,調(diào)查采用多階分層抽樣方式,因此該數(shù)據(jù)集可以在一定程度上支撐本課題的研究。
2.2 樣本特征與統(tǒng)計學分析
該問卷通過“是否打算大學期間入黨”確定大學生入黨意愿,分為打算和不打算兩類。考慮包括基本信息、自身實力與自我規(guī)劃等因素,通過人工篩選,最終確定12個可能與入黨意愿密切相關的特征因素:民族、戶口性質(zhì)、性別、大學年級、現(xiàn)專業(yè)、大學期間是否獲得獎勵和榮譽、成績排名、政治面貌、大學期間是否擔任過干部、畢業(yè)后最希望去的單位、對我國整體發(fā)展狀況滿意度、認為家庭經(jīng)濟層次。其中,為便于使用,將成績排名通過(1-班級排名/班級人數(shù))×100得到連續(xù)的值,數(shù)值越大代表排名越靠前。對于刻度變量(即連續(xù)變量)的缺失值采用平均值填補,對于名義變量(在現(xiàn)有前提或條件下確定的值)的缺失值用眾數(shù)填補。經(jīng)計算,成績排名和對我國整體發(fā)展?jié)M意度刻度變量的峰度絕對值小于10并且偏度絕對值小于3,因此基本可接受為正態(tài)分布。
3 基于Logistic 回歸和決策樹的數(shù)據(jù)分析
3.1 Logistic回歸相關性探究
本文研究的是大學生在大學期間是否打算入黨,因變量表示入黨意愿,取值只有兩項,將打算入黨賦值為1,不打算入黨賦值為0。采用二元Logistic回歸模型,如式(1):
其中,[β0]是常數(shù)項,[ βi]是自變量[Xi]的回歸系數(shù)。[p]為打算入黨的可能性。[p]在0到1之間變化(公式(1)中[p]表示愿意入黨的概率)。[X]為影響大學生入黨意愿的相關變量。
分別采用[χ2]檢驗和[t]檢驗,計算人工篩選后變量與因變量的依賴度。對刻度變量(對當前我國整體發(fā)展狀況滿意程度和認為家庭經(jīng)濟層次)采用t檢驗,對名義變量采用[χ2]檢驗。[χ2]統(tǒng)計值或[t]值越大,說明兩個變量的相關性越高。有關人工篩選后的變量的分布情況,參見表1。
3.2 CHAID模型創(chuàng)建與分析
卡方自交互檢測決策樹(Chi-squared Automatic Interaction Detector,CHAID),分類樹方法,按照卡方顯著性劃分或組合形成多叉樹狀結(jié)構。定距和定類變量均可作為目標變量,適宜于預測變量為分類變量的情況。CHAID決策樹將因變量作為根節(jié)點,按照[χ2]值最大(P值最小)選取變量的原則建立樹。
對CHAID模型,將父節(jié)點中的最小案例數(shù)設置為100,將子節(jié)點中的最小案例數(shù)設置為30。拆分節(jié)點的顯著性水平為0.05,合并類別的顯著性水平為0.1。合并和拆分條件的顯著性值采用Bonferroni方法進行調(diào)整。通過樣本分割驗證30%的測試樣本與70%的訓練樣本用來檢驗決策樹的分類效果。其中,成績排名與對我國目前發(fā)展狀況滿意度的區(qū)間均設定為25。利用單因素logistic回歸得到的具有統(tǒng)計學意義的變量,最終生成最大樹深度為3,有22個節(jié)點和14個終端節(jié)點數(shù)的樹。包括政治面貌、大學年級、畢業(yè)后最希望去的單位、大學期間是否擔任班委、成績排名、大學期間是否獲得榮譽以及對我國整體發(fā)展整體滿意度7個自變量。結(jié)果如圖1所示。
在決策樹模型圖中,從節(jié)點0可以看出打算在大學期間入黨的大學生占多數(shù)(65.1%)。第一層分類的因素是政治面貌,預測結(jié)果為共青團員和民主黨派傾向于入黨(61.6%),普通群眾入黨意愿稍弱(20.8%),說明已經(jīng)向黨組織靠攏的人入黨意愿更大,共產(chǎn)黨員(含預備黨員)因已經(jīng)或即將成為黨員所以不再進行分析。對于節(jié)點4和節(jié)點5,大學一年級(72.5%)的學生比大學三年級(47%)的學生更傾向入黨。入黨的流程需要消耗一定的時間,低年級學生在校剩余時間更長,入黨成功率更高。從節(jié)點5可知,畢業(yè)后最理想的工作單位也影響大學生入黨意愿。其中,希望未來到黨政機關和大型國有企業(yè)的大學生打算入黨的意愿更高(66.8%),其次是到學校,科研機構以及其他國有和集體企業(yè)的學生(50%),而傾向去外企或合資企業(yè)、創(chuàng)業(yè)、民營企業(yè)和一般事業(yè)單位打算入黨的大學生(35.8%)較少。在節(jié)點7,對我國整體發(fā)展狀況滿意度高于75%的入黨意愿為71.3%,低于75%的為57.1%。在節(jié)點8,隨著成績排名下降,以34名次和68名次為分界點,打算入黨的比例分別是89.9%、86.9%和64.1%,表明成績更好的學生有入黨意愿的概率越高。在節(jié)點12,擔任過學生干部(59.3%)比未擔任過學生干部(43.1%)的入黨意愿更強。2F64113D-F082-465A-BB82-FB64D92889B9
3.3 模型測試結(jié)果與評價
模型通過自動減枝去除現(xiàn)專業(yè)、認為家庭經(jīng)濟層次兩種因子。對模型交叉測試得到表2。將結(jié)果分為了四類:真負-將打算入黨的學生預測為打算入黨,假負-將不打算入黨的學生預測為打算入黨,真正-將不打算入黨的學生預測為不打算入黨,假正-將打算入黨的學生預測為不打算入黨。其中將實際不打算入黨預測為不打算入黨數(shù)為597,占比51.5%,預測正確率即真正率較低。將實際打算入黨預測為打算入黨的預測正確率即真負率較高為84.7%,預測成功率較高。總體正確率為73.3%。
因模型僅對個人因素探究,且沒有對其進行多因素logistic回歸分析,所以預測率未達到80%。但從研究的角度來看,仍具有一定的參考價值。如果對各因素進行多元分析,并結(jié)合家庭、學校和社會等外部因素,對提高準確度有積極意義,后續(xù)需要更深入的研究。
4 結(jié)語
從決策樹模型可以看出,對大學生入黨意愿影響最大的因素是政治面貌,共青團是黨的助手和后備力量,共青團員進入大學后,在政治上仍有理想與追求。其次是畢業(yè)后期望工作單位,工作單位不同入黨意愿不同體現(xiàn)了大學生的入黨動機的功利性。這種現(xiàn)實傾向?qū)h組織和學生本身均存在危害,應采取相關措施積極避免。成績排名靠前或獲得過榮譽的大學生往往有更高的追求,渴望加入黨組織。本文提出的模型預測率為73.3%。考慮到家庭因素(如家庭成員對大學生的思想教育等)、社會因素(如黨領導取得的一系列成就對大學生的吸引力等)、學校因素(如學校開展的政治思想教育的力度)等個體以外的因素對大學生入黨意愿都有較大的影響,本文模型還有較大的改進空間,后續(xù)將進一步考慮上述因素對學生入黨意愿的影響,并為促進大學生入黨提供指導意見。大學生應該積極提高自身素質(zhì),不斷完善自我,成為“四有”新人。同時,社會、學校和家庭層面也要加強對大學生的思想政治教育和輔導,形成教育合力,為高校黨建工作注入更加新鮮的血液。
參考文獻:
[1] 張銳.高校大學生入黨意愿分析[J].共產(chǎn)黨員(河北),2015(26):62.
[2] 張銳.高校青年教師和大學生入黨意愿深度分析——以寧夏師范學院為例[J].寧夏師范學院學報,2015,36(5):158-160.
[3] 姚斌.基于計劃行為理論的高職學生入黨意愿和行為的影響因素研究[J].職教通訊,2020,35(2):55-63.
[4] 王君濤,沙治邦,王云龍.大學生入黨意愿影響因素及引導策略[J].沈陽建筑大學學報(社會科學版),2019,21(4):411-416.
[5] 宋文凱,汪睿琪.Logistic回歸與CHAID探究高考成長環(huán)境影響與結(jié)果預測[J].信息技術與信息化,2020(7):83-86.
[6] 李如平.數(shù)據(jù)挖掘中決策樹分類算法的研究[J].東華理工大學學報(自然科學版),2010,33(2):192-196.
[7] 姚爽,謝夢婷,鄒迪莎,等.空腹血糖受損危險因素的Logistic回歸及分類樹分析[J].安徽醫(yī)科大學學報,2018,53(9):1407-1411.
[8] 晁靈,李然,梁利花.分類樹模型與Logistic回歸在兒童高血壓預測中的應用[J].中國學校衛(wèi)生,2015,36(7):1066-1068.
[9] 王君濤.系統(tǒng)科學視閾下大學生入黨意愿影響因素研究[J].河北青年管理干部學院學報,2020,32(1):15-22.
[10] 胡小軍.新時期激發(fā)培育大學生入黨意愿的途徑研究[J].廣西青年干部學院學報,2011,21(6):15-17.
[11] 苗楠.民辦高校大學生入黨意愿與動機現(xiàn)狀分析——以寧夏理工學院為例[J].現(xiàn)代商貿(mào)工業(yè),2016,37(30):151-152.
[12] 胡小軍.新時期激發(fā)培育大學生入黨意愿的途徑研究[J].廣西青年干部學院學報,2011,21(6):15-17.
[13] 張海平,李堅.工科大學生入黨積極性的影響因素及對策研究——以華南農(nóng)業(yè)大學為例[J].學理論,2013(29):355-357.
[14] 張云.高職院校學生入黨意愿的調(diào)查研究[J].長沙民政職業(yè)技術學院學報,2018,25(1):59-61.
[15] 馬圣.發(fā)揮榜樣引導作用 端正大學生入黨動機[J].求知,2018(9):49-50.
[16] 劉軍.高校學生黨員發(fā)展工作存在的問題及對策探析[J].山東社會科學,2010(9):173-176.
[17] 黃玖琴,王德召.地方高校大學生入黨動機研究[J].學校黨建與思想教育,2019(16):22-23.
【通聯(lián)編輯:王力】2F64113D-F082-465A-BB82-FB64D92889B9