劉丹丹,朱家明,黃婷婷
(安徽財經大學 統計與應用數學學院,安徽 蚌埠 233030)
統計分析方法在青少年心理狀況研究中的應用
劉丹丹,朱家明,黃婷婷
(安徽財經大學 統計與應用數學學院,安徽 蚌埠 233030)
針對青少年心理狀況問題,使用方差分析、變異系數等統計方法,輔助SPSS、MATLAB軟件,得出不同年齡段青少年的心理狀況存在差異,年齡是驅使青少年施加暴力等行為的主要誘因.通過分析正負框架下各領域的自變量權重,得出正向框架下的主要影響因素為風險偏好,其次為認知需要;負向框架下的主要影響因素為風險偏好,其次為決策風格.最后基于研究結果對我國教育事業的發展提出了一些建議.
青少年心理狀況;風險偏好;方差分析;變異系數;正負框架
近年來校園霸凌事件頻繁發生,“霸凌”一詞迅速發酵成為熱點,引起廣大人民群眾的關注.發生在校園中的暴力事件對青少年心理健康的危害程度是極大的,如果沒有受到專業的心理引導,受害者有可能轉變為報復社會的人,進而從受害者轉變為施暴者,將自己的遭遇原封不動或放大百倍地轉嫁到他人身上[1].因此對于這些情況我們應該給予高度的重視,及時了解成因并進行積極干預,預防和避免此類狀況的再發生.本文通過對不同年齡段青少年心理狀況的問卷調查結果進行分析,試圖研究青少年存在潛在心理問題的主要原因,為我國的教育事業發展提出一些有效的建議.
1.1 數據獲取
本文數據來源于2016年第九屆“認證杯”數學建模網絡挑戰賽,該比賽設計了一次針對不同年齡段青少年心理狀況的問卷調查,涉及生命教育、生活方式、娛樂三個領域,包括正向和負向兩個框架.自變量包括風險偏好、認知需要、決策風格三個主要方面,其中決策風格又分為理智型、直覺型、依賴型、回避型、沖動型五個維度,每個方面的題目可以按照選擇的答案來計算相應的得分.本文旨在利用調查的結果進行分析,判斷各個年齡段的心理狀況是否存在顯著性差異以及分析不同框架下的主要影響因素.
1.2 數據預處理
⑴數據的重新組合
通過對調查所得數據的觀察,我們發現在原有數據分組中年齡分布存在一定的交叉,9歲組包含8到13歲6個年齡;11歲組包含10到14歲5個年齡;13歲組包含12到17歲6個年齡;15歲組包含14到18歲5個年齡;17歲組中包含16到20歲5個年齡.因此我們對8到20歲這13個年齡進行重新分組:9歲組(8-10歲)、11歲組(11-12歲)、13歲組(13-14歲)、15歲組(15-16歲)、17歲組(17-20歲).
⑵異常數據處理
通過對數據進行分析發現,在8歲和20歲兩個年齡上分別只有一組數據,樣本量過少不具有代表性,因此可以剔除.剔除后的分組為:9歲組(9-10歲)、11歲組(11-12歲)、13歲組(13-14歲)、15歲組(15-16歲)、17歲組(17-19歲).
2.1 研究思路
為了使不同年齡段的青少年心理狀況得分具有可比性,有必要計算出各年齡段風險偏好、認知需要、決策風格這三個自變量的權重.本文采用變異系數法來確定不同年齡段各指標的權重.
2.2 數據處理與分析
⑴決策風格得分量化
對于決策風格這一變量,文中只給出理智型、直覺型、依賴型、回避型、沖動型這五個維度的得分,為了便于分析,我們通過賦分值將其量化,所賦分值如表1所示:

表1 五種決策風格的分值轉換情況
通過賦分情況不難發現,青少年的決策風格得分越高,其心理狀況越好.
⑵自變量的標準化處理
通過對數據進行分析,我們發現風險偏好、認知需要、決策風格這三個自變量的量綱存在較大差異,因此有必要進行標準化處理.
本文采用min-max標準化處理方法:

式(1)中,xij為該年齡組第i個學生第j項指標的值,xjmax為第j項指標的最大值,xjmin為第j項指標的最小值,x'ij為該年齡組第i個學生第j項指標標準化后的值.I1表示效益型指標,I2表示成本型指標.
⑶變異系數法確定權重
計算各指標的變異系數公式為:


利用MATLAB編程計算,得到不同年齡段各指標的權重結果如表2所示:

表2 不同年齡段各指標的權重
得到各指標的權重后,可將標準化后的指標與權重加權求和,得到不同年齡段青少年的心理狀況得分.
3.1 研究思路
本文假設所給樣本量已足夠大,數據近似服從正態分布,因此可以通過方差分析判斷各個年齡段的心理狀況是否有顯著的差異.
3.2 研究方法
方差分析是從觀測變量的方差入手,研究諸多控制變量中哪些變量是對觀測變量有顯著影響的變量,對觀測變量有顯著影響的各個控制變量不同水平以及其交互搭配是如何影響觀測變量的[3].
方差分析的基本步驟如下:
⑴建立假設檢驗,即提出原假設和備擇假設
H0:a1=a2=Λ=ak=0,即不同水平下的控制變量對觀測變量均值沒有顯著性影響,
H1:ai不全為0.
⑵計算檢驗統計量G

式(4)中,SSA為組內離差平方和,SSE為組間離差平方和,k-1、n-k分別為SSA與SSE的自由度.F統計量消除了水平數和樣本量對分析帶來的影響.若F顯著大于1,則拒絕原假設;若F接近1,則接受原假設.
⑶確定P值,選擇顯著性水平α,對假設檢驗做出決策
若P值小于α,則拒絕原假設,認為ai不全為0,控制變量不同水平下觀測變量各總體均值存在顯著差異,控制變量不同水平對觀測變量均值產生了顯著影響;若P值大于α,則接受原假設,認為a1=a2=Λ=ak=0,控制變量不同水平對觀測變量均值沒有產生顯著影響,觀測變量值的變化是由抽樣誤差引起的[4].
3.3 軟件實現及結果分析
將得到的不同年齡段青少年的心理狀況得分導入SPSS軟件中進行單因素方差分析,得到表3:

表3 ANOVA單因素方差分析
由表3的結果可知,F統計量的值為4.119>1,對應的顯著性水平為0.001<0.05,所以在0.05的顯著性水平下可以認為五個年齡段青少年的心理狀況存在顯著性差異.
4.1 研究思路
通過對問題進行分析可知,原數據分為生命教育、生活方式、娛樂三個領域,對于各個領域分為正向、負向兩種框架,這兩種框架有二選一式的評價變量,用A或B來表示,并且由風險偏好、認知需要、決策風格三個主要方面來決定.因此,我們對框架進行多層次的分類,其中,每一層都是對上一層的細化分類.

圖1 框架圖
研究不同框架下的主要影響因素仍可以采用上面介紹的變異系數法.采用變異系數法確定影響正、負向框架各領域的評價變量取值的自變量的權重,綜合各領域的評價變量取值的自變量的權重得到正負框架下的自變量的權重.最后按照權重越大,影響越大的原則,進而可以確定不同領域的主要影響因素.
4.2 結果實現及分析
利用MATLAB編程計算,得到影響正、負向框架各領域的評價變量取值的自變量權重如表4所示:

表4 影響正、負向框架各領域的評價變量取值的自變量權重
根據得到的權重可以分析出正負框架下不同領域的主要影響因素,如表5所示:

表5 正負框架下不同領域的主要影響因素
因為在正負框架下生命教育、生活方式、娛樂三個領域沒有相對重要性之分,因此可以通過求和后歸一化得到影響正、負向框架的自變量的權重如下表6所示:

表6 正負框架下的主要影響因素的權重
由表6的結果可知,正向框架下的影響因素主要為風險偏好,其次為認知需要;負向框架下的影響因素主要為風險偏好,其次為決策風格.
本文通過研究發現不同年齡段的心理狀況存在顯著性差異,故我們應有針對地對處于青春期的學生進行著重的教育,在風險偏好、認知需求、決策風格三個方面給予他們的正確引導,在生活中潛移默化地降低其潛在心理問題的可能性,從而抑制校園霸凌事件的發生.同時,對于教育知識的選取,在正向、負向兩種不同框架下應進行不同方面的側重.對于正向框架下的正確教育知識,應側重于風險偏好、認知需求方面;對于負向框架下的正確教育知識,應側重于在風險偏好、決策風格方面.
〔1〕張自然.面對校園暴力,美法兩國零容忍[N].中國教師報,2015-09-30(003).
〔2〕楊桂元.數學建模[M].上海:上海財經大學出版社,2015.112-116.
〔3〕高忠江,施樹良,李鈺.SPSS方差分析在生物統計的應用[J].現代生物醫學進展,2008,8(11):2116-2120.
〔4〕梁坤宇,張超,曹明宏.YH公司員工滿意度調查:分析與對策[J].中國農業銀行武漢培訓學院學報,2012(6):78-80.
〔5〕謝銀迪.美國:“霸凌零容忍”[J].上海教育,2015 (35):25-29.
〔6〕任亞珍,頓曉明.青少年心理健康狀況研究[J].讀天下,2016(9):11-13.
〔7〕張良良.關于青少年心理健康狀況的研究[J].商, 2016(14):83-83.
〔8〕李娟,殷仕淑,高彥文,李冬梅.基于典型相關的青少年心理健康影響因素研究[J].阜陽師范學院學報(自然科學版),2016(04):93-97.
B844.2
A
1673-260X(2017)04-0044-03
2017-02-14
國家自然科學基金資助項目(11601001);安徽財經大學教研資助項目(acjyzd201429)
朱家明(1973-),男,安徽泗縣人,安徽財經大學統計與應用數學學院數學建模實驗室主任,副教授,碩士,研究方向:應用數學與數學建模