◇任靜
基于校園霸凌事件的統計分析研究
◇任靜
文章以青少年心理狀況問卷調查數據為基礎,運用方差分析、logistic回歸以及因子分析,研究了校園暴力事件中青少年心理狀況的顯著特點、主要影響因素以及對案例中每一案例的心理風險進行了4個等級評估,結果發現不同年齡段的心理狀況存在顯著性差異,并且影響心理狀況的主要變量為年齡段以及風險偏好,風險分為高度風險類、中度風險類、輕度風險類、無風險類。有心理風險者已經占65%,所以學校、家庭應及時發現情況并預防暴力事件。
方差分析;邏輯回歸;因子分析;聚類分析
10.13999/j.cnki.scyj.2016.08.024
霸凌事件對學生的身心傷害都是極為嚴重的,故有必要對青少年的心理狀態進行問卷調查分析,使社會、學校、家庭各方面正確的認識青少年的一些潛在心理問題,并引導他們的思想與行為。青少年對他人施加暴力的原因之一是年齡太小不知如何轉化暴力沖動。該問卷是針對不同年齡段的青少年進行調查,調查方向為生命教育、生活方式和娛樂。
本文數據來源于2016年第九屆“認證杯”中國數學建模網絡挑戰賽,首先對所給的初始數據進行篩選與處理,根據統計分組中窮盡性和互斥性分組原則,本文數據分為以下五組:A:9~10歲;B:11~12歲;C:13~14歲;D:15~16歲;E:17~19歲。進行初步分析得到變量關系如附圖:

附圖 變量框架圖
由于本次調查的重點是在五個不同年齡段上的青少年心理狀況,所以本文首先分析不同年齡段之間的心理狀況是否有顯著性差異。年齡段是控制變量,六種心理框架(生命正向、生命負向、生活正向、生活負向、娛樂正向、娛樂負向)為觀測變量,控制變量的不同取值稱為不同水平,在本文中年齡段分為五種不同水平,所以該部分主要用單因素方差分析的方法分別對控制變量的五種不同水平上的六種心理框架進行顯著差異分析。將這五組分別定義為1、2、3、4、5組,使用方差分析,其中六個框架中生命正向的各年齡段方差分析結果如表1所示。其他五個框架的顯著性水平依次為0.000,0.012,0.000,0.000,0.000。

表1 生命正向方差分析結果
可以得出,對于心理狀況的生活正向、生活負向、生命正向、生命負向、娛樂正向、娛樂負向六個框架顯著性水平均小于0.05,說明在這五個不同年齡段,青少年心理狀況確實存在顯著性差異。
Logistic回歸方法研究的是當Y取某值(如Y=1)發生的概率P與某暴露因素(X)的關系。結合數據分析,因變量被設計為一種二選一的評價變量,取值為A和B,A令為1,B為0。自變量中,決策風格屬于分類變量,包括理智型、直覺型、依賴型、回避型、沖動型這5個維度,根據樣本在這五個維度的得分情況,以得分最高的維度作為樣本的決策風格。故用二項邏輯回歸對因變量與自變量的關系進行研究。在進行邏輯回歸前需要對分類變量進行重新編碼,1~5分別對應理智型、直覺型、依賴型、回避型、沖動型。要求對不同框架找出主要因素,而一個框架中又有二分類,所以需要建六個回歸模型,回歸結果如下:

表2 方程中的變量
可以看出風險偏好和年齡段兩個變量入選。表二出現了非常有趣的現象:年齡段(1)(11歲組)和年齡段(3)(15歲組)的檢驗P值均大于0.05,但是均沒有被移出方程,這是因為從模型整體檢驗來看,年齡段這個變量是顯著的,而年齡段變量是分類變量,所有分類變量均要同時進入模型才有意義,故仍然保留年齡段(1)和年齡段(3)。風險偏好為2分的人在生活正向處于B狀態的發生概率為風險偏好為1分的1.118倍。從EXP(B)數值來看,年齡段的影響程度要大于風險偏好的影響程度。年齡越大,生活正向評價量為B的概率越大。對于其他五種框架采用同樣的方法也得出其主要的影響變量為風險偏好和年齡段,符合初始假設,年齡是暴力事件發生的最主要原因之一。
本文選擇了8個初始自變量,風險偏好、認知需要、理智型、直覺型、依賴型、回避型、沖動型、年齡,對數據進行無量綱化,使這8個變量都服從標準正態分布。通過初步檢驗可以得到KMO值為0.802,故可以做因子分析。
提取公共因子,用SPSS軟件計算初始載荷矩陣,對主成分方法而言,就是通過計算資料矩陣的相關系數矩陣計算特征值和特征向量。利用主成分分析法,提取特征根大于1的公因子,如表3所示,提取3個公因子,累計方差貢獻率為64.93%。確定公共因子,得到的因子載荷矩陣就是公共因子系數,如表4。

表3 主成分特征值及貢獻率
由表4可看出,公因子1在非理性型決策風格上具有較大載荷,說明直覺型、依賴型、回避型和沖動型這四個變量有較強的相關性,可歸為一類,因此把因子1命名為非理智型決策因子,在這個因子上得分越高,該樣本的決策風格越不理性。因子2在理智型決策風格和認知需要兩個變量上因子載荷最大,說明這兩個變量有較強的相關性,可以歸為一類,命名為理性認知因子,該項因子得分越高,說明樣本的認知需求越大,決策越理性。因子3在風險偏好和年齡上具有較大載荷,說明這兩個變量有較強的相關性,可以歸為一類,命名為風險年齡因子。

表4 因子載荷矩陣(旋轉后)
結合表3中的貢獻率可算得每個樣本的綜合得分,利用聚類分析對840個樣本的綜合得分進行K-均值聚類分析,可分為4個類別,每一類的最終聚類中心和區間分別見表5。

表5 樣本類別與自變量特征分布
類別2為無風險類型,類別1為輕度風險類型,類別3為中度風險類型,類別4為高度風險類型,表五列出了每一類別的均值與得分區間,可知總體得分越高風險越大,這符合基本假設,初始8個自變量中,風險偏好越強烈,認知需要越高,決策風格偏不理智,這樣就更容易出現心理問題,風險等級就會越高。
由于不同年齡段的心理狀態存在顯著性差異,且影響青少年心理狀態的主要因素是年齡與風險偏好,所以對于青少年暴力的主要控制方向應該從年齡段和風險偏好出發,對于處于中學叛逆心理狀態的青少年應該更要注意從家庭與學校兩個方面做好心理檔案的建立。每學期初應當用心理測量量表進行心理測試,對每一位學生做好心理檔案建設,家庭與學校各存一份,并且用恰當的模型對每一個孩子的心理狀態進行評估,對心理有無風險、輕度風險與中度風險的學生應該進行不同程度的心理教育。最后,應當定期對學生心理進行測試與評估,以了解測試體系是否合理。對風險偏好的喜愛這一方面,需要家長與老師平時共同指導,對出現太高風險偏好的學生應該多加注意。
[1]廖秋梅.大學生心理健康狀況及教育對策研究[D].長沙:湖南農業大學,2013.
[2]彭虎軍,魏書堂.大學生心理健康狀況及其與應對方式、社會支持的關系[J].中國健康心理學雜志,2008(09).
[3]鄒芙蓉.大學生心理健康狀況相關因素分析及心理健康教育效果的對照研究[D].濟南:山東大學,2007.
(作者單位:江西財經大學統計學院)