杜文玲















摘 要:針對大學生多級別心理壓力智能預測過程中數據的來源較為復雜,導致預測結果可信度較低的問題,提出基于多源數據整合的大學生多級別心理壓力智能預測方法。采用卡爾曼濾波法完成數據濾波處理,并應用C均值聚類方法完成數據預處理。使用密度函數計算相關數據結構特征值,引入參數估計算法得到最終可應用于心理壓力預測的數據樣本,實現數據信息結構整合。計算信息增益率確定數據質量,并應用此數據構建新型大學生多級別心理壓力智能預測模型。結果表明,此方法可對數據進行高質量處理,并得到可靠性較高的心理壓力預測結果,為大學生心理輔導工作提供幫助。
關鍵詞:Min-Max方法;多源數據整合;心理壓力預測;C均值聚類方法;卡爾曼濾波法
中圖分類號:TP391;B844.2? 文獻標識碼:A? 文章編號:1673-260X(2023)09-0074-04
高校大學生作為未來社會的高層人才,他們是具有高修養以及高素質的群體,同時也是承受較高心理壓力的群體[1,2]。由于近年來工作壓力與學習壓力日益增加,社會對大學生心理承受能力的要求不斷提升,大學生心理健康也受到社會各界人士的關注。在對大量在校大學生進行心理分析后發現,20%左右的學生存在不同程度上的心理問題或是心理障礙。大學生的心理障礙問題不僅影響其自身的發展,還會影響社會的和諧性。立足于社會角度,大學生作為國家發展的寶貴人才資源,作為重要的社會發展力量,其心理健康發展需要得到密切的關注。
隨著社會的不斷發展,教育水平的日益提升,大學生出現了多種不同層級的心理問題,為對其展開更具有針對性的治療,在過去的研究中部分專家提出了大學生多級別心理壓力智能預測方法,但此部分方法在應用的過程中多存在不足,無法為大學生心理輔導提供幫助[3-5]。針對此情況,本次研究中應用多源數據整合技術對采集到的大學生心理素質數據進行整合,并提出更為先進的基于多源數據整合的大學生多級別心理壓力智能預測方法,希望此方法可在當前方法的基礎上獲取可信度更高的心理壓力預測結果,為大學生心理疏導提供幫助。
1 大學生心理數據集成預處理
在大學生心理壓力預測過程中,需要獲取大量的心理測試或行為數據,此部分數據質量與特征選擇均對預測模型結果的真實性具有直接影響,決定預測方法預測質量的上限,因此需要對此部分數據進行集成處理。
本次數據處理主要針對異常值與噪聲數據進行處理,對于異常值不能采用常規的剔除處理將數據刪除,需要首先確定其是否為真異常值。如其為真異常值,再對其進行刪除或平均值替換等方法進行處理。異常值處理完成后,對數據中的噪聲值進行處理。對比多種數據處理方法后,采用卡爾曼濾波法[6,7]完成數據濾波處理。假設采集到的原始數據為:
其中,S(k)表示k時刻下的數據狀態向量;P(k)表示數據觀測向量;?琢(k)表示數據處理系統的輸入向量;T(k+1,k)表示時刻變動后的數據狀態轉移矩陣;Z(k+1,k)表示時刻變動后的數據處理系統狀態控制矩陣;Q(k+1)表示時刻變動后的預測輸出矩陣。此次研究中,將公式(1)視作數據狀態方程;公式(2)視作數據測量方程。根據卡爾曼濾波要求,將兩公式融合,得到數據中的噪聲協方差:
其中,表示數據處理環節狀態向量;?琢表示輸入向量;Z表示濾波環節控制矩陣;U表示狀態轉移矩陣;W表示誤差協方差矩陣。整合上述公式,得到卡爾曼濾波增益,將此數據帶入公式(4)中,得到可應用于心理數據的卡爾曼濾波器,應用此濾波器剔除原始數據中的噪聲數據,并設定其他數據處理環節,對其進行后續處理。
由于大學生心理素質數據組成較為復雜且數據來源較多,不同類型、不同性質的數據集成在一起后,為保證數據質量,需對其進行集成整合,以此保證數據質量。對比多種方法后,本次研究采用Min-Max方法[8]對數據進行初步處理,此方法可在一定程度上可有效降低數據規模,減少數據分布差異,提升預測結果的可靠性。根據Min-Max方法的相關要求,將數據初步處理公式設定如下:
其中,a表示采集到的原始數據;max表示此類數據最大值;min表示以此類數據最小值。通過此部分公式,對數據進行初步處理,并將其導入到指定數據庫中。而后,使用C均值聚類方法[9]對原始數據進行簡單的聚類處理。假設處理后的數據集合為C={c1,c2,…,cn},此集合為有限數據集合,集合中的數據均為d維向量,將此部分數據整合為模糊劃分矩陣形式,并在其中設定聚類中心點,得到數據聚類目標函數:
其中,(bij)c*n表示模糊劃分矩陣;c表示聚類中心個數。公式(6)在應用過程中,還需設定部分約束條件,具體內容設定如下:
其中,m表示模糊加權系數;bij表示數據隸屬度;aj表示數據集合聚類核心;d表示不同數據核心的距離。在完成數據分類工作后,將數據按照不同類型保存好,為后續的心理健康分析提供數據支持。
2 整合大學生心理數據信息結構
在完成心理壓力預測數據的初次數據挖掘后,假設數據庫中的多源數據集合為F={Fk|k=1,2,…,m},數據度量集合為G={Gk|k=1,2,…,m}。在此假設下,數據度量集合可表示多源數據集合的信息結構集合,通過其可確定多源數據集合的內核特征點。本次研究為了更好地完成數據處理工作,使用密度函數計算相關數據結構特征值,引入參數估計算法得到最終可應用于心理壓力預測的數據樣本。使用e表示來自不同數據結構集合?字,?酌之前的差異特征。對于數據樣本{?酌kl|l=1,2,…}則有:
其中,knl表示第k個信息源的第n個采樣點在數據存儲空間中的取值結果,在預設條件下,一定存在相應的密度函數,此密度函數可在一定程度上表示不同信息單位的度量值,并由此計算出不同類型源頭數據的上近似邊界以及下近似邊界。
上述計算完成后,使用高低模型導入已經獲取到的密度函數,此時高斯函數模型可連續表示為:
其中,V1表示數據存儲空間中的矢量;R表示協方差矩陣;?滓表示密度函數均值。針對任意量不同源頭數據集合,其密度函數均可應用上述公式計算。根據以上公式,得到多源數據整合密度函數,則有:
應用此部分公式,可對預處理后的全部數據集進行整理,并得到相應的對應的數據結構信息,整理此部分信息,完成大學生多源心理數據的整合工作。
3 構建大學生多級別心理壓力智能預測模型
整理上文設定內容,結合以往研究結果,構建大學生多級別心理壓力智能預測模型,此模型操作流程具體設定如圖1所示。
按照圖1設定流程,本次研究將決策樹劃分為系統樹、主樹以及子樹,通過三層決策樹對大學生心理數據進行預測,并得到最終的大學生多級別心理壓力預測。整理上述內容,將其有序連接,至此,基于多源數據整合的大學生多級別心理壓力智能預測方法設計完成。
4 實驗論證分析
4.1 實驗準備
本次實驗在對大量心理測試案例進行分析后續,將本次研究中需要采集的大學生心理多級別壓力預測數據劃分為個人智力、情緒健康、意志健全、人格完整、自我評價正確、人力管理良好、社會關系正常7個方面。為保證本次實驗具有較為可信的實驗結果,選擇某高校的部分學生作為實驗志愿者,獲取20位學生的原始心理健康指數,構建原始數據集,具體內容如表1所示。
對表1中數據進行多次迭代運算,得到以上7種指標的數據整合中心,如表2所示。
綜合分析上述數據后,將原始樣本的心理壓力劃分為3個層級,具體層級劃分結果如下:
I級:A05、A06、A07、A11、A12、A15、A20
Ⅱ級:A03、A04、A08、A010、A16、A17、A18、A01、A02
III級:A09、A13、A14、A19
將上述數據作為此次實驗的數據基礎,并使用文中方法、基礎方法以及人工智能方法對實驗樣本心理壓力進行等級預測,確定不同方法的預測能力與應用效果。
4.2 數據整合精度實驗結果分析
使用不同方法對獲取到的原始數據進行整理,并分析不同方法應用,不同指標整合精準度,具體實驗結果如表3所示。
分析表3中數據可以看出三種方法使用后,所得數據整合結果具有較大的差異。文中方法使用后,各個指標數據的整合精度得到明顯的提升,此方法整合后的數據整體質量較高。基礎方法可對部分數據進行高質量整合,無法對整體數據進行整合,使用此部分數據所得預測結果可靠性較差。人工智能技術在一定程度上緩解了基礎方法的不足,但其應用效果無法與文中方法相比,因此在日后的研究中還需對其進行優化,以此提升此方法的數據處理能力。
4.3 大學生心理多層級壓力預測準確性實驗結果分析
應用不用方法的預測過程,所得預測結果如下所示:
文中方法預測結果:
I級:A05、A06、A07、A11、A12、A15、A20
Ⅱ級:A03、A04、A08、A010、A16、A17、A18、A01
III級:A09、A13、A14、A19、A02
基礎方法:
I級:A05、A06、A07、A11、A12、A15、A20
Ⅱ級:A08、A010、A16、A17、A18、A02
III級:A09、A13、A14、A19、A03、A04、A01
人工智能方法:
I級:A05、A06、A07、A11、A12、A15、A20
Ⅱ級:A03、A04、A08、A010、A16、A17、A18、A01、A02、A14、A19
III級:A09、A13
分析上述內容可以看出,三種方法的預測結果與預設的心理壓力分級結果存在不同,但文中方法對預設方法較為接近。為了更好地對上述結果進行分析,使用以下公式確定不同方法的預測準確率:
其中,i表示正確預測結果;?灼all表示全部預測結果。應用此公式可以發現,文中方法的預測準確率為97.50%;基礎方法的預測準確率為89.0%;人工智能方法的預測準確率為92.3%。由此部分數據可以確定,文中方法的預測結果具有較高的可信度。綜合上述實驗結果可知,文中方法的應用效果優于其他兩種方法,其具有較高的數據處理能力。
5 結束語
針對大學生多級別心理壓力預測過程中,數據量較大、類別較為復雜,且預測方法數據處理能力不佳,導致預測結果可靠性較差的問題,提出應用多源數據整合技術的新型預測方法。此方法經實驗證實,其應用效果優于當前可應用預測方法。但本次研究數據樣本較少,所得結果不具備普遍性,在日后的研究中還需增加數據樣本,對此方法進行大規模測定,以保證其符合當前心理測試要求。
——————————
參考文獻:
〔1〕王樣,胡雨含,周楚雯,等.基于KANO模型和PCSI指數的大學生心理健康服務設計研究[J].包裝工程,2023,44(06):84-93.
〔2〕徐偉華,黃旭東,蔡可.基于粒計算的多源信息融合方法綜述[J].數據采集與處理,2023,38(02):245-261.
〔3〕林艷飛,龍媛,張航,等.基于XGBoost的多種生理信號評估心理壓力等級方法[J].北京理工大學學報,2022,42(08):871-880.
〔4〕家曉余,張宇馳,邱江.思維模式對大學生情緒健康的影響:壓力知覺和心理韌性的鏈式中介效應[J].西南大學學報(社會科學版),2022,48(04):202-209.
〔5〕朱逢樂,嚴霜,孫霖,等.基于深度學習多源數據融合的生菜表型參數估算方法[J].農業工程學報,2022,38(09):195-204.
〔6〕張書欽,白光耀,李紅,等.多源數據融合的物聯網安全知識推理方法[J].計算機研究與發展,2022, 59(12):2735-2749.
〔7〕王東方,孫夢,歐陽萱,等.簡版社區心理體驗評估測評大學生的效度和信度[J].中國心理衛生雜志,2022,36(02):172-178.
〔8〕黃伍,龍文浩,劉鑄,等.多維度智能心理測評系統[J].計算機應用,2021,41(S2):192-197.
〔9〕王姝,任玉,關展旭,等.基于差異信息量的多源數據融合方法[J].東北大學學報(自然科學版),2021, 42(09):1246-1253.