許惠惠
(山西藥科職業(yè)學(xué)院器械工程系,太原 030031)
大學(xué)生心理健康問題是當(dāng)今社會廣受關(guān)注的重要議題之一。在現(xiàn)代社會中,大學(xué)生面臨來自學(xué)業(yè)、人際關(guān)系、未來就業(yè)等多個方面的壓力,這些壓力可能對他們的心理健康產(chǎn)生負(fù)面影響。因此,重視大學(xué)生心理健康問題,提供必要的支持和幫助顯得尤為關(guān)鍵[1]。
目前,全球范圍內(nèi)各個國家對大學(xué)生心理健康的重視程度逐漸增加。越來越多的國家和教育機構(gòu)認(rèn)識到大學(xué)生心理健康的重要性,并采取積極的措施來支持和關(guān)注這一問題。在許多國家,大學(xué)生心理健康已經(jīng)成為教育政策的重要組成部分[2]。中國教育部、衛(wèi)生健康委員會等相關(guān)部門已經(jīng)多次發(fā)布關(guān)于大學(xué)生心理健康的政策文件和指導(dǎo)意見,如《普通高等學(xué)校學(xué)生心理健康教育指導(dǎo)原則》等。這些文件強調(diào)了加強心理健康教育的必要性,要求學(xué)校加強心理健康教育課程的設(shè)置,提供心理咨詢和支持服務(wù),加強心理健康教師隊伍的建設(shè)等[3-4]。
在評估大學(xué)生心理健康時,傳統(tǒng)的方法大多是居于心理健康問卷調(diào)查、心理咨詢和面談、心理測評工具、學(xué)業(yè)成績和行為觀察以及學(xué)生自助工具和在線資源等。然而,這些方法存在一些問題。例如,它們可能無法有效地捕捉復(fù)雜的模式和關(guān)聯(lián)關(guān)系,只能從為數(shù)不多的幾個指標(biāo)中分析出大學(xué)生的一些心理情況,缺乏全局的特征分析。
為了克服這些問題,本文提出了一種基于多分支深度學(xué)習(xí)的大學(xué)生心理健康評估模型。該模型利用先進的深度學(xué)習(xí)技術(shù),結(jié)合多種學(xué)生心理屬性數(shù)據(jù),對潛在的大學(xué)生心理異常狀態(tài)(尤其是抑郁)進行評估和預(yù)測。相比傳統(tǒng)方法,這種模型具有更高的準(zhǔn)確性和實用性,能夠更全面地了解大學(xué)生的心理健康狀況,為學(xué)校和相關(guān)機構(gòu)提供更有效的干預(yù)和支持策略。
本研究旨在構(gòu)建一種基于多分支深度學(xué)習(xí)的大學(xué)生心理健康評估模型,以綜合評估大學(xué)生的心理健康狀況并預(yù)測其心理健康水平。該模型的構(gòu)建理念主要是基于多分支深度學(xué)習(xí)思想,將每種不同的心理特征類型視為獨立的分支,通過并行處理和融合不同分支的特征來獲取綜合的心理健康評估結(jié)果。通過多分支設(shè)計,我們能夠充分利用不同數(shù)據(jù)類型的特征信息,從而提高模型的信息提取能力和預(yù)測準(zhǔn)確性。
該模型的應(yīng)用研究主要包含以下內(nèi)容:首先,利用大學(xué)生的不同類型指標(biāo)心理評估結(jié)果等信息,對其潛在抑郁狀況進行預(yù)測;其次,通過對模型的解釋性分析,我們能深入了解不同心理屬性對心理健康的影響;最后,基于模型對大學(xué)生的心理健康水平進行預(yù)測,提供個性化的心理健康建議和支持,為進一步的研究和干預(yù)提供指導(dǎo)。
由于調(diào)查問卷中數(shù)據(jù)的特殊格式,無法直接用于抑郁癥狀的預(yù)測,所以首先需要對數(shù)據(jù)進行預(yù)處理。
首先,我們需要消除填寫問卷的時間異常短,或者某些測量得分異常的數(shù)據(jù)[5]。如果關(guān)鍵字段的得分為0或者是某種明顯的最大值,這可能表明參與者在填寫問卷時沒有認(rèn)真填寫,我們將這些異常數(shù)據(jù)按學(xué)生刪除,這樣的處理有助于過濾掉未認(rèn)真填寫問卷的異常數(shù)據(jù)。
其次,我們對數(shù)據(jù)中的缺失值進行了補充,檢查心理健康各種屬性數(shù)據(jù)中的缺失值。對于缺失值,我們采用平均值插值的方法對缺失值進行了補充,具體公式如下。
其中,表示第i個缺失值的估計值,Xj表示已知的樣本值,N表示已知樣本的數(shù)量。
為了通過調(diào)查問卷的數(shù)據(jù)預(yù)測學(xué)生的抑郁狀況,我們采用了三分支的深度學(xué)習(xí)模型,如圖1所示。每個分支都被設(shè)計來處理學(xué)生問卷中的一種特定類型的心理特征數(shù)據(jù):積極特征數(shù)據(jù)、負(fù)向特征數(shù)據(jù)和中性特征數(shù)據(jù)。下面簡要介紹模型結(jié)構(gòu)。

圖1 多分支深度學(xué)習(xí)心理評估模型框架
首先,我們構(gòu)建一個全連接神經(jīng)網(wǎng)絡(luò)(fully connected neural network,F(xiàn)CN)分支處理學(xué)生積極特征類數(shù)據(jù)[6-7]。這類數(shù)據(jù)包括了參與者的聰慧性、責(zé)任性、敢為性、獨立性和自律性。根據(jù)研究表明,高聰慧性增加壓力和期望,高責(zé)任感導(dǎo)致自責(zé),高敢為性面對挫折,高獨立性可能感到孤獨,高自律性增加壓力,這些積極心理特征對學(xué)生的抑郁情況有潛在的反面作用,而FCN 可以抓取這些積極心理數(shù)據(jù)中的非線性模式,為模型預(yù)測學(xué)生抑郁狀況提供部分信息特征。
其次,我們構(gòu)建了一個隨機森林模型來處理學(xué)生負(fù)向特征心理評估類數(shù)據(jù)。這類數(shù)據(jù)包括學(xué)生的幻想性、世故性、支配性、敏感性、懷疑性、憂慮性和緊張性得分。這些特征是學(xué)生個體心理負(fù)向特征方面的數(shù)據(jù),相比積極心理特征與抑郁癥的關(guān)聯(lián)性更大。較高的幻想性和世故性、較強的支配性、敏感性、懷疑性、憂慮性和緊張性可能與抑郁癥風(fēng)險增加相關(guān)。缺乏社交支持、情緒波動大、過度控制他人、焦慮、敏感、猜疑、憂慮和緊張可能導(dǎo)致抑郁情緒。這些信息深度描繪了學(xué)生的負(fù)向心理狀態(tài)和行為表現(xiàn),由于這些屬性和抑郁性都是作為負(fù)性心理指標(biāo),所以具有高度的預(yù)測價值。隨機森林作為一個非參數(shù)的集成學(xué)習(xí)模型,能夠有效處理各種特征之間的復(fù)雜交互關(guān)系,對心理評估數(shù)據(jù)進行深度分析。
最后,我們構(gòu)建一個新的全連接神經(jīng)網(wǎng)絡(luò)(FCN)分支處理學(xué)生心理中的中性特征數(shù)據(jù)。這類數(shù)據(jù)包括了學(xué)生的合群性、穩(wěn)定性、興奮性和開放性得分。這些特征涉及個體的內(nèi)外向傾向和對新奇體驗的接受程度。它們與抑郁癥之間的關(guān)系可能相對較弱,與處理積極特征類數(shù)據(jù)的FCN 相似,這個FCN 也可以捕獲這些特征之間的非線性關(guān)系,并進一步輔助主要特征提高預(yù)測的準(zhǔn)確性。
以下是該模型的算法表示:
算法:三分支深度學(xué)習(xí)心理評估模型
輸入:學(xué)生的積極特征數(shù)據(jù)X1,消極(負(fù)向)特征數(shù)據(jù)X2,中性特征數(shù)據(jù)X3
輸出:預(yù)測的抑郁狀況Y
步驟:
第一步:初始化模型參數(shù)。
第二步:對每一個訓(xùn)練實例執(zhí)行以下步驟:
①將積極特征數(shù)據(jù)X1輸入到全連接神經(jīng)網(wǎng)絡(luò)(FCN)分支,得到特征表征結(jié)果Y1;將消極特征數(shù)據(jù)X2輸入到隨機森林模型分支,得到特征表征結(jié)果Y2;②將中性特征數(shù)據(jù)X3輸入到全連接神經(jīng)網(wǎng)絡(luò)(FCN)分支,得到特征表征結(jié)果Y3;③拼接整合三個分支的預(yù)測結(jié)果Y1,Y2,Y3,生成綜合預(yù)測結(jié)果Y。
第三步:使用交叉熵?fù)p失來計算預(yù)測結(jié)果Y 與實際值之間的差距。
第四步:使用隨機梯度下降法更新模型的參數(shù)。
第五步:重復(fù)步驟二~步驟四,直到模型收斂,即損失值不再顯著下降或達(dá)到100訓(xùn)練輪數(shù)。
第六步:輸出預(yù)測的抑郁狀況Y。
1.4.1 全連接神經(jīng)網(wǎng)絡(luò)模型(FCN)
全連接神經(jīng)網(wǎng)絡(luò)(FCN)是一種常見的深度學(xué)習(xí)模型,由多個層次的節(jié)點(或稱為神經(jīng)元)組成,每一層的節(jié)點與上一層和下一層的所有節(jié)點都相互連接。這種全連接的方式意味著網(wǎng)絡(luò)可以捕獲輸入特征之間的復(fù)雜關(guān)系。每個節(jié)點都是輸入數(shù)據(jù)的加權(quán)求和,然后通過一個非線性激活函數(shù),如ReLU或sigmoid,得到輸出。
下面是FCN 方法的分步介紹:
(1)輸入層:多層感知機的輸入層接受輸入數(shù)據(jù)x=(x1,x2,…,xn),其中n為特征數(shù)量。
(2)隱藏層:隱藏層的任務(wù)是從輸入數(shù)據(jù)中提取有用的信息。隱藏層的神經(jīng)元將使用權(quán)重和偏置對輸入數(shù)據(jù)進行線性變換,然后通過激活函數(shù)進行非線性變換,得到一個內(nèi)部狀態(tài)值hi:
其中wij和bi分別表示第i個神經(jīng)元的權(quán)重和偏置項。
(3)激活函數(shù):隱藏層的每個神經(jīng)元都會對內(nèi)部狀態(tài)值hi應(yīng)用一個非線性激活函數(shù)g(hi),得到輸出值ai:
常用的激活函數(shù)包括Sigmoid 函數(shù)、ReLU函數(shù)和Tanh 函數(shù)等,本實驗使用ReLU 函數(shù)。ReLU 函數(shù)具有簡單、高效、非線性和正則化等優(yōu)點,因此在多層感知機模型中廣泛使用[12]。
(4)輸出層:多層感知機的輸出層對隱藏層的輸出值ai進行線性變換,得到最終的輸出值y:
除了基本的全連接層和激活函數(shù),全連接神經(jīng)網(wǎng)絡(luò)中使用其他的技術(shù),Dropout 和Batch Normalization來提升模型性能。
Dropout 是一種正則化技術(shù),它在訓(xùn)練過程中隨機忽略(即設(shè)置為0)部分神經(jīng)元的輸出,以防止模型過擬合。
Batch Normalization 是一種歸一化技術(shù),它將每一層的輸入標(biāo)準(zhǔn)化到0 均值和1 標(biāo)準(zhǔn)差,以加速訓(xùn)練過程,并提高模型的泛化能力。
1.4.2 隨機森林
隨機森林(random forest,RF)是一種集成學(xué)習(xí)方法,它結(jié)合了多個決策樹的預(yù)測能力來生成最終的輸出。隨機森林在處理回歸問題時,通過對每個樹的預(yù)測結(jié)果進行平均,產(chǎn)生一個連續(xù)的輸出值。
對于一個給定的訓(xùn)練集D=(xi,yi)N i=1,隨機森林的基本工作流程如下:
首先從D中進行有放回的抽樣(Bootstrap)以產(chǎn)生一個新的訓(xùn)練集,然后在這個訓(xùn)練集上構(gòu)建T個決策樹。
基于以上構(gòu)建的T個決策樹,對于一個新的輸入x,隨機森林的預(yù)測值是所有決策樹預(yù)測值的平均,可以表示為
其中,ft(x)是第t棵決策樹的預(yù)測值。
首先,本文實驗平臺基于英特爾I7處理器、64 GB運行內(nèi)存的超微高性能服務(wù)器,并搭載了8 塊NVIDIA GeForce GTX 3090 顯 卡。操 作 系 統(tǒng)為Ubuntu 16.8。軟件方面,使用基于Anaconda3 5.0.1 軟件包管理系統(tǒng)開發(fā),CUDA 版本為9.0。深度學(xué)習(xí)框架采用PyTorch開發(fā)環(huán)境。
本研究以山西藥科職業(yè)技術(shù)學(xué)院2021 年心理健康測評數(shù)據(jù)為實驗數(shù)據(jù)集。這個數(shù)據(jù)集包含了19 個班級,其專業(yè)包括藥品質(zhì)量與安全、中藥制藥技術(shù)和中藥學(xué)。
本數(shù)據(jù)集基于《卡特爾十六種人格因素測驗》探討了大學(xué)生的16 種人格因素的測試,其中包括實驗設(shè)計中提到的合群性、聰慧性、穩(wěn)定性、支配性、興奮性等16 種人格因素,它整合了重要的人口統(tǒng)計信息以及自我報告的數(shù)據(jù)和心理測試結(jié)果,以全面了解醫(yī)學(xué)領(lǐng)域大學(xué)生的心理狀態(tài)。
我們的目的是基于數(shù)據(jù)集中的三類數(shù)據(jù)類型(積極、消極、中性)對學(xué)生的抑郁情況進行預(yù)測,從中分析學(xué)生各個數(shù)據(jù)屬性和潛在抑郁心理情況的相關(guān)性,從而構(gòu)建學(xué)生的心理健康評估模型。
由于抑郁情況評估任務(wù)為回歸問題,本文使用的評價指標(biāo)包括:
(1)均 方 誤 差(mean squared error, MSE):MSE 是預(yù)測值與實際值之差的平方的平均值。公式為
其中,n是樣本數(shù)量,Yi是實際值,是預(yù)測值。
(2)均方根誤差(root mean squared error,RMSE): RMSE 是MSE 的平方根,更易于解釋,因為它的單位和原始目標(biāo)變量相同。公式為
(3)平 均 絕 對 誤 差(mean absolute error,MAE):MAE 是預(yù)測值與實際值之差的絕對值的平均值。公式為
(4)R 方值(R2Score): R 方值,也稱為確定系數(shù),衡量的是模型的預(yù)測能力。它的取值在0~1 之間,越接近1 表示模型的預(yù)測性能越好。公式為
其中,是實際值的平均值。
對于回歸問題,我們希望MSE,RMSE 和MAE的值盡可能小,而R2的值盡可能大。
為了驗證所提出模型的有效性,本文設(shè)計了以下方法作為對比方法,并進行相應(yīng)的對比實驗:
(1)線性回歸(linear regression):線性回歸是最基礎(chǔ)的回歸算法,其目標(biāo)是找到一條使得預(yù)測值與實際值之間誤差平方和最小的直線[8];
(2)嶺回歸(ridge regression):嶺回歸是一種修改版的線性回歸,通過對系數(shù)的大小施加懲罰來防止過擬合[9]。
(3)決策樹回歸(decision tree regressor): 決策樹回歸是一種非線性回歸方法,它將特征空間劃分為一系列的矩形區(qū)域,對于每個矩形區(qū)域的預(yù)測值為該區(qū)域內(nèi)的目標(biāo)變量的平均值[10]。
(4)支持向量回歸(support vector regression,SVR): SVR 是支持向量機的回歸版本,它嘗試尋找一個超平面,使得所有點到該平面的距離都小于或等于預(yù)設(shè)的值,并且距離超平面最遠(yuǎn)的點盡可能多[11]。
以上算法在本數(shù)據(jù)集上的預(yù)測準(zhǔn)確率見表1。

表1 各模型預(yù)測結(jié)果
從表1可以看出,本文提出的多分支心理健康評估模型在各個指標(biāo)上均優(yōu)于其他模型。本文模型獲得值為0.3 的MSE,說明本文模型預(yù)測的殘差平方和最小,進一步闡明本文模型從其他的屬性特征中挖掘抑郁相關(guān)信息的能力較強。在R2方面,本文模型有最高的確定系數(shù)0.85,說明模型在挖掘各項不同的屬性數(shù)據(jù)上的能力最強,從中成功捕捉到學(xué)生心理抑郁情況的能力最強,而線性回歸模型的R2值最低,為0.72,在解釋變量對結(jié)果的影響的能力最弱,預(yù)測精度相對較低。
圖2是本文方法和對比方法在RMSE和MAE指標(biāo)上的結(jié)果對比,可以看到本文的方法具有最佳的預(yù)測性能。

圖2 不同模型的RMSE(↓)和MAE(↓)結(jié)果對比
為了驗證學(xué)生的不同指標(biāo)對學(xué)生抑郁情況的影響,我們進行了部分屬性的相關(guān)性分析,結(jié)果如圖3所示。

圖3 心理屬性相關(guān)性分析熱圖
首先,我們發(fā)現(xiàn),學(xué)生的憂慮性和緊張性與抑郁癥狀存在正相關(guān)關(guān)系。憂慮性得分越高,對應(yīng)的潛在抑郁情況分?jǐn)?shù)也越高。隨著年齡的增長,學(xué)生可能會面臨更多的學(xué)業(yè)和生活壓力,導(dǎo)致對學(xué)習(xí)和生活的憂慮,這可能會提高抑郁癥的風(fēng)險。同時,緊張性也和抑郁有正相關(guān)關(guān)系,過度的憂慮和緊張導(dǎo)致負(fù)面情緒的積累,增加抑郁的風(fēng)險。抑郁和焦慮常常共同存在,相互影響,形成一種惡性循環(huán)。憂慮情緒增加可能導(dǎo)致抑郁情緒的加重,而抑郁情緒的存在又會進一步加重個體的憂慮和緊張感。
此外,我們發(fā)現(xiàn)責(zé)任感和學(xué)生的抑郁情況也存在相互影響。責(zé)任感較強的個體可能更容易在面對困難和挫折時產(chǎn)生自責(zé)和抑郁情緒。他們可能過分追求完美,對自己的要求過高,當(dāng)無法達(dá)到自己設(shè)定的目標(biāo)時,會感到失望和沮喪。同時,抑郁情緒可能會降低個體對自我責(zé)任的感知,導(dǎo)致其對任務(wù)和義務(wù)的執(zhí)行能力下降。
最后,我們的實驗進一步驗證了積極心理特征中的敢為性與抑郁具有負(fù)相關(guān)性關(guān)系。具有較強敢為性的同學(xué),普遍具有較低的抑郁風(fēng)險。這可能是因為敢為性的同學(xué)更加樂觀和自信,更能夠積極面對挑戰(zhàn)和困難,從而減少抑郁的發(fā)生。
本研究成功開發(fā)出一種基于多分支深度學(xué)習(xí)模型的大學(xué)生心理健康評估工具。通過綜合處理和分析學(xué)生的各項心理咨詢數(shù)據(jù)以及心理評估數(shù)據(jù),能夠有效地預(yù)測他們的潛在抑郁風(fēng)險。
研究結(jié)果表明,本文模型在預(yù)測精度和可靠性上明顯優(yōu)于傳統(tǒng)方法。此外,我們還發(fā)現(xiàn)學(xué)生一些消極心理評估結(jié)果與他們的抑郁狀況顯著相關(guān),尤其是憂慮、緊張和責(zé)任性等因素對學(xué)生抑郁風(fēng)險的影響最為顯著,同時敢為性可以最大程度地減少抑郁風(fēng)險。
總體來看,本研究為深入理解大學(xué)生抑郁癥狀的成因和影響因素,以及設(shè)計更精確和針對性的預(yù)防和干預(yù)措施提供了重要依據(jù)。