董旻曄 ,賈芷瑩 ,董圣潔 ,施貞夙, ,李國紅
1. 上海交通大學公共衛生學院,上海200025;2. 上海交通大學中國醫院發展研究院衛生技術評估研究所,上海200025;3. 上海唯晶信息科技有限公司,上海 200025
超過30%的中國大學生存在心理障礙,大學生自殺和傷害他人的行為大多與心理危機有關[1]。學校是學生活動的主要場所,危機干預預防和處理工作的開展,有賴于學校心理健康服務人員。然而,他們往往缺乏必要的應對危機問題的專業知識和能力[2],無法及時有效地向主動尋求幫助或需要幫助的學生提供服務[3]。一項針對全國1 117名學校心理健康服務人員的調查[4]顯示,24.3%的高校心理健康服務人員和38.9%的中小學心理健康服務人員未在國內專業機構學習過心理健康相關理論課程。在我國心理健康服務人員中,自評勝任特征水平達“比較符合”的人不足半數,占比僅為44.8%[5]。
基于情境學習理論和在線模擬技術開發的情境互動在線課程對于提高學習者危機干預技能具有良好的效果[6]。在線學習平臺記錄的大量學習行為數據也為學習效果評估和技能發展策略制定提供了更多的數據支持。然而,紙筆測驗、自我報告問卷等傳統測驗方法較難真實地反映學習者在模擬環境下對技能的掌握情況。研究認為,學習者在學習過程中為了解決問題而進行的一系列操作和行為也是一種學習表現[7],而不同學習者解決問題的策略是不同的[8]。與完全獨立于學習系統外的測驗(如前后測)不同,序列模式挖掘(sequential pattern mining,SPM)是專門利用從教育環境(如Moodle學習管理系統)收集的日志數據(log data)來發現、分析教學過程的一種數據挖掘方法[9]。可通過對學習過程的分析,識別不同學習者的學習行為模式。
因此,本研究以對心理健康服務人員進行情境互動式心理危機干預在線培訓為例,探索SPM方法在心理衛生領域的應用。利用在線學習平臺記錄的學習日志數據對其進行學習行為模式的分析,并結合活動圖(activity diagram)對學習路徑進行可視化,分析導致不同學習績效的關鍵因素,從而提出具有針對性的危機干預技能發展策略。
研究對象為參與心理危機干預在線課程的有效學習者,共計104名上海市心理危機干預示范點的心理健康服務人員。分析相似群體的學習行為,可以得到較為長期的、穩定的特性,綜合反映一個群體的特征[10]。由于參與學習的心理健康服務人員在年齡、性別、專業背景的分布上存在不均衡,因此本研究以最終的學習績效作為不同群體的分組標準。
根據學習效果多元評價得到學習者危機干預六步法單項技能得分[6],并結合熵值法[11]計算得到危機干預綜合技能評價得分(K)。以K得分前27%的學生作為高績效組(high-performance group,HG),后27%作為低績效組(low-performance group,LG),中間的46%作為中績效組(medium-performance group,MG)[12]。分組后各組K得分情況如表1所示。

表1 3組績效組綜合技能評價得分(K)Tab 1 Comprehensive learning performance scores of three groups
數據來源于學習者的操作日志數據,存儲于Moodle學習平臺的MySQL數據庫中,日志數據記錄了學習者所有信息和操作行為,包括學習者標識符(user ID)、標識每次點選操作的事件標識符(event ID)、標識不同課程集數的課程標識符(course ID)、在所有關鍵節點上的選擇情況(item code)及對應的時間戳(timestamp),分別保存在不同的關系型數據表中。
危機干預六步法是一種實用的系統式框架,可在實施危機干預時,用于指導危機評估、干預的策略和步驟[13]。課程共有5個完整的危機干預任務(5集),均依據危機干預六步法框架進行設計。來訪者的危機事件包括人際關系、學業問題、親人過世、家庭結構改變以及被診斷重大疾病。
學習者通過角色扮演,以咨詢師的身份與來訪者互動,對來訪者進行危機干預。在每個咨詢的關鍵節點,設置3~4個不同得分的可供選擇的響應策略,對應咨詢師不同的語言或非語言行為,進而觸發來訪者不同的反應(如哭泣、生氣等)。當學習者在實施危機干預的過程中表現過差,超過事先設定的容忍度,即可能造成來訪者情況惡化,課程會為學習者提供特定的反饋,并要求其重新返回指定位置進行學習。一旦學習者完成了整個咨詢進程,即來訪者的危機狀態解除,表示學習任務結束,記為一次完整的學習記錄。
1.4.1 頻繁序列集生成 為了適應算法,需對日志數據進行記錄篩選及格式轉化。篩選需要的字段及記錄形成導航數據(navigation data),并按課程使用Python將導航數據轉換為作答序列的橫表格式,其中TRUE表示在某時間戳上用戶點選了該項,FALSE表示未點選。該表數據用于適應SPM分析,產生不同學習績效分組的學習者各自的高頻序列集合。
1.4.2 SPM SPM可以從學習者序列數據中尋找特定群體的頻繁子序列,分析不同學習績效的學習者的學習行為模式并提出解決策略[14]。本研究中采用廣義序貫 模 式(generalized sequential pattern,GSP) 算 法 對學習者的學習行為模式進行分析。分別計算每1集中3組不同學習績效水平的學習者的頻繁序列集合。支持度(support)是指支持該序列模式的學習者人數的百分比[15],如某序列的支持度為0.5,即表示50%的學習者的學習序列中出現了該序列。GSP算法將超過預設最小支持度(minimum support)的序列識別為頻繁序列。由于課程的每1集均為一個獨立的問題解決過程,因此以集為單位,為不同學習績效水平的學習者設定1個相應的最小支持度,使各集間的高頻序列數相近,以生成頻繁序列集。
1.4.3 活動圖繪制 根據統一建模語言(unified modeling language,UML)繪制活動圖[16],對不同學習績效群體的危機干預實施路徑進行可視化,直觀地描述學習者模擬實施1次危機干預的過程,從而對影響學習績效的關鍵節點進行分析。
1.4.4 數據處理 利用DBeaver 4.3.0數據庫管理工具對MySQL 5.3.8數據庫進行訪問、記錄篩選和數據處理;在Jupyter Notebook 6.0.2(Python 3.6.5)程序中調用pandas、numpy、csv模塊進行數據格式轉換;采用RapidMiner 9.0軟件進行序列模式挖掘分析。
納入分析的心理健康服務人員共計104人,年齡為(36.07±7.35)歲,工作年限為(11.52±7.66)年。其中,女性占90.38%(94/104);33.65%(35/104)的心理健康服務人員擁有心理咨詢師資質;2.88%(3/104)的心理健康服務人員學歷為??茖W歷,76.92%(80/104)為本科學歷,20.19%(21/104)為碩士研究生學歷;27.88%(29/104)的心理健康服務人員專業背景為心理學,62.50%(65/104)為教育學,9.62%(10/104)為其他(包括臨床醫學、語言學、公共衛生、電氣技術)。
通過MySQL語言對log data進行記錄篩選,生成作答序列導航數據(表2)。并通過Python對其進行格式轉換,生成作答序列導航數據橫表(表3)。

表2 作答序列導航數據(示例)Tab 2 Navigation data (examples)

表3 作答序列導航數據橫表(示例)Tab 3 Horizontal format of navigation data (examples)
以橫表格式的數據作為算法輸入數據。生成的頻繁序列集(示例)以及各集學習者的高頻序列集包含的序列數分別如表4和表5所示。

表4 學習者高頻序列集(示例)Tab 4 Learners′ sequential patterns (examples)

表5 各集不同學習績效學習者高頻序列集合中的序列數Tab 5 Frequent pattern numbers in each episode of different performance learners
由表5所示,由于A集和D集學習者的高頻序列數較少,因此當最小支持度設為0.7時可獲得與其他集次相近的高頻序列數。根據預設標準確定各集的最小支持度,生成各學習績效水平組的頻繁序列并進行計數。在5集課程中,3組不同績效特征的學習者高頻序列的數量排序均為:高績效組>中績效組>低績效組。
根據危機干預六步法,將整個危機干預過程劃分為6個部分。以第1集(A)小學危機干預為例,根據學習者對干預策略的選擇,繪制不同績效學習者在干預關鍵節點的學習路徑活動圖,如圖1所示。

圖1 不同績效群體學習路徑活動圖Fig 1 Activity charts of learning paths of different performance groups
由圖1所示,高績效組學習者在實施危機干預時有多種任務解決路徑,結合其具有最多的高頻序列,說明高績效組具有最多樣化的學習路徑,并且最終都順利完成了整個危機干預咨詢進程,因此可以達到較好的學習績效。與高績效組相比,中績效組的學習路徑中缺少“12”這一關鍵節點及前后路徑,在確認安全這一步驟中學習者所掌握的知識和技能出現斷層,導致整個危機干預進程不完整。此外,中績效組在“8”“18”“22”(分別對應危機干預六步法的確定問題、提供支持和制定計劃3個步驟)這幾個關鍵節點的可用路徑較少,也是導致其整個危機干預進程完整性較差的原因之一。因此,雖然中績效組最終完成了危機干預任務,但其績效表現仍有進步的空間。而低績效組的學習路徑,僅有2條高頻序列,可能是由于學習者業務能力及專業知識較為薄弱,因此在進行確定問題這一步驟后,無法繼續向下進行,最終導致咨詢進程的失敗。以上結果表明,針對不同學習績效的學習者,應根據其學習特點制定相應的技能發展策略。
序列模式分析最早應用于分析消費者的超市購物籃數據[17],后被廣泛應用于電子商務、生物信息、在線學習、網頁點擊流等諸多具有典型序列特征數據的領域[18-19]。近年來,越來越多的研究開始探索臨床教育與模擬技術、在線學習的結合,而通常采用的評估方式仍為傳統的紙筆測試[20],其可用于測量和評估,但對能力發展的借鑒意義較為有限。本研究中,不論是在線學習過程還是危機干預六步法均具備一定的順序模式,除了培訓前后的知識測試,利用海量的學習行為數據,對參與危機干預六步法學習的心理健康服務人員的學習結果進行分析,可以從過程角度對學習者的學習情況進行評估并制定有效的改進策略。
本研究采用GSP算法對不同學習績效的學校心理健康服務人員的學習過程進行SPM分析,結合對學習路徑的可視化結果,發現不同學習績效的心理健康服務人員在頻繁序列集及學習路徑上存在顯著的差異。高績效組學習者的頻繁序列集有最多的序列數,且在順利完成整個咨詢進程的基礎上,高績效組學習者具備多樣化的學習路徑,從而可以為有效解除來訪者的危機狀態提供更多的可能。
從任務解決角度來看,可能是由于高績效組學習者在工作經驗和專業知識方面具有更好的優勢,從而可以在規定的時間內成功解除模擬來訪者的危機狀態。從課程學習角度來看,可能是由于高績效組學習者通過對情境中不同危機干預策略的選擇,領悟到自己實踐中是否也存在同樣的問題,并在此基礎上探索不同的危機干預策略,最終解除來訪者的危機狀態。
高頻學習序列集合可以代表某個群體內大多數學習者的學習趨勢特點,這些特點會受到學習者本身認知結構、學習風格、個人特質的影響,因此對不同特點的學習者的序列模式進行分析可以幫助培訓者深入了解不同學習特征學生的學習路徑和問題解決策略,從而采取有針對性的措施實現低績效學習者向高績效學習者、“新手向專家”的轉變。
Shih等[14]通過分析任務游戲應用程序的日志數據,探究高績效和低績效的學生行為模式的區別。Taub等[21]開發了一個學習環境,探索了高績效和低績效學習者的學習序列情況。這些研究通過對不同特征群體的學習者的序列進行分析,從而提出針對性的改進策略。相比于比較學習前后相關指標的傳統評估方式,對過程性的行為分析,能更好地發現學習者及培訓內容本身的缺陷,對于相關技能的發展更具參考意義。
對于參與本次學習的學校心理健康服務人員來說,比較不同績效組學習路徑圖的差異可以發現,在危機干預進程中,幾個特定的節點及其所對應的危機干預六步法步驟,尤其是確認安全與否是決定危機干預成功與否的關鍵因素。對于學校心理健康服務人員來說,明確處于危機當中學生所面臨的問題、保障其人身安全并與其建立良好的溝通關系非常重要。因此在后續的學習和培訓中,需要在這幾項步驟上予以重點關注。在課程和培訓設計時,需要在危機干預六步法上給予更多的反饋,從培訓者的角度幫助學習者克服弱點;對于學習者自身而言,在今后遇到相似問題時,也可以有意識地避免出現相同的錯誤,從而實現相關技能的提高。