吳 霞,石 蕾,陳志龍,謝曉玲,潘慧珍,余惠琴*
(1.廈門醫(yī)學(xué)院,福建 廈門 361023;2.廈門醫(yī)學(xué)院附屬第二醫(yī)院,福建 廈門 361021)
客觀結(jié)構(gòu)化臨床考試(Objective Structured Clinical Examination,OSCE)是1975 年由英國鄧迪大學(xué)的學(xué)者首先提出并應(yīng)用的,又稱為多站式臨床考試[1]??陀^結(jié)構(gòu)化臨床考試由一定數(shù)量模擬臨床情景的考站組成,受試者在規(guī)定時間內(nèi)依次通過各個站點的考核,可用于評價醫(yī)學(xué)生臨床綜合能力[2]??陀^結(jié)構(gòu)化臨床考試被國內(nèi)外高校和臨床廣泛應(yīng)用于醫(yī)學(xué)教育(如內(nèi)科護理學(xué)、骨科學(xué)教學(xué))和臨床培訓(xùn)(如醫(yī)生培訓(xùn)、護士培訓(xùn))等領(lǐng)域,評價醫(yī)學(xué)生和實習(xí)生臨床綜合能力與評判性思維,是被國內(nèi)外普遍認可的考核方式[3-7]。但由于成本效益、文化差異、學(xué)校差異等不可控因素,不同國家和地區(qū)的站點數(shù)量、考核內(nèi)容有所差異,目前沒有標準的考核設(shè)置,考核的信效度評價等也不盡相同[8]。因此,本研究探討并分析客觀結(jié)構(gòu)化臨床考試在我校健康評估課程中的應(yīng)用效果,并對其信效度、難度等進行評價。
2019 年2 月至2021 年2 月,選取我校192 名2018 級、152名2019 級護理專業(yè)本科生,共344 名學(xué)生為研究對象。
OSCE 設(shè)置3 個考核站點,站點一:病史采集站點,即問診站點,標準化病人由專業(yè)課教師擔(dān)任。站點二:體格檢查站點,包括腹部觸診、聽診,心臟聽診,肺部聽診等內(nèi)容。該站點共9項操作,學(xué)生隨機抽取一項完成,標準化病人由同組學(xué)生擔(dān)任。站點三:護理診斷站點,學(xué)生從教師準備好的案例(共4 個)中隨機抽取一個作答。每個站點的考核時間均為8 分鐘,考核前將學(xué)生按照學(xué)號每4~6 人分為一組,小組參加考核的時間共24分鐘,見表1。

表1 OSCE 站點設(shè)置Table 1 OSCE site settings
1.3.1 評分者的信度評價 為了保證不同評分者評分結(jié)果的一致性,在考核前一周對6 名評分教師進行培訓(xùn),培訓(xùn)內(nèi)容包括評分表的使用方法和評分標準,對有異議的部分進行討論并統(tǒng)一標準,最大程度減少人為誤差,保證同質(zhì)性。
1.3.2 OSCE 各站點的信度 采用Cronbach′s α 系數(shù)評定各站點及OSCE 總體信度,并計算各站點得分與總分之間的相關(guān)系數(shù)。
1.3.3 OSCE 的重測信度 以2018、2019 級護生各站點成績與總分計算相關(guān)系數(shù)。
1.3.4 OSCE 的效度 以2018、2019 級護生的理論期末考試成績評價其校標效度。
1.3.5 OSCE 的難度與區(qū)分度 以主觀試題分數(shù)計算考核難度,即考核難度=平均得分/滿分;考核區(qū)分度=2×[高分組(前26%的學(xué)生]平均分- 低分組(后26%的學(xué)生)平均分]/試卷滿分。
采用SPSS 23.0 軟件進行統(tǒng)計學(xué)分析,計量資料服從正態(tài)分布時以(±s)表示,計數(shù)資料以百分比表示。信度采用內(nèi)部一致性檢驗測量,以Cronbach′s α 系數(shù)表示;以O(shè)SCE 成績與課程總成績的相關(guān)性(r)評價OSCE 的校標效度。以α=0.05 為檢驗水平,P<0.05 表示差異有統(tǒng)計學(xué)意義。
2018 級OSCE 合格率為86.46%,總分為(68.80±8.92)分;2019 級OSCE 合格率為76.32%,總分為(67.14±10.85)分。2018 級和2019 級整體合格率為81.39%,總分為(68.07±9.84)分,各站點得分情況見表2。
表2 學(xué)生OSCE 成績(±s,分)Table 2 Students′ scores of OSCE(±s,score)

表2 學(xué)生OSCE 成績(±s,分)Table 2 Students′ scores of OSCE(±s,score)
年級病史采集體格檢查2018 級2019 級合計69.44±10.65 59.99±14.86 65.27±13.51 69.83±8.63 81.41±13.05 74.95±12.23護理診斷67.19±20.05 61.42±23.45 64.64±23.94 OSCE 總分68.80±8.92 67.14±10.85 68.07±9.84合格率(%)86.46 76.32 81.39
2.2.1 OSCE 信度檢驗結(jié)果 內(nèi)部一致性檢驗結(jié)果顯示,OSCE的Cronbach′s α 系數(shù)為0.476,提示其內(nèi)部一致性可信。其中護理診斷站點的信度最高為0.735[9]。OSCE 的重測信度系數(shù)為0.099,各站點信度及重測信度系數(shù)見表3。

表3 OSCE 各站點信度及效度檢驗結(jié)果Table 3 Reliability and validity test results of OSCE sites
2.2.2 OSCE 效度檢驗結(jié)果 以O(shè)SCE 成績與期末理論考試成績的相關(guān)性評價OSCE 的校標效度。結(jié)果顯示,OSCE 總分與期末理論考試總分的相關(guān)系數(shù)為0.203(P<0.001),且各站點得分與期末理論考試成績均顯著相關(guān)。其中護理診斷站點得分與期末理論考試總分的相關(guān)性最強(r=0.825,P<0.001)。各站點得分與期末理論考試總分的相關(guān)性見表3。
OSCE 的難度指數(shù)為0.65~0.75,整體難度指數(shù)為0.68。根據(jù)國家醫(yī)學(xué)考試中心的標準,難度指數(shù)<0.4 屬于難,0.4~0.8屬于中,>0.8 屬于易[10]。因此,本次考核的整體難度屬于中等水平。OSCE 的區(qū)分度為0.70~0.75,整體區(qū)分度為0.73。區(qū)分度>0.4 說明試題的區(qū)分能力和鑒別能力好,0.3~0.4 為區(qū)分度良好,但修改后更佳,所以本次考核整體區(qū)分度和鑒別能力好[11](見表4)。

表4 OSCE 各站點的難度及區(qū)分度Table 4 Difficulty and discrimination of OSCE sites
本研究結(jié)果顯示,344 名護生OSCE 整體合格率為81.39%,總分為(68.07±9.84)分。其中,2018 級合格率和總分均高于2019 級,可能和該屆生源質(zhì)量更好有關(guān)。盡管護生OSCE 合格率較高,但護理診斷站點得分最低,表明其健康評估技能掌握較好,但臨床思維和評判性思維能力不強。
OSCE 被廣泛用于臨床護理綜合能力及評判性思維評價,評價對象包括實習(xí)護士和在校護理專業(yè)、助產(chǎn)專業(yè)學(xué)生,但由于各高校的資源和文化差異,站點考核內(nèi)容及項目數(shù)量不同,沒有統(tǒng)一評價標準,需要探索更加便捷、客觀、科學(xué)的評價方式,因此考核的信效度極為關(guān)鍵[12-16]。目前,我國OSCE 在護理領(lǐng)域的應(yīng)用仍處于摸索階段,需要廣泛而有效地開展相關(guān)研究。本研究采用嚴謹?shù)难芯糠椒ㄌ接懞头治鯫SCE 在健康評估課程中的應(yīng)用效果。檢驗結(jié)果顯示,OSCE 的Cronbach′s α 系數(shù)為0.476,提示該考核形式的內(nèi)部一致性基本可信,低于國內(nèi)OSCE 信度水平,可能與本次考核的站點數(shù)量少、測試時間較短、項目設(shè)置不成熟有關(guān)[17-19]。一般認為,信度主要受站點數(shù)量和質(zhì)量影響,站點數(shù)量越少結(jié)果越容易受試題偶然性的影響,未來應(yīng)增加考核站點,細化考核內(nèi)容[20]。同時,由于兩個年級不是同一組受試者,護生操作差異也導(dǎo)致重測一致性較低。由于時間和空間的限制,未能在兩周內(nèi)對同一批護生進行再次考核以檢驗重測信度,這也是本研究的不足。效度是評價考核有效性的指標,國內(nèi)關(guān)于OSCE 效度的研究較少,而理論考試又是檢驗學(xué)生知識掌握情況最常用的方式,因此本研究以O(shè)SCE 成績與理論考試成績的相關(guān)性評價OSCE 的校標效度。結(jié)果顯示,OSCE 總分與理論考試總分的相關(guān)系數(shù)為0.203,其中護理診斷站點的相關(guān)性最高,相關(guān)系數(shù)為0.825,提示該考核站點的校標效度較好。
試題的難度及區(qū)分度是評價試題內(nèi)容的重要指標,也是評價試題質(zhì)量的重要依據(jù)。本次OSCE 難度指數(shù)為0.65~0.75,整體難度指數(shù)為0.68。提示各站點難度波動幅度不大,均在合適的水平。本次OSCE 區(qū)分度為0.70~0.75,整體區(qū)分度為0.73。說明其區(qū)分度較高,適用性較強,與韓麗炘等[21-22]的結(jié)論一致。本研究也發(fā)現(xiàn),OSCE 不僅可以有效提高本科護生的實踐能力和臨床思維能力,而且可以提高其臨床綜合能力。此外,本次OSCE 的試題內(nèi)容及質(zhì)量較好,值得推廣。
健康評估對護生臨床思維能力要求很高,雖然OSCE 可以縮短臨床實踐和理論教學(xué)的距離,提高護生綜合能力、溝通能力,增強護生學(xué)習(xí)動機,但在我國仍處于摸索階段,尚存在很多不足,未來仍需要持續(xù)改進[23-24]。
3.4.1 標準化病人不“標準”與胡春玲等[25]的研究結(jié)果相似,本研究發(fā)現(xiàn)完整而系統(tǒng)的OSCE 除了需要設(shè)置考核站點外,標準化病人也是其重要組成部分,但本次OSCE 的標準化病人分別由教研室專業(yè)課教師和本班學(xué)生擔(dān)任。健康評估課程作為護理學(xué)專業(yè)的一門橋梁課程,涉及內(nèi)容廣泛,學(xué)生不僅要學(xué)習(xí)基礎(chǔ)知識而且要具備臨床思維。教師擔(dān)任標準化病人很容易從專業(yè)角度去考核,學(xué)生則由于專業(yè)知識不足而不能做出準確且真實的臨床反應(yīng),從而影響OSCE 的專業(yè)性和精準性。因此,未來需要培養(yǎng)更多高質(zhì)量的標準化病人或引進高級模擬人,從而提高OSCE 的整體質(zhì)量和應(yīng)用效果[26-28]。
3.4.2 考核站點數(shù)量過少 考核站點的數(shù)量是OSCE 的根本,數(shù)量過多或過少均會影響考核質(zhì)量,但目前對站點數(shù)量尚無統(tǒng)一標準。由于本次考核站點過少導(dǎo)致偶然性較大,未來還需加以改進以提高其信度。此外,本次考核以小組為單位,未能對每個護生進行考核、評價,這也是本研究存在缺憾之處。未來將改進考核方式,爭取做到精準考核,保證學(xué)生人人過關(guān)。
3.4.3 未進行閉環(huán)反饋 考核結(jié)束后,未進行閉環(huán)反饋,不了解護生是否滿意或接受本次OSCE。未來還需要對護生進行調(diào)查,了解其對OSCE 的評價和滿意度,收集其意見,提高OSCE 質(zhì)量及適用性。我校于2019 年開始招收助產(chǎn)專業(yè)本科生,迄今已有3 年,未來考慮將OSCE 應(yīng)用于助產(chǎn)專業(yè)本科生,以評價其適用性。
我校內(nèi)科護理學(xué)教研室于2017 年春季學(xué)期首次引進并啟動OSCE。健康評估是一門連接基礎(chǔ)課程和臨床課程的橋梁課程,涉及大量基礎(chǔ)醫(yī)學(xué)知識和人文知識,其中應(yīng)用于臨床實踐的各種臨床護理技能訓(xùn)練尤為重要,而OSCE 是國內(nèi)外普遍認可的考核學(xué)生各項臨床護理技能的有效方式。本研究發(fā)現(xiàn),OSCE 在我校健康評估課程中的應(yīng)用效果較好,可用于分析和評估本科護生臨床護理能力和評判性思維,值得推廣。此外,該考核模式不僅能為健康評估等課程教學(xué)評價提供理論依據(jù),還能為護理專業(yè)課程教學(xué)評價方法改革和教學(xué)質(zhì)量提升提供一定參考。