吳憶寧,萬穎,胡超越,孫亞男,于長禾
腰背痛是一類嚴重影響患者生活質量的常見病癥,可導致患者運動功能障礙,甚至喪失生活自理能力[1],首要發病因素是軟組織損傷引起的肌筋膜痛,其他常見原因還包括退行性病變及精神因素[2]。研究指出1990—2015年因腰背痛造成的肢體運動功能障礙增加了54%[3],是目前全球范圍內造成運動功能減退的主要原因[4]。中國腰背痛發病率最高的人群為農村人口(64%),其次為教師及工人(50%)[5],可見腰背痛在疾病預防及診治方面是不可忽視且亟待更多研究投入的問題。國內專家對于慢性腰背痛提出了治療共識,包括明確診斷、動態評估、藥物基礎、合理微創、綜合康復、心理治療等六大方面[6]。腰背痛屬中醫“腰痛”范疇,中醫治療包括內治法及外治法,內治法多為中藥口服治療,外治法包含牽引、推拿、針灸、針刀、拔罐、刮痧、理療、中藥外敷、熏蒸等療法[7-8],中醫治療方法對于提高療效、改善患者遠期預后具有良好作用。
結局指標的本質在于反映受試者的健康狀態或狀態變化[9],在臨床研究中不可或缺,但目前臨床試驗存在結局指標選擇、測量及報告缺乏一致性、實用性、規范性等問題,造成同領域的研究結果無法進行合并比較[10],因此需加強同領域研究選擇報告結局指標的同質性和實用性[11-12]。本課題組前期建立了2015—2019年腰背痛臨床研究〔隨機對照試驗(RCT)、隊列、病例系列等〕的數據庫,并依據專家共識開發了腰背痛核心結局指標集及其測量工具集[13],以上研究結果突出了具有腰背痛癥狀的不同疾病所表現出來的共性結局指標,但是并未對不同干預措施(中醫、西醫、中西醫結合)結局指標的異同進行分析比較,結局指標缺少體現干預措施特點的個性內容。因此,本文通過檢索近五年的關于腰背痛的臨床研究,分析及比較中、西醫及中西醫結合治療腰背痛采用不同干預措施的結局指標及測量工具的差異,為未來開展腰背痛相關的臨床試驗、系統評價、指南開發等研究在選擇報告結局指標及測量工具時提供參考。
1.1 文獻檢索策略 檢索Cochrane Library、PubMed、Web of Science、中國知網(CNKI)、萬方數據知識服務平臺(Wanfang Data)、中國生物醫學文獻服務系統(SinoMed)、維普網(VIP)數據庫中關于腰疼的文獻,研究類型為RCT,檢索時間從2017—2021年。由于部分臨床RCT研究可能未在中英文數據庫發表,為避免漏檢灰色文獻,檢索Complementary Medicine Field Trials Register(CRSO)、Back and Neck Review Group Trials Register(CRS)、ClinicalTrials.gov、WHO ICTRP 4個臨床研究注冊平臺,獲取相同時間段內注冊的所有RCT研究。英文檢索詞“low back pain”“back pain”“backache”,中文檢索詞“腰痛”“腰腿痛”“腰背痛”“下腰痛”“尾骨痛”。
1.2 納入及排除標準
1.2.1 納入標準 (1)研究中包括中醫干預措施(針灸、推拿、導引、中藥、理療、功法等);(2)研究中包括西醫干預措施(藥物、手術、微創、康復治療、心理療法等);(3)中西醫結合治療腰背痛的RCT。
1.2.2 排除標準 (1)未找到全文或無法提取完整數據;(2)重復文獻;(3)與本研究主題不相關;(4)未對腰痛、腰背痛、下腰痛等疾病名稱明確定義;(5)病例數不足(n<50);(6)文獻質量過低(改良Jadad評分<1分)。
1.3 數據提取與分析 由兩名研究者按照納入、排除標準獨立篩選文獻,提取資料并進行交叉核對。2017—2019年數據由雙人審核。對納入文獻提取相關資料,包括發表年份、參與國家、干預措施、測量工具及結局指標。
1.4 文獻質量及結局指標評價 采用改良Jadad評分量表對西醫、中醫、中西醫結合治療腰背痛RCT研究進行質量評價,量表包括隨機序列產生、隨機化隱藏、盲法、退出與失訪4個條目,前3個條目評價選項為恰當、不清楚、不恰當,分別計0、1、2分,第4個條目評價為有、無,分別計1分和0分,總分1~3分為低質量研究,4~7分為高質量研究[14]。本研究的結局指標評價采用已發表文獻中使用的6條目結局指標評價標準[15-17],評價結局指標報告條目共6條,分別為:(1)是否明確說明主要結局指標;(2)是否定義主要結局指標;(3)是否明確說明次要結局指標;(4)是否定義次要結局指標;(5)是否闡述所選結局指標的用途或使用方法;(6)是否考慮增強結局指標的質量或結局指標的更新,符合相應條目得1分,不符合得0分,通過相加單條目得分得到結局指標報告總分,滿分為6分,≥5分為結局指標報告完整。
1.5 結局指標分類標準 參考既有的臨床研究核心結局指標集[13,18]制定結局指標的分類標準,將測量結局指標的工具內容劃分為14個結局指標域,分別為疼痛程度、身體功能、整體生活質量、認知功能、情緒功能或幸福感、感知的健康狀況、醫院相關結局、經濟學指標、角色功能、進一步干預、肌肉骨骼和結締組織結局、不良事件或影響、精神病學結局及其他結局。
1.6 統計學方法 使用Excel錄入提取資料,采用SPSS 25.0軟件對提取資料進行描述性分析,計量資料首先采用K-S檢驗分析數據的正態性,非正態分布的數據采用M(P25,P75)表示;計數資料以相對數表示。
2.1 腰背痛臨床研究注冊及發表概況 檢索臨床研究注冊平臺及數據庫,得到已發表的RCT文獻共2 030篇,不同年份西醫、中醫和中西醫結合發表數量見表1,對比既往數據庫[13]未增加新結局指標或測量工具。其中,西醫治療腰背痛的RCT共1 014篇,涉及57個國家及地區,參與國家及地區以中國為多(68.5%),非亞洲國家(美國、加拿大等美洲國家及德國、比利時等歐洲國家)其次(18.6%),后依序為除中國外的亞洲國家(韓國、日本、伊朗等)(7.6%)、其他(2.9%)、除中國外的亞洲國家與其他國家的聯合項目(1.6%)、未明確提及(0.6%)、中國與其他國家聯合項目(0.2%)。中醫/中西醫結合治療腰背痛已發表的RCT文獻共1 016篇(中醫624篇、中西醫結合392篇),參與國家絕大部分為中國(中醫91.7%、中西醫結合85.5%)。中醫治療腰背痛的干預措施主要為針灸治療(33%)、物理治療(19%)及推拿(19%),中西醫結合治療腰背痛的干預措施主要為手術(17%)、運動療法(14%)、針灸治療(12%)及中醫理療(12%)。

表1 不同年份腰背痛臨床RCT發表數量(篇)Table 1 Number of RCTs about low back pain treated with western medicine,traditional Chinese medicine and integrated traditional Chinese and western medicine published during 2017 to 2021
2.2 腰背痛RCT質量評價及結局指標報告情況
2.2.1 腰背痛RCT質量評價 腰背痛RCT Jadad評分總分西醫2(2,4)分、中醫2(2,3)分、中西醫結合2(2,2)分,超過50%的研究Jadad評分總分為2分,超過10%研究Jadad評分為3分(表2),整體研究質量偏低,原因可能與研究設計不規范以及干預措施較難設盲有關。改良Jadad量表單條目評分分布情況顯示,70%以上的研究為隨機試驗但未描述隨機方法(西醫73.3%、中醫80.1%、中西醫結合79.6%),70%以上研究未采用雙盲或盲法不恰當(西醫71.2%、中醫88.0%、中西醫結合87.8%);60%以上研究未描述退出與失訪的數目和理由(西醫64.4%、中醫84.0%、中西醫結合79.6%),見表3。

表2 納入RCT研究改良Jadad評分總分分布〔n(%)〕Table 2 Distribution of the total modified Jadad score of included randomized controlled trials by the type of intervention

表3 納入RCT研究改良Jadad評分單條目評分分布〔n(%)〕Table 3 Distribution of scores for specific items of the modified Jadad score reported in included randomized controlled trials by the type of intervention
2.2.2 腰背痛RCT結局指標報告情況 納入研究中超過80%結局指標評分為1分,第5條為報告頻率最高的條目(西醫97.8%、中醫97.6%、中西醫結合93.6%),報告頻率最低的條目為第6條(西醫0.2%、中醫0.3%、中西醫結合0.8%),而西醫RCT有14.6%的研究總分為5分(表4、5),結果顯示不同干預措施的結局指標報告均不完整、充分。

表4 納入RCT研究結局指標評價結果〔n(%)〕Table 4 Reporting status of outcome indices in RCTs about low back pain treated with western medicine,traditional Chinese medicine and integrated traditional Chinese and western medicine

表5 納入RCT結局指標評價總分分布〔n(%)〕Table 5 Total score of outcome reports in RCTs about low back pain treated with western medicine,traditional Chinese medicine and integrated traditional Chinese and western medicine
2.3 腰背痛臨床研究結局指標及測量工具報告情況
2.3.1 西醫治療腰背痛臨床研究結局指標及測量工具報告情況 西醫治療腰背痛RCT報告的指標數量為1~8個(中位數M=2個),報告的結局指標共239個,涉及71個量表,90個結局指標評價維度(結局域),包含149個實驗室及其他指標。報告頻率前5位的結局域為疼痛程度(28.2%)、身體功能(28.0%)、醫院相關結局(8.0%)、經濟學指標(8.0%)、不良事件/影響(8.0%),評價研究結局使用頻率前3位的量表為視覺模擬評分量表(Visual Analogue Scale,VAS)/口述分級量表(Verbal Rating Scale,VRS)、Oswestry功能障礙指數問卷表(The Oswestry Disability Index,ODI)、日本骨科協會評估治療分數(Japanese Orthopaedic Association Scores,JOA),其他較常使用的量表為生活質量評定量表(Quality of Life,QoL)簡明版(Short Form 12,SF-12)/(Short Form 36,SF-36)、疼痛數值評定量表(Numerical Rating Scale,NRS/NPRS)、Roland-Morris功能障礙調查表(Roland-Morris Disability Questionnaire,RMDQ/RMD)等,見圖1。

圖1 西醫治療腰痛RCT評價結局指標測量工具報告頻次矩形樹狀圖Figure 1 Rectangular tree map of the frequency of measurements in RCTs about low back pain treated by western medicine
2.3.2 中醫治療腰背痛臨床研究結局指標及測量工具報告情況 中醫治療腰背痛RCT報告的指標數量為1~6個(中位數M=2個),報告的結局指標共171個,涉及36個量表,81個結局指標評價維度,其中包括90個中醫療效評價指標,實驗室指標及其他指標共81個。報告頻率前5位的結局域為疼痛程度(45%)、身體功能(27%)、其他(14%)、整體生活質量(5%)、肌肉骨骼和及結締組織結局(2%),主要使用的量表包含VAS/VRS、ODI、簡化McGill疼痛問卷(Shortof McGill Pain Questionnaire,SF-MPQ)、NRS/NPRS、RMDQ/RMD、SF-12/SF-36,其他較高頻使用的結局指標測量工具有日常生活能力評分(Activities of Daily Living,ADL)、腰椎功能測試〔如指地距離(Finger-Floor Distance,FFD)〕及中醫癥候積分和癥狀體征積分,見圖2。

圖2 中醫治療腰痛RCT評價結局指標測量工具報告頻次矩形樹狀圖Figure 2 Rectangular tree map of the frequency of measurements in RCTs about low back pain treated by traditional Chinese medicine
2.3.3 中西醫結合治療腰背痛臨床研究結局指標及測量工具報告情況 中西醫結合治療腰背痛RCT報告的指標數量為1~12個(中位數M=2個),報告的結局指標共141個,涉及36個量表,涵蓋疼痛程度、身體功能、整體生活質量、認知功能、情緒功能/幸福感等維度,包括51個實驗室指標、中醫療效評價指標及其他指標(圖3)。其中報告頻率前5位的結局域為身體功能(39%)、疼痛程度(34%)、其他(9%)、整體生活質量(5%)、肌肉骨骼和結締組織結局(4%),高頻率使用的量表為VAS/VRS、ODI、JOA、SF-12/SF-36、RMDQ及NRS/NPRS,其他使用的測量工具有住院時間、住院費用、影像學測量工具(X線、CT、MRI)、圍術期指標、中醫證候積分及癥狀體征積分等。

圖3 中西醫結合治療腰痛RCT評價結局指標測量工具報告頻次矩形樹狀圖Figure 3 Rectangular tree map of the frequency of measurements used in RCTs about low back pain treated by integrated traditional Chinese and western medicine
2.4 治療腰背痛RCT結局指標及測量工具的應用情況 西醫、中醫或中西醫結合3種類型RCT的干預措施結局指標評價維度皆以疼痛程度與身體功能結局為主,所運用的測量工具集中在VAS/VRS量表(西醫22.16%、中醫32.97%、中西醫結合30.94%)及ODI/中文版ODI(CODI)(西醫15.88%、中醫18.74%、中西醫結合20.07%),見表6。3種類型RCT共有的高頻結局指標及其測量工具為疼痛程度(VAS/VRS)、生理功能(ODI/CODI/RMDQ/RMD)、生活質量(SF-12/SF-36)及影像學結果(X線/CT/MRI)。

表6 納入RCT高頻結局指標測量工具應用情況〔n(%)〕Table 6 High-frequency outcome measurements used in included RCTs
3.1 腰背痛臨床研究結局指標及測量工具報告數量和質量 縱觀2017—2021年發表的腰背痛RCT,干預措施為西醫、中醫或中西醫結合的研究報告結局指標評分,中位數均為2分,單一中西醫結合RCT報告的指標最多12個,指標數量與研究階段相關,研究初期在不確定何種指標臨床效果較突出的情況下,常會選擇較多指標評價療效,但臨床研究中評價受試者結局也會因為使用過多結局指標而增加難度、降低結局數據的可靠性[19],因此并非納入越多結局指標越好[20],而是需要根據研究進展情況考慮是否更新指標或增強指標質量,審慎選擇適合的結局指標。
不同干預措施的結局指標報告情況提示多數研究的指標報告均不完整、充分,總分偏低,依據得分條目可知得分因素主要是提及了結局指標的用途或使用方法,失分原因是多數研究并未對主要結局指標和次要結局指標進行區分和定義;說明如何評定療效是RCT的基本項目[21],因此多數研究無缺失此條目,而區分、定義主要和次要結局指標并非臨床研究的硬性條件,研究者可能因缺乏相關概念而忽略報告相應條目。
3.2 中西醫腰背痛臨床研究中共有的結局指標 考慮中西醫結合治療的干預措施以手術、運動治療結合針灸治療及中醫理療為主,同一研究涵蓋西醫及中醫結局,常同時運用相應西醫或中醫指標域的測量工具,因此未將中西醫結合治療腰背痛的結局指標歸為中醫范疇。研究結果表示,無論是西醫、中醫或是中西醫結合治療腰背痛的RCT,結局指標均包括疼痛程度、身體功能、整體生活質量、認知功能、情緒功能/幸福感、感知的健康狀況、角色功能、進一步干預、肌肉骨骼和結締組織結局、不良事件/影響、精神病學結局及其他結局。腰背痛為臨床常見病,多數患者常于急性期緩解后反復進行性進展[22],嚴重影響日常生活及工作,而腰背痛的治療目標主要為緩解疼痛、恢復功能及預防復發[23]。本研究的結果為腰背痛核心結局指標(Core Outcome Sets,COS)及其測量工具的構建提供文獻基礎,而且本研究結果與國內外構建的腰背痛COS及其測量工具結果相似。國外已建立的COS及核心結局指標測量工具集,主要包含疼痛、身體功能、生活質量、社會參與、安全性及不良反應、心理健康及患者滿意度[18]。現國內初步建立了慢性腰背痛中醫臨床研究的結局指標集,包含疼痛或不適、運動功能、日常生活活動能力、腰部功能障礙、對生活質量的影響和安全性指標等6個結局指標[13]。
3.3 腰背痛臨床研究中醫、西醫不同的結局指標 中西醫有不同的結局指標,與其治療腰背痛的干預措施特點有關。住院時間為西醫RCT對于醫院相關結局獨有的測量工具,由于西醫治療腰背痛的干預措施多為手術治療(53%),西醫RCT使用的指標尚包含醫院相關結局、經濟學指標(8%),在不良事件/影響中使用了圍術期指標測量工具(8%);中醫證候積分/癥狀體征積分為中醫/中西醫結合RCT獨有的測量工具,由于中醫治療腰背痛的干預措施以針灸、推拿及中醫理療為主,不涉及西醫手術治療,因此缺少醫院相關結局、經濟學指標、圍術期指標等結局指標及其測量工具。中西醫在經濟學指標和醫院相關結局報告的差異可能與RCT注冊情況、研究人員認知以及國情有關,中醫RCT幾乎未在臨床研究注冊平臺注冊,缺乏報告規范且中醫從業人員對于循證醫學概念認知不足[24],而納入中醫文獻中超過90%的研究國家為中國,由于在歷史、文化背景和思維方式上與其他國家相異[25],加上醫療保健、衛生經濟學、人文醫療等概念仍在構建與進步中,因此中醫研究在這兩個結局中存在缺失。納入的西醫文獻干預措施以手術為多(53%),因此關于圍術期指標較多,關注了手術治療的安全性。中醫學的特點包含辨證論治,證候則是辨證論治的核心之一,臨床中以改善證候相關的體征和癥狀為治療要點[26],因此中醫證候/癥狀積分作為評價中醫療效的測量工具應用在臨床研究中。目前腰背痛的治療尚缺少構建腰背痛證候積分的框架論述,作為結局指標應用不普遍,使用證候積分的研究仍存在缺乏統一、通用評價標準的問題,且尚未被國內外學術界認可[27]。
3.4 臨床試驗相關結局指標研究的方法學要點 規范結局指標分類標準有利于匯總不同疾病的結局指標,形成較大集合,進行橫向和縱向的比較。如張英等[28]比較了肺炎相關疾病結局指標的異同,發現相同生理病理基礎的不同疾病間存在共性結局指標,而特異性結局指標和疾病特點及干預措施有關,因此可考慮構建相同病種COS,減少研究浪費和使用率低的問題。本研究采用COMET推薦的結局分類標準[29],對不同干預措施報告的結局進行比較和分類,其標準對結局表達一致性較好,且適用于不同疾病,有利于臨床數據分類、報告,減少臨床中因選擇不同結局指標框架使研究難以比較及合并的問題。
經過測量屬性評價的工具才具有臨床應用價值。本研究中使用其他測量工具的研究以中醫為多(西醫5%、中醫9%、中西醫結合6%),大多是臨床較少應用的測量工具,容易造成研究結果間的可比性差,相同結果難以在Meta分析中合并,導致臨床試驗資源未能充分利用;此外,大部分測量工具為自我研制,未經過測量屬性評價,導致評價干預效果存在測量誤差[30]。臨床研究過程中可使用患者報告結局測量工具(Patient-Reported Outcome Measures,PROMs)進行測量工具的測量屬性評價,但目前PROMs存在數量多、不全面、不規范的問題,不利于研究人員選擇及應用。陳千吉等[31]參考基于共識健康測量工具的選擇標準(COSMIN),以ADLS為例歸納出PROMs的選擇路徑,未來臨床研究可參考該路徑,使用可信度好、質量高的PROMs評價,選擇性能佳、適合中國腰背痛人群的量表。
3.5 腰背痛臨床研究中醫結局指標體系構建的設想通過分析文獻中的結局及其測量工具發現,腰背痛臨床試驗中存在疼痛程度、身體功能、生活質量等共性結局,同時手術治療腰背痛的試驗注重圍術期安全性指標,中醫治療腰背痛的試驗注重中醫證候評價等。筆者提出設想,針對患者特定健康狀態的共性結局,可以采用適用于任何干預或對照措施的COS進行評價,針對這部分內容國內外已構建相應的腰背痛COS。針對干預的特點構建干預特色相關的特色結局指標集(Interventionrelated Specific Outcome Sets,In-SOS),即除外COS結局外,針對具有代表性干預措施(如手術、中藥、針灸等)的特色結局的集合,而且目前已經提出了In-SOS相關的研究方法和流程[32]。研究者選擇中醫治療腰背痛的結局指標及其測量工具時,在COS推薦測量結局的基礎上,針對研究對象從In-SOS中選擇最能體現干預療效特色的結局指標,特別是作為主要結局指標。并通過COSMIN(The Consensus-based Standards for the Selection of Health Measurement Instruments)系統篩選合適的測量工具,保證其測量的效度、信度、反應度[33]。這樣研究結果既能突出研究目標干預的療效特點,又能滿足循證醫學對重要結局的要求。
本研究可能存在的偏倚:(1)本研究僅針對近5年文獻開展研究,存在漏檢結局指標的可能,但是近5年文獻研究得到的結果與2015年之前的結局指標評價的文獻得到的結果[34]相同,而且COMET手冊對核心結局指標集中文獻研究的年限設定在2年[35],因此本研究可以較大程度上避免由于漏檢導致的結局缺失。(2)研究對既往2015—2019年腰背痛臨床研究數據庫進行篩選并增加了2020—2021年的數據,2017—2019數據經過雙人審核,更新數據只有一人進行文獻篩選和評價,可能存在主觀偏倚,通過對數據反復核對提高了信度。
綜上所述,2017—2021年發表的腰背痛臨床RCT運用的結局指標及測量工具涵蓋范疇廣,不同研究間選擇指標差異較大,中、西醫在同一結局指標域中使用頻率較高的測量工具略有不同,且各有相異的結局指標。基于上述結果,本研究提出了未來構建腰背痛COS集與干預相關的特色結局指標集的設想,不同干預措施可在COS基礎上選擇體現干預特色的結局指標,滿足臨床試驗對主要結局和重要結局的要求。未來進行的中醫腰背痛臨床研究可擴展不同維度的結局指標,更新結局指標,提高測量工具的測量屬性等。
作者貢獻:吳憶寧完成了數據更新、提取、分析數據,撰寫論文初稿;萬穎參與構建數據庫;胡超越參與課題設計與討論;孫亞男、于長禾提出科學問題、假說,設計課題,參與論文撰寫和修改;于長禾負責監督管理,對論文整體負責。
本文無利益沖突。