馮天笑,李康健,于大偉,孫婉鈺,符碧峰,馮敏山,王平*
神經根型頸椎病(cervical spondylotic radiculopathy,CSR)是由于頸椎間盤組織退變及其繼發性病理改變累及神經根,出現相應節段的上肢放射性疼痛、麻木、無力等臨床癥狀[1]。中國人群頸椎病的患病率高達17.3%[2],且呈年輕化趨勢,嚴重影響患者生活質量。CSR在各型頸椎病中發病率最高,為60%~70%[3]。中醫學認為CSR屬于“項痹病”范疇,作為保守治療的重要組成部分,手法治療可通過放松頸項部肌肉,解除局部痙攣,糾正關節移位與紊亂,調節頸椎內外源性結構穩定,恢復動靜態力學平衡,有效調整“筋出槽,骨錯縫”的病理狀態[4]。近年來,隨著手法治療CSR的臨床研究和循證評價不斷增加,其有效性和安全性逐步被證實[5-6]。以頸椎扳動類手法為代表的研究成果被納入2017年美國物理治療學會發布的《頸痛治療國際循證臨床實踐指南》[7],已獲得國際認可。
隨機對照試驗(randomized controlled trial,RCT)是臨床實踐指南形成推薦意見的基礎證據,是臨床疾病療效評價的金標準[8],目前采用RCT評價手法治療CSR的有效性和安全性的報道較多。選擇合適的結局指標可增加研究一致性、減少選擇性報告偏倚、提高研究質量和價值[9]。目前同類臨床研究結局指標普遍存在不規范、不適用、不公認等問題,影響高質量臨床研究證據產生及循證能力建設[10]。本研究通過分析近十年手法治療CSR的RCT中結局指標的應用情況,分析存在的問題并提出相關建議,以期為該領域臨床研究結局指標的選擇和應用提供參考。
1.1 納入標準 (1)研究類型為手法治療CSR的RCT,且不受語種限制;(2)研究對象為CSR患者;(3)干預措施為任何中醫手法類治療,如手法、推拿、正骨、整脊、按摩等。單用手法或手法聯用其他中西醫干預措施治療的研究均被納入。對照組干預措施不進行限定。納入研究報告中的所有結局指標。
1.2 排除標準 (1)未明確指出研究對象為CSR者;(2)合并有其他類型頸椎病或其他疾病者;(3)篇幅為單頁紙的文獻;(4)關鍵信息缺失、重復報告文獻;(5)中文文獻中非中文核心期刊或科技核心期刊文獻。
1.3 檢索策略 計算機檢索中國知網、萬方數據知識服務平臺、維普網、中國生物醫學文獻服務系統、PubMed、EMBase和Cochrane Library數據庫,檢索手法治療CSR的RCT,檢索時限為2011年1月至2021年5月。追溯納入文獻的參考文獻以補充獲取相關文獻。中文數據庫采用題名或關鍵詞和主題詞相結合的方式進行檢索,檢索詞包括“手法”“推拿”“正骨”“整脊”“按摩”“神經根型頸椎病”“神經根性頸椎病”“項痹”。英文數據庫采用主題詞和自由詞相結合的方式進行檢索,檢索詞包括Massage、Massage Therapy、Zone Therapy、Cervical Spondylotic Radiculopathy、Radiculopathies、Cervical Radiculopathies。
1.4 文獻篩選與資料提取 由2名研究者嚴格按照納入和排除標準獨立篩選文獻、提取資料并交叉核對。如有分歧,則經討論或與第三方協商解決。文獻篩選時首先閱讀文獻題目和摘要進行初篩,排除與研究主題明顯不相關的文獻及非RCT研究,對可能納入的文獻閱讀全文進行復篩。資料提取的內容包括:(1)納入研究的基本信息,包括文獻題目、發表年份、第一作者等;(2)研究對象的基線資料,包括各組患者的樣本量、年齡、性別、病程等;(3)干預措施具體信息,包括干預措施名稱、劑量/頻次、療程等;(4)測量時點;(5)偏倚風險評價的關鍵要素;(6)所有結局指標。
1.5 納入研究的偏倚風險評價 由2名研究者根據Cochrane風險偏倚評估工具[11]評價納入研究的偏倚風險,并分別作出“低偏倚風險”“高偏倚風險”“偏倚風險不確定”的判斷。
1.6 統計學方法 采用定性描述的方法分析以下內容:(1)以指標的功能屬性為依據,將結局指標按照癥狀體征、生活質量、理化檢查、中醫癥狀/證候、安全性事件、遠期預后、經濟學評估7個領域進行歸類,分析納入研究的結局指標分類、報告率、各種結局指標的頻次;(2)主要結局指標測量時點情況;(3)結局指標組合應用情況;(4)有效率指標的應用與參考標準;(5)納入研究的偏倚風險評價。
2.1 文獻篩選流程及結果 初步檢索出相關文獻6 301篇,經逐層篩選,最終納入RCT 66篇[12-77]。文獻篩選流程及結果見圖1。
2.2 納入研究的偏倚風險評價結果 圍繞誤差風險(ROB)工具的7個評價條目評價結果如下:(1)隨機序列產生:41項RCT提及隨機數字表法(39項)、中央隨機系統(2項)被評價為“低偏倚風險”,4項RCT提及就診順序(3項)、單雙號(1項)被評價為“高偏倚風險”,21項RCT僅提及隨機,未明確具體方式,被評價為“偏倚風險不確定”。(2)分配隱藏:3項RCT采用隨機信封進行分配隱藏,被評價為“低偏倚風險”,63項RCT未提及分配隱藏方式,被評價為“偏倚風險不確定”。(3)對患者、試驗人員實施盲法:3項RCT對患者設置盲法,且盲法未破壞,被評價為“低偏倚風險”,63項RCT未提及盲法及實施方式,被評價為“偏倚風險不確定”。(4)對結局評估者實施盲法:1項RCT對結局評估者設置盲法,1項RCT采用客觀性結局指標,被評價為“低偏倚風險”,64項RCT未報告對結局評估者設置盲法,評價為“偏倚風險不確定”。(5)結局數據不完整:50項RCT未報告不完整結局數據,被評價為“低偏倚風險”,16項RCT被評價為“高偏倚風險”。(6)選擇性報告偏倚:66項RCT均無試驗設計方案,被評價為“偏倚風險不確定”。(7)其他偏倚:66項RCT未報告其他偏倚,且無試驗設計方案,被評價為“偏倚風險不確定”,見圖2。

圖2 納入研究的偏倚風險圖Figure 2 Risk of bias assessment for included RCTs
2.3 結局指標
2.3.1 結局指標分類 本研究納入的66項RCT均報告了結局指標,干預措施單用手法治療的有34項研究[15-17,19-22,27-28,35,38-42,45,48,51-53,57-60,63-64,67-71,73-74,76],手法聯合針刺治療的有 9 項[29-30,32-33,43-44,46,50,65],手法聯合牽引治療的有 7 項[25,34,36,47,49,72,75],手法聯合中藥外治法治療的有4項[18,31,66-77],手法聯合中成藥治療的有3項[24,37,61],手法聯合功能鍛煉治療的有3項研究[13,55-56],手法聯合中藥注射劑[62]、微波[23]、脈沖射頻術[26]治療的各有1項研究,手法聯合中成藥及中藥外治法治療的有1項研究[12],手法針刺聯合牽引[54]、西藥[14]治療的各有1項研究。納入的研究共采用59種結局指標,共應用229次。單個研究結局指標最多為9個,最少為1個,平均每項RCT結局指標的數量為3項。根據報告的結局指標的功能屬性將其分為7類,其中生活質量95次、癥狀體征64次、理化檢查39次、安全性事件12次、經濟學評估12次、遠期預后5次、中醫癥狀/證候2次。納入研究的結局指標分類、具體名稱、頻次及報告率見表1。

表1 納入研究的結局指標分類、頻次及報告率Table 1 Categories,frequencies,and reported rate of outcome used in included RCTs

(續表1)
2.3.2 結局指標測量時點、頻次及百分比 使用頻次排名前5位的結局指標測量時點見表2。總有效率指標測量時點范圍為治療后7 d~隨訪6個月,共報告16個測量時點,以測量時點為治療后14 d(27.08%)為主;疼痛視覺模擬評分法(VAS)評分指標測量時點范圍為治療后7 d~隨訪6個月,共報告13個測量時點,以測量時點為治療后14 d(26.67%)為主;NDI評分指標測量時點范圍為治療后1 d~隨訪3個月,共報告12個測量時點,以測量時點為治療后14 d(29.17%)為主;不良反應和不良事件指標測量時點范圍為治療后7 d~隨訪3個月,共報告8個測量時點,以測量時點為治療后28 d(28.57%)為主;癥狀體征積分指標測量時點范圍為治療后14~35 d,共報告6個測量時點,以測量時點為治療后14 d(33.33%)為主。

表2 使用頻次前5位的結局指標測量時點、頻次及百分比Table 2 Measurementtime points,frequency and percentage of five outcomes mostly frequently used in included RCTs
2.3.3 結局指標組合應用情況 27項RCT同時應用4個及以上的結局指標,14項RCT同時應用3個結局指標,20項RCT同時應用2個結局指標,5項RCT應用1個結局指標。在結局指標的選擇中,有3項RCT同時應用VAS評分、NDI評分、SF-36評分及總有效率4個結局指標;有10項RCT同時應用VAS評分、NDI評分及總有效率3個結局指標;有26項RCT同時應用VAS評分及總有效率2個結局指標。頻次≥3次的結局指標組合應用情況見表3。

表3 頻次≥3次的結局指標組合應用情況Table 3 Combined application of outcomes used at least three times in included RCTs
2.3.4 總有效率指標應用現狀 48項RCT報告總有效率指標,其中 22 項 RCT[12,19-20,26,30,32,39,42,45-48,55,57-59,62,64,72-73,75,77]參考《中醫病證診斷療效標準》[78]制定,8 項 RCT[13,23,31,43,49,60,67,71]參考《中藥新藥臨床研究指導原則(試行)》[79]制定,2項 RCT[16,55]參考《第三屆全國頸椎病專題座談會紀要》[80]制定,2項RCT[18,71]參照田中靖久頸椎病20分法評分制定,1項RCT[54]參考《臨床疾病診斷依據治愈好轉標準》[81]制定,1項RCT[38]參考《脊椎病因治療學》[82]制定,1項RCT[34]參考《骨科常見疾病診療經驗叢書:頸椎病及腰腿痛》[83]制定,13 項 RCT[14,24,27-29,40,50-51,56,65,68-69,76]未明確說明參考標準。
隨著骨傷事業的快速發展,提升中醫骨傷科循證研究水平已成為學科建設的重要目標和方向。本研究基于國內外七大數據庫對近十年手法治療CSR的RCT結局指標應用現狀進行分析。通過對納入的66項RCT進行偏倚風險評估,發現納入研究的方法學總體質量不高,如部分研究隨機序列產生方法錯誤、缺少臨床試驗前的注冊方案、無法確定利益沖突和樣本量計算的過程、研究的結果存在發表偏倚、只報告對研究結果有意義的陽性結果、未報告陰性結果等。在RCT的研究設計中,結局指標的選擇是衡量干預措施療效和價值的重要參考依據,選擇不同的結局指標可能會對相同的干預措施得出不同的療效結論。本研究發現,目前手法治療CSR的RCT結局指標的應用存在較多問題。
3.1.1 未區分主要和次要結局指標 RCT研究中,結局指標的主次安排是研究設計的重要問題。一般在療效評價研究中,應將與研究目的關系最密切的結局指標設定為主要結局,以反映主要研究問題及研究實施的優先方向,同時作為樣本量估算的重要依據[84]。通常應將RCT的主要結局指標設置為1個,應用多個主要結局指標易在結果闡釋時產生問題[85]。本研究納入的RCT均未區分主要和次要結局指標,多數為不同結局指標的羅列,普遍缺少針對某個主要結局指標的樣本量計算的內容。單一主要結局指標的設定可以避免解釋多重檢驗假設產生的問題。
3.1.2 更多關注替代指標,輕視終點結局指標 本研究結果顯示,手法治療CSR的臨床療效評價指標多以生活質量、癥狀體征等替代指標為主,如VAS評分、NDI評分、田中靖久頸椎病20分法評分、癥狀體征積分等。對于死亡、殘疾、復發等終點結局指標的報告較少。合格的替代指標應為特定治療與終點結局因果關系鏈上的主要中間介導因素[86]。盡管選擇替代指標可以降低臨床研究所需樣本量、隨訪時間、人力物力消耗等,但是若想更好地說明干預措施的價值和臨床意義仍應在RCT設計中選擇應用終點結局指標。在手法治療CSR的臨床研究中,大量研究難以選擇終點結局指標進行觀測,這在一定程度上限制了高質量證據的獲得,是難以產出高質量臨床研究的主要原因之一。
3.1.3 忽視主觀結局指標應用時的設盲 本研究納入的66項RCT中僅3項RCT提及對患者設置盲法,1項RCT提到對結局評估者設置盲法。在臨床研究過程中通過設置盲法可以將確定和判斷結局時產生的偏倚風險最小化,尤其是對于一些主觀性的評價指標如本研究中出現頻次較高的VAS評分、NDI評分、田中靖久頸椎病20分法評分、頸椎病治療成績評分表、SF-36評分等指標,可能會對結果產生安慰劑效應或霍桑效應。由于手法治療的特殊性,對患者和治療人員設盲難度較大。但通過對結局評估者設置有效的盲法,可進一步提高研究質量及結果的可信性。
3.1.4 結局指標數量及組合選擇異質性大 本研究納入的66項RCT共采用59種結局指標,共計應用229次。單個研究結局指標最多為9個,最少為1個,平均每項研究結局指標的數量為3項。66項RCT中有27項RCT同時應用4個及以上的結局指標,14項RCT同時應用3個結局指標,20項RCT同時應用2個結局指標,5項RCT應用1個結局指標。在臨床研究中,結局指標數量選擇過少不能很好說明干預措施的療效,過多則易產生錯誤引導。不同結局指標組合應用時也存在相似子條目重復測量的問題,說明尚缺乏可靠的核心指標規定的相關標準與可參考的核心指標集。
3.1.5 使用復合結局指標評價結局 本研究納入的66項RCT中有48項RCT采用了總有效率指標評價,對疾病的轉歸大多分為治愈、顯效、有效、無效或優、良、可、差等不同等級,最后多加以總有效率的復合結局指標進行描述,且RCT中報告的治療效果均為陽性結果,這可能與這種復合結局的評價方式有關。總有效率的參考標準并不統一,部分研究未明確報告參考標準。復合結局指標的評價方式存在過于籠統、主觀性強、削弱統計學效能等特點,因此可能會夸大干預措施的療效及價值[87]。
3.1.6 結局指標測量時點不統一 本研究顯示結局指標測量時點差異性較大,頻次前5名的結局指標測量時點范圍從治療后1 d~隨訪6個月,共涉及17個測量時點,測量時點跨度較大。在RCT設計中臨床療效的觀測時間設置十分重要,可影響整個研究質量與價值。當前對于臨床研究中反映手法優勢效應的訪視時間尚無統一的認識,對結局指標測量時點重要性的認識不足,尚缺乏相應的參考標準以進一步提升研究設計水平與質量。
3.2.1 做好充分的頂層設計與前期研究 在開展臨床研究工作前,需要對疾病的研究現狀進行梳理和總結,做好充分的頂層設計與前期研究工作。在研究方案設計時,需要重點考慮結局指標相關內容。首先可通過COMET數據庫查找是否已有相關核心結局指標集的建立,然后參考和借鑒國內外高質量的臨床實踐指南、系統綜述和RCT中所選擇的結局指標,結合研究目的及干預措施本身確定合適的結局指標。在臨床研究開始前可進行小樣本量的預試驗,盡早了解研究中存在的問題與不足。高質量的骨傷科臨床研究一般需要中西醫臨床專家、影像學專家、臨床流行病學與循證醫學專家、醫學統計學專家等組成多學科協同的研究團隊以保障臨床研究的質量。
3.2.2 開展手法治療CSR臨床研究的核心結局指標集工作 筆者經過檢索COMET數據庫,發現目前尚未開展關于CSR核心結局指標集的研制工作。建立中醫藥臨床試驗核心結局指標集是解決目前臨床研究中結局指標不規范、不統一、不一致等問題的重要途徑[88]。建立屬于手法治療CSR的核心結局指標集,并結合中醫藥理論和中醫外治法特色,為手法治療CSR臨床研究選擇合適的結局指標和測量工具,將核心結局指標集和相應的測量工具推廣到整個同類臨床研究中,提高該領域臨床研究質量與水平,促進中醫骨傷科循證能力的建設。為此建議結合當前中醫藥臨床研究現狀及中醫藥理論特點,參照COMET核心結局指標集研制程序開展規范化研究,建立適合手法治療CSR的核心結局指標集。
綜上所述,本研究通過分析近十年中醫手法治療CSR的RCT結局指標的應用現狀,提出在結局指標選擇中存在的問題與建議,為研制手法治療CSR的核心結局指標集提供前期研究基礎。
本研究尚存在一定的局限性:本研究僅對近十年手法治療CSR的RCT結局指標進行分析,未對其他時間范圍及臨床研究類型的結局指標進行匯總,以及對于結果的解釋和推斷可能存在一定偏倚。未來研究中可增加其他臨床研究類型文獻進行補充分析,為構建手法治療CSR核心結局指標集的建立提供參考依據。
作者貢獻:馮天笑、王平負責文章的構思及設計,提出主要研究指標及研究目的;李康健、于大偉、孫婉鈺、符碧峰、馮敏山負責文獻篩選與數據統計,繪制表格;馮天笑、李康健負責論文起草、初步撰寫;王平負責文章的質量控制及審校,并對文章整體負責。
本文無利益沖突。