潘俊杰 陳鈺琳△ 王 兵 陳凌強 楊革軍 陸 順 范順云 何 穎
(1臨滄市人民醫院脊柱骨病腫瘤科,臨滄 677000;2昆明醫科大學第一附屬醫院骨科 骨科研究所,昆明 650032)
腰椎間盤突出癥 (lumbar disc herniation, LDH)是引起腰腿痛的主要原因,是臨床常見疾病[1],發病率較高,其治療也備受關注,規范化保守治療效果不佳需考慮手術治療,而臨床上的手術方式主要有開放和微創兩種,傳統椎板開窗腰椎間盤切除術是經典的標準術式,在臨床上廣泛應用[2]。隨著技術的進步,立足傳統手術并借助先進的操作工具(如內鏡、顯微鏡、通道或數字導航設備等)開展的微創脊柱外科手術,能實現切口微小化和靶點精準化,但微創技術本身并非顛覆性的創新,而是對原有傳統技術的完善。無論是微創技術還是傳統技術都沒有脫離外科治療的框架和基本形式,今天的微創技術有可能在將來被更“微創”的技術或其他技術所覆蓋,而成為“傳統”技術。近年來,經皮內鏡下腰椎髓核摘除術 (Percutaneous Endoscopic Lumbar Discectomy, PELD) 則作為微創技術的領軍技術廣泛運用于臨床,該技術在局部麻醉下通過內鏡直達病灶,摘除病變椎間盤[3],具有創傷小、恢復迅速、安全性高等優勢,但也存在術后短暫性感覺減退、髂棘過高影響L5-S1節段通道建立以及學習曲線陡峭等不足[4,5],本研究檢索兩種術式治療LDH的相關研究結果(隨機對照試驗和高質量病例對照研究),采用Meta分析軟件進行亞組分析相關指標,對兩種不同術式治療腰椎間盤突出癥的臨床療效進行系統評價,旨在評價兩種術式的優勢與不足,分析不同質量研究結果的可靠性,為臨床醫師術式選擇及臨床研究提供一定的參考價值,并為LDH患者選擇獲益更大的治療方案提供思路和臨床參考價值。
隨機對照試驗(RCT),高質量病例對照研究(Case Control),準隨機對照試驗(QRCT),有完整數據資料,出版語言僅限于英文,盲法未做精準要求。
根據預先設定的標準,納入標準如下:性別和年齡無限制,既往無相關脊柱手術史,根據體格和影像學檢查(腰椎X線、CT、MRI)診斷為單節段椎間盤突出,經規范保守治療3月以上效果欠佳。
排除標準:①影像學檢查提示腰椎不穩、馬尾綜合征、腫瘤、滑脫、類風濕關節炎、退行性椎管狹窄、感染、腫瘤及椎管廣泛狹窄;②涉及多個解剖層面的多節段突出③再手術史和椎間盤再發突出。
PELD組采用經皮椎間孔鏡技術治療,OD組采用傳統開放椎板開窗椎間盤切除術治療。
包括以下10個指標:年齡、手術切口長度、手術時間、術中出血量、平均住院時間、術后療效評分(VAS評分、SF-36評分)、術后優良率 (改良Macnab 標準)、術后并發癥發生率、影像學改變情況等。
時間范圍設定為建庫至2017年12月。在PubMed, EMBASE, Web of Science, China Biomedical Literature Database, Cochrane LibraryCochraneMedline, OVID等多個外文數據庫中進行計算機輔助檢索,此外還檢索了Spine, European Spine Journal等幾個核心脊柱外科雜志及期刊,如涉及未出版的文獻還采取聯系作者的方式。檢索中采用的檢索策略為主題詞與自由詞結合的方式,主題詞主要為:lumbar disc herniation,lumbar intervertebral disc protrusio, nlumbar disc prolapse, lumbar disc rupture等。涉及的自由詞主要有以下幾種:Percutaneous endoscopic lumbar discectomy,percutaneous transforaminal endoscopic discectomy,percutaneous endoscopic discectomy,YESS,TESSYS, minimally invasive transforaminal Discectomy MID,micro discectomyMD,endoscopic discectomy, fenestration discectomylaminectomyPELD, PTED, open discectomy,traditional open surgery, traditional discectomy等。
兩名研究人員需要閱讀完整的文章,并獨立評估這些試驗的質量。質量評價借助 Cochrane 風險偏倚評估工具和NOS量表獨立完成。質量評級是根據Cochrane協作指南:①隨機序列生成(選擇偏倚);②分配隱藏(選擇偏倚);③成果評估(檢測偏倚)盲法;④不完整的結果數據(摩擦偏倚);⑤選擇性報告(報告偏倚);⑥其他偏倚。此外還通過NOS量表的評判標準嚴格評判,本研究中所涉及的差異都是通過協商一致來解決的。
數據由兩位作者提取,然后收集核對,并將相關數據和資料制作成電子表格,包括:①納入文獻的基本情況;②觀察指標:年齡、手術切口長度、手術時間、術中出血量、平均住院時間、術后療效評分(VAS評分、SF-36評分) 及術后優良率 (改良Macnab 標準)、術后并發癥發生率,影像學改變情況等。
對納入研究應用 RevMan 5.3.5 軟件進行分析。當觀察指標屬于計數資料(分類變量)時,采用計算比值比(OR值)的方式;如為計量資料(數值變量)并且同一評價指標的單位相同時,則采用計算均數差(MD值)的方式,否則采用標準化均數差替代的方式以消除不同單位的影響,均采用95%可信區間(CI)來表示各指標的效應量。納入研究間存在的異質性,采用X2檢驗進行分析(P< 0.05差異有統計學意義),并根據I2大小來判斷異質性,若P≥0.1,I2≤50%,則采用 Fixed 固定效應模型進行分析;否則認為其異質性較大,應對其異質性來源情況進一步分析,若異質性為統計學性質而非臨床性的情況下,可采用Random 隨機效應模型分析,若各研究間異質性過大,則采用描述性分析。
按照制定的檢索策略所有方式共搜索到904篇相關文獻,經層級篩選,最終納入16篇研究,其中有14篇為隨機對照試驗(RCT),2篇為高質量病例對照研究(Case Control),共1333例對象,其中PELD組668例,傳統椎板間開窗組(OD組)665例,納入研究的一般情況(見表1),質量評價結果及偏倚分析如下(見圖1),NOS量表(the newcastle-ottawa scale)評估評分均高于8分。
(1)平均年齡:9篇[8,11~15,17,19,20]文獻涉及平均年齡,各研究間無統計學異質性 (P= 0.62,I2= 0%),選用固定效應模型(Fixed)進行 Meta 分析,結果顯示PELD 組與OD組在平均年齡上差異無統計學意義[MD = -0.36,95%CI (-1.69, 0.97),Z= 0.53,P= 0.59]。
(2)切口長度: 6篇[9,11,16,19~21]文獻涉及切口情況,其中RCT 4篇,Case control 2篇,亞組分析結果顯示兩類文獻之間無明顯異質性(I2= 0.0%);但各研究間存在統計學異質性 (P< 0.00001,I2= 99%),采用隨機效應(Random)模型分析,結果證實PELD組的手術切口長度明顯小于OD組,差異有統計學意義[MD = - 3.01, 95% CI (- 4.23,- 1.80),Z= 4.86,P< 0.00001]。
(3)手術時間:11 篇[9~13,15,17~21]文獻涉及手術時間,其中RCT9篇,Case control 2篇,亞組分析結果顯示兩類文獻之間無明顯異質性(I2= 0.0%);但各研究間有統計學異質性 (P< 0.00001,I2= 93%),采用隨機效應(Random)模型分析,結果顯示PELD 組與OD組在手術時間上差異無統計學意義[MD = 6.29,95% CI (-3.45, 16.03),Z= 1.27,P= 0.21]。
(4)術中出血量:10篇[6,9,11,12,15~18,20,21]文獻涉及術中出血情況,其中RCT 8篇,Case control 2篇,亞組分析結果顯示兩類文獻之間無明顯異質性(I2= 0.0%);但各研究間有統計學異質性 (P< 0.00001,I2= 99%),采用隨機效應(Random)模型分析,結果顯示PELD組的術中出血量明顯少于OD組,差異有統計學意義[MD = - 67.06, 95% CI (-93.17,-40.94),Z= 5.03,P< 0.00001]。
(5)平均住院時間:11篇[9,10,12~16,18~21]文獻涉及住院時間,其中RCT 9篇,Case control 2篇,亞組分析結果顯示兩類文獻之間存在異質性(P=0.009,I2= 85.2%),分析異質性來源于病例對照試驗的實驗設計方案的嚴謹性;各研究間也存在統計學異質性 (P< 0.00001,I2= 99%),采用隨機效應(Random)模型分析,結果顯示PELD 組的平均住院日明顯少于OD組差異有統計學意義[MD = -3.44,95% CI (-4.99, -1.89),Z= 4.35,P< 0.0001]。
(6)術后 VAS評分:10篇[6,9,11,12,14,16,17,19~21]文獻涉及術后VAS評分,其中RCT 8篇,Case control 2篇,亞組分析結果顯示兩類文獻之間無明顯異質性(I2= 9.4%);但各研究間有統計學異質性 (P< 0.00001,I2= 78%),采用隨機效應(Random)模型分析,結果顯示PELD 組與OD組在術后VAS評分上差異無統計學意義[MD = - 0.26, 95% CI (-0.53, 0.00),Z= 1.95,P= 0.05],兩種術式療效相當。

表1 納入文獻的一般資料

圖1 納入研究的 Cochrane 風險偏倚評估結果圖(Risk of bias graph)
(7)術后SF-36評分:3篇[8,12,14]文獻涉及術后SF-36評分,均為RCT,選用固定效應模型(Fixed)分析,結果顯示 PELD 組與傳統開放開窗組(OD組)在術后SF-36評分上差異無統計學意義 [MD =-0.79, 95%CI (-2.14, 0.55),Z= 1.15,P= 0.25],兩種術式療效相當。
(8)術后優良率(根據改良 Macnab 標準):11篇[6~10,15,16,18~21]文獻涉及術后優良率,其中 RCT 9篇,Case control 2篇,亞組分析結果兩類文獻之間無明顯異質性(I2= 0%);各研究間無統計學異質性(P= 0.94,I2= 0%),采用固定效應(Fixed)模型分析,結果顯示PELD 組與傳統開放開窗組(OD組)在術后優率上差異無統計學意義 [OR = 1.39, 95%CI(0.83, 2.34),Z= 1.25,P= 0.21]。
(9)術后并發癥發生率:13 篇[6~10,15,16,18~21]文獻涉及術后并發癥情況,其中RCT 11篇,Case control 2篇,亞組分析結果顯示兩類文獻之間存在異質性(P= 0.03,I2= 78.8%),分析異質性來源于病例對照試驗的實驗設計方案的嚴謹性;各研究間無統計學異質性(P= 0.08,I2= 39%),采用 Fixed 模型分析,結果顯示PELD 組與傳統開放開窗組(OD組)在術后并發癥發生上差異無統計學意義 [OR = 1.02,95%CI (0.70, 1.48),Z= 0.09,P= 0.92]。
(10)術后影像學改變情況:3篇[10,17,20]文獻涉及術后影像學變化,其中RCT 2篇,Case control 1篇,亞組分析結果顯示兩類文獻之間無明顯異質性(I2= 0%);各研究間無統計學異質性(P= 0.56,I2= 0%),采用固定效應(Fixed)模型分析,結果顯示傳統開放開窗組(OD組)在術后影像學改變上較PELD 組明顯,差異有統計學意義[OR= 2.64,95%CI (1.32, 5.30),Z= 2.74,P= 0.006]。
隨著脊柱外科的發展和人們生活水平的改變,LDH的診治也更精準,運用最小的創傷和先進的技術,解除神經及脊髓的壓迫,獲得與傳統開放手術相同的療效[22]。為明確開放和微創兩種術式治療LDH的安全性和有效性,評判不同研究方法的質量,本研究檢索大量外文文獻分亞組進行分析,旨在系統評價兩種術式的近期療效,為臨床提供一定的參考價值。
Meta分析結果顯示PELD 組與OD組在年齡、手術時間、術后各療效評分及術后優良率、術后并發癥方面差異無統計學意義,而在手術切口長度、術中出血量、平均住院時間及影像學改變等方面,PELD 組明顯優于OD組,其療效和優勢都與白一冰[23]、隰建成[24]、伊立[25]等的研究結果一致。究其原因,主要包括以下幾方面:①同一種疾病,致病機理均為神經受壓,減壓后癥狀緩解明顯,故臨床療效相當;②PELD技術經生理解剖結構入路解除神經壓迫,創傷小,但該技術學習曲線陡峭,對手術醫師PELD操作水平及熟練程度要求較高,并且該技術操作步驟復雜,手術時間延長,故兩種術式手術時間差異不明顯;③傳統開放手術相比于微創而言,對腰椎后方的肌肉骨骼系統創傷較大;而PELD手術切口小,出血少,術后恢復快,內鏡放大后并發癥少,術后臥床時間及住院時間均較開放手術明顯縮短,手術部位感染風險較低。然而,PELD技術有限的可視化[26]和限制能力的擴展[27]等不足,導致其不能廣泛開展。鑒于最近比較PELD和OD的RCTs的結果并不完全一致[28,29],因此,本研究的相關分析結果是有價值的。
本研究的局限性所檢索的數據庫均為外文數據庫,需加入國內高質量隨機對照研究;隨訪時間均較短,對中遠期的療效和并發癥無法考證,本系統評價檢索時間跨度較大,未對PELD進行嚴格界定,故安全性和有效性評價可能存在一定偏倚;納入研究數量雖為16項,但觀察指標涉及研究并不完全,對偏倚進行評估可能不全面。
總之,微創的理念始終貫穿在外科技術發展過程中,不論是傳統還是微創技術,其根本目的是一致的。但隨著科技的發展,微創理念始終貫穿于脊柱外科發展的全過程,在當今各種微創技術層出不窮、百花齊放的新形勢下,準確把握微創理念的精髓及與技術之間相輔相成的關系,有助于正確認識微創技術的本質,規范微創技術的適應證,因時制宜、因人制宜選擇手術方式,始終秉承謹慎、嚴格的學術觀念,進而最大程度地發揮微創技術的優勢,促進學科的規范發展。本系統評價為近期療效的評價,鑒于以上局限性,其中遠期療效和全面精確的研究結果仍需大樣本、長時間、多方面的系統評價來實現。本研究證實高質量病例對照研究的可靠程度僅次于RCT,在科研過程中研究中可以參考借鑒類似研究結果,但需要進行嚴格的質量等級評估。