王玉柳明 張巍遠 張宇坤 胡漢卿 黃睿 湯慶超 陳瑛罡 王貴玉
近年來,結直腸癌(colorectal cancer,CRC)的發病率和死亡率逐年攀升,成為威脅國民健康的重大疾病[1]。針對結直腸癌的預防、診斷和治療的研究日漸增多,尤其是對于分子機制及治療靶點的研究已成為熱點內容。腸道菌群與結直腸疾病有著密切關聯,如具核梭桿菌、大腸桿菌和糞腸球菌等已被證明在結直腸癌的發生和發展中發揮重要作用,可以作為未來結直腸癌防治的潛在靶點[2-6]。隨著高通量測序技術的日趨成熟,利用糞便樣本研究結直腸疾病患者的腸道菌群特征成為便捷、可靠的實驗手段。目前的研究表明,腸球菌屬(Enterococcus)可以發揮“抑瘤”作用,高豐度的腸球菌屬可能降低結直腸癌的發病風險[6]。但亦有研究表明,腸球菌屬可能通過誘導胞外過氧化物介導DNA 損傷等機制發揮“促瘤”作用[7]。
進展期結腸癌是結腸癌中的特殊類型,其治療、預后及菌群特征均不同于非進展期結腸癌[8]。而其中Ⅲ期與Ⅳ期結腸癌患者的菌群特征差異尚缺乏充足的研究,腸球菌屬作為“明星”菌屬在兩組間的豐度差異仍不明確。因此,基于高通量測序技術探究Ⅲ期與Ⅳ期結腸癌患者腸球菌屬豐度差異不僅可以明確Ⅲ期與Ⅳ期結腸癌患者的菌群特征差異,更將有助于后續的基礎研究及為臨床轉化提供目標和方向。
收集2018 年7 月至2019 年1 月,于哈爾濱醫科大學附屬第二醫院結直腸腫瘤外科就診的結腸癌患者糞便樣本。所有樣本均于患者入院當天未進行醫療處置時采集。本研究的入組標準如下:(1)患者通過病理活檢及影像學評估確認為Ⅲ期結腸癌或結腸癌肝轉移(Ⅳ期);(2)患者于本科室行原發灶切除手術。本研究的排除標準如下:(1)樣本采集前3 個月內服用抗生素或皮質類固醇激素或益生菌治療者;(2)樣本采集前3 個月內接受過腹部手術或其他侵入性治療者;(3)樣本采集前1 周內服用導瀉劑或行灌腸治療或行腸鏡檢查者;(4)有癌癥個人史、家族史或炎癥性腸病個人史者;(5)特殊飲食者[2,8];(6)術前進行放療或新輔助化療者;(7)既往進行過糞菌移植治療者;(8)信息不完善或未取得知情同意者。根據入組標準和排除標準,共收集符合標準的Ⅲ期結腸癌患者糞便樣本17例,結腸癌肝轉移(Ⅳ期)患者糞便樣本10 例。獲取糞便樣本后立即放入-80 ℃冰箱保存備用。所有進行糞便樣本采集的患者均已取得其同意,并簽署知情同意書。本研究已經被哈爾濱醫科大學附屬第二醫院倫理審查委員會批準進行。
為排除入組患者基線資料不一致導致的菌群分析結果差異,我們采用傾向值匹配法(PSM)均衡組間基線資料。運用Logistic 回歸模型分析27 例患者的基線資料變量賦值,所得P值即為傾向值,按最近匹配法1:1 配對,卡鉗值取0.1。我們選取患者的性別、年齡、身體質量指數(BMI)、美國麻醉師協會(ASA)評分和腫瘤部位作為變量。其中,性別、年齡、BMI、腫瘤部位是患者的基本特征。ASA 評分是一個簡單、主觀的量化標準用以評估患者的身體狀況及手術風險,在臨床工作和研究中應用廣泛[9]。通過傾向值匹配法,納入基線資料基本一致的9 例Ⅲ期患者和9 例Ⅳ期患者入組,對其糞便樣本進行高通量測序和生物信息學分析。
1.DNA 提取:糞便樣本微生物總DNA 的提取采用德國QIAGEN 公司生產的QIAamp DNA Stool Mini Kit 試劑盒。具體步驟按照說明書操作,所提取的DNA 于-80℃冰箱保存[10]。
2.高通量測序:高通量測序擴增細菌16S rRNA的338F~806R 區域,上下游引物序列分別為338F 5'-ACTCCTACGGGAGGCAGCAG-3',806R 5'-GGACTACHVGGGTWTCTAAT-3'。將得到的PCR產物構建測序文庫,采用Illumina Miseq 平臺測序,對高質量測序數據進行生物信息學分析,該部分由上海美吉生物醫藥科技有限公司完成。
采用統計學軟件SPSS 22.0 進行傾向值匹配法和統計學分析。組間差異采用方差分析,符合正態分布、方差齊性的數據采用t檢驗,不滿足正態分布或者方差齊性的數據采用Wilcoxon 秩和檢驗,以P<0.05 認為差異有統計學意義。基于樣品測序產生的OTU(Operational Taxonomic Units)結果,采用Qiime 軟件計算beta 多樣性距離矩陣,并用R 語言vegan 軟件包作非線性多維標度(nonmetric multidimensional scaling,NMDS)[10]。
選取性別、年齡、BMI、ASA 評分和腫瘤部位作為變量進行傾向值匹配,匹配前及匹配后兩組基線信息詳見表1。此外,我們對匹配后的兩組除綜合病理分期之外的其他病理信息進行了比較(見表2)。總體來看,經過傾向值匹配后,Ⅲ期組和Ⅳ期組除綜合病理分期不同外,在基線資料和病理信息上差異沒有統計學意義,這便于我們進行后續的測序數據分析比較。
總計18 例樣本進行了測序分析,共獲得原始序列1 552 674 條。經過質量過濾和去除嵌合體之后的優質序列有1 044 208 條,樣本序列平均長度主要集中在421~441 bp 區域。為了便于進一步研究,對于所有有效序列進行了OTU 聚類分析,按照最小樣本序列數進行了抽平,最終獲得了283 個OTU。以測序數據量為橫坐標,以香農指數為縱坐標,作Shannon-wiener 曲線圖(見圖1)。從圖中可以看出,曲線在開始時迅速上升,說明隨測序深度增加,新發現的菌種在逐漸增多。隨著序列數增多(測序深度增加),曲線逐漸趨于平緩,進入平臺期,說明測序深度達到要求,覆蓋了所有菌種。

表1 傾向值匹配結果[例(%)]

表2 匹配后患者病理信息表[例(%)]

圖1 Shannon-wiener 曲線圖
Alpha 多樣性分析是反映樣本物種組成豐富度和多樣性的重要指標。對兩組樣本進行基于OTU 水平的Alpha 多樣性差異分析,可以有效反映兩組在物種組成豐富度和多樣性層面的差異。我們選取了sobs 指數、chao 指數、ace 指數來反映物種豐富度,采用辛普森(simpson)指數、香農(shannon)指數來反映物種多樣性。指數組間差異性檢驗提示,Ⅲ期組與Ⅳ期組在物種多樣性和豐富度上差異有統計學意義(P<0.05)(見表3)。此外,我們在屬水平進行了群落組成分析,選取豐度前15 的菌屬繪制了Heatmap 圖(見圖2)。群落組成分析結果提示,兩組在菌屬水平的群落組成上有著明顯不同。
Beta 多樣性表示的是微生物群落構成的比較,用來評估微生物群落間的差異。本研究中,我們采用PCoA 分析進行樣本的Beta 多樣性分析。PCoA 分析,即主坐標分析(principal co-ordinates analysis),是一種非約束性的數據降維分析方法。相比于PCA 分析只能采用歐氏距離算法進行分析計算,PCoA 分析可以通過不同的距離算法來進行分析評估。ANOSIM 分析,即相似性分析(analysis of similarities)是一種非參數檢驗,用來檢驗組間(兩組或多組)的差異是否顯著大于組內差異,其檢驗值用于PCoA 分析。利用unweighted_unifric算 法(R=0.570,P=0.001)和weighted_unifric 算法(R=0.236,P=0.018)進行PCoA 分析,發現兩組樣本主成分差異顯著(見圖3)。

表3 Alpha 多樣性指數表

圖2 屬水平群落Heatmap 圖

圖3 基于OTU 水平的主坐標分析(3A:unweighted_unifric 算法,R=0.570,P=0.001;3B:weighted_unifric 算法,R=0.236,P=0.018)
組間差異顯著性檢驗根據得到的群落豐富度數據,運用嚴格的統計學方法來檢測不同組(樣本)微生物群落中表現出豐富度差異的物種,進行假設性檢驗,評估觀察到的差異的顯著性。從門水平看,兩組的優勢菌門均為厚壁菌門(Firmicutes)、擬桿菌門(Bacteroidetes)和變形菌門(Proteobacteria),Ⅲ期組與Ⅳ期組之間有豐富度顯著差異的是疣微菌門(Verrucomicrobia)(見圖4)。從屬水平看,Ⅲ期組與Ⅳ期組的腸球菌屬豐富度差異具有統計學意義(P<0.05),并且Ⅲ期組的腸球菌屬豐度更高。此外,兩組在Faecalibacterium、Subdoligranulum、Blautia 和Alistipes 等菌屬的豐度上亦存在差異(見圖5)。為進一步分析腸球菌屬豐度的差異對于組間差異的貢獻度,我們利用LEfSe 多級物種差異判別分析繪制LDA(線性回歸分析)判別柱形圖(見圖6)。組間顯著差異的菌屬獲得的LDA分值越大,代表物種豐度對差異效果影響越大。結果提示,在組間豐度差異菌屬中,腸球菌屬對于組間差異貢獻最大。
人類腸道內定殖著數量眾多的微生物群落,其中絕大多數為細菌。近年來,腸道菌群與結直腸疾病及系統性疾病的關聯成為了研究熱點,關于腸道菌群在結直腸癌發生和發展中的作用機制研究日漸增多[2-8]。多項研究結果表明,進展期結直腸癌與早期結直腸癌的菌群特征有明顯差異,大腸桿菌、具核梭桿菌等定殖菌可以促進結直腸癌的進展[5,8,11]。然而,對于進展期結腸癌,不同階段之間是否存在菌群特征差異尚未見明確報道。因此,我們進行了單中心的臨床樣本收集,并嘗試利用新興的高通量測序技術探究Ⅲ期與Ⅳ期結腸癌患者的腸球菌屬豐度差異,從而揭示不同病理分期的進展期結腸癌患者間菌群特征差異。
近年來,腸球菌屬的研究熱度逐漸攀升,關于腸球菌屬與結直腸癌關聯的機制研究及臨床隊列研究不斷增多。然而,目前對于腸球菌屬與結直腸癌的關系尚存爭議。早期的隊列研究發現,與健康人群相比,腸球菌屬在結直腸癌患者體內豐度增加,提示腸球菌屬可能起到“促瘤”作用[12]。機制研究提示腸球菌屬可以產生胞外過氧化物,從而導致腸道上皮細胞DNA 損傷,進而發揮作用[7]。然而,近年來日本學者開展的一項隊列研究發現,高豐度的腸球菌屬可能與較低的結直腸癌風險相關[6],但亦有其他隊列研究提出反對意見[13]。綜上,腸球菌屬與結直腸癌間確存關聯,但究竟是“促瘤”還是“抑瘤”作用尚有爭議。此外,鑒于中國人群的臨床樣本研究結果尚缺乏,我們開展了本項研究,并收集糞便樣本來反映腸道菌群特征。

圖4 門水平兩組腸道菌群差異圖

圖5 屬水平兩組腸道菌群差異圖

圖6 LDA 判別柱形圖
糞便樣本中包含了大量在糞便形成過程中沖刷下來的腸道黏膜定殖菌。并且,相比于黏膜活檢,糞便樣本的采集過程屬于非侵入性操作,更容易被受檢者接受。因而,糞便是研究人體腸道菌群特征的常用樣本[14-16]。但侵入性治療(內鏡下治療及手術治療)、抗生素治療、口服瀉藥或使用灌腸劑等治療手段都會干擾正常的腸道菌群組成,進而影響糞便樣本質量[11,14]。因此我們在入組標準中將近期有上述治療情況者排除。此外,本研究中傾向值匹配法的使用可以更好地保證基線資料一致,避免基線資料不一致而導致的菌群分析差異結果。
從測序的基本信息來看,測序深度達到了要求,能夠支持我們進行后續的生物信息學分析[10]。Alpha 多樣性分析提示Ⅲ期組與Ⅳ期組在物種豐富度和多樣性上都有明顯差異,Ⅳ期組的物種豐富度和多樣性發生了明顯改變。主坐標分析(PCoA 分析)提示兩組菌群的OTU 分布明顯不同,進一步的相似性分析(ANOSIM 分析)又證實了組間差異確實大于組內差異,這些結果提示進展期結腸癌的不同階段,腸道菌群有著明顯不同的特征,并且提示本研究的分組有意義。最后,利用組間差異顯著性檢驗,我們發現Ⅲ期組與Ⅳ期組腸球菌屬豐度差異顯著,并且其豐度差異對組間差異貢獻值最高。這可能提示腸球菌屬與結腸癌疾病進展存在相關性。
結合既往研究來看,日本學者進行的一項隊列研究提示早期CRC 患者與健康人群相比,腸球菌屬的豐度降低[6]。并且,該研究發現高豐度的腸球菌屬與結直腸癌發生風險降低相關。同時,我們的研究結果又發現Ⅲ期結腸癌患者的腸球菌屬豐度較高,腸球菌屬的豐度降低對Ⅲ期與Ⅳ期間菌群特征的差異貢獻最大,這可能提示腸球菌屬豐度的降低與結腸癌疾病進展相關。然而,對于早期結腸癌(Ⅰ期、Ⅱ期)與進展期結腸癌(Ⅲ期、Ⅳ期)之間的菌群差異及腸球菌屬發揮的作用尚缺乏研究,無法建立健康人、早期結腸癌到進展期結腸癌與腸球菌屬的整體聯系,從而論證腸球菌屬豐度降低與結腸癌發病及進展相關,這一問題仍有待于更多相關研究的開展。此外,腸球菌屬的“抑瘤”角色尚存爭議,缺乏機制說明。目前的基礎研究發現腸球菌屬可通過產生胞外過氧化物,誘導腸道上皮細胞DNA 損傷的方式誘導腫瘤發生[7]。是否腸球菌屬可以通過膜表面蛋白結合結腸腫瘤細胞,發揮抑制增殖、促進凋亡的作用,從而發揮“抑瘤”功能?基于本研究成果的后續機制探究可能會獲得更加嚴謹的結論。
綜上所述,Ⅲ期結腸癌患者與Ⅳ期結腸癌患者腸道菌群的物種組成和豐富度有顯著差異,而腸球菌屬豐度改變對差異的貢獻最大。這可能提示腸球菌屬與結腸癌疾病進展存在相關性。因此,本研究不僅為后續的實驗研究提供目標和研究基礎,更將有助于為結直腸癌的預防、診斷和治療提供新思路。