孫 琳,宋 昕,魏夢霞,趙學科,徐瑞華,李 貝,范宗民,韓雪娜,陳亞杰,鐘 侃,喬佳欣,馬琳琳,謝葉真,王立東
食管癌(esophageal cancer,EC)是世界上排名第六的惡性腫瘤。在中國,食管癌發病率居第六位,死亡率居第四位,預后差,中晚期EC的5 a生存率僅為15%~25%[1-3]。但EC至今缺乏較高敏感性和特異性的早期篩查和診斷方法。本研究團隊在60 a的食管癌研究過程中已建立50萬例跨度47 a(1973 年至 2019年)的食管癌和賁門癌患者隨訪的臨床診療、病理信息大數據庫和大樣本庫。全基因組外顯子測序(whole exome sequence,WES)技術用于分析個體的全基因組DNA外顯子序列,已經被廣泛應用于腫瘤治療領域。相比于全基因組測序,WES周期短、成本低、深度高,可以檢測到比全基因組測序更多的低頻和罕見突變,從而可以分析大量的樣本[4-6]。表達數量性狀基因座(expression quantitative trait loci,eQTL)分析方法是將不同基因型個體的基因表達數據作為數量性狀,分析基因型對基因轉錄的影響。eQTL作用可根據遺傳變異位點與靶基因的相對位置分為順式(cis)和反式(trans)[7]。本研究旨在采用WES測序和eQTL的方法對食管癌患者癌組織和癌旁組織不同單核苷酸多態性(single nucleotide polymorphisms,SNP)基因型進行對比分析,為臨床食管癌發病風險預測和早期診斷提供分子基礎,揭示分子基礎及環境和遺傳因素交互作用對食管癌發生的影響。現報道如下。
1.1 樣本來源
1.1.1 研究對象的采集共收集來自高發地區醫院的199位食管癌患者的癌組織和癌旁組織。所用組織樣品均為新鮮組織樣本,在手術切除后30 min內剝離,-80 ℃保存。癌旁正常組織選取距腫瘤邊緣至少2 cm遠的鄰近上皮正常組織(生殖系對照)。患者在入組前未接受放化療等其他治療,排除圍手術期內吻合口瘺死亡的患者。所有患者都簽署了獨立的知情同意書,用于取樣和分子分析,并已獲得了相關機構的審查和批準。本研究主要通過電話、家訪和村醫與患者或患者家屬直接聯系,或通過新合作醫療數據庫、醫療保障局數據庫和公民死亡信息登記管理等系統查詢方式進行隨訪,每3個月進行1次隨訪,記錄去世時間和主要死因等。
1.1.2 組織樣本的制備將199例食管癌患者的癌組織和癌旁組織配對,分裝到已經標記的凍存管內,樣本編號為001~199號。在樣本類型中,食管癌組織用字母T標記(Tumor),癌旁正常組織用字母N標記(Normal)。收集到的樣品在液氮中快速冷凍并保存,同時保證每份樣品有足夠的DNA可供提取。
1.2 WES測序SNP分析
1.2.1 DNA樣品檢測利用瓊脂糖凝膠電泳分析DNA樣本是否有蛋白、RNA污染及其降解程度。用Nanodrop2000(Thermo,美國)檢測DNA的純度,并用Qubit 3.0測出DNA樣品濃度,選擇0.6 μg以上的DNA樣品進行后續建庫。
1.2.2 建庫捕獲及上機測序采用Agilent液相芯片捕獲系統,對患者全外顯子區的DNA進行富集,基因組DNA經破碎儀隨機打斷成片段,采用Agilent SureSelect Human All Exon V6試劑盒進行建庫及捕獲。后在Illumina平臺上進行高通量測序。
1.2.3 數據質量控制高通量測序獲得的原始圖像數據經過轉化后形成原始Raw Data測序序列。將原始Raw Data數據進行過濾,并且控制平均堿基位置測序錯誤率低于0.1%,樣本的測序reads達到95%以上的比對率,且堿基覆蓋深度達到10×以上時該點檢測的SNP比較可信。
1.2.4 SNP檢測和功能注釋使用bcftools軟件識別SNP,并利用ANNOVAR軟件對多態性位點進行功能注釋。
1.3 蛋白質組學分析與鑒定
采用液相色譜—質譜(liquid chromatography-tandem mass spectrometry,LC-MS/MS)技術對199例食管癌的癌組織和癌旁組織樣本進行分析。
1.4 eQTL分析
利用199例食管癌患者的基因型分型數據以及癌組織和癌旁組織的全基因組外顯子測序數據進行eQTL分析,根據SNP位點(即單個DNA突變的位點)到基因的距離,eQTL可分為順式作用(cis-eQTL)和反式作用(trans-eQTL)。
1.5 統計學分析
統計學處理采用SPSS 21.0進行分析。高發區癌組織與癌旁組織的SNP影響蛋白的表達,從而導致腫瘤的發生采用雙重線性回歸檢驗,生存率采用Kaplan-Meier方法。檢驗標準α=0.05。
2.1 全基因組外顯子測序結果
通過對199例食管癌患者癌組織和癌旁組織的WES分析,NES基因rs951781位點的SNP分型:①野生型純合子CC型158例,占79.40%;②突變型雜合子CT型37例,占18.60%;③突變型純合子TT型4例,占2.01%。
2.2 NES基因rs951781位點不同基因型食管癌患者生存率比較
對199例食管癌患者3種基因型的生存期進行比較,不同基因型食管癌患者的生存之間存在顯著性差異(P=0.018)。CC型的生存率最差,TT型的生存率最高,生存曲線如圖2所示,對野生型純合子CC型、突變型雜合子CT型、突變型純合子TT型的0.5、1、1.5 a生存率進行比較。

圖2 NES 3種基因型生存曲線(n=199)
2.3 eQTL分析結果
通過對199例食管癌患者癌組織和癌旁組織進行eQTL分析,發現 ACTB的表達量與NES基因rs951871位點變異存在關聯性(P<0.001)。NES基因rs951871位點對ACTB的轉錄表達水平有trans-eQTL效應,可下調ACTB蛋白的表達水平(beta=-0.43),將野生型純合子CC型賦值為0,突變型雜合子CT型賦值為1,突變型純合子TT型賦值為2。其中,NES基因rs951871位點的突變型純合子TT型蛋白表達量最低,突變型雜合子CT型次之。見圖3。

圖3 NES 3種基因型對ACTB表達量的影響
食管癌的發生與環境和遺傳因素密切相關。吸煙、飲酒、人乳頭瘤病毒感染等環境因素暴露個體并非均患有食管癌,遺傳因素在食管癌發生過程中可能發揮重要作用[8]。目前已發現超過100個基因含有罕見的易感等位基因,且與食管癌發生風險有關[9-14]。
NES-rs951871位點SNP與食管癌的相關研究相對較少。本研究結果顯示,NES-rs951871位點的基因型與食管癌患者預后生存期有關,不同基因型食管癌患者的生存之間存在顯著差異(P=0.018)。突變型純合子TT型的生存率最好,TT基因型患者0.5、1、1.5 a生存率均高于CC基因型和CT基因型,說明NES-rs951871位點TT基因型患者預后優于CC、CT基因型患者,推測NES-rs951871位點突變的食管癌患者預后較好,提示 NES-rs951871位點與食管癌的發生發展有密切的關系,可能是預測食管癌患者生存期的生物標志物,為評估患者預后提供理論依據。
NES基因rs951871位點的多態性可顯著影響食管癌患者癌組織和癌旁組織中的β-肌動蛋白(ACTB)蛋白水平,NES基因rs951871位點風險等位基因T的劑量每增加1,受調控的ACTB蛋白表達量下調0.43個單位。ACTB是一種高度保守的細胞骨架結構蛋白,多年來一直被認為是一種常見的看家基因,并被用作參考基因[15]。近年來越來越多的研究表明ACTB在肺癌、肝癌、前列腺癌、黑色素瘤,結直腸癌等多種癌癥中表達水平較高[16-19],也有免疫相關結果表明ACTB在調節腫瘤免疫微環境中發揮特定作用,異常的ACTB表達可能會改變腫瘤免疫微環境,從而影響腫瘤的侵襲和轉移[20]。故推測NES-rs951871位點為功能性SNP,其多態性可能影響了與該段DNA序列相互作用的反式作用因子的結合能力,從而影響ACTB蛋白的表達,進而最終影響了食管癌的發生發展。但NES-rs951871的具體作用機制還有待進一步研究。