張云云, 黃鳳丹, 馬千里, 張新文, 李盈甫, 何秀蓮, 李傳印, 姚宇峰, 劉偉鵬**
(1.中國醫學科學院 & 北京協和醫學院 醫學生物學研究所, 云南 昆明 650118; 2.云南大學 研究生院, 云南 昆明 650504; 3.昆明醫科大學第三附屬醫院 胸外科, 云南 昆明 650118; 4.昆明醫科大學第一附屬醫院 干療科, 云南 昆明 650032)
肺癌是最常見的癌癥類型之一,2020年全世界估計有超過220萬新報告肺癌病例和超過179萬新增肺癌死亡病例[1]。非小細胞肺癌(NSCLC)包含鱗癌、腺癌以及大細胞癌三種病理亞型,占所有肺癌病例的85%以上[2]。雖然吸煙是肺癌發生的主要誘因,但很早人們就已經認識到肺癌具有在家族內部聚集的遺傳傾向[3],針對雙生子的研究顯示肺癌的遺傳率約為18%[4];對肺癌的遺傳結構分析顯示,常見單核苷酸多態性(single nucleotide polymorphism, SNP)能夠解釋很大一部分肺癌的遺傳力。在過去的幾十年里,研究人員已經將注意力轉移到眾多致癌/抗癌基因中常見單核苷酸多態性的研究中[5-7]。近年在全基因組關聯研究 (genome-wide association studies, GWAS) 中已經鑒定到上百個與肺癌發生風險顯著相關的基因座[5,8]。重復研究及精細定位研究也發現唇腭裂跨膜1樣蛋白(cleft lip and palate transmembrane protein 1-like,CLPTM1L)基因區域的多個單核苷酸多態性變異在多種族人群中都與肺癌的發生風險具有顯著的相關性,包括rs401681、rs402710和rs31489[9-11],提示該區域內可能具有多個獨立的風險功能變異,然而,由于 GWAS的分辨率受到群體連鎖不平衡結構的限制,直到目前CLPTM1L基因區域內真正發揮生物學作用的功能變異仍舊不清楚。有研究表明,位于基因轉錄調控區域的SNP能夠通過調節特定基因的表達來增加其攜帶者罹患肺癌的風險[12-14]。因此,對CLPTM1L轉錄調控區內的單核苷酸多態性變異開展進一步分析,并評估這些變異位點與肺癌發生風險之間的相關性,將有助于鑒定CLPTM1L基因座中的潛在功能變異位點,為肺癌的診斷和治療提供新的靶點。
本研究經昆明醫科大學第三附屬醫院倫理委員會批準(審查編號KYCS202198),每位參與者均簽署知情同意書。隨機挑選2015—2018年在昆明醫科大學第三附屬醫院被診斷為非小細胞肺癌的500例患者作為病例組,并選取同一時期在該醫院參加體檢613例健康體檢者作為對照組。病例組排除標準:(1)采樣之前接受過放療、化療等抗腫瘤治療手段的患者;(2)患有其他惡性腫瘤的患者或者患有心血管疾病、糖尿病等慢性疾病的患者;(3)診斷結果不明確、臨床資料不完整者。本次研究所有參與者全部為云南地區的漢族人群。
1.2.1樣本基因組DNA提取 使用血液DNA提取試劑盒(QIAGEN,貨號51106)提取外周血基因組DNA,使用超微量紫外可見分光光度計(ND-2000,Thermo Fisher Scientific)檢測提取的基因組DNA的質量是否合格,并存放于-20 ℃冰箱備用。
1.2.2SNP位點選擇 本研究選取CLPTM1L基因上游2 000 bp的區域作為CLPTM1L基因的轉錄調控區,并借助HaploReg v4.1[Ha]ploReg v4.1 (broadinstitute.org)〗對已報道與肺癌發生風險相關的CLPTM1L基因區域SNP位點(rs401681、rs402710和rs31489)及與其高度連鎖的SNP位點進行功能預測,根據每個SNP所在區域的染色質狀態,選取位于基因啟動子或者增強子區域內的SNP位點作為候選功能SNP位點[15]。由于rs27069、rs27070、rs27071和rs27996位于CLPTM1L基因上游的轉錄調控區,并位于基因啟動子或者增強子區域內,更可能具有調控CLPTM1L的生物學功能。因而在本研究中選取了rs27069、rs27070、rs27071和rs27996這4個SNP位點作為候選位點用于后續研究。
1.2.3SNP位點基因分型 采用TaqMan探針法對CLPTM1L轉錄調控區SNP位點rs27069、rs27070、rs27071和rs27996進行基因分型,TaqMan探針(貨號C___2854672_10、C___2854671_20、C___2854670_10和C___8769810_10)及分型試劑盒(貨號A30866)均購自美國 ABI公司。利用ABI公司的QuantStudio 6實時熒光定量PCR儀進行基因分型實驗。PCR反應體系的總體積為5 μL:Roche 2×prime STAR Max 2.5 μL,20× Probe 0.25 μL,樣品DNA 1 μL,無菌水1.25 μL。反應條件為95 ℃預變性10 min,92 ℃ 15 s、60 ℃ 1 min、擴增40個循環,72 ℃ 延伸5 min。使用QuantStudioTMReal-Time PCR軟件對基因分型原始數據進行分析,并針對每個SNP位點隨機選取10個樣本進行Sanger測序,對TaqMan 基因分型的結果進行驗證。
使用GraphPad Prism7.0對數據進行統計分析,使用t檢驗分析兩組被檢者的年齡差異有無統計學意義,采用χ2檢驗分析兩組被檢者的性別差異有無統計學意義,采用Hardy-Weinberg平衡檢測分析對照組樣本的代表性。使用SHEsis軟件[16]比較4個SNP位點等位基因和基因型頻率在各組中的差異有無統計學意義,并分析上述4個SNP位點之間的連鎖程度;構建上述4個SNP的單倍型,并用χ2檢驗計算所構建的單倍型在兩組被檢者中的分布頻率差異有無統計學意義。采用Bonferroni進行多重比較校正,由于本研究涉及4個SNP位點,當校正后P<0.0125(0.05/n,n=4)時,認為差異有統計學意義。
本次研究共納入非小細胞肺癌病例組500例和對照組613例。病例組和對照組間的年齡、性別比較差異無統計學意義(P=0.32和P=0.10)。按照病理類型分類,非小細胞肺癌病例組包含非小細胞肺癌肺腺癌(lung adenocarcinoma,AC)病例319例、肺鱗狀細胞癌(lung squamous cell carcinoma,SCC)154例和其他(大細胞癌)病例27例。Hardy-Weinberg檢驗結果顯示,CLPTM1L調控區4個SNP(rs27069、rs27070、rs27071及rs27996)的各基因型在對照組中的分布均符合Hardy-Weinberg平衡(P=0.916、P=0.926、P=0.29、P=0.851),表明本研究中所收集的樣本是具有群體代表性的。
結果顯示,rs27071的等位基因和基因型頻率在對照組和非小細胞肺癌組之間的差異有統計學意義(P=0.006、P=0.004),該位點的C等位基因可能與降低的肺癌發生風險相關(OR=0.67,95%CI為0.50~0.89);而rs27069、rs27070和rs27996位點的等位基因和基因型分布頻率在非小細胞肺癌病例組和對照組之間的差異無統計學意義(P>0.0125),提示這3個SNP位點與肺癌的發生風險可能不具有相關性。見表1。

表1 CLPTM1L基因4個SNP位點的等位基因和基因型在非小細胞肺癌組和對照組的分布頻率Tab.1 The allelic and genotypic distribution of SNPs in CLPTM1L genes between the case group and the control group
CLPTM1L調控區SNP(rs27069、rs27070、rs27071和rs27996)位點在對照組和病例組AC、SCC中的等位頻率和基因型頻率見表2。結果顯示,rs27071的C等位基因在對照組與病例組AC患者間的分布頻率差異有統計學意義(P=0.006,OR=0.61,95%CI為0.43~0.87),且rs27071位點基因型頻率在AC患者與對照組間之間的差異有統計學意義(P=0.012);而rs27071位點的等位基因和基因型在對照組與病例組SCC患者間的分布頻率差異無統計學意義(P>0.0125),提示rs27071位點的C等位更可能是非小細胞肺腺癌發生的保護性因素。

表2 CLPTM1L基因4個SNP位點的等位基因和基因型在腺癌組、鱗狀細胞癌組和對照組的分布頻率Tab.2 The allelic and genotypic distribution of SNPs in CLPTM1L genes among AC, SCC, and the control groups
連鎖不平衡分析顯示,rs27069、rs27070、rs27071和rs27996存在強連鎖(D'>0.95),故而進一步構建了CLPTM1L調控區SNP(rs27069、rs27070、rs27071和rs27996)位點的單倍型,并分析頻率>3%的單倍型在病例組和對照組中的頻率差異,分析結果顯示,病例組單倍型rs27069[T]-r27070[C]-rs27071[C]-rs27996[G]的分布頻率與對照組相比差異具有統計學意義(P=0.006),提示單倍型rs27069[T]-r27070[C]-rs27071[C]-rs27996[G]可能是云南漢族非小細胞肺癌發生的保護性性因素(OR=0.662,95%CI為0.493~0.890)。見表3。

表3 CLPTM1L基因4個SNP位點在非小細胞肺癌組和對照組的單倍型分析與比較Tab.3 Haplotype analysis and comparison of four SNPs in CLPTM1L between the case group and the control group
本文研究了CLPTM1L基因轉錄調控區內的四個單核苷酸多態性變異(rs27069、rs27070、rs27071和rs27996)與非小細胞肺癌發生風險的相關性,發現rs27071的C等位以及單倍型rs27069[T]-rs27070[C]-rs27071[C]-rs27996[G]與云南漢族人群非小細胞肺癌的發生風險顯著相關。
之前肺癌GWAS研究及后續的重復性研究已經報道了很多CLPTM1L基因區域中與肺癌的發生風險具有顯著相關性的位點,rs401681、rs402710和rs31489是其中最為顯著的SNP[9-11],然而,由于上述SNP位點均位于不太可能具有生物學功能的基因間區域[15],因而GWAS研究鑒定到的CLPTM1L基因區域的肺癌風險信號很可能并不來自rs401681、rs402710和rs31489本身。近年來,很多研究都發現位于基因轉錄調控區域的 SNPs能夠通過調節特定基因的表達來增加其攜帶者患肺癌的風險[12-14],因而可以推測位于CLPTM1L基因的轉錄調控區,且與rs401681、rs402710和rs31489高度連鎖的SNP更可能是該區域內真正具有功能的肺癌因果變異位點。
本研究發現位于CLPTM1L基因啟動子和增強子區域的rs27071與云南漢族人群非小細胞肺癌的發生風險顯著相關。2011年,Pande等[10]的研究也報道了rs27071與不吸煙者罹患肺癌的風險具有相關性,這與本研究的結果是一致的。值得注意的是,Fang等[17]使用ENCODE數據庫對rs27071進行功能注釋也發現rs27071位于CLPTM1L的轉錄調控區中。唇腭裂跨膜蛋白1樣蛋白(cleft lip and palate transmembrane protein 1-like,CLPTM1L)是一種能夠在肺、胰腺、卵巢和皮膚等正常組織及癌組織中廣泛表達跨膜蛋白[18-20]。目前已有研究表明CLPTM1L在肺癌組織中表達升高[21],且CLPTM1L還被報道能夠影響肺癌細胞的凋亡[21]、遷移和侵襲能力[22],因而推測rs27071可能通過改變CLPTM1L的基因表達,參與了肺癌的發生和發展進程。
2018年發表的一篇精細定位研究中,rs27996被認為是一個可能性非常大的致病性變異,因為rs27996位于CLPTM1L啟動子和增強子區域中ETS1、POI2和SIX5等轉錄因子結合位點的核心序列中[11],提示rs27996很可能通過影響這些轉錄因子與DNA序列的親和力,影響CLPTM1L的基因表達水平,從而參與肺癌的發生。但在此次研究中,rs27996與非小細胞肺癌發生風險的關聯并沒有達到顯著性的水平,這可能是本次實驗樣本量相對較小的原因導致的。
單倍型分析結果顯示,CLPTM1L的單倍型rs27069[T]-rs27070[C]-rs27071[C]-rs27996[G]與降低的云南漢族人群NSCLC的發生風險相關,由于上述4個SNP位點本身均位于CLPTM1L基因的啟動子或者增強子區域,因而上述4個SNP可能在調控CLPTM1L基因表達中發揮著協同效應。在之后的研究中將繼續開展雙熒光報告等功能性實驗對CLPTM1L基因表達調控的影響做進一步探究。
綜上所述,本研究發現位于CLPTM1L基因轉錄調控區的單核苷酸多態性變異及單倍型rs27069[T]-rs27070[C]-rs27071[C]-rs27996[G]與云南漢族人群非小細胞肺癌的發生風險顯著相關。Rs27071的C等位與單倍型rs27069[T]-rs27070[C]-rs27071[C]-rs27996[G]可能是云南漢人群非小細胞肺癌發生的保護性因素,研究結果將有助于鑒定CLPTM1L基因座中的潛在功能變異位點,并為肺癌的診斷和治療提供新的靶點。