沈智俊 劉世國
近10年來,肺癌的發生率逐年提高。大多數肺癌患者在初次診斷時就已經有轉移。即使在之后行根治性切除術,5年生存率只有25~30%。所有肺癌病例中,非小細胞肺癌(Non-small cell lung cancer,NSCLC)約占85%[1]。肺癌是環境和遺傳因素相互作用的結果,其遺傳因素在其發生發展中的作用越來越受到人們的重視。許多學者對單核苷酸多態性(single nucleotide polymorphism,SNP)和肺癌易感性之間的關系進行了深入的研究,并取得了良好的效果[2]。目前,關于NSCLC 易感基因單核苷酸多態性的研究,我國已有開展,但湖北地區漢族人群卻研究較少。將這些易感基因的單核苷酸多態性位點作為風險因素或可疑信號,運用到腫瘤個體化治療的診斷還需要進一步驗證。本研究采用高通量實時多聚酶鏈反應(PCR)評估湖北地區漢族人群NSCLC 患者相關基因單核苷酸多態性突變型的情況,為肺癌綜合防治提供科學依據。
選取2016年1月到2018年1月,本院收集的51 例NSCLC 患者的樣本作為患者組。其中,男性36 人(70.6%),女性15 人(29.4%),平均年齡(62.4±14.1)歲。入選標準包括:①進行過X 光或CT 檢測,發現有肺部陰影;②通過細胞組織病理切片確診為NSCLC;③患者只有NSCLC 而沒有其他器官的惡性腫瘤。排除標準為:①本次治療以前該患者被診斷過其他惡行腫瘤;②本次治療以前該患者執行過放療或手術治療;③該患者同時患有嚴重的內分泌疾病;④該患者同時患有心腦血管疾病;⑤該患者同時患有慢性肝臟和腎臟功能異常;⑥該患者有精神障礙,不能正常交流。同時收集了64 位健康人作為對照組,包括男性35 人(54.7%),女性29 人(45.3%),平均年齡(61.8±15.3)歲。入選標準為:①沒有腫瘤患病史或腫瘤臨床特征;②入選者之間沒有血緣關系。對照組的排除標準同患者組。所有患者及家屬均已簽署知情、同意書。本研究經本醫院醫學倫理委員會批準。
核酸提取采用離心柱型DNA 提取試劑盒(DP318,天根生化科技(北京)有限公司);引物合成及PCR 試劑均購自生工生物工程(上海)股份有限公司;核酸定量采用NanoDrop One/OneC 微量紫外-可見光分光光度計(Thermo Scientific,中國)進行;PCR擴增儀為GeneAmp?PCR system9700(Applied Biosystem,中國)。
本研究通過調查問卷的形式獲取樣本的相關信息,每位入選者抽取外周靜脈血5 mL,EDTA 抗凝,放-20℃備用。待入組完成后,按DNA 提取試劑盒說明書對人外周血樣本進行核算提取。采用NanoDrop 分析儀對各DNA 樣本進行濃度測定及質量評價。確定符合后續實驗條件后,取10 μL 進行PCR 擴增,反應條件為94℃5 min;以下3 個溫度循環32 次:94℃30 s,57℃35 s,72℃40 s。然后將擴增產物送生工生物工程(上海)股份有限公司測序,分析各SNP 位點突變情況。SNP 檢測位點及其PCR 引物見表1。

表1 SNP 檢測位點及PCR 引物Table 1 SNP and PCR primers
采用SPSS 25.0 軟件進行數據分析。計量資料采用(±s)表示,用t檢驗,計數資料用n(%)表示,采用χ2檢驗;對于基因的多態性位點與NSCLC 的相關性采用logistic 單因素分析;對于基因的多態性位點與NSCLC 的因果關系,本研究選擇顯性模型,采用非條件二分類logistic 回歸分析,計算優勢比,P<0.05 為差異有統計學意義。
入選的研究人群中,有吸煙史的人數,NSCLC患者組較健康人群組多,但截至入組時還在吸煙的人數,NSCLC 患者組較健康人群組無統計學差異。測序結果表明,NSCLC 患者的ALK、EGFR、ROS1單核苷酸多態性突變的陽性率都要比健康人群高,特別是EGFR單核苷酸多態性突變型(P<0.05)。見表2。
Logistic 單因素分析表明,ALK的rs113994090和rs113994092 突變型與NSCLC 易感性顯著性相關(P<0.05);EGFR的rs28929495,rs121434568,rs121434569,rs12193428,rs121913465,rs397517127,rs606231253 也與NSCLC 易感性顯著性相關(P<0.05),但ROS1位點與NSCLC 易感性的相關性無顯著性差異(P>0.05)。見表3。
Logistic 回歸分析結果表明,EGFR的幾個單核苷酸多態性突變型均是NSCLC 易感性的風險因素,其中優勢比最高的位點是rs121434569;ALK與NSCLC 易感性的患病風險比較差異無統計學意義(P>0.05)。見表4。
表2 兩組臨床資料對比[n(%),(±s)]Table 2 Comparison of clinical data in the two groups[n(%),(±s)]

表2 兩組臨床資料對比[n(%),(±s)]Table 2 Comparison of clinical data in the two groups[n(%),(±s)]
注:a 為采用fisher 精確概率法計算。
類別平均年齡(歲)性別男性女性入組時有肝轉移例數吸煙史從不現在吸以前吸癌胚抗原(CEA)(ng/mL)NSCLC 分型腺癌鱗癌其他ALK 突變比率陽性陰性EGFR 突變比率陽性陰性ROS1 突變比率陽性陰性健康人群組(n=64)61.8±15.3 NSCLC患者組(n=51)62.4±14.1 t/χ2值0.196 3.038 P 值0.8045 0.087 35(54.7)29(45.3)-36(70.6)15(29.4)32(41.2)28(43.8)26(40.6)10(15.6)2.76±1.65 9(17.6)14(27.5)28(54.9)259.89±345.51 8.862 2.172 19.790 0.003 0.141<0.001---46(90.2)3(5.9)2(2.9)5.123a 0.024 1(1.6)63(98.4)3(4.7)61(95.3)0(0)64(100)6(11.8)45(88.2)31(60.8)20(39.2)3(5.9)48(94.1)42.890<0.001 3.866a 0.049
不同個體對環境因素造成的影響是有差異的,造成這種差異的一個重要的內在因素就是單核苷酸多態性(Single nucleotide polymorphism,SNP)。人類基因組目前已發現1.5×107個SNP 位點,每隔300~600 bp 就有一個[3]。關于NSCLC 易感性與SNP 的關聯分析一直是熱點,近期的研究包括:維生素D 信號通路的相關分子[4],端粒酶TERT基因[3-4],TOP2A和ERCC1[5],miR-423-3p 基因拷貝數變異[6],非轉移性細胞1 基因[7],IL-17F 和IL-17A[8]等,均與NSCLC 易感性相關。本研究通過分析全基因組關聯(Genome-wide association,GWAS)數據庫(https://atlas.ctglab.nl/)[9],備選了ALK、EGFR、ROS1的幾個位點,研究在湖北漢族人群中,其SNP 與NSCLC 的易感性是否相關。

表3 ALK、EGFR、ROS1 基因多態性logistic 單因素分析Table 3 Univariate analysis of polymorphism of ALK,EGFR and ROS1 by logistic regression

表4 ALK、EGFR、ROS1 基因二分類logistic 回歸分析Table 4 Binary Logistic Regression analysis of ALK,EGFR and ROS1 genes
ALK是間變性淋巴瘤激酶基因,其重排可誘導NSCLC[10],不同人群NSCLC 患者的ALK陽性突變的比率在1.4~13%之間[11]。尤其是NSCLC Ⅳ期患者,ALK陽性突變的比率相比其他幾個NSCLC 分期都要高[12]。本研究進一步明確了ALK與NSCLC發生的相關關系,但并非患病的危險因素。
EGFR是表皮生長因子受體基因,其致癌突變在低分化型和預后不良的NSCLC 患者中很常見,90%的EGFR突變存在于18-21 外顯子中[13]。其突變的頻率在不同種族之間差異較大,Kosaka 等[14]報道,日本人群的突變頻率要顯著高于歐美人群。而我國的研究發現,中國人群的突變頻率甚至達30%[15]。本研究表明,EGFR的突變型頻率在選取的三個基因中最高,這也與國際上的研究結果一致。本研究選取的EGFR各單核苷酸多態性位點均與NSCLC 的易感性顯著相關,其中,rs121434568,rs121434569,rs12193428,rs121913465 是NSCLC 患病的危險因素。曾有報道EGFR的rs2293347 位點與吉非替尼臨床療效相關[16],筆者推測這幾個位點也是通過突變改變了EGFR 受體的生物學功能,進而影響了疾病的發生,確切機制還需要進一步研究。
ROS1是c-ros 肉瘤致癌因子基因,在NSCLC的患者中有ROS1重排的發生,但其重排的發生率不及EGFR和ALK的突變率高[17]。ROS1的重排多發于年輕的非吸煙的NSCLC 患者中,這與其他幾種突變不同(EGFR突變/KRAS突變/ALK重排)。有研究通過原位雜交檢測ROS1的重排,發現其比率僅為1.7%[18]。本研究中,ROS1的單核苷酸多態性突變與NSCLC 之間的相關性無顯著差異,因此未能分析其易感性,這很有可能是筆者的數據較少導致,需增加臨床病例以確定最終結論。
NSCLC 的病理分型中,肺腺癌占比最多,約50%,其次是鱗癌,約30%[6],而本研究收集的樣本大部分為腺癌,鱗癌樣本較少,導致分析數據有一定的偏向性。另外,本研究選擇顯性模型進行統計分析,因為在將雜合型與純合型突變分別分析時,發現與將二者合并分析得到了一致的統計學結論。由于技術原因,很多分析不能進行,例如部分位點存在連鎖不平衡,可能會影響最終結果判斷。同時,腫瘤作為一種系統性疾病[19],不僅是遺傳因素,環境因素和心理因素的影響同樣重要,本研究模型未將是否吸煙這一因素加入,導致其有一定的局限性。即便如此,目前包括miRNA 及LncRNA 的SNP 與疾病的相關性研究還是越來越多[20-21],這些相關分析有利于解釋個體的不同個體對系統性疾病的易感性以及對各種藥物的耐性和對環境因素反應的差異,是后續研究的基礎。本研究下一步將從生物學功能的角度,探討SNP 與系統性疾病的因果關系,為腫瘤診斷與預防提供理論支持。