韓仁杰吳傳城劉寶英 *郭賽熊陳 昱
(1. 福建醫科大學公共衛生學院,福建福州 350108;2. 福建省莆田市仙游縣醫院,福建 莆田 351200)
胃癌是世界范圍內最常見的惡性腫瘤,居消化系統腫瘤的首位[1]。加強對胃癌高發區高危人群發生胃癌危險性的監控,對胃癌的防治有重要的現實意義[2]。近年來大量的流行病學研究發現某些基因3′非翻譯區(untranslated region,UTR)有許多單核苷酸多態性位點(single nucleotide polymorphisms,SNPs)與腫瘤的易感性顯著相關,研究表明基因3′UTR的SNPs與人類疾病相關的機制之一,是其存在miRNA的結合位點[3],這些SNPs的存在有可能影響miRNA-mRNA配對的有效性以及結合數量,從而通過影響基因的轉錄后調控,參與腫瘤的發生發展[4]。本研究采用SNP芯片聯合飛行時間質譜技術篩檢福建省仙游縣胃癌患者血液中差異的消化道腫瘤相關基因3′UTR區SNPs,采用病例-對照研究分析芯片篩選出來的SNPs與胃癌易感性的關系。
采用1∶1配對的病例-對照研究,胃癌病例來源于福建省仙游縣醫院的胃癌新發病例。大樣本納入標準為:經手術或內窺鏡取得組織標本,經病理確診的新發病例;確診日期為2013年4月至2017年10月;在仙游本地居住10年以上。芯片組納入標準是在此基礎上選擇男性,年齡50~70歲之間,經病理確診為胃腺癌的患者。排除標準:經病理確診為胃部炎癥、良性病變及病情危重或不能清晰回答問題者及腫瘤繼發病例和復發病例。
健康對照納入標準:按性別、年齡、地區與病例進行配對,其中芯片健康對照選擇年齡±3歲與病例進行配對,大樣本健康對照選擇年齡±5歲與病例進行配對。選擇在仙游本地居住10年以上者。排除標準為:胃癌或慢性萎縮性胃炎的直系家屬。
以上標本均要求資料和血樣完整,最后SNP芯片篩選階段我們納入96例胃癌患者和96例對照,均為男性,年齡分布在52~71歲之間。其中病例組平均年齡(63.84±4.64)歲,對照組平均年齡(63.84±4.66)歲。
在驗證階段納入確診胃癌病例622例,正常對照622例,其中男性466對,女性156對。病例組由312例賁門癌患者和310例非賁門癌患者組成。病例組年齡分布在39~89歲之間,平均年齡為(67.32±9.72)歲;對照組年齡分布在41~87歲之間,平均年齡為(67.22±9.65)歲。經均衡性檢驗,病例組與對照組在年齡、性別、職業等方面差異均無統計學意義(P>0.05)。病例組中高中及以上的文化程度比例低于對照組,已婚的比例高于對照組,差異有統計學意義(P<0.05)。
采用統一設計的調查表,進行面對面的訪談式調查。病例的病史資料經患者本人及醫院同意后通過摘錄電子病歷獲得。調查內容包括研究對象的年齡、性別、文化程度、婚姻狀況、職業史等相關因素,同時采集病例及對照人群的空腹外周靜脈血5 mL,抽取的血樣置于EDTA抗凝管,3 000 r/min離心10 min后,分裝成血漿、白細胞、紅細胞,置-80 ℃低溫冰箱保存。本研究涉及的調查數據及人體數據,均已通過福建醫科大學生物醫學研究倫理委員會的審查,符合醫學倫理相關規定和要求。
1.3.1 基因分型原理 本過程通過Affymetrix Axiom SNP芯片對芯片中消化道腫瘤相關基因3′UTR區SNPs進行基因分型,基因芯片分型技術采用酶介導及單堿基測序的全自動化流程。
1.3.2 消化道腫瘤相關基因3′UTR區SNPs的篩選方法 利用KEGG-PATHWAY數據庫(http://www.kegg.jp/kegg/pathway)搜索食管癌、胃癌、腸癌、肝癌等消化道腫瘤相關基因。根據dbSNP數據庫(https://www.ncbi.nlm.nih.gov/snp/)篩選位于這些基因3′ UTR的SNPs。將篩選出的SNPs與芯片位點做交集。再利用SPSS和Excel軟件對所有的消化道腫瘤相關基因3′UTR區SNPs進行卡方檢驗,選取 P<0.10的位點;根據千人基因網站(https://www.ncbi.nlm.nih.gov/variation/tools/1000 genomes/)查找各位點的最小等位基因頻率(minor allele frequency,MAF),選擇MAF在0.15~0.40的位點;對各多態性位點進行Hardy-Weinberg遺傳平衡度檢驗,選取基因型頻率分布在健康對照人群中符合Hardy-Weinberg遺傳平衡定律的位點進行后續實驗分析。
1.3.3 大樣本人群中miRNA基因分型原理與方法 將芯片中篩選得到的5個SNPs位點區域的DNA模板通過PCR技術擴增,再使用特異的延伸引物與PCR產物進行單堿基延伸反應。通過基質輔助激光解吸附電離飛行時間質譜分析質譜技術(MALDI-TOF-MS),檢測延伸產物相對分子質量,應用專用的分析軟件,通過判斷分子大小的差異而進行SNP分型檢測。
對芯片選取的5個SNP位點進行基因型鑒定,使用Sequenom公司Genotyping Tools及Mass ARRAY Assay Design軟件設計待測SNP位點的PCR擴增引物及單堿基延伸引物,見表1。

?
按以下標準進行質量控制:①所有病例均經過病理確診;②芯片分型過程中使用評估信號值分布與背景信號值的差異(Dish QC)對樣品進行質控,Dish QC低于0.82的樣品不納入后續的分型中;③基因型的判讀采用盲法;④芯片檢測與MALDI-TOF-MS檢測進行結果一致性比較;⑤少數樣本由于DNA質量或者濃度問題,未能檢測出基因型的樣本予以剔除。
所有實驗室基因型數據經過核實后建立數據庫,采用 χ2檢驗對病例組和對照組的一般人口學資料進行均衡性檢驗;采用 χ2檢驗計算對照組的各基因多態性位點分布是否符合Hardy-Weinberg平衡定律(H-W平衡);采用Cox Regression命令擬合條件Logistic模型對單個位點的基因型、等位基因進行單因素Logistic分析,計算其比值比(odds ratio, O R)及95%可信區間(confidential interval, C I)。以上分析均采用SPSS 21.0軟件包完成。所有 P值基于雙側檢驗,統計學檢驗水準α=0.05。
按照消化道腫瘤相關基因3′UTR區SNPs篩選策略,最終選出5個與胃癌相關的消化道腫瘤相關基因3′UTR區SNPs,見圖1。分別為表皮生長因子受體(epidermal growth factor receptor, EGFR) EG FR rs884225 C>T, EGFR r s10277413 G>T,F A S r s1468063 C>T,MSH2 rs17502941 A >G,M SH2 r s11125144 A >G,見表2。
本次選取的5個SNPs位點的基因型頻率分布在對照組中符合H-W 平衡(P >0.05)。經婚姻狀況、文化程度等危險因素校正的條件Logistic回歸分析未發現兩位點與胃癌易感性相關,見表3。對病例-對照的分層分析顯示rs884225中含有T等位基因的基因型(CT+TT)與賁門癌相關(O R= 0.67,95% C I:0.46~0.99),而其他位點與賁門癌、非賁門癌的風險關聯無統計學意義(P>0.05),見表4。

圖1 消化道腫瘤相關基因 3 ′UTR區 S NPs篩選情況圖

表2 有差異的消化道腫瘤相關基因3 ′UTR 區 S NPs 及其基本信息
2.3.1 EGFR基因單體型分析 我們所研究的EGFR基因2個多態性位點共可產生4個單體型SNP位點,排列順序依次為rs884225、rs10277413,結果單體型1~4在病例和對照組的分布差異均無統計學意義(P>0.05)。見表5和表6。
2.3.2 MSH2基因單體型分析MSH2基因2個多態性位點共可產生4個單體型SNP位點,排列順序依次為rs17502941、rs11125144,結果單體型1~4在病例和對照組的分布差異均無統計學意義(P>0.05)。見表7和表8。
近年來發現miRNA在轉錄后水平調控基因的表達進而參與調控腫瘤的發生發展。而miRNA與SNP均在分子水平上對腫瘤的發生發展產生一定的調控作用[5],因此探索miRNA與SNP之間的相互作用對腫瘤的作用不容忽視。miRNA編碼基因本身可存在SNPs位點[6],而在靶基因mRNA 3′UTRs的miRNA結合位點上也有可能存在SNPs位點[7],單個堿基的改變均有可能影響miRNA與mRNA配對的有效性以及結合數量,從而在轉錄后水平改變靶基因的蛋白質表達[8]。由于miRNA片段小,發生在miRNA編碼基因上的SNP數量少,而miRNA與靶基因結合位點上的SNPs可減弱相應miRNA對靶基因的翻譯抑制效應,增強靶基因表達或者形成新的miRNA結合位點,從而抑制靶基因的表達[9]。若該基因與胃癌的發生發展密切相關,則發生在其3′非翻譯區的SNP可影響胃癌的易感性。目前對于miRNA靶位點的SNP與腫瘤的研究多采用生物信息學預測的方法[10],由于預測結果缺乏一定的可靠性,因此在本研究中我們采用SNP芯片對消化道腫瘤相關基因3′UTR區SNPs位點進行關聯分析,然后通過飛行時間質譜法驗證,最后發現1個SNP位點與賁門癌易感性相關。

表3 消化道腫瘤相關基因3′UTR區SNPs與胃癌的關聯程度
本次研究首先通過生物信息學方法篩選出43個消化道腫瘤相關基因共計10 494個3′UTR區SNPs位點。但其中包含了許多SNPs位置相同但名稱不一致的位點,我們為了不遺漏地篩選出消化道腫瘤相關基因3′UTR區SNPs,將所有通過生物信息學篩選出的SNPs位點與SNP芯片中的位點做交集,發現有9個消化道腫瘤相關基因3′UTR區SNPs位點在芯片中。通過卡方檢驗分析后發現有5個SNPs位點基因分型在病例對照組中分布差異有統計學意義,然后對該5個SNPs位點進行大樣本驗證,最后篩查出來的5個SNPs中發現EGFR rs884225與賁門癌的易感性相關(P<0.05),而其他位點與胃癌發病風險無關聯(P>0.05)。有文獻報道EGFR rs884225[11]及 F AS rs1468063[12]均與胃癌的發病風險密切相關,而其他位點還未見相關文獻報道。

表4 消化道腫瘤相關基因3′UTR區SNPs與不同胃癌部位的關聯程度

表5 EGFR不同單體型在胃癌人群中的分布情況

表6 EGFR不同單體型在賁門癌、非賁門癌人群中的分布情況

表7 MSH2不同單體型在胃癌人群中的分布情況

表8 MSH2不同單體型在賁門癌、非賁門癌人群中的分布情況
表皮生長因子受體(EGFR)是HER/cerb-B家族跨膜受體酪氨酸激酶成員[13],能促進上皮細胞增生,與乳腺癌[14]、 非小細胞肺癌[15]、 結直腸癌[16]等多種腫瘤密切相關。大量研究表明, EGFR基因與胃癌的發生、發展及遺傳有關[17-18]。而發生在其3′UTR的SNP將影響miRNA的調控作用,新的SNP可以減弱相應miRNA對其翻譯的抑制效應,增強靶基因表達或者形成新的miRNA結合位點,從而抑制靶基因的表達。
進一步擴大樣本量后的病例-對照研究方法發現EGFRrs884225 C>T攜帶CT+TT基因型的個體與CC基因型相比,患賁門癌的風險明顯增加。且根據多個生物信息學數據庫預測結果,我們發現miR-31、miR-214可與 EGFR r s884225位點C等位基因結合,而EGFR rs884225位點C等位基因突變成T等位基因后,會增加更多miRNA的調控作用,形成miR-103、miR-107、miR-424、miR-486-3p、miR-497與 EGFR的新的結合位點,從而抑制了 EGFR基因的翻譯過程,對賁門癌的發生具有一定的保護作用,這與我們的結果是相一致的。為了進一步探討單體型對胃癌發生風險的影響,分別聯合了 EGFR( r s884225、rs10277413)和MSH2(rs17502941、rs11125144)基因的2個3′UTR SNPs位點構建單體型,但均未發現單體型與胃癌、賁門癌、非賁門癌發病風險有關。
本次研究從消化道腫瘤相關基因3′UTR區SNPs角度探討新發現的SNP位點是否存在與胃癌相關的遺傳易感標志物。研究結果發現, EGFR基 因3′UTR的rs884225多態性位點改變可能引起miRNA對其表達調控過度導致在體內低表達,從而抑制賁門癌的發生,但具體的作用機制還需進一步實驗驗證。miRNA靶基因3′UTR SNPs與腫瘤關系的分子流行病學研究是目前的熱點[19],通過分子流行病學的研究積累,可以對腫瘤的發生有較好的預見作用,進而有利于腫瘤的預防甚至是預后的判斷。[20]