田玉旺 許春偉 方美玉
腎癌、前列腺癌、膀胱癌及睪丸癌全基因組關聯研究計量和熱點的分析
田玉旺 許春偉 方美玉
目的 分析腎癌、前列腺癌、膀胱癌和睪丸癌全基因組關聯研究(GWAS)英文文獻數據的構成特征。方法對國際最新GWAS研究數據庫之一——美國國立人類基因組研究所(NHGRI)數據庫進行數據挖掘。結果 應用文獻計量學方法,客觀分析了NHGRI的文獻基本特征、第一第二階段樣本量、染色體區域相關(核苷酸多態性)SNP、風險等位基因頻率、P值文獻中最強SNP、優勢比(odds ratio,OR)或β相關系數、實驗平臺及檢測SNP 數量8項數據,找出了泌尿生殖系統腫瘤GWAS的一些共性特征。結論 8號染色體區域SNP多態性,可能是泌尿生殖系統腫瘤遺傳易感區域,深入此易感區域研究,可能為闡述腫瘤發生、治療及預后評估提供一定線索。
全基因組關聯研究;文獻研究;數據挖掘
(ThePracticalJournalofCancer,2014,29:1548~1552)
全基因組關聯研究(genome-wide association study,GWAS)是應用高通量基因芯片技術,對人類全基因組范圍內常見遺傳變異——單核苷酸多態性(single nucleotide polymorphism,SNP)和拷貝數變異(copy number variation,CNV)進行總體關聯分析的研究方法[1]。它基于DNA是可遺傳的且和臨近的等位基因從上一代傳遞給下一代這一理論。它可以在病例和對照中比較全基因組范圍內所有變異的等位基因頻率,從中發現與疾病相關聯的序列變異[2-3]。GWAS統計分析的基本原則是減少系統偏倚和加大研究強度,譬如進行強有力的SNP設定分析[4]。2007年4月Duggan等[5]和Murabito等[6]利用Illumina及Affymetrix的基因芯片對前列腺癌進行了GWAS,其結果同時首次在Science雜志上發表,自此以后越來越多腫瘤方面的GWAS研究結果陸續發表?,F通過對最新GWAS數據庫之一——NHGRI,進行腎癌、前列腺癌、膀胱癌和睪丸癌文獻特征數據分析挖掘,所獲得的GWAS數據信息或許能對國內泌尿生殖系統腫瘤GWAS產生參考作用。
研究資料來源于NHGRI,該數據庫由Hindorff等始建于2008年11月25日。登入頁面http://www.genome.gov/page.cfm?pageid=26525384#searchForm。在頁面下Disease/Trait一欄中輸入“Renal cell carcinoma”,點擊Search后,再點擊“Download Spreadsheet of Search Result”保存“MyGWASSearch.xls”,并改名為“Renal cell carcinoma.xls”,并用同樣的步驟獲得“Prostate cancer.xls”、“Bladder cancer.xls”和“Testicular cancer.xls”。
2.1 文獻基本特征
數據庫原記錄包含30篇論文[5-34](腎癌3篇,前列腺癌21篇,膀胱癌4篇、睪丸癌2篇)、涉及135個SNP(腎癌8個SNP,前列腺癌112個SNP,膀胱癌12個SNP,睪丸癌3個SNP)。論文分別發表在Nat Genet(IF:35.209/2012)16篇,BMC Med Genet(IF:2.536/2012)1篇,Cancer Biol Ther(IF:3.287/2012)1篇,Cancer Res(IF:8.65/2012)1篇,Hum Genet(IF:4.633/2012)1篇,Hum Mol Genet(IF:7.692/2012)7篇,J Natl Cancer Inst (IF:14.336/2012)1篇,Cancer Epidemiol Biomarkers Prev(IF:4.559/2012)2篇。
2.2 第一(篩選)階段樣本量
30篇泌尿生殖系統腫瘤GWAS研究文獻,第一階段病例組樣本量從202~6 621例;對照組從100~41 603例。按病例數/對照數的研究文獻的分布見表1。3.33%的文獻沒有明確報告對照組樣本量。

表1 泌尿生殖系統腫瘤GWAS文獻第一階段樣本量分布
注:NR為未報道。
2.3 第二(驗證) 階段樣本量
第二階段病例組樣本量從439~22 957例,沒有報告第二階段病例數據的文獻占3.33%。對照組從860~24 726例。按病例數/對照數的研究文獻的分布見表2。

表2 泌尿生殖系統腫瘤GWAS文獻第二階段樣本量分布
2.4 染色體區域相關SNP(NCBI rs登記號)
所定位的染色體區域分布大致與染色體長度近似。其中8號染色體明顯多于鄰近的染色體,見表3。
2.5 對照組相關風險等位基因頻率
泌尿生殖系統腫瘤GWAS文獻中對照組相關風險等位基因P頻率的分布見表4,其中未發現稀有變異(即在對照人群中的發生頻率<0.01)。
2.6 優勢比(odds ratio,OR)或β相關系數
文獻中最強SNP相關風險等位基因優勢比(或β相關系數),其中β相關系數最小值為1.04,最大值為3.07,見表5。
2.7P值文獻中最強SNP
相關風險等位基因P值選擇<1×10-6為錄入標準,最小P值3×10-33。P值分布見表6。
2.8 實驗平臺及檢測核苷酸多態性(SNP)數量
文獻中SNP試驗平臺見表7。超過一半(73.33%)的泌尿生殖系統腫瘤GWAS獨立使用了Illumina研究平臺,六分之一(16.67%)使用Affimetrix芯片系統。SNP數量從60 275~5 340 737個。16.67%研究試驗平臺的SNP數量在100萬~1 000萬間,見表7,8。
3.1 概述

表3 泌尿生殖系統腫瘤GWAS文獻染色體區域相關SNP (NCBI rs 登記號)

表4 泌尿生殖系統腫瘤GWAS文獻中對照組相關風險等位基因頻率分布

表5 最強SNP相關風險等位基因優勢比(或β相關系數)分布

表6 P值分布

表7 泌尿生殖系統腫瘤GWAS文獻實驗的試驗平臺分布

表8 泌尿生殖系統腫瘤GWAS文獻使用的試驗平臺檢測核苷酸多態性(SNP)數量
目前泌尿生殖系統腫瘤GWAS方面的報道主要在腎癌、前列腺癌、膀胱癌和睪丸癌領域,其中腎癌GWAS方面Purdue等[9]研究發現2p21區域(EPAS1基因)rs7579899、12q24.31區域(SCARB1基因)rs4765623和11q13.3區域(基因間隔區)rs7105934位點多態性與腎細胞癌遺傳易感性相關聯。Wu等[8]研究發現12p11.23區域(ITPR2基因)rs718314位點多態性與腎細胞癌遺傳易感性相關聯。前列腺癌GWAS方面2007年Murabito等[6]研究發現3p22區域(CTDSPL基因)rs9311171、6p12區域(PKHD1基因)rs10498792、5q14區域(HAPLN1基因)rs4466137、3q24區域(基因間隔區)rs345013和13q33區域(基因間隔區)rs1529276與前列腺癌遺傳易感性相關聯。并在在同一年Duggan等[5]也報道前列腺癌GWAS結果但未報道位點具體未知,以上這兩篇是GWAS首次在腫瘤中的報道,從此也拉開了腫瘤GWAS的序幕,此后在前列腺癌GWAS領域陸續發現上百個基因多態性位點。膀胱癌GWAS方面Wu等[32]研究發現8q24.3區域(PSCA基因)rs2294008位點多態性與膀胱癌遺傳易感性相關聯。睪丸癌GWAS方面Kanetsky等[34]研究發現9p24區域(DMRT1基因)rs7040024和rs755383與睪丸癌遺傳易感性相關。一年后Kanetsky等[33]又發現12q21.3區域(KITLG基因)rs4474514也與睪丸癌遺傳易感性相關。
3.2 NHGRI數據庫分析
通過對NHGRI數據庫中泌尿生殖系統腫瘤中八項數據進行不完全統計后,我們發現泌尿生殖系統腫瘤有如下特點:①在文獻基本特征方面:泌尿生殖系統腫瘤在Nat Genet發表的文獻最多,占53.33%,其次Hum Mol Genet占23.33%和Cancer Epidemiol Biomarkers Prev占6.67%,BMC Med Genet、Cancer Biol Ther、Cancer Res、Hum Genet和J Natl Cancer Inst各一篇。筆者推測Nat Genet以其影響力將是優質泌尿生殖系統腫瘤GWAS的主要陣地。②泌尿生殖系統腫瘤GWAS第一、二階段的病例組樣本量方面:一般從幾百例到幾萬例不等,且以千例為主,最大樣本量均不超過25,000例;對照組樣本量也從幾百例到幾萬例不等,但以千例以上為主,最大樣本量均為超過50,000例。③染色體區域相關SNP方面:以8號染色體區域SNP居多,其中8號染色體區域SNP在胃腸消化系統腫瘤中也居多。④對照組相關風險等位基因頻率方面:泌尿生殖系統腫瘤GWAS中風險等位基因以Risk Allele Frequency=0.40左右最多,其次是Risk Allele Frequency=0.50,但未發現稀有變異。⑤P值文獻中最強SNP方面:泌尿生殖系統腫瘤P值以10-10為主,其中最強P值2×10-33。⑥優勢比(odds ratio,OR)或β相關系數方面:泌尿生殖系統腫瘤OR以1.00左右的弱相關占多數,2.00以上的強相關也占相當一部分比例。⑦實驗平臺及檢測SNP 數量方面:泌尿生殖系統腫瘤實驗平臺方面Illumina研究平臺占大多數,其次是Affymetrix芯片系統,未見Perlegen或Invader研究平臺的報道。檢測SNP數量從60 275個到5 340 737個不等,1/6試驗平臺的SNP數量在100萬~1 000萬之間。
腫瘤方面GWAS的最終目標是應用于臨床,主要體現在對正常人群進行腫瘤的危險度預測評估和指導腫瘤的個體化治療。個體化治療推崇在腫瘤遺傳譜指導下的個體化醫學(personalized medicine),為腫瘤發生和治療療效提供早期預測,促進腫瘤預防和治療。泌尿生殖系統腫瘤GWAS經過7年的發展,已在腎癌、前列腺癌、膀胱癌和睪丸癌遺傳易感性研究方面取得了很大成功,為個體化治療打下了基礎。本文通過運用文獻計量學方法客觀分析了NHGRI的文獻基本特征、第一、二階段樣本量、染色體區域相關SNP、對照組相關風險等位基因頻率、P值文獻中最強SNP、優勢比(odds ratio,OR)或β相關系數和實驗平臺及檢測SNP 數量8項數據,找到了泌尿生殖系統腫瘤GWAS的一些共性特征,為把握泌尿生殖系統腫瘤GWAS的研究現狀和發展趨勢奠定基礎,并對國內泌尿生殖系統腫瘤GWAS產生參考作用。
[1] 張學軍.全基因組關聯分析對銀屑病遺傳學研究的啟示〔J〕.浙江大學學報(醫學版),2009,38(4):333-337.
[2] 嚴衛麗.復雜疾病全基因組關聯研究進展——研究設計和遺傳標記〔J〕.遺傳,2008,30(4):400-406.
[3] 嚴衛麗.復雜疾病全基因組關聯研究進展——遺傳統計分析〔J〕.遺傳,2008,30(5):543-549.
[4] Kraft P,Cox DG.Study designs for genome-wide association studies〔J〕.Adv Genet,2008,60:465-504.
[5] Duggan D,Zheng SL,Knowlton M,et al.Two genome-wide association studies of aggressive prostate cancer implicate putative prostate tumor suppressor gene DAB2IP〔J〕.J Natl Cancer Inst,2007,99(24):1836-1844.
[6] Murabito JM,Rosenberg CL,Finger D,et al.A genome-wide association study of breast and prostate cancer in the NHLBI's Framingham Heart Study〔J〕.BMC Med Genet,2007,8 (Suppl 1):S6.
[7] Henrion M,Frampton M,Scelo G,et al.Common variation at 2q22.3 (ZEB2) influences the risk of renal cancer〔J〕.Hum Mol Genet,2013,22(4):825-831.
[8] Wu X,Scelo G,Purdue MP,et al.A genome-wide association study identifies a novel susceptibility locus for renal cell carcinoma on 12p11.23〔J〕.Hum Mol Genet,2012,21(2):456-462.
[9] Purdue MP,Johansson M,Zelenika D,et al.Genome-wide association study of renal cell carcinoma identifies two susceptibility loci on 2p21 and 11q13.3〔J〕.Nat Genet,2011,43(1):60-65.
[10] Nam RK,Zhang W,Siminovitch K,et al.New variants at 10q26 and 15q21 are associated with aggressive prostate cancer in a genome-wide association study from a prostate biopsy screening cohort〔J〕.Cancer Biol Ther,2011,12(11):997-1004.
[11] Cheng I,Chen GK,Nakagawa H,et al.Evaluating genetic risk for prostate cancer among Japanese and Latinos〔J〕.Cancer Epidemiol Biomarkers Prev,2012,21(11):2048-2058.
[12] FitzGerald LM,Kwon EM,Conomos MP,et al.Genome-wide association study identifies a genetic variant associated with risk for more aggressive prostate cancer〔J〕.Cancer Epidemiol Biomarkers Prev,2011,20(6):1196-1203.
[13] Sun J,Zheng SL,Wiklund F,et al.Sequence variants at 2- 2q13 are associated with prostate cancer risk〔J〕.Cancer Res,2009,69(1):10-15.
[14] Tao S,Feng J,Webster T,et al.Genome-wide two-locus epistasis scans in prostate cancer using two European populations〔J〕.Hum Genet,2012,131(7):1225-1234.
[15] Amin Al Olama A,Kote-Jarai Z,Schumacher FR,et al.A meta-analysis of genome-wide association studies to identify prostate cancer susceptibility loci associated with aggressive and non-aggressive disease〔J〕.Hum Mol Genet,2013,22(2):408-415.
[16] Schumacher FR,Berndt SI,Siddiq A,et al.Genome-wide - association study identifies new prostate cancer susceptibility loci〔J〕.Hum Mol Genet,2011,20(19):3867-3875.
[17] Xu J,Mo Z,Ye D,et al.Genome-wide association study in Chinese men identifies two new prostate cancer risk loci at 9q31.2 and 19q13.4〔J〕.Nat Genet,2012,44(11):1231-1235.
[18] Kote-Jarai Z,Olama AA,Giles GG,et al.Seven prostate c- ancer susceptibility loci identified by a multi-stage genome-wide association study〔J〕.Nat Genet,2011,43(8):785-791.
[19] Haiman CA,Chen GK,Blot WJ,et al.Genome-wide association study of prostate cancer in men of African ancestry identifies a susceptibility locus at 17q21〔J〕.Nat Genet,2011,43(6):570-573.
[20] Takata R,Akamatsu S,Kubo M,et al.Genome-wide association study identifies five new susceptibility loci for prostate cancer in the Japanese population〔J〕.Nat Genet,2010,42(9):751-754.
[21] Eeles RA,Kote-Jarai Z,Al Olama AA,et al.Identification of seven new prostate cancer susceptibility loci through a genome-wide association study〔J〕.Nat Genet,2009,41(10):1116-1121.
[22] Gudmundsson J,Sulem P,Gudbjartsson DF,et al.Genome-wide association and replication studies identify four variants associated with prostate cancer susceptibility〔J〕.Nat Genet,2009,41(10):1122-1126.
[23] Eeles RA,Kote-Jarai Z,Giles GG,et al.Multiple newly identified loci associated with prostate cancer susceptibility〔J〕.Nat Genet,2008,40(3):316-321.
[24] Gudmundsson J,Sulem P,Rafnar T,et al.Common sequen- ce variants on 2p15 and Xp11.22 confer susceptibility to prostate cancer〔J〕.Nat Genet,2008,40(3):281-283.
[25] Thomas G,Jacobs KB,Yeager M,et al.Multiple loci identified in a genome-wide association study of prostate cancer〔J〕.Nat Genet,2008,40(3):310-315.
[26] Gudmundsson J,Sulem P,Steinthorsdottir V,et al.Two variants on chromosome 17 confer prostate cancer risk,and the one in TCF2 protects against type 2 diabetes〔J〕.Nat Genet,2007,39(8):977-983.
[27] Gudmundsson J,Sulem P,Manolescu A,et al.Genome-wide association study identifies a second prostate cancer susceptibility variant at 8q24〔J〕.Nat Genet,2007,39(5):631-637.
[28] Yeager M,Orr N,Hayes RB,et al.Genome-wide association study of prostate cancer identifies a second risk locus at 8q24〔J〕.Nat Genet,2007,39(5):645-649.
[29] Garcia-Closas M,Ye Y,Rothman N,et al.A genome-wide association study of bladder cancer identifies a new susceptibility locus within SLC14A1,a urea transporter gene on chromosome 18q12.3〔J〕.Hum Mol Genet,2011,20(21):4282-4289.
[30] Rafnar T,Vermeulen SH,Sulem P,et al.European genome-wide association study identifies SLC14A1 as a new urinary bladder cancer susceptibility gene〔J〕.Hum Mol Genet,2011,20(21):4268-4281.
[31] Rothman N,Garcia-Closas M,Chatterjee N,et al.A multi-stage genome-wide association study of bladder cancer identifies multiple susceptibility loci〔J〕.Nat Genet,2010,42(11):978-984.
[32] Wu X,Ye Y,Kiemeney L A,et al.Genetic variation in the prostate stem cell antigen gene PSCA confers susceptibility to urinary bladder cancer〔J〕.Nat Genet,2009,41(9):991-995.
[33] Kanetsky PA,Mitra N,Vardhanabhuti S,et al.A second independent locus within DMRT1 is associated with testicular germ cell tumor susceptibility〔J〕.Hum Mol Genet,2011,20(15):3109-3117.
[34] Kanetsky PA,Mitra N,Vardhanabhuti S,et al.Common variation in KITLG and at 5q31.3 predisposes to testicular germ cell cancer〔J〕.Nat Genet,2009,41(7):811-815.
(編輯:吳小紅)
Measurement and Hot Research of Genome-wide Association Study in Renal Cell Carcinoma、Prostate Cancer、Bladder Cancer and Testicular Cancer
TIANYuwang,XUChunwei,FANGMeiyu.
DepartmentofPathology,theMilitaryGeneralHospitalofBeijingPLA,Beijing,100700
Objective To analyze the data constitution features of genome-wide association study (GWAS) in Renal cell carcinoma、Prostate cancer、Bladder cancer and Testicular cancer in English literature.Methods National human genome institute GWAS database,one of the latest international research database of GWAS,was meticulously data mined.Results Using literature metrology method objectively analyzed 8 data of the NHGRI's basic characteristics of the literature,the first and second stage of sample size,chromosomal regions associated SNPS,related risk allele frequency in the control group,P value with the strongest SNP in the literature,odds ratio or beta coefficient of correlation and experimental platform including testing the SNP number,and found out the common characteristics of the urogenital system tumor GWAS.Conclusion Chromosome 8 regional SNP polymorphism may be the urogenital system tumor genetic susceptibility region,and through into the susceptible area can provide some clues in the treatment of cancer and prognosis assessment.
Genome-wide Association Study( GWAS);Literature research;Data Mining
100700 中國人民解放軍北京軍區總醫院(田玉旺,許春偉);310021 浙江省腫瘤醫院中西醫結合科(方美玉)
許春偉
10.3969/j.issn.1001-5930.2014.12.012
R73-36
A
1001-5930(2014)12-1548-05
2014-02-24
2014-03-18)