劉 鐳,黃 亮,車清海,趙恩宏,黃 旭,程露陽,肖麗君
(1.承德醫(yī)學(xué)院基礎(chǔ)醫(yī)學(xué)部免疫教研室,河北 承德 067000;2.承德醫(yī)學(xué)院附屬醫(yī)院腫瘤診治中心,河北 承德 067000;3.吉林市龍?zhí)秴^(qū)婦幼保健院婦產(chǎn)科 132000)
乳腺癌是嚴(yán)重威脅婦女健康的惡性腫瘤,發(fā)病率已躍居國內(nèi)婦女癌癥發(fā)病首位[1]。X線片篩查受影像學(xué)特點(diǎn)的制約,使很多患者失去了早期發(fā)現(xiàn)的機(jī)會(huì)[2]。篩查腫瘤生物標(biāo)記物對(duì)乳腺癌的早期發(fā)現(xiàn)具有重要意義,成為目前研究的主要焦點(diǎn)[3]。隨著生物數(shù)據(jù)的急劇增長和計(jì)算機(jī)技術(shù)的快速提高,生物信息學(xué)這一新興學(xué)科得到了前所未有的迅速發(fā)展,尤其是應(yīng)用生物信息學(xué)方法發(fā)現(xiàn)新基因和進(jìn)行功能研究[4]。本文通過腫瘤基因組解剖計(jì)劃(cancer genome anatomy project,CGAP)基因表達(dá)系列分析(SAGE)數(shù)據(jù)庫,全面分析腫瘤組織基因表達(dá)譜,篩選新的乳腺癌高表達(dá)基因,并對(duì)其中一條功能未知的新基因FAM83A進(jìn)行了初步的生物學(xué)分析,為進(jìn)一步深入研究該基因的生物學(xué)功能及其參與乳腺癌發(fā)生發(fā)展的分子機(jī)制奠定了基礎(chǔ)。
1.1 材料 乳腺癌細(xì)胞系MDA-MB-231和MCF-7來自承德醫(yī)學(xué)院中心實(shí)驗(yàn)室。承德醫(yī)學(xué)院附屬醫(yī)院收集5例乳腺癌手術(shù)切除標(biāo)本(均經(jīng)術(shù)后病理證實(shí)),相應(yīng)的距癌灶邊緣2cm以外的癌旁組織,以及5例乳腺纖維瘤組織,各約100mg。標(biāo)本裝入無菌管內(nèi),迅速投入液氮罐內(nèi)冷凍。
1.2 方法
1.2.1 差異基因的篩選 利用CGAP提供的SAGE Genie數(shù)據(jù)庫,選取數(shù)字基因表達(dá)演示工具。選擇乳腺癌組織和乳腺良性腫瘤兩個(gè)池,設(shè)置F值為2,即表達(dá)差異大于2倍以上;Q為0.1。差異表達(dá)的基因按差異顯著性高低排序,比對(duì)出在短、長序列標(biāo)簽文庫中都出現(xiàn)的差異基因。并對(duì)其中一條功能未知的高表達(dá)序列FAM83A進(jìn)行初步的生物信息學(xué)分析。
1.2.2 序列比對(duì) 利用BLAST軟件檢索EST數(shù)據(jù)庫、nr數(shù)據(jù)庫及pro數(shù)據(jù)庫。將所克隆的基因核苷酸序列與GeneBank中已知核苷酸序列進(jìn)行同源性分析。氨基酸序列相似性分析用NCBI/blastp,多序列比對(duì)和進(jìn)化樹分析用clustal W。
1.2.3 理化性質(zhì)和亞細(xì)胞定位 對(duì)蛋白質(zhì)分子量、等電點(diǎn)、疏水性等理化性質(zhì)分析,用 ExPASy-protparam 工具。用PSORTⅡ服務(wù)程序進(jìn)行亞細(xì)胞定位預(yù)測。
1.2.4 蛋白質(zhì)結(jié)構(gòu)預(yù)測 ELM預(yù)測蛋白質(zhì)功能性位點(diǎn)(http://elm.eu.org/)[5]。信號(hào)肽及剪切位點(diǎn)預(yù)測用 SignalIP。二級(jí)結(jié)構(gòu)預(yù)測應(yīng)用SOPMA工具。保守結(jié)構(gòu)域用NCBI/CDD預(yù)測。
1.2.5 電子表達(dá)譜分析 以FAM83A為關(guān)鍵詞,通過Uni-Gene庫中的EST表達(dá)情況分析獲得FAM83A基因電子表達(dá)譜。
1.2.6 半定量RT-PCR驗(yàn)證性實(shí)驗(yàn) TRIZOL法提取乳腺癌細(xì)胞系、乳腺癌、癌旁、乳腺纖維瘤組織總RNA,按逆轉(zhuǎn)錄試劑盒(QIAGEN)操作步驟進(jìn)行逆轉(zhuǎn)錄。PCR反應(yīng)體系25μL,其中包括2.5μL cDNA模板,2.5μL 10×PCR反應(yīng)緩沖液,0.5μL dNTP(10mmol/L),0.5μL Taq DNA 聚合酶,上下游引物各0.5μL。FAM83A 上游引物為:5′-TAG AGG CAG CCA ACA AGC GTG-3′;下游引物為:5′-CCT TTG GAA AGC TGG GCT TGG GAG-3′。反應(yīng)條件為94 ℃,15s;60℃,30s;72 ℃ 1min,30個(gè)循環(huán)。以甘油醛-3-磷酸脫氫酶(GAPDH)作為反應(yīng)內(nèi)參。取10μL PCR產(chǎn)物,在1%瓊脂糖凝膠上進(jìn)行電泳檢測。
2.1 乳腺癌高表達(dá)基因的篩選 最終篩選出33個(gè)在乳腺癌中高表達(dá)的基因,它們多數(shù)在Gene Bank中都被詳細(xì)注釋,并從中選取一條功能未知的明顯高表達(dá)的基因FAM83A。選擇短標(biāo)簽序列搜索后結(jié)果顯示,在38個(gè)乳腺癌短序列標(biāo)簽文庫中,有31個(gè)文庫具有FAM83A代表標(biāo)簽(ATGTACAGGT),共出現(xiàn)1 575次。而在7個(gè)良性乳腺腫瘤短序列標(biāo)簽文庫中,有2個(gè)文庫出現(xiàn)該代表標(biāo)簽,表達(dá)差異為7.46倍。同時(shí),在23個(gè)乳腺癌長序列標(biāo)簽文庫中,有20個(gè)文庫具有FAM83A代表標(biāo)簽(ATGTACAGGTTTGTAGC),共出現(xiàn)964次。而在5個(gè)良性乳腺腫瘤長序列標(biāo)簽文庫中,只有一個(gè)文庫出現(xiàn)該代表標(biāo)簽,表達(dá)差異為3.14倍。
2.2 FAM83A在GeneBank中的序列比對(duì)結(jié)果及不同剪接體組成 應(yīng)用BLAST工具比對(duì),發(fā)現(xiàn)共有6條序列與FAM83A高度同源,多為人類新mRNA序列。其中發(fā)現(xiàn)兩條序列是FAM83A的轉(zhuǎn)錄變異體,GeneBank登錄號(hào)分別為NM_207006.1和 NM_032899.4,加上最初發(fā)現(xiàn)的轉(zhuǎn)錄變異體,F(xiàn)AM83A共有3個(gè)不同的剪接體。經(jīng)對(duì)FAM83A的多物種氨基酸序列相似性比較,人與長臂猿、小鼠、火雞和爪蟾的相似性分別為98%、87%、64%和41%,可見氨基酸組成在脊椎動(dòng)物中保守性較高。各物種序列大小接近,起始氨基酸都是蛋氨酸。基于FAM83A多序列比對(duì)進(jìn)化樹分析,人和長臂猿在進(jìn)化上最為接近,在其他物種也有比較接近的進(jìn)化來源。
2.3 理化性質(zhì)與亞細(xì)胞定位 FAM83A(AF497803)由367個(gè)氨基酸組成,生物軟件預(yù)測相對(duì)分子質(zhì)量為40 606,等電點(diǎn)為8.97。該蛋白質(zhì)的半衰期在人體網(wǎng)織紅細(xì)胞為30h;不穩(wěn)定指數(shù)為51.49(>40考慮為不穩(wěn)定),分類為不穩(wěn)定蛋白質(zhì);脂肪指數(shù)為77.06,平均疏水值為-0.346,是親水蛋白質(zhì)。根據(jù)軟件分析,預(yù)測該蛋白質(zhì)在線粒體中表達(dá)的可能性稍大(43.5%),其次分別是細(xì)胞核(34.8%)和細(xì)胞質(zhì)(21.7%)。
2.4 蛋白質(zhì)結(jié)構(gòu) ELM預(yù)測發(fā)現(xiàn)有PK、PKA等磷酸化位點(diǎn),MAPK作用識(shí)別位點(diǎn),SH2、SH3,RPEL和 WH2結(jié)合基序等,未發(fā)現(xiàn)有保守結(jié)構(gòu)域存在。未預(yù)測出信號(hào)肽剪切位點(diǎn)。SOPMA方法預(yù)測二級(jí)結(jié)構(gòu),發(fā)現(xiàn)FAM83A中α螺旋占43.5%,β折疊占5.72%,延伸鏈和無規(guī)則卷曲結(jié)構(gòu)分別占11.99%和48.5%。
2.5 FAM83A基因表達(dá) 電子表達(dá)譜分析顯示,F(xiàn)AM83A基因在部分正常組織和多種腫瘤中均有表達(dá),見表1。

表1 FAM83A基因電子表達(dá)譜
2.6 FAM83A在乳腺癌細(xì)胞系和乳腺癌組織中的表達(dá) RTPCR結(jié)果顯示,F(xiàn)AM83A在乳腺癌細(xì)胞系 MDA-MB-231和MCF-7中均有表達(dá)(圖1A)。在5例乳腺癌組織中,3例FAM83A高表達(dá);而在相應(yīng)的癌旁組織和乳腺纖維瘤中均不表達(dá),見圖1B~C。

圖1 半定量RT-PCR檢測FAM83A基因的表達(dá)
乳腺是最常發(fā)生良、惡性腫瘤的器官,癌性增生與良性腫瘤有著本質(zhì)的不同,治療方案也完全不同[6]。所以,在篩選乳腺癌高表達(dá)基因時(shí),臨床工作者希望尋找在癌組織中高表達(dá),而在良性腫瘤組織中不表達(dá)或低表達(dá)的基因,對(duì)指導(dǎo)臨床的診斷和治療更具有意義。CGAP SAGE數(shù)據(jù)庫能夠全面分析腫瘤組織基因表達(dá)譜、尋找腫瘤特異性表達(dá)新基因[7]。在SAGE文庫中,本研究選擇了乳腺癌和良性乳腺腫瘤兩個(gè)池,提交后看到良性乳腺腫瘤池的文庫在短序列標(biāo)簽中有7個(gè),長序列標(biāo)簽中有5個(gè),主要是:乳腺纖維瘤、乳腺肌上皮瘤和良性乳腺間質(zhì)瘤,并最終篩選出乳腺癌高表達(dá)基因FAM83A。而且,半定量RT-PCR結(jié)果也進(jìn)一步證實(shí)了生物信息學(xué)數(shù)據(jù)庫的可靠性。該基因在乳腺癌細(xì)胞系和多例乳腺癌組織中均高表達(dá)。
目前,F(xiàn)AM83A的研究很少,只是將該基因作為腫瘤生物學(xué)標(biāo)記物用于外周血的檢測[8-9],但關(guān)于該基因的功能少見文獻(xiàn)報(bào)道。ELM 分析提示,該蛋白質(zhì)具有 LIG_14-3-3_1,LIG_14-3-3_3蛋白質(zhì)配體,cylin底物識(shí)別位點(diǎn)和PK、PKA磷酸化位點(diǎn)等。14-3-3蛋白質(zhì)是真核生物中的一類保守蛋白質(zhì)家族,它們?cè)诩?xì)胞中發(fā)揮著信號(hào)轉(zhuǎn)導(dǎo),細(xì)胞周期調(diào)控,凋亡和應(yīng)激反應(yīng)以及腫瘤惡性轉(zhuǎn)化等重要的作用,是蛋白質(zhì)間相互作用的媒介和調(diào)節(jié)者[10]。Cyclin底物識(shí)別位點(diǎn)在cyclin/CDK相互作用蛋白質(zhì)中被廣泛發(fā)現(xiàn)。該基序在CDK中的存在增加了(ST)Px(KR)基序的磷酸化水平。它通過cyclin蛋白質(zhì)中的保守區(qū)域被識(shí)別,并與p21Kip cyclin相似的方法結(jié)合[11]。PK和PKA磷酸化位點(diǎn)是信號(hào)傳導(dǎo)調(diào)控中的常見分子結(jié)構(gòu),在細(xì)胞增殖及細(xì)胞周期中有著廣泛的調(diào)節(jié)作用[12]。
以上分析發(fā)現(xiàn),該蛋白質(zhì)在進(jìn)化上保守,從低等到高等動(dòng)物都有相似蛋白質(zhì)的表達(dá),是不穩(wěn)定的親水性蛋白質(zhì),可能定位于線粒體上,有著多個(gè)功能位點(diǎn)和基序,提示參與信號(hào)轉(zhuǎn)導(dǎo)和細(xì)胞周期調(diào)控。特別要提出的是,該基因存在多個(gè)轉(zhuǎn)錄變異體,表明它在生物體發(fā)育過程中的細(xì)胞增殖和凋亡的調(diào)控方面起著重要的作用。該基因在乳腺癌中的高表達(dá)具有顯著意義,很可能是通過使細(xì)胞持續(xù)增生,控制凋亡和改變細(xì)胞周期而發(fā)揮作用的。
[1] Yang L,Parkin DM,F(xiàn)erlay J,et al.Estimates of cancer incidence in China for 2000and projections for 2005[J].Cancer Epidemiol Biomarkers Prev,2005,14(1):243-250.
[2] 任麗,陳瑛.乳腺癌骨轉(zhuǎn)移的實(shí)驗(yàn)室檢測進(jìn)展[J].國際檢驗(yàn)醫(yī)學(xué)雜志,2010,31(2):137-138,141.
[3] Liska V,Holubec L Jr,Treska V,et al.Evaluation of tumour markers as differential diagnostic tool in patients with suspicion of liver metastases from breast cancer[J].Anticancer Res,2011,31(4):1447-1451.
[4] 劉娜,郭云波,孫顯赫,等.比較基因組學(xué)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J].南方醫(yī)科大學(xué)學(xué)報(bào),2010,30(2):219-223.
[5] Puntervoll P,Linding R,Gemund C,et al.ELM server A new resource for investigating short functional sites in modular eukaryotic protein[J].Nucleic Acids Res,2003,31(13):3625-3630.
[6] 陳國平,夏立平,翁陽,等.乳腺癌90例臨床與病理分析[J].海南醫(yī)學(xué)院學(xué)報(bào),2009,15(2):151-153.
[7] Kavak E,UnlüM,Nistér M,et al.Meta-analysis of cancer gene expression signatures reveals new cancer genes,SAGE tags and tumor associated regions of co-regulation[J].Nucleic Acids Res,2010,38(20):7008-7021.
[8] Li Y,Dong X,Yin Y,et al.BJ-TSA-9,a novel human tumor-specific gene,has potential as a biomarker of lung cancer[J].Neoplasia,2005,7(12):1073-1080.
[9] Liu L,Liao GQ,He P,et al.Detection of circulating cancer cells in lung cancer patients with a panel of marker genes[J].Biochem Biophys Res Commun,2008,372(4):756-760.
[10]Tzivion G,Avruch J.14-3-3proteins active cofactors in cellular regulation by serine/threonine phosphorylation[J].Biol Chem,2002,277(5):3061-3064.
[11]Lowe ED,Tews I,Cheng KY,et al.Specificity determinants of recruitment peptides bound to phospho-CDK2/Cyclin A[J].Biochemistry,2003,41(52):15625-15634.
[12]Dash PK,Moore AN,Kobori N,et al.Molecular activity underlying working memory[J].Learn Mem,2007,14(8):554-563.