徐茂義 侯國新 李娜
肺癌是一種常見的惡性腫瘤,其死亡率和發病率均位居前列。近年來,隨著吸煙人數的降低、早期診斷的改進,以及治療方式的改革,肺癌的發病率和死亡率有所下降[1]。肺腺癌(lung adenocarcinoma,LUAD)約占肺原發腫瘤的一半,易發生于女性,與吸煙、二手煙、室內外環境污染以及與遺傳基因關系密切,同時,肺腺癌是非吸煙者中最常見的組織學類型[2]。FAM83A(family with sequence similarity 83 member A), 屬 于FAM83家族中的一員,位于8號染色體,其在多種癌癥中表達異常,能夠影響細胞的侵襲遷移,且參與多種信號通路。本研究通過生物信息學的方法結合多種數據庫分析肺腺癌組織中FAM83A的表達情況及特征,旨在為肺腺癌患者的治療策略及預后評估提供理論依據,為肺腺癌的治療提供新的分子標志物。
1.1 LUAD組織和正常肺組織FAM83A基因的表達水平 首先,在癌癥基因圖譜計劃(the cancer genomeatlas program,TCGA)數據庫中下載基因表達譜數據,利用limma包分析得到基因表達差異結果其次,運用Oncomine數據庫(https://www.oncomine.org/)中輸入目的基因“FAM83A”、設定相應篩選條件腫瘤類型選擇“LUAD”,分析類型選擇“cancer vs. normol analysis”得到LUAD中FAM83A基因水平的表達差異結果,并進行薈萃分析。最后,運用基因表達譜數據動態分析數據庫(gene expression profiling interactive analysis,GEPIA)(http://gepia.cancer-pku.cn/)檢索,條件如下:(1)“Expression DIY”框中選擇“Boxplot”;(2)Gene輸入“FAM83A”;(3)Cancer name選擇LUAD;比較目的基因在肺腺癌組織和正常肺組織的表達情況,進一步驗證Oncomine數據庫中的FAM83A mRNA表達水平。
1.2 不同FAM83A基因表達水平對臨床和病理學特征的分析 下載TCGA數據庫中的相關臨床數據,根據LUAD患者FAM83A基因表達水平的中位數,將患者劃分為FAM83A高表達組和低表達組。應用SPSS 21.0軟件進行χ2檢驗。其次用GEPIA數據庫檢索:(1)“Expression DIY”框中點擊“Stage plot”;(2)Gene輸入FAM83A;(3)Cancer name選擇LUAD;比較不同分期的肺腺癌組織中FAM83A表達量。P<0.05為差異有統計學意義。
1.3 不同FAM83A基因表達水平的LUAD患者生存及預后分析 首先TCGA數據庫中下載相關生存數據,使用R語言survival包分析并繪制圖形。其次,用KaplanMeier Plotter在線數據庫(https://www.kmplot.com/analysis/)工具分析,其中收錄了肺癌患者總生存期(overall survival,OS)、無進展生存期(progress free survival,PFS)和目的基因的表達信息,在數據庫中設置條件:Gene輸入FAM83A;Split patients by:median,選擇lung cancer分析數據庫內FAM83A表達與肺腺癌患者OS和PFS的關系。最后,運用GEPIA數據庫檢索:(1)“survival框中點擊“Survival plot”;(2)Gene 輸入 FAM83A;(3)Cancer name選擇 LUAD;(4)Method分別選擇“Overall Survival”和“Disease Free Survival”可分別得到FAM83A高低表達對肺腺癌患者總生存率和無病生存期的影響。P<0.05為差異有統計學意義。
1.4 FAM83A相互作用蛋白網絡分析 String數據庫(https://string-db.org/)是用以探索蛋白質之間相互作用網絡的檢索工具,根據文獻報道、數據庫收錄數據和分子間共表達蛋白相關性等證據給出蛋白質間存在相互作用的可信度評分。該分數由0~1表明分子間相互作用的可信度由低到高。在 String數據庫中搜索蛋白質名稱“FAM83A”,選擇物種“homo sapiens”,獲取FAM83A相互作用蛋白網絡。
1.5 FAM83A基因在單個細胞中的功能 CancerSEA數據庫(http://biocc.hrbmu.edu.cn/CancerSEA/)是一個單細胞測序在線數據庫,檢索條件設置Gene輸入FAM83A,Cancer Type選擇lung adenocarcinoma,獲得FAM83A基因在單個細胞中的功能。
1.6 FAM83A與臨近長鏈非編碼RNA FAM83AAS1的相關性分析 用GEPIA數據庫檢索(1)點擊“Correlation”(2)GeneA輸 入 FAM83A;GeneB輸 入FAM83A-AS1(3)Correlation Coefficient選擇“pearson”(4)TCGA Tumor選擇LUAD Tumor;可獲取FAM83A與FAM83A-AS1在肺腺癌中的相關性結果。
2.1 FAM83A基因在LUAD組織和正常肺組織的表達差異 TCGA數據庫分析結果顯示FAM83A在LUAD組織中的基因水平顯著高于正常肺組織(P<0.01),Oncomine數據庫分析結果表明,LUAD組織中FAM83A基因的表達水平較正常肺組織顯著升高(P值及變化倍數分別為 P1=6.75×10-13、FC1=3.672、P2=2.61×10-22、FC2=3.742、P3=4.19×10-17、FC3=3.567)。薈萃分析這 3項研究結果表明,與正常肺組織相比FAM83A在 LUAD組織中的基因水平顯著升高(Median Rank=300.0,P=6.75×E-13)最后GEPIA在線數據庫檢索結果也顯示LUAD組織中FAM83A基因表達水平顯著高于正常肺組織。(P<0.05),三種數據庫表達結果一致。
2.2 FAM83A基因表達水平與臨床和病理學特征的關系 筆者團隊運用GEPIA數據庫設定檢索條件,結果顯示在肺腺癌不同臨床病理分期中FAM83A基因的表達有顯著差異,且有統計學意義(P<0.05)。為了進一步探索FAM83A與其他臨床參數的關系,筆者團隊從TCGA數據庫中下載了相關臨床數據,根據FAM83A基因水平的中位數將其分為高表達組和低表達組,結果表明,不同年齡、吸煙史、淋巴轉移程度和腫瘤分期的LUAD患者FAM83A基因表達水平存在差異且有統計學意義(P<0.05)。
2.3 FAM83A基因表達水平與肺腺癌患者預后的關系 (1)首先分別采用Kaplan-Meier Plotter數據庫和GEPIA數據庫分析FAM83A基因表達與肺腺癌患者總生存期的關系,發現兩個數據庫結果均表明,與FAM83A基因高表達組比較,FAM83A基因低表達組OS顯著延長(P<0.01)。筆者團隊在TCGA數據庫中下載相關的生存數據,用R語言分析并繪制了生存曲線,結果顯示FAM83A基因低表達組較高表達組而言,總生存率(P<0.01)及無進展生存期(P<0.01)均有顯著延長,三種數據庫顯示結果一致。提示FAM83A基因表現為癌基因的特征,且FAM83A高表達可作為肺腺癌患者預后的標志物。(2)應用R語言分析年齡、性別、吸煙史、臨床分期、FAM83A表達水平與肺腺癌患者預后的關系,并繪制森林圖,單因素獨立預后分析結果顯示臨床分期(P<0.01)、FAM83A表達水平(P<0.01)與患者預后存在顯著相關性,而年齡、性別、吸煙史與肺腺癌預后相關性不顯著。多因素獨立預后分析結果顯示臨床分期(P<0.01)及FAM83A(P<0.01)的表達水平可作為影響肺腺癌患者生存預后的獨立危險因素。以上結果表明,FAM83A是肺腺癌患者預后不良的指征。
2.4 FAM83A相互作用蛋白網絡 String數據庫分析結果顯示與FAM83A相互作用蛋白,分數由高到低分別 為 C1QTNF6(Recombinant Human Complement C1q Tumor Necrosis Factor-Related Protein 6)、ZSCAN12、UHRF1BP1L、EGFR(epidermal growth factor receptor)、GPATCH2L(G patch domain-containing protein 2)、TRIM62、ENSG00000233757、RAC3(Rac family small GTPase 3)、VPS13C(vacuolar protein sorting 13 homolog C)、RAF1。
2.5 FAM83A基因在單個細胞中的功能 CancerSEA數據庫檢索結果顯示,在單個肺腺癌細胞中FAM83A基因表達與多種細胞功能有關,其中KIM結果顯示FAM83A基因表達與細胞沉默、轉移、缺氧、血管生成、分化及上皮-間質轉化成正相關,GUILLAUMETADKINS等研究顯示FAM83A基因表達與細胞缺氧、炎癥呈正相關,與DNA修復及DNA損傷呈負相關。綜合相關性結果分析,FAM83A基因與細胞缺氧存在顯著的正相關(r=0.48、r=0.49)。
2.6 FAM83A與臨近長鏈非編碼RNA FAM83A-AS1的相關性分析 查閱PubMed數據庫發現FAM83A-AS1為FAM83A基因的反義長鏈非編碼RNA,運用GEPIA數據庫檢索FAM83A與臨近lncRNA FAM83A-AS1的相關性,結果顯示二者間存在正相關,且具有統計學意義(r=0.85,P<0.05)。
在我國,肺癌發病率及死亡率均位居惡性腫瘤首位,隨著臨床分子檢測、靶向治療及免疫治療的發展,一些基因的異常表達已成為肺癌的潛在分子靶點,如EGFR 基因突變[3]、EML4-ALK 融合[4]、KRAS 突變[5]等。肺腺癌早期一般無明顯癥狀,因此,探索肺腺癌發生發展的機制,找尋有效的診斷、治療及預后靶點對肺腺癌的早期發現及治療有重要的意義。
現已報道FAM83A基因在、肝癌[6]、肺癌[7-8]等多種惡性腫瘤中異常表達。本研究通過生物信息學并結合多種數據庫,包括Oncomine、GEPIA及TCGA數據庫,分析結果均顯示與正常肺組織相比,FAM83A基因在肺腺癌組織中顯著高表達。TCGA及Kaplan-Meier Plotter數據庫生存分析顯示較FAM83A基因高表達組相比,低表達組總生存率(P<0.01)顯著延長,同時FAM83A的表達水平與患者無進展生存期存在相關性,且具有統計學意義(P=0.007),聯合生存分析結果表明高表達FAM83A的患者預后較差。此外筆者團隊分析了FAM83A表達與LUAD患者臨床及病理學特征的關系,結果表明,FAM83A的表達水平與LUAD患者的年齡、吸煙史、淋巴轉移程度及腫瘤分期有關。單因素及多因素分析結果顯示FAM83A的表達可作為影響肺腺癌患者生存預后的獨立危險因素。FAM83A與臨近的LncRNA FAM83A-AS1呈正相關,LncRNA FAM83AAS1是FAM83A的一條反義RNA,現已有文章報道在多腫瘤中異常表達且能夠影響腫瘤細胞的侵襲遷移能力。現已有報道,FAM83A參與多種經典信號通路并發揮其作用,如MEK/ERK信號通路、Wnt信號通路及PI3K/Akt/mTOR信號通路[7-8],促進肺癌的發生發展。FENGRUI等[9]研究表明FAM83A與PD-L1在肺腺癌中高表達,且FAM83A可以通過ERK途徑促進PD-L1的表達增加,引起免疫逃逸,此研究也為肺腺癌的相關免疫治療提供了一個新的思路。
綜上所述,多數據庫聯合分析結果顯示肺腺癌患者癌組織中FAM83A呈高表達,其表達水平與預后狀況呈負相關。FAM83A作為肺腺癌的驅動基因,參與多種信號通路,同時也是影響預后的獨立危險因素,其有望成為肺腺癌的一個新的治療靶點。深入研究FAM83A參與肺腺癌發生發展的機制,可能為肺腺癌的治療策略及預后評估提供有力的理論依據。