蘇雨,田振華,羅丹丹,齊祥宇,劉魯娜,管慶波
山東大學附屬省立醫院,濟南250021
肝癌是常見的人類消化系統惡性腫瘤之一,其發病率在所有癌癥中位居第七,是全球癌癥相關的第四大死因[1]。在美國,肝癌的五年生存率約為18%,其致死性僅次于胰腺癌[2],在中國,肝癌的五年生存率更差,僅為12%[3]。肝細胞肝癌(HCC)為原發性肝癌的主要類型,早期HCC 可以接受潛在的治愈性治療,包括手術治療、射頻消融和肝臟移植等[4],但由于其起病隱匿、高度惡性、早期即發生轉移等特征,對于80%以上的患者,在診斷時通常已喪失良好的治療機會[5]。因此,探索和尋找HCC 預后相關的生物標志物及潛在的治療靶點對解決這一全球性健康問題尤為重要。DNAJC13 是熱休克蛋白家族(Hsp40)成員之一,也被稱為RME8,是早期在秀麗隱桿線蟲的胞吞缺陷篩查中發現的一種含有DnaJ 結構域的蛋白質,在細胞內物質運輸中發揮作用[6-7]。近年來,DNAJC13在腫瘤中的作用逐漸被發現,有研究報道,DNAJC13是ErbB2陽性乳腺癌的潛在調控靶標[8],DNAJC13 可作為miR-193b 的靶基因促進乳腺癌進展[9]。然而,DNAJC13 在HCC 中的作用目前仍未知。本研究利用生物信息學方法對癌癥基因組圖集(TCGA)數據庫、國際癌癥基因組聯盟(ICGC)數據庫、基因表達綜合(GEO)數據庫中DNAJC13 在HCC 中的mRNA 表達水平進行分析,對其表達與臨床病理特征和預后的關系及潛在的生物信號通路進行深度挖掘,為HCC 的預后評價及治療提供思路。
1.1 數據庫資料獲取 通過檢索TCGA 數據庫(https://portal. gdc. cancer. gov/)及ICGC 數 據 庫(https://dcc.icgc.org/)下載HCC及其他26種癌癥相關的表達數據、HCC 相關的臨床資料,TCGA 數據庫HCC 臨床資料檢索條件:TCGA-LIHC,共424個樣本(包含50 個癌旁樣本)用于表達分析,370 個病例用于臨床相關分析,下載時間為2020年12月;ICGC 數據庫臨床資料檢索選用ICGC-LIRI-JP 項目的資料,共431個樣本(包含199個癌旁樣本)用于表達分析,232 個病例用于臨床相關分析,下載時間為2020 年12 月。同時,選取GEO 數據庫(https://www. ncbi.nlm. nih. gov/geo/)中GSE25097(包含癌旁:289、癌:268 個)、GSE14520(包含癌旁:220 個、癌:225 個)數據集用于表達分析驗證。數據整理及標準化矯正使用R(3.6.3)及Perl(5.26.3)。
1.2 基因富集分析(GSEA) 本研究中,首先利用GSEA 軟件根據與DNAJC13表達的相關性生成所有基因的有序列表,然后進行基因富集來說明高、低DNAJC13 表達組之間存在的生存差異。富集分析基于從GSEA 官網下載的c2. cp. kegg. v7.2. sym?bols. gmt 規范化通路基因集,每次分析對基因組進行1 000次排列。
1.3 統計學方法 采用R(3.6.3)及Graphpad(8.0.8)統計軟件。兩組間的差異比較使用非參數檢驗,非配對樣本使用Mann-Whitney U 檢驗,配對樣本使用Wilcoxon matched-pairs signed rank 檢驗。使用邏輯回歸方法分析臨床病理特征與DANJC13表達間的關系。生存分析采用Kaplan-Meier法,Logrank 檢驗計算P,最佳截斷值使用R 語言中的“survminer”程序包確定。單因素和多因素Cox 風險比例回歸模型用于分析DANJC13 及其他臨床病理特征與生存率間的關系。P<0.05 為差異有統計學意義。
2.1 患者基本臨床信息 本研究納入的臨床數據來自TCGA 數據庫370 例原發性HCC 病例和ICGC數據庫232 例原發性HCC 病例,患者臨床特征包括年齡、性別、BMI、T 分期(T),淋巴結侵犯(N),遠處轉移(M),病理分期及分級、生存狀態、癌癥家族史、新的腫瘤事件等。來自TCGA 數據庫的HCC 病例中,年齡分布在16~90 歲,中位年齡為61 歲,其中61~80 歲病例最多,為183 例(49.5%);男249 例(67.3%),女120 例(32.7%);病理分期Ⅰ期病例最多,為171 例(46.2%);病理分級G2級病例最多,為177 例(47.8%)。來自ICGC 數據庫的HCC 病例中,年齡分布在31~89 歲,中位年齡68 歲,占比最多的在61~80 歲,為167 例(72.0%)例;男171 例(73,7%),女61 例(26.3%);病理分期Ⅱ期病例最多,為106 例(45.7%);病理分級G2級病例最多,為121 例(52.2%)。
2.2 DNAJC13 在肝癌及多種腫瘤組織中的表達通過對TCGA 數據庫中的肝細胞肝癌表達數據進行非配對和配對分析,結果表明,相對于癌旁組織,DNAJC13 表達在腫瘤組織中上調(P 均<0.01)。IC?GC 數據庫、GSE25097 和GSE14520 數據庫集中肝細胞癌表達數據分析結果與TCGA 數據庫分析結果一致(P均<0.01)。
2.3 DNAJC13 高表達者病理分期和分級 來自TCGA 數據庫的樣本中,DANJC13 表達較高的患者病理分期和病理分級更高(P 均<0.05);來自ICGC數據庫的樣本中,DANJC13 表達較高的患者病理分期和病理分級更高(P 均<0.05)。邏輯回歸分析的方法亦得出相似結果,見表1。

表1 DNAJC13 mRNA表達的臨床相關性分析(邏輯回歸)
2.4 DNAJC13高表達與HCC預后的關系 Kaplan-Meier 生存分析顯示,在TCGA 隊列中,DNAJC13 高表達組的總生存率(OS)(圖1A,P<0.01)及無病生存率(DFS)(圖1B,P<0.01)均相對于低表達組更差;在ICGC 隊列中,DANJC13 高表達組總生存率(0S)更差(圖1C,P<0.05)。對于TCGA 隊列的單因素和多因素Cox風險比例回歸分析提示DNAJC13可作為影響HCC 預后的獨立危險因子(HR 分別為1.877、2.038,P均<0.01),見圖1D。
2.5 DNAJC13 相關信號通路富集分析 在DNAJC13 高表達組出現adherens junction、endocyto?sis、ERBB signaling pathway、pathways in cancer、ubiq?uitin mediated proteolysis基因集的富集。
熱休克蛋白(HSP)是細胞在應激條件下產生的一類蛋白質,因最初發現這些基因在熱處理細胞中表達而得名,其被人們所熟知的功能是幫助蛋白質的折疊,是細胞中蛋白質穩態的守護者[10]。然而,并不是所有的HSP 都在應激誘導時才表達,有許多是組成性表達,并在細胞內具有管家基因功能[11]。隨著研究的深入,HSP 在癌癥中的作用逐漸走進人們的視線,HSP90 和HSP70 家族成員已被確定為癌癥的重要因素,并被認為是真正的抗癌藥物靶點[12]。

圖1 DNAJC13高表達與HCC預后不良的關系
DNAJC13 是HSP40 成員之一[6],在該家族成員中,有許多蛋白已被證實參與腫瘤的發生和進展,在諸多腫瘤中發揮促癌或抑癌作用,如在惡性膠質瘤和前列腺癌中,DNAJA1 表達與腫瘤惡性程度及放療耐受性相關[13];DNAJA3 被證明參與多種腫瘤的增殖、凋亡、遷移及轉移調控[14];DNAJB4 可抑制肺癌的進展[15];在乳腺癌中,DNAJB6 通過抑制Wnt 信號通路抑制細胞遷移、侵襲和腫瘤發生[16];在轉移性宮頸癌中,DNAJC9 表達上調[17];在神經母細胞瘤中,DNAJC10 過表達可增強對內質網應激誘導的凋亡敏感性[18];最近研究已證實DNAJC13 是ErbB2 陽性乳腺癌的潛在調控靶標[8],可作為miR-193b 的靶基因促進乳腺癌的進展[9]。這些結果提示HSP 家族在腫瘤中有較大的潛在研究價值。
近年來,高通量測序技術的發展和諸多大型數據庫的建立為腫瘤潛在機制的研究提供了便利,本研究中我們利用生物信息學的方法探究DNAJC13在HCC 中的潛在作用。GSEA 是一種計算方法,可確定先驗定義的一組基因是否在兩個生物學狀態之間顯示出統計學上差異[19]。通過對TCGA 數據庫、ICGC數據庫、GEO數據庫中肝癌及其他腫瘤表達譜的分析,我們發現,DNAJC13 在肝癌及多種腫瘤中的表達較正常或癌旁組織升高且有統計學差異。隨后我們結合臨床資料對其表達在TCGA 數據庫和ICGC 數據庫進行臨床相關性分析,結果顯示在這兩個數據庫中DNAJC13 高表達均與更高的病理分期和分級呈正相關關系。對TCGA 數據庫的生存分析顯示,在HCC患者中DNAJC13高表達組無論總生存率還是無病生存率均較低表達組差,對ICGC數據庫的生存分析顯示,在HCC患者中DNAJC13高表達組總生存率相對更差。TCGA 數據庫資料進行的單因素和多因素Cox回歸分析提示DNAJC13表達可作為影響HCC 患者總生存的獨立危險因子,進一步說明DNAJC13對HCC 預后預測的可靠性。GSEA 結果顯示adherens junction、endocytosis、ERBB signaling pathway、pathways in cancer、ubiquitin mediated prote?olysis 五個基因集在兩個數據庫排名前20 個富集結果中均有出現且有統計學意義,這些通路與腫瘤發生有關,其中DNAJC13 通過ERBB 信號通路在乳腺癌中作用已被證實[8],提示DNAJC13 在HCC 中可能是一個致癌基因,并通過這些通路在HCC 中發揮作用,這將對后續的機制研究提供有力的理論支持和指導,提示DNAJC13 可能是一個潛在的HCC 治療靶點。
本研究存在以下局限性。首先,這項研究是一項回顧性研究,將來應進行前瞻性研究以彌補該回顧性研究的局限性;其次,公共數據庫中缺少例如患者用藥和(或)手術治療的具體細節,亦會影響患者的預后;最后,肝癌中DNAJC13 的蛋白及其在肝癌進展和轉移中的直接作用仍有待體外驗證。盡管這項研究有一定局限性,但確實為研究DNAJC13 在肝癌中的作用提供了線索,并為HCC 提供了可能的治療靶標和潛在的預后標志物。
綜上所述,DNAJC13表達升高可能是HCC 的一個可靠的獨立預后生物標志物和治療靶點。此外,黏附連接、內吞作用、ERBB 信號通路、泛素介導的蛋白水解作用可能是DNAJC13 參與HCC 發生和進展的關鍵通路。