趙靜 王雅卓 王潤芳 李娜 褚兆蘋 韓華 趙源 王蓓 田菲 張媛 張蘊霞
上皮性卵巢癌(EOC)是惡性程度最高的婦科腫瘤之一[1]。大多數患者早期無明顯不適,診斷時已為晚期[2],這在很大程度上解釋了這種惡性腫瘤預后差的原因。上皮性卵巢癌是一種包含多種組織學亞型的異質性疾病[2],但其癌變機制尚未完全闡明。根據二元癌變模型理論,卵巢癌包括Ⅰ型和 Ⅱ型兩類[3]。Ⅰ型腫瘤通常是惰性的,以信號通路相關基因(KRAS、BRAF、PIK3CA、CTNNB1、ARID1A、PPP2R1A和PTEN)突變為特征,包括低級別漿液性、黏液性、子宮內膜樣癌和透明細胞癌及Brenner瘤等[3]。與Ⅰ型腫瘤相比,Ⅱ型腫瘤侵襲性強,基因穩定性差,常含有p53和BRCA1/2突變,包括高級別漿液性癌、子宮內膜樣癌和未分化癌等[3,4]。其中致死率最高的高級別漿液性卵巢癌(HGSOC)[5,6]患者雖然對標準治療(包括減瘤手術和基于鉑的化療)反應良好,但他們之中很多人術后不久卻因為耐藥大大降低了生存率[7]。在過去的十年中,通過標準療法治療的患者的生存率也僅有微小的改善,因此闡明其分子機制和發現新的分子生物標志物對于HGSOC具有非常重要的意義[8]。慶幸的是,生物信息學技術的大力發展使得我們可以利用大數據篩選目標基因并對其進行探究分析,也為后續的基礎研究及臨床實踐提供了重要的理論依據。在我們的研究中,首先使用R語言分析了來自Gene Expression Omnibus (GEO)數據庫中的3個表達譜芯片數據集,以確定HGSOC與正常人類卵巢表面上皮樣本(HOSE)之間的差異基因。并通過GO[9]、KEGG[10]通路富集分析和PPI網絡分析,揭示了HGSOC可能相關的分子機制,并挖掘出176個差異基因(DEGs),在這176個差異基因中我們使用MCODE插件鑒定出22個核心基因,在這22個核心基因中我們發現KIF20B在HGSOC中顯著高表達,為了鑒定并驗證KIF20B作為卵巢癌生物標志物的可行性及對卵巢癌的影響,我們隨機對其進行了生存曲線分析,ROC曲線分析及其與免疫浸潤的相關性分析,報道如下。
1.1 數據獲取與差異基因分析 為了探索高級別漿液性卵巢癌的相關基因,我們從GEO (http://www.ncbi.nlm.nih.gov/geo) Affymetrix GPL570平臺[11]通過使用R包中GEOquery包下載了3個微陣列數據集(GSE18520[12], GSE27651[13], GSE40595[14])。其中,GSE 18520數據集包含53個高級別漿液性卵巢癌組織樣本(HGSOC,n=53)和10個正常人類卵巢表面上皮樣本(HOSE,n=10)。GSE27651含有6個人卵巢表面上皮細胞(HOSE,n=6)和22個高級別漿液性卵巢癌(HGSOC,n=22)。GSE40595包含32個來自高級別漿液性卵巢癌患者(HGSOC,n=32)和6個正常人類卵巢表面上皮樣本(HOSE,n=6)。使用limma包進行差異基因分析,|logFC (fold change)| >2和P<0.05為差異有統計學意義。為了直觀地顯現差異基因表達的情況,我們利用R包中的ggplot2對3個數據集進行差異基因(DEGs)分析,并使用韋恩圖進行可視化。
1.2 功能富集分析 為了進一步系統地分析DEGs的功能注釋,我們使用了R中的clusterProfiler包[15]進行GO和KEGG分析,并利用org.Hs.eg.db包進行基因ID轉換,P<0.05為差異有統計學意義。
1.3 蛋白互作網絡構建及核心基因鑒定 我們使用STRING數據庫 (http://string-db.org )[16]和Cytoscape (version 3.4.0)[17]繪制了蛋白蛋白互作網絡圖(PPI),并使用Cytoscape中的MCODE插件 (version 1.4.2)分析出互作關系中最強大的模塊,這些模塊中的基因即為核心基因。MCODE評分>5, degree cut-off=2, node score cut-off=0.2, Max depth=100, k-score=2差異有統計學意義。
1.4 核心基因與生存預后關系分析 為了深入挖掘與預后相關的基因,我們利用Kaplan-Meier Plotter (http://kmplot.com/analysis/index.php?p=service&
cancer = ovar)[18]數據庫分析核心基因表達與高級別漿液性卵巢癌患者總生存期(OS)和無進展生存期(PFS)的關系,篩選出對HGSOC生存及預后有影響的靶標基因。
1.5 預后標志物鑒定 為了探究靶標基因KIF20B作為卵巢癌生物標志物的可行性及預測能力,我們使用pROC包[1.17.0.1版本]對TCGA中的卵巢癌數據集進行KIF20B的ROC曲線分析,并使用ggplot 2包[3.3.3版本]進行可視化展現。
1.6 靶標基因與腫瘤細胞免疫浸潤分析 為了明確靶標基因KIF20B是否通過調節免疫微環境影響患者預后,我們使用R中的GSVA包[1.34.0版本]對靶標基因KIF20B進行免疫浸潤分析,并在TIMER數據庫中加以驗證,P<0.05為差異有統計學意義。
1.7 KIF20B的分子相關性分析 為了探究與KIF20B密切相關的分子以探究其作用機制,我們使用R 的ggplot2[3.3.3版本]對TCGA數據集進行KIF20B的分子相關性分析,P<0.05為差異有統計學意義。
1.8 免疫組化驗證KIF20B在HGSOC中的表達 選自河北省人民醫院2018至2021年行手術切除并且病理證實為高級別漿液性卵巢癌組織及正常卵巢組織所制標本蠟塊各20塊。卵巢癌組織均為原發性腫瘤,正常卵巢組織均為因子宮肌瘤、功能性異常子宮出血、子宮脫垂等良性疾病切除子宮的同時切除卵巢的病例,病理證實卵巢組織無異常。采用SP法進行免疫組化染色,DAB顯色后發現KIF20B定位于胞漿,呈現黃色或棕褐色為陽性。顯微鏡下隨機選10個高倍鏡視野(×400)結果判定:按細胞顯色有無及深淺計分:0分為無色,1分為淺黃色,2分為棕黃色,3分為棕褐色;按顯色細胞所占比例計分:0分<1%,1分1%~10%,2分11%~25%,3分26%~50%,4分51%~75%,5分>75%,二者乘積之和即為該切片積分,>5分認為為陽性染色,由兩位資深病例學專家單獨評定,并達成一致意見。
2.1 差異基因鑒定 我們使用GEOquery包識別出GSE18520中的698個基因,GSE27651中的568個基因,GSE40595中的1 012個基因。其中,GSE18520中高表達基因404個,低表達基因294個;GSE27651中高表達基因357個,低表達基因211個; GSE40595中高表達基因160個,低表達基因852個。3個數據集的重疊部分包含176個差異基因,如韋恩圖所示,提示這176個差異基因可能對HGSOC具有重要意義,值得深入研究。見圖1。

圖1 韋恩圖
2.2 功能富集分析 我們使用R中的clusterProfiler包對176個DEGs進行了功能富集分析。DEGs的生物學過程(BP)在核染色體分離、核有絲分裂中顯著富集;細胞組分(CC)的變化主要集中在紡錘體、著絲粒區;分子功能(MF)主要在糖胺聚糖結合,肝素及含硫化合物等結合方面富集。提示這些差異基因主要與細胞周期及糖代謝等功能相關。見圖2。

圖2 功能富集分析
2.3 蛋白互作網絡構建及核心基因鑒定 我們使用Cytoscape構建DEGs的蛋白互作網絡(PPI),并找到最強大的模塊從而確定出聯系最緊密的22個核心基因。見圖3、4。

圖3 蛋白-蛋白互作網絡圖

圖4 核心基因
2.4 核心基因與生存預后關系分析 我們利用Kaplan-Meier Plotter在線數據庫對22個核心基因進行生存分析。我們發現在HGSOC患者中核心基因KIF20B的高表達與低表達患者的PFS和OS差異均有統計學意義(P<0.05),提示該基因的差異表達對HGSOC患者預后有顯著影響。見圖5。

圖5 KIF20B的差異表達對HGSOC患者生存預后的影響
2.5 預后標志物鑒定 我們利用R語言對TCGA數據庫中漿液性囊腺癌樣本進行KIF20B的ROC曲線分析,曲線下面積AUC為0.875,提示KIF20B對于卵巢癌患者的預后具有較好的預測性。見圖6。

圖6 TCGA數據集中KIF20B的ROC曲線分析圖
2.6 靶標基因與腫瘤細胞免疫浸潤分析 腫瘤浸潤淋巴細胞的分布是判斷患者淋巴結狀況的重要指標。我們使用R中GSVA包對靶標基因KIF20B進行免疫分析時發現KIF20B高表達患者的T細胞富集程度低于低表達患者(P<0.05),提示KIF20B可能參與調節HGSOC患者免疫浸潤從而影響患者的生存預后。TIMER數據庫檢索進一步顯示卵巢癌患者KIF20B的表達與B細胞的浸潤程度呈負相關,與CD4+T細胞、巨噬細胞浸潤程度呈正相關(P<0.05)。見圖7、8。

圖7 KIF20B差異表達對HGSOC患者T細胞富集程度的影響

圖8 KIF20B的表達與免疫細胞浸潤程度的相關性
2.7 KIF20B的分子相關性分析 為了探究與KIF20B密切相關的分子以探究其作用機制,我們使用R 的ggplot2[3.3.3版本]對TCGA數據集進行KIF20B的分子相關性分析,結果提示KIF20B與BIRC5及BCL2A1的表達密切相關。
2.8 KIF20B在HGSOC患者中呈高表達 我們對20塊HGSOC及20塊HOSE組織蠟塊進行免疫組化染色后分析發現在HGSOC患者中KIF20B的陽性表達率(17/20≈85%)顯著高于在HOSE患者中的陽性表達率(1/20≈5%),差異有統計學意義(P<0.05),實驗驗證符合生信分析數據結果。見圖9。

圖9 KIF20B在HGSOC組織中的免疫組化染色結果
上皮性卵巢癌分為兩型,Ⅰ型腫瘤是低級別的、生長緩慢的卵巢腫瘤。而Ⅱ型腫瘤是高級別的、侵襲性強惡性程度極高的卵巢腫瘤[19],其中HGSOC在上皮卵巢癌中占>60%,而在卵巢癌死亡病例中占>70%[20,21],所以確定HGSOC的特異性生物標志物和靶標基因對于提高卵巢癌的早期檢測和預防率非常重要,并可能為治療晚期卵巢癌提供有利幫助。
在我們的研究中發現HGSOC和HOSE之間有176個DEGs。GO的變化主要富集在染色體分離、紡錘體中,之前的已有的研究表明細胞周期的失調可能在腫瘤的癌變過程中發揮重要作用[22-24],這與我們的發現相一致。在挖掘到的22個核心基因中,我們發現KIF20B的表達可以顯著影響卵巢癌患者的生存和預后。KIF20B是參與有絲分裂磷酸化蛋白的家族成員之一,它是一種緩慢正端定向的驅動蛋白相關蛋白,并在G2/M轉變時被磷酸化,它有固定的表達定位與表達模式,主要表達于細胞核,但我們的免疫組化結果提示它在卵巢組織中表達于胞漿。眾多研究提示它可以促進膀胱癌、肝癌、結直腸癌、腎細胞癌、舌癌和乳腺癌等多種惡性腫瘤的進展[25-30]。Chen等[31]的研究發現,KIF20B 可促進胰腺癌細胞增殖,并可能成為胰腺癌的潛在治療靶點。Alahmad等[32]的研究還發現KIF20B可能是參與陣發性夜間血紅蛋白尿患者免疫缺陷機制的自身靶標抗原。而迄今為止,關于KIF20B對于卵巢癌尤其是高級別漿液性卵巢癌的影響尚不明確。我們的研究發現KIF20B在HGSOC患者中呈高表達,低表達患者的PFS與OS顯著優于高表達患者,提示KIF20B的差異表達與HGSOC患者預后密切相關。ROC曲線分析中AUC>0.75,提示KIF20B對于卵巢癌預后具有很好的預測性,基于此研究結果,我們推薦KIF20B作為卵巢癌的生物標志物指導預后,當然這也需要后續的臨床研究加以驗證。凋亡抑制因子5(BIRC5)通過抑制凋亡促進多種惡性腫瘤的增殖侵襲,B淋巴細胞瘤2相關蛋白1(BCL2A1)與免疫微環境息息相關,分子相關性分析提示KIF20B與這兩個基因密切相關,提示KIF20B可能通過抑制凋亡促進卵巢癌的增殖侵襲,并且可能參與調節腫瘤免疫微環境。R中GSVA包與TIMER數據庫對KIF20B在卵巢癌中的免疫分析提示,KIF20B在正常卵巢組織及腫瘤組織中免疫浸潤程度具有顯著差異,再次提示KIF20B或可通過調節腫瘤免疫微環境影響卵巢癌的進展,但機制仍需進一步實驗加以驗證。
綜上所述,我們的實驗研究通過綜合的生物信息學分析,篩選出靶標基因KIF20B,并發現其與高級別漿液性卵巢癌患者的預后密切相關,對于卵巢癌預后具有良好的預測性,可作為預測卵巢癌預后的生物標志物,分子相關性分析及免疫浸潤分析提示其可能通過抑制凋亡及參與調節腫瘤免疫微環境促進卵巢癌的增殖侵襲,雖然我們已經驗證了KIF20B在卵巢癌組織中的表達,但仍需后續實驗進一步確認和分析其具體作用機制。