嚴玉娟,趙 健,宋曉峰
(南京航空航天大學 自動化學院, 南京 211106)
卵巢癌是一種起源于卵巢的惡性腫瘤,常見于卵巢表面上皮細胞。雖然卵巢癌發病率僅次于宮頸癌和子宮內膜癌,但其死亡率居所有婦科惡性腫瘤之首。國家癌癥中心統計數據顯示,近年來隨著我國醫療質量和診療能力的提升,惡性腫瘤五年生存率提升近10%,但卵巢癌患者五年生存率僅提高0.4%,幾乎無明顯改善。卵巢癌仍是婦科癌癥中最危險、患者愈后表現最差的疾病之一,嚴重威脅著女性生命健康。在我國,每年約5萬余名女性被確診患有卵巢癌[1]。
卵巢癌具有極強的侵襲轉移特性,極易以血行轉移、淋巴轉移等方式將腫瘤細胞“運輸”到全身多個臟器組織中,進而引發各類不良癥狀,如血栓栓塞、血液并發癥和感染等,這些由癌癥轉移或侵襲引發的并發癥是導致卵巢癌患者死亡的主要原因[2-3]。因此,了解清楚卵巢癌侵襲轉移機制,對于卵巢癌的診治及預后意義重大,不僅有助于改善現有的臨床治療方法,還可為新藥研發提供有價值的科研線索,進而提高卵巢癌患者的五年生存率。為此繪制了卵巢癌發生侵襲轉移的簡要示意圖,并對轉錄組和蛋白質組層面的生物大分子調控因素、生信工具和數據庫進行了總結(見圖1)。

圖1 卵巢癌侵襲轉移機制的生物信息學研究進展Fig.1 Progress in bioinformatics research on the invasion and metastasis mechanisms of ovarian cancer
卵巢癌侵襲是指癌細胞離開原發卵巢部位向周圍組織進攻的過程,其標志是癌細胞突破基底膜。基底膜是圍繞大多數組織細胞外基質的薄層,是一層物理屏障,其剛度是由關鍵因子Netrin-4所調節的[4]。癌細胞借助自身所形成的肌動蛋白和蛋白酶侵入體,以此突破基底膜[5]。此外,在上皮-間充質轉化過程中,上皮細胞黏附分子如E-鈣黏蛋白、細胞角蛋白等上皮標志物表達水平降低,波形蛋白、N-鈣黏蛋白等間質標志物表達水平升高。通過上皮-間充質轉化,上皮細胞失去了細胞極性,失去了與基底膜的連接等上皮表型,而卵巢癌細胞在這一過程中獲得了部分干細胞的生理特征,提高了自身的侵襲能力[6]。
卵巢癌細胞擴散到身體其它部位并形成新的轉移灶,這個過程稱為轉移。同樣地,卵巢癌細胞從病灶的脫落也與腫瘤上皮-間充質轉化的機制密切相關。上皮-間充質轉化是一種細胞重編程過程,與卵巢癌微環境有一定的相關性。轉化后基質金屬蛋白酶表達上調,加速細胞外基質降解速度,細胞之間失去了相互黏附的作用,卵巢癌細胞從病灶脫落,導致了卵巢癌轉移灶[7]。脫落的卵巢癌細胞在自身或者間質細胞分泌的蛋白質水解酶的作用下降解新生血管的基底膜與內皮,癌細胞得以進入血液循環或者淋巴系統[8],形成循環的卵巢癌細胞。循環的卵巢癌細胞在一些運動因子的作用下,通過信號傳導途徑到達新的轉移靶器官,并穿出血管,通過膜受體結合基質蛋白,刺激血管增生,形成新的轉移灶[9],這些過程與黏附、降解、運動等行為密切相關。
卵巢癌侵襲轉移機制是一個多因素參與的極其復雜的過程,涉及到多種生物學過程。目前已知的卵巢癌侵襲轉移相關調控因素有以下兩類。
惡性腫瘤能夠“掙脫”機體束縛,進行無限增殖和分化,其中承擔主要作用的“角色”是腫瘤干細胞(Cancer stem cell,CSC)。CSC是存在于惡性腫瘤組織中的一小群具有干細胞特性的細胞,被認為是腫瘤發生、發展、侵襲和轉移能力的根源。卵巢癌干細胞(Ovarian cancer stem cells,OCSC)于2005年被Bapat等[10]首次發現,隨后Dean和Gupta等證實OCSC具有自我更新、增殖、分化和耐藥的能力[11-12]。研究發現卵巢癌干細胞特征基因在卵巢表面上皮細胞及輸卵管上皮細胞中均顯著表達,預示卵巢表面上皮細胞和輸卵管上皮細胞可能是卵巢癌發生的根源所在[13]。Flesken-Nikitin等[14]進一步通過小鼠實驗證實了上述推論,結果表明OCSC可能來源于卵巢表面上皮細胞、輸卵管上皮細胞及周圍組織中的多能干細胞。
Medema Jan Paul和Vermeulen Louis[15]發現卵巢上皮細胞不斷重復著損傷-修復過程,這一動態過程隨著女性月經周期反復出現。中國科學院曾藝研究組近來發現,成年小鼠卵巢的周期性排卵過程會誘導卵巢表面上皮細胞發生周期性破裂和再生修復[16]。這一過程往往伴隨著卵巢干細胞的增生分化,若受到炎性因子刺激、間質內皮轉化和缺氧等細胞環境變化的影響,則可能導致干細胞走向持續增生、停止分化的結局,引發癌變。
2.2.1 RNA
正常卵巢細胞失去機體對其的控制,逃脫免疫細胞的監管,進而變成不受控的癌細胞,這一過程必然少不了基因的調控。多個研究報道了新型癌基因S100A10參與調節細胞增殖、分化、凋亡、炎癥、血管生成、運動、遷移和侵襲等多種生物學過程[17-20]。其表達量的增加會顯著增強卵巢癌細胞的增殖、遷移和侵襲能力。同時還發現S100A10基因表達下調的同時,卵巢癌細胞對卡鉑(卵巢癌患者最重要、最基本的治療藥物)的敏感性反而得到了提升[19]。作為卵巢癌中新發現的致癌基因PRR11(Proline-rich protein 11)[20],抑制其表達,卵巢癌細胞的增殖和體外細胞遷移行為會受到抑制。Peng等[21]通過轉錄組測序技術鑒定出了多種與卵巢癌侵襲轉移過程相關的基因。其中,上調的基因有COL4A3、FGF18、LAMA3、SYK等關鍵基因,這些基因參與細胞外基質-受體相互作用途徑[22-25]。而識別出的下調基因包括AKT3、DCN、ITGA2、TLR4、TP53,與PI3K-Akt信號傳導過程有著密切的聯系[26-29]。這些基因通過參與生物學過程對卵巢癌細胞的侵襲轉移能力進行調控,可能會成為卵巢癌潛在的治療靶點。
研究報道,MTA1(Metastasis-associated gene1)基因與卵巢癌的侵襲轉移機制有著密切的關系。Song等[30]以20個原發性卵巢癌樣本、20個轉移到淋巴結的卵巢癌樣本和8個正常卵巢樣本為例,發現MTA1過表達率在有轉移的原發性卵巢癌中為100%,而在無轉移的卵巢癌中僅為38.5%。同樣地,來自慕尼黑大學的Christine Dannenmann等[31],通過對115個處于不同癌癥分期和FIGO分級的卵巢癌組織樣本分析,得到一致的結論:MTA1的表達在轉移性卵巢癌組織中顯著增強。隨著生物學檢測技術的不斷發展,華中科技大學團隊[32]通過體外基因轉染技術將MTA1導入卵巢癌細胞株中,研究發現MTA1表達量的上調不影響癌細胞的生長活性,但是促進了癌細胞的克隆形成、遷移和侵襲能力。
microRNA(miRNA)作為一類小的、非編碼RNA,被發現在細胞控制基因表達的過程中承擔著關鍵性的角色。Inoue等[33]對癌癥相關的miRNA進行了綜述,發現:miRNA不僅與腫瘤的發生、發展密切相關,還參與腫瘤的細胞增殖、細胞存活和細胞侵襲過程,并且在多種腫瘤中存在miRNA表達異常的現象。Wang等[34]在探究卵巢癌侵襲轉移機制的過程中發現,Hsa-miR-320與卵巢癌遷移和侵襲高度相關,其高表達表征卵巢癌的不良預后和轉移高風險。
2.2.2 蛋白質
19世紀德國病理學之父魯道夫·維爾肖提出腫瘤起源于慢性炎癥這一假說,認為侵襲轉移傳導通路的激活源自炎性因子的上調。侵襲轉移傳導通路被激活后,進一步促進腫瘤細胞的侵襲、遷移和上皮間質轉化(Epithelial-mesenchymal transition,EMT)。常見的重要炎性因子有細胞黏附分子、腫瘤壞死因子以及血管內皮細胞生長因子等。
細胞黏附分子是一類細胞表面蛋白,起著粘附、識別的作用,能夠介導細胞間相互作用以及細胞和細胞外基質之間的通訊,其數量眾多,種類繁雜,在多個生物學過程中都起著重要的作用[35]。近來,Nakamura K等[36]發現細胞黏附分子CD24在卵巢癌中高度表達。通過對手術切除的原發性卵巢癌的組織切片進行免疫組織化學分析,CD24被發現在卵巢癌Ⅰ-Ⅳ期患者中高表達,且在75%的卵巢癌轉移患者中均檢測到CD24,研究結果預示黏附分子CD24參與了卵巢癌細胞的增殖、侵襲轉移過程。
1975年發現了對體外培養的多種腫瘤細胞株均具有細胞毒性作用的腫瘤壞死因子α(Tumor necrosis factor alpha,TNF-α)。研究表明,TNF-α是由單核細胞和巨噬細胞產生的一種具有多種生物活性的因子。Jiang等檢測了20名惡性上皮性卵巢癌患者和20名良性卵巢囊腫患者中腫瘤組織的TNF-α的mRNA和蛋白質表達量,發現在惡性上皮性卵巢癌患者中TNF-α的mRNA和蛋白質的表達顯著升高[37]。Mamta Gupta研究團隊[38]發現,隨著上皮性卵巢癌患者體內TNF-α的表達量增加,白細胞介素6(Interleukin 6,IL-6)的血清水平也在不斷地升高,而TNF-α和IL-6正是全身炎癥反應標志物。Kyeong A So等[39]深入探究了IL-6在上皮-間質轉化過程中的作用,實驗結果表明卵巢腫瘤細胞在IL-6的刺激下,上皮細胞標志物減少,間充質細胞標志物增加。此外,經IL-6處理的癌細胞,基質金屬蛋白酶(Matrix metalloproteinases,MMP-2和MMP-9)顯著增加,遷移能力顯著增強。上述結果說明IL-6可使癌細胞獲得間充質特性,通過加速EMT過程促進卵巢癌的侵襲轉移。
卵巢癌的生長和增殖往往伴隨著血管的新生,而后者需要血管生長因子的刺激。血管內皮生長因子(Vascular endothelial growth factor,VEGF)是一種促血管生長因子,具有高度特異性,能夠通過促進腫瘤血管新生來加快腫瘤的增殖生長,從而協助癌細胞進入血液并轉移到其他組織,加速腫瘤的浸潤與轉移[40]。在卵巢癌細胞中,VEGF能夠刺激卵巢細胞中的血管內皮細胞增生,誘導新血管的生成。同時還會增強血管通透性,加快血漿蛋白向外滲出,促使蛋白水解酶生成,降解細胞外基質,從而加快卵巢癌的浸潤與侵襲轉移。
癌癥作為一場“失控”的進化過程必然涉及對蛋白質的異常調控。Chen等[41]發現WAP四二硫鍵核心結構域蛋白2(WAP four-disulfide core domain protein 2,WFCD2)能夠促進卵巢癌的轉移。相比于原發性卵巢癌樣本,侵襲轉移到腹膜和淋巴結的卵巢癌樣本中的 WFCD2染色評分顯著升高;而敲除WFCD2后,則會減少卵巢癌細胞的遷移、侵襲。這些結果表明WFCD2可能在原發性卵巢癌細胞向腹膜和淋巴結轉移的過程中發揮著舉足輕重的作用,參與了卵巢癌腫瘤細胞的侵襲和轉移過程。已被多個研究報道過在多種腫瘤中起到重要作用的蛋白質Rab23,是Rab GTPase家族的成員。在卵巢癌中,通過敲低Rab23會出現卵巢癌細胞增殖、侵襲和轉移能力下降的現象,并會抑制上皮間質轉化的惡性過程[42],這表明Rab23與卵巢癌的增殖、侵襲轉移過程密切相關。同時Zhang等[43]還發現Rab23可以通過Shh-Gli1-ABCG2通路促進卵巢癌細胞對鉑類藥物產生耐藥性,導致卵巢癌患者生存率低,生存質量差。對于這些調控卵巢癌侵襲轉移機制的生物大分子因素,我們從種類、內容和功能三個方面進行了總結(見表1)。

表1 卵巢癌侵襲轉移機制的生物大分子調控因素Table 1 Biomolecular regulators of the mechanisms of ovarian cancer invasion and metastasis
測序技術的發展使得生物信息學工具也處于不斷更新的狀態,目前已涌現出大量生物信息學工具可用于癌癥相關的蛋白質組和單細胞轉錄組等多種組學數據的處理、分析與可視化。
蛋白質組學是通過高通量檢測方法對蛋白質的特征進行研究,包括蛋白質的表達水平、翻譯后修飾、蛋白間相互作用等。開展蛋白質組學的研究不僅有助于更好地了解生命活動規律,同時也闡明了多種疾病的發病機制,為疾病的治療開拓了新的思路和方法。近年來,適用于分析癌癥相關蛋白質組學數據的生物信息學工具逐漸成熟。
芝加哥大學研究團隊[44]采用液相色譜-質譜聯用/質譜方法,使用顯微切割技術提取卵巢癌組織和基質的蛋白質組學數據,發現NNMT蛋白是調控卵巢癌轉移過程中的關鍵蛋白。這為卵巢癌細胞的轉移過程提供了一個非常有價值的干預靶點。通過對蛋白組組學進行可視化分析,將會使得研究人員對具有侵襲轉移性質的癌癥的發病機制有著更加深入的理解。目前對蛋白質的定量工具如下:2014年,George Rosenberger等[45]發現:雖然相對定量已普遍用于蛋白質組學,但是很少有測量絕對蛋白質數量的蛋白質組學數據集被報道。然而對于生物樣品中蛋白質的絕對量的測定對于多種類型的科學研究是非常有必要的。因此George Rosenberger團隊設計了一款可支持從無標記的液相色譜-質譜聯用/質譜(LC-MS/MS)方法獲得的蛋白質組學數據來估計絕對蛋白質數量的用戶友好型且透明的軟件。此軟件提供一個包括48種蛋白質,由8個蛋白質組成的動態范圍為5個數量級的示例數據集。用戶可以輸入從各種質譜測量模式和分析軟件工具所得到的輸入數據,根據示例數據可將輸入數據變換成合適的格式。通過aLFQ軟件可實現無標記的蛋白質的絕對量。同樣地,2020年出現了由Thang V Pham團隊開發的以實現基于無標記數據獨立采集 (Data-independent acquisition,DIA) 質譜的蛋白質組學的準確蛋白質定量的iq軟件[46]、2022年更新的由Wolfgang Raffelsberger開創的wrProteo軟件[47]都是對基于LC-MS/MS方法產生的蛋白質組學數據進行蛋白質的絕對量的測量。除此之外,wrProteo軟件還可以對由于某些樣品中給定肽的物理缺失、靈敏度限制或其他原因造成的定量蛋白質組學測量中經常出現的多個NA值進行處理,提供了以圖形的方式來檢查數據。并且通過各自的重復測量來研究NA值的性質,并幫助確認用低隨機值替換NA的選擇。2020年,Christian Panse等[48]創建了一款可以根據蛋白質組學中質譜相關數據,可對數據進行可視化操作與分析的軟件——protViz,大大完善了蛋白質組學數據的分析體系。aLFQ和iq軟件還可以診斷和校正大規模蛋白質組學數據中的批次效應[49]。這些對蛋白質組學數據分析的軟件可以在網絡上輕松獲取下載鏈接與幫助文檔。
單細胞測序技術能夠很好地分析腫瘤的異質性、獲取腫瘤微環境中的細胞狀態以及細胞之間的通訊行為等這些可以揭示腫瘤侵襲轉移現象的機制。目前,用于處理、分析以及可視化單細胞轉錄組測序數據的生物信息學工具十分常見,數量眾多,且形成了一套相對較為固定的處理流程。
Pang等[50]針對具有高度侵襲轉移性質的膠質母細胞瘤的單細胞轉錄組測序數據進行了侵襲轉移軌跡的構建以及找尋分子機制,確定了控制腫瘤侵襲潛力的關鍵因素。整體的處理流程包括對于獲取到的膠質母細胞瘤的單細胞轉錄組測序數據,先使用Bowtie2[51]將其與人類基因組數據進行超快速和高效比對。Bowtie2允許CPU以每小時超過2 500萬次的讀取速度來對齊35個堿基對。在相同條件下,相較于同類型的讀取軟件Maq[52]、SOAP[53]分別提升了35倍和300倍。對于比對之后的數據使用RSEM[54]進行轉錄本定量,將基因表達水平量化到每百萬轉錄本的量級。接著,以GTEx Consortium(Genotype-tissue expression consortium),基因型-組織表達研究聯盟)[55]中的腦組織正常樣本為參照,基于拷貝數變異篩選腫瘤細胞。最后,對篩選出的膠質母細胞瘤細胞的單細胞轉錄組數據,通過閾值過濾進行預處理,得到單細胞轉錄組表達矩陣,并用Seurat對其進行深入處理。Seurat[56]作為最常用的單細胞轉錄組數據分析工具,可對單細胞轉錄組表達矩陣進行多種處理:包括使用特定的函數對數據進行線粒體基因含量的檢測和每一細胞所處細胞周期的確定等預處理工作,以及對數據進行標準化、聚類和根據需要進行可視化分析。
Kharchneko等[57]還采用了SCDE進行了差異表達基因的鑒定與篩選。SCDE作為特定的用于分析單細胞轉錄組測序數據差異表達基因的分析工具,能夠解決單細胞測序中由于細胞本身不表達某些基因或者在測序過程中未測到而出現的許多零值的問題。同時為了評估不同特征與通路的活性,試圖采用GSVA[58]軟件。GSVA(Gene set variation analysis,基因集變異分析)軟件,采用了非參數、無監督的算法,進行數據特征和通路活性的描述。在重建細胞的偽時間軌跡時,使用公認的Monocle軟件[59]。Monocle使用了一種簡單的、無偏的和高度可擴展的統計程序來對細胞的偽時間軌跡進行構建。當試圖描述膠質母細胞瘤中干細胞入侵現象背后的分子事件,采用隱馬爾可夫算法[60](HMM)以無偏的方式確定每個基因的狀態,同時使用ClueGO[61]進行動態過程的分析。所形成的完整的分析流程可以應用到任何一種具有侵襲轉移特性的癌癥的單細胞轉錄組測序數據上,卵巢癌也不例外。
對卵巢癌侵襲轉移機制研究方面常用的生物信息學工具進行了列表總結(見表2)。

表2 卵巢癌侵襲轉移機制研究常用生物信息學工具Table 2 Bioinformatics tools commonly used in studies of the invasion and metastasis mechanisms of ovarian cancer
卵巢癌侵襲轉移的發生是多種因素復雜調控的結果,涉及基因組、轉錄組、蛋白質組等多個組學層面。隨著新一代測序技術的出現和發展,癌癥相關組學測序數據近十年來呈指數型增長,特別是單細胞測序技術的出現,使得人們得以更細微的從單細胞角度深入研究腫瘤細胞侵襲轉移的分子機制。目前已有大量卵巢癌相關組學數據存儲于各類數據庫中,可用于探索卵巢癌侵襲轉移的分子機制。此外,還有一些數據庫對目前已知的侵襲轉移相關調控因素進行了整理歸納,方便研究人員查詢及進一步研究(見表3)。

表3 卵巢癌侵襲轉移機制研究相關數據庫Table 3 Data resources related to the invasion and metastasis mechanisms of ovarian cancer
侵襲和轉移是腫瘤惡性發展的一個重要特征,相關研究大都基于TCGA數據庫(網址https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga)中收集的組學數據。此外,華東師范大學董東教授團隊 從GEO和TCGA數據庫以及7 081篇文獻中,收集了29種腫瘤、45種腫瘤亞型和38個轉移部位的測序數據,構建了HCMDB數據庫[62]。該數據庫共有124個數據集,涵蓋了mRNA、miRNA、lncRNA等多種RNA的表達數據。
哈爾濱醫科大學的李霞、肖云團隊[63]在2019年開發了CancerSEA數據庫則旨在全面解碼癌細胞在單細胞水平上的不同功能狀態,此數據庫提供了14種癌癥相關功能狀態:血管生成、細胞凋亡、細胞周期、細胞分化、DNA損傷、DNA修復、EMT、細胞缺氧、炎癥發生、癌細胞侵襲、轉移、增殖、細胞靜息、干細胞特性。數據包括25種癌癥類型的900個癌癥單細胞,此數據庫允許查詢不同癌癥的不同功能狀態的相關基因。其中,可以查詢到54個與卵巢癌侵襲轉移過程相關的基因。
武漢科技大學的鄧文生教授課題組[64]于2020年開發了LncR2metasta數據庫,記錄了54種人類癌癥亞型中的304個lncRNAs和39個包括癌細胞侵襲、內滲、外滲和增殖等過程的癌癥轉移事件(Cancer metastatic events,CME)之間的1 238個關聯。通過檢索此數據庫,共找到4個與卵巢癌轉移至淋巴結過程相關的lncRNA:SNHG20、DLX6-AS1、HOTTIP、LEF1-AS1。
自2009年湯富酬教授開創單細胞轉錄組測序技術[65]以來,該技術便開始井噴式地應用于各個方面,現已成為研究腫瘤微環境、癌癥發病機制、侵襲轉移事件以及各種癌癥精準治療與診斷方面必不可少的工具。基于大規模的癌癥單細胞轉錄組測序數據出現爆炸式增長,迫切需要對這些數據進行整合,據此中國科學院北京基因組研究所于2021年12月正式上線了CancerSCEM數據庫[66]。該數據庫整合分析了208個癌癥單細胞轉錄組測序數據集,涵蓋了卵巢癌(OV)、惡性膠質瘤(GBM)等在內的20種人類癌癥。通過標準化分析流程處理,獲得了癌癥的精確細胞類型注釋信息以及細胞類型間基因差異表達分析、細胞表面受體-配體基因對表達譜、樣本內細胞互作網絡構建等結果,可為用戶提供豐富的腫瘤微環境相關信息。利用此數據庫,可以進一步從單細胞層面分析卵巢癌侵襲轉移的分子機制。
細胞特異性調控網絡的識別有助于加深對疾病病理學的理解,哈爾濱醫科大學李霞教授團隊開發的單細胞層面的lncRNA相關內源性競爭RNA(ceRNA)調控網絡數據庫LnCeCell[67]。總共包含卵巢癌在內的25種癌癥類型,細胞數量大于94 000個,并提供超過9 000種由實驗支持與腫瘤轉移、復發、預后、循環和耐藥性等相關的lncRNA生物標志物。該數據庫能夠對每種癌癥細胞展示ceRNA在細胞內位置的全景圖,并描述其在單個癌細胞中的功能狀態。同時,LnCeCell還支持通過特定的細胞背景推斷ceRNA功能。
卵巢癌極強的侵襲轉移特性是其高致死率的重要原因,調控機理甚為復雜。已有研究表明,卵巢癌的侵襲轉移特性根源于卵巢癌腫瘤干細胞的無限增殖分化,并在炎性因子的刺激下得到活化和加強。近年來,隨著高通量測序技術出現和發展,以及分子純化方法的革新,又陸續在基因組層面發現諸如S100A10、MTA1等關鍵調控基因,在轉錄組層面發現與卵巢癌遷移和侵襲高度相關的Hsa-miR-320等非編碼RNA,以及在蛋白質組層面發現WFCD2、Rab23等關鍵蛋白。然而,不同層面因素間的互作關系、協作模式及調控網絡仍然未知,這些問題的探討有助于我們更深入地理解卵巢癌侵襲轉移的分子機制。目前,已積累了相當多的卵巢癌相關不同組學層面的高通量測序數據,且已有部分成熟的生信分析工具及數據庫可供使用。相信隨著研究的更進一步深入,未來將有更多的組學整合分析方法出現,深入揭示卵巢癌的侵襲轉移機制,助力癌癥治療藥物的研發,提高患者生存率。