殷紅梅
乳腺癌是臨床上較為常見的惡性腫瘤,居女性腫瘤發病率第一位。北美腫瘤流行病學報告顯示,2018年,美國乳腺癌新診斷人數為268 670例,而死亡人數為41 400例,乳腺癌已成為腫瘤相關死亡的重要原因之一[1]。近年來,隨著分子生物學的研究進展,乳腺癌靶向藥物及激素治療使得患者的預后大大提高。但部分晚期乳腺癌患者仍預后不良,探討影響乳腺癌患者的相關因素是目前的研究熱點[2-3]。
CK-19蛋白由KRT19基因編碼,該基因位于人17號染色體q21.2區域,全長41.53 Mb[4]。該基因編碼的蛋白為細胞角蛋白,與上皮細胞骨架的穩定性有關。CK-19 mRNA在乳腺癌中的表達及其與患者預后關系及其共表達網絡研究較少。本研究采用數據挖掘方法,在多個數據庫中探討CK-19基因表達及其臨床意義。
1.1 數據庫選擇 分別對腫瘤芯片數據庫Oncomine(https://www.oncomine.org/),生存分析數據庫Kaplan-Meier Plotter(http://kmplot.com/analysis/)和蛋白-蛋白相互作用String數據庫(https://string-db.org/cgi/input.pl)進行乳腺癌CK-19基因表達情況數據挖掘。
1.2 Oncomine,Kaplan-Meier Plotter和String數據平臺分析 首先在Oncomine數據庫中對CK-19 mRNA在乳腺癌組織與對應的正常乳腺組織中的差異表達情況進行分析。數據篩選條件為:①腫瘤類型:乳腺癌;②組織對比:乳腺癌vs正常乳腺組織;③數據類型:mRNA;④顯著性:P=1E-4;⑤差異表達級別:大于2倍;⑥基因排序:前10%。然后利用Kaplan-Meier Plotter數據平臺挖掘CK-19 mRNA表達的芯片數據,并繪制CK-19高低表達生存曲線,分析CK-19與乳腺癌患者的預后關系。應用蛋白-蛋白相互作用數據庫String分析CK-19相互作用蛋白網路,探討其可能的生物學功能。

2.1 CK-19基因mRNA表達于腫瘤 檢索Oncomine數據庫發現,在乳腺癌中有9個數據集均顯示乳腺癌中CK-19高表達(包括細胞系),圖1。

圖1 CK-19基因mRNA在多種實體腫瘤與對應正常組織中的整體表達
2.2 CK-19基因共表達聚類分析 Oncomine數據庫中對CK-19 mRNA在乳腺癌中的共表達基因進行聚類分析顯示,CK-19 mRNA與KRT18,ERBB3,PRR5等基因mRNA存在共表達,提示上述基因在生物學功能上可能具相關性,圖2。進一步在String蛋白數據庫中對CK-19蛋白共表達進行了分析,結果顯示CK-19與KRT8,KRT18等蛋白具有共表達關系,圖3。

圖2 CK-19基因在乳腺癌組織中與其他基因共表達聚類分析

圖3 CK-19基于String數據庫的基因共表達分析
2.3 CK-19在乳腺癌與正常乳腺組織中的差異表達 Oncomine數據庫中,有3項基因表達芯片數據關于CK-19 mRNA在乳腺癌與正常組織中的差異表達分數數據,其中1項來自TCGA數據庫,另2項文獻[5-6],圖3。結果均提示在乳腺癌組織中CK-19 mRNA表達水平高于正常乳腺組織(P<0.05),圖4。

A:12項數據比較了不同類型乳腺癌組織與正常組織中CK-19 mRNA的差異表達情況;B:不同類型乳腺癌組織與正常組織比較的箱式圖,數據來自TCGA數據庫http://tcga-data.nci.nih.gov/tcga/;C:不同類型乳腺癌組織與正常組織比較的箱式圖,數據來自Radvanyi BreastStatistics;D:不同類型乳腺癌組織與正常組織比較的箱式圖,數據來自Perou Breast Statistics圖4 CK-19在乳腺癌與正常乳腺組織中的差異表達
2.4 CK-19表達與乳腺癌預后的關系 檢索Kaplan-Meier Plotter數據庫,發現關于CK-19表達水平與乳腺癌患者預后相關的表達譜芯片數據有1項[7]。根據CK-19 mRNA表達水平中位數分為低表達組和高表達組,并繪制生存曲線,比較高低表達組總生存期和無疾病進展生存期有無差異。結果顯示,CK-19 mRNA高低表達組總生存期分別為90.0月和115.0月,差異比較無統計學意義(HR=1.14,95%CI:0.92~1.41,P=0.23),而高低表達組無疾病進展生存期分別為48.16月和48.0個月,差異比較無統計學意義(HR=1.09,95%CI:0.98~1.22,P=0.11),圖5。

A:總生存比較;B:無疾病進展生存比較圖5 CK-19 mRNA高低表達與乳腺癌患者生存期關系
2.5 CK-19相互作用蛋白網絡 應用String數據庫富集CK-19相互作用的可能相關蛋白,富集條件為P=2E-15,節點數共11個,其中蛋白網絡中與CK-19相互作用的蛋白有10個,分別為KRT8,KRT18,KRT7,KRT5,KRT4,KRT6B,KRT1,KRT3,KRT80和KRT78,作用評分均大于0.9。上述10個關聯蛋白均屬于細胞角蛋白家族,參與上皮細胞結構的穩定性。
CK-19為細胞角蛋白家族的成員,角蛋白通常為負責上皮細胞結構完整性的中間絲蛋白,分為細胞角蛋白和毛發角蛋白。CK-19是一種Ⅰ型角蛋白,Ⅰ型細胞角蛋白由酸性蛋白組成,酸性蛋白成對排列[8]。與它的相關家族成員不同,這種已知最小的酸性細胞角蛋白在上皮細胞中不與堿性細胞角蛋白配對。編碼該蛋白的記憶定位于17q12-q21的一個區域。既往研究認為,CK-19在多種實體腫瘤組織中呈現高表達,并可在腫瘤患者外周血中檢測到CK-19蛋白的表達,可作為腫瘤診斷的標志物[9]。但在不同的腫瘤中,以其為參考指標,診斷的敏感性或特異性均不高,因而單獨作為腫瘤標志物的臨床應用價值有限[10-11]。
CK-19在乳腺癌中的表達已有報道,大多數研究采用免疫組織化學方法,探討腫瘤組織中CK-19蛋白的表達與乳腺癌患者臨床病理特征,如年齡、性別、HER2等情況的相關性。黃英等[12]采用qPCR檢測60例Ⅱ、Ⅲ期乳腺癌患者手術及化療前后外周靜脈血CK-19 mRNA變化情況,結果提示CK-19 mRNA的表達與神經及脈管受侵以及淋巴結轉移有關,與激素受體及HER2表達無關。近年來隨著基因芯片技術的發展及高通量測序成本的降低,基因表達與腫瘤預后關系得到了大量芯片和測序數據的支持。而這些芯片和測序數據的公開獲取為進一步數據深入挖掘提供了條件。
本研究綜合利用腫瘤芯片數據庫(Oncomine),腫瘤預后數據庫(Kaplan-Meier Plotter)和蛋白-蛋白相互作用數據庫(String)對CK-19基因表達情況與乳腺癌的關系進行了分析,研究認為CK-19 mRNA在乳腺癌組織中高表達,其蛋白與KRT18等角蛋白家族可能共同參與了上皮細胞結構的穩定性,但CK-19 mRNA高低表達與乳腺癌患者的預后無關。上述結論在基因芯片數據中得到了很好的支持,為其在臨床中的應用,包括靶向CK-19藥物研發,腫瘤標志物篩選提供了有力證據。