郭佩,何寧寧,夏玉軍#
1青島大學基礎醫學院,山東 青島 266071
2煙臺毓璜頂醫院放射科,山東 煙臺 264000
結直腸癌又稱大腸癌,是結腸癌和直腸癌的總稱,是人類最常見的消化道惡性腫瘤之一。在中國,隨著經濟水平的提高以及生活方式的改變,結直腸癌的發病率逐年上升。目前,結直腸癌的主要診斷方法包括腸鏡檢查、磁共振成像(magnetic resonance imaging,MRI)和異常隱窩病灶(aberrant crypt foci,ACF)檢查。目前對結直腸癌的早期診斷仍然缺乏一種高敏感性的方法。腫瘤標志物存在于組織、血液、體液和尿液中,對腫瘤的早期診斷、預后和療效評估具有重要作用。組織激肽釋放酶家族(kallikrein-related peptidase,KLK)也稱為激肽釋放酶,屬于絲氨酸蛋白酶,它們廣泛存在于機體的各個組織中,主要參與調控心血管、腎臟、神經系統等的生理功能。KLK的異常表達與心臟病、腎病、炎癥反應、惡性腫瘤等疾病的發生有著密切聯系,尤其是在腫瘤中,KLK異常表達提示其可作為臨床上腫瘤早期診斷的標志物。已有研究證明,KLK5、KLK10、KLK11的異常表達與卵巢癌密切相關,KLK6的高表達與胃癌的增殖和遷移密切相關,KLK3可以作為前列腺癌診斷的生物標志物,KLK7的高表達與結腸癌細胞的增殖和侵襲密切相關。雖然人們對KLK與各種惡性腫瘤的關系進行了一些研究,但是對KLK家族基因在結直腸癌中的表達及與預后的關系未進行過系統分析。ONCOMINE數據庫是目前世界上最大的腫瘤基因芯片數據庫和整合數據提取平臺。TCGA數據庫是目前世界上最大的腫瘤基因組信息數據庫。STRING數據庫是一個搜尋蛋白質和蛋白質之間相互作用的系統,以幫助研究人員更加深入地認清相關蛋白質的功能和其調控機制。GEO是功能基因組學的數據存儲庫,可以查詢和下載樣本信息以及基因組的表達概況。本研究利用ONCOMINE、TCGA及GEO數據庫進行數據挖掘,分析人KLK基因在結直腸癌中的表達和預后意義,以及KLK作為結直腸癌標志物的可能性,為研究KLK基因在結直腸癌發生發展中的作用機制提供線索和思路,現報道如下。
在ONCOMINE v4.5數據庫中進行注冊,獲得數據庫的使用權限。根據實驗要求設定搜索條件,設定篩選條件。①Gene:KLK1-KLK15(依次檢索KLK家族的基因);②THRESHOLD(P-VALUE):0.01;③THRESHOLD(FOLD CHANGE):2;④ THRESHOLD(GENE RANK):ALL;⑤ Data Type:All。
登錄TCGA數據庫(版本v71),獲得人KLK基因在結直腸癌組織和正常結直腸組織中的表達數據。
登錄UALCAN在線分析工具(http://ualcan.path.uab.edu/index.html),選擇TCGA數據庫的研究,設定篩選條件。①Select Cancer Study:Colorectal cancer;②Select Genomic Profiles:Expression;③Kaplan-Meier生存曲線:Survival。然后以PDF格式導出。
選擇GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/)的GSE39582系列數據,這個數據庫包括585個結直腸癌樣本。此數據系列還具有分子亞型分類以及臨床生存特征等信息。下載數據庫后,利用R軟件(https://www.r-project.org/,版本:3.5.3)分析KLK基因表達與結直腸癌患者預后的關系。根據基因的中位表達數,分為高表達和低表達。
進入STRING在線數據庫(https://string-db.org/),設定查找條件。①基因名稱:KLK6、KLK8和KLK10;②物種:homo(人種);③證據來源(active interaction sources):選擇實驗數據(Experiments)。從而得到KLK基因相關的蛋白質-蛋白質作用網絡。
臨床組織樣本來自于煙臺毓璜頂醫院,且是在患者知情同意且簽署知情同意書的情況下取得的。研究方案得到了青島大學醫學部倫理委員會批準。2018年6月至2019年5月,共收集了24例組織樣本,包括20例結直腸癌組織和4例正常結直腸組織。手術之前,患者未進行任何化療或放療。在手術切除后,組織樣本立即被冷凍在液氮中,保存于-80℃,供后續研究。
根據mirVana miRNAIsolation kit(購自Thermo Fisher Scientific公司)的說明書進行操作,從組織中提取RNA。采用逆轉錄試劑盒[購自寶生物工程(大連)有限公司]進行cDNA的合成。采用Nanodrop測定cDNA的濃度。產物保存于-80℃,用于下一步的實驗。使用試劑盒Power SYBR-Green PCR Master Mix(購自Thermo Fisher Scientific公司)以及適當的引物進行聚合酶鏈反應,采用ABI7500-fast thermocycler(購自Thermo Fisher Scientific公司)進行實驗數據的采集。以甘油醛-3-磷酸脫氫酶(glyceraldehyde-3-phosphate dehydrogenase,GAPDH)作為內參,引物見表1。

表1 KLK和GAPDH基因的引物序列
M
(Q
,Q
)]表示,組間比較采用非參數檢驗;符合正態分布的計量資料以均數±標準差(x-
±s
)表示,組間比較采用t
檢驗。采用Kaplan-Meier法繪制生存曲線,組間比較采用Logrank檢驗。采用AdobeIllustrator CS4軟件對圖片進行整理。以P
<0.05為差異有統計學意義。KLK6
、KLK8
、KLK10
和KLK11
基因在結直腸癌組織中具有高水平的表達,KLK7
和KLK12
具有相對較高的表達水平,KLK1
和KLK15
具有較低的表達水平。其中KLK6
在13組數據、KLK8
在6組數據,KLK10
在17組數據、KLK11
在10組數據中顯示具有高水平的表達(且基因排序超過1%)。(圖1)
圖1 ONCOMINE數據庫中人KLK 基因在各種腫瘤類型中的表達情況
KLK
基因在結直腸癌組織和正常結直腸組織中的表達結果,對具有顯著性差異的數據進行比較分析。結果顯示,結直腸癌組織中人KLK6
、KLK7
、KLK8
、KLK10
、KLK11
和KLK12
基因的表達水平均明顯高于正常結直腸組織,差異均有統計學意義(P
<0.01)。(表2)
表2 TCGA數據庫中人KLK基因在結直腸癌組織和正常結直腸組織中的表達情況
KLK
基因表達與結直腸癌預后的關系,本研究利用UALCAN在線工具分析TCGA數據庫中人KLK
mRNA表達水平與結直腸癌預后的相關數據。結果表明,KLK
基因表達與結直腸癌預后無關。TCGA數據庫包括121例具有預后信息的結直腸癌組織,進一步選擇GEO數據庫中的GSE39582系列數據,此系列數據包括578例具有預后信息的結直腸癌組織。利用R軟件進行數據處理和分析,結果顯示,KLK6
、KLK8
、KLK10
和KLK12
基因低表達患者的預后分別優于上述基因高表達的患者,差異均有統計學意義(P
=0.0008、0.0392、0.0013、0.0203)(圖2)。
圖2 人KLK 基因高表達與低表達結直腸癌患者的生存曲線
KLK
基因在結直腸癌組織中的表達情況,對臨床收集的20例結直腸癌組織和4例正常結直腸組織進行定量逆轉錄聚合酶鏈反應。結果顯示,結直腸癌組織中KLK1
基因的表達水平低于正常結直腸組織,KLK6
、KLK7
、KLK8
、KLK10
和KLK11
基因的表達水平均高于正常結直腸組織,差異均有統計學意義(P
<0.05)(表3)。綜合數據挖掘結果和臨床樣本驗證的結果,KLK6
、KLK8
和KLK10
基因具有很高的可能性作為結直腸癌標志物。
表3 臨床樣本中人KLK基因在結直腸癌組織和正常結直腸組織中的表達水平
為了進一步明確與KLK6、KLK8和KLK10相互作用的蛋白,通過挖掘STRING數據庫構建KLK6、KLK8和KLK10蛋白質-蛋白質作用網絡。結果表明,KLK6和5個蛋白[YY1關聯因子2(YY1 associated factor 2,YAF2)、α-突觸核蛋白(alpha-synuclein,SNCA)、α2-巨球蛋白樣蛋白 1(alpha-2-macroglobulin like protein 1,A2ML1)、絲氨酸蛋白酶抑制劑Kazal型5(serine peptidase inhibitor Kazal type 5,SPINK5)和絲氨酸蛋白酶抑制劑Kazal 型 9(serine peptidase inhibitor Kazal type 9,SPINK9)]相關,KLK10 和 2 個蛋白(SPINK5 和KLK8)相關,KLK8和8個蛋白[SPINK5、SPINK9、KLK5、半胱天冬酶 1(caspase-1,CASP1)、半胱天冬酶募集結構域16(caspase recruitment domain 16,CARD16)、絲氨酸蛋白酶抑制劑B6(serine proteinase inhibitor B6,SERPINB6)、絲氨酸蛋白酶抑制劑B5(serine proteinase inhibitor B5,SERPINB5)和KLK10]相關。進一步對KLK6、KLK8和KLK10相關的10個相互作用蛋白的生物學功能進行分析,發現這些相互作用分子主要參與對細胞增殖和凋亡的調節。(圖3)

圖3 KLK6、KLK8和KLK10基因相關的蛋白質-蛋白質作用網絡圖
結直腸癌是臨床上一種常見的消化道腫瘤,對人類的健康和生命危害極大,并且經常伴隨多種并發癥。結直腸癌的醫學研究一直是腫瘤研究的熱點之一。目前治療結直腸癌的主要方法是外科手術和結腸鏡治療,結直腸癌可經手術治愈,但術后復發轉移率高,可達40%~50%。因此,早期發現是治療結直腸癌的關鍵,提前發現將會發生癌變的患者是醫學的研究重點。發現有效的結直腸癌標志物對了解腫瘤成因及患者預后具有關鍵作用。
20世紀90年代中期發展起來的基因組學是生物信息學的主要研究內容之一。在病理生理、疾病檢測、藥物開發、疾病預防和功能基因組方面得到了廣泛的應用。在腫瘤研究領域,利用公開的組學數據庫尋找腫瘤標志物成為目前科學研究的重要手段之一。本研究通過ONCOMINE數據庫的整合分析發現,KLK6、KLK8、KLK10和KLK11基因在結直腸癌組織中具有高水平的表達,KLK7和KLK12基因具有相對較高的表達水平。通過TCGA數據庫收集KLK mRNA在結直腸癌組織和正常結直腸組織中的表達水平,結果發現,結直腸癌組織中人 KLK6、KLK7、KLK8、KLK10、KLK11和KLK12基因的表達水平均明顯高于正常結直腸組織(P<0.01)。TCGA數據庫雖然是目前世界上最大的腫瘤基因組信息數據庫,但是它只有121例具有預后信息的結直腸癌組織,因此,本研究進一步選擇了GEO數據庫中包括578例具有預后信息的結直腸癌組織的GSE39582系列數據進行生存分析,采用Kaplan-Meier法繪制生存曲線。結果發現,KLK6、KLK8、KLK10和KLK12基因低表達患者的預后分別優于上述基因高表達的患者,差異均有統計學意義(P<0.05)。本研究還對臨床收集的結直腸癌組織和正常結直腸組織樣本中的KLK基因進行檢測,結果發現,結直腸癌組織中KLK6、KLK7、KLK8、KLK10和KLK11基因的表達水平均高于正常結直腸組織,差異均有統計學意義(P<0.05)。綜合分析,KLK6、KLK8和KLK10基因具有很大的可能性作為結直腸癌標志物。之前的研究已經發現KLK6在結直腸癌中具有較高的表達水平以及靶向KLK6作為結直腸癌治療策略的可能性。另外,本研究通過挖掘STRING數據庫構建了KLK6、KLK8和KLK10基因相關的蛋白質-蛋白質作用網絡圖。通過分析相關的10個相互作用蛋白的生物學功能,進一步證明了KLK6、KLK8和KLK10對細胞增殖和凋亡具有調節作用。
綜上所述,本研究通過對公共數據庫中腫瘤相關基因信息和預后信息深入挖掘,發現KLK6、KLK8和KLK10基因在結直腸癌組織中高表達,且與結直腸癌患者的預后有關,將為進一步闡明KLK6、KLK8和KLK10在結直腸癌發生發展中的作用奠定理論基礎。