宋宜來,劉中國
山西醫科大學第一醫院,山西太原 030001
多發性骨髓瘤(multiple myeloma,MM)是一種血液惡性腫瘤,其特征為骨髓中B淋巴細胞的克隆增殖,因此多發性骨髓瘤是一種B淋巴細胞淋巴瘤的血液系統疾病。近年來間充質干細胞(MSC)作為血液系統腫瘤治療的新型方法得到了廣泛的關注[1-4]。但是隨著對MSC研究的不斷深入,有人發現與源自正常供體(ND-hMSC)的MSC相比,MM患者來源的MSC(MM-hMSC)在遺傳和功能上是不同的,自體MM骨髓間質細胞的移植不能解決間充質干細胞的來源問題[5]。為進一步探索間充質干細胞的來源問題,明確是否自體來源的脂肪間充質干細胞是一種理想的細胞來源,我們對健康人與MM患者的脂肪基質細胞進行了比較,為脂肪基質細胞的來源提供參考依據。
1 材料 GSE133346微陣列芯片數據包以及其平臺文件GPL570-55999來自基因表達數據庫(NCBI-GeneExpression Omnibus GEO)數據庫,以“多發性骨髓瘤和脂肪基質細胞”為關鍵詞搜索而來,包含樣本24個,共分2組,分別為健康人和MM患者的脂肪基質細胞,每組12個人類樣本。R語言軟件以及操作指令代碼來自在線平臺 (Bioconductor http://www.bioconductor.org)。 蛋白質互作網絡圖(PPI)利用蛋白功能關系網絡數據庫STRING(http://string-db.org)構建后下載,并通過軟件Cytoscape二次構建。注釋、可視化和集成數據庫在線數據平臺(DAVID https://david.ncifcrf.gov)對差異基因進行基因聚類分析(GO聚類分析和KEGG通路分析)。腫瘤關鍵基因的生存預后分析由癌癥數據在線分析、挖掘網站(UALCAN http://www.ualcan.path.edu/index.html)在線分析而得。
2 健康和MM患者脂肪基質細胞差異基因的篩選下載GSE133346微陣列芯片數據包,通過R語言軟件對芯片進行質量監控,在確認芯片質量的情況下對芯片數據RMA法矯正。平臺文件GPL570-55999對矯正后數據轉換基因ID至國際通用名稱。R軟件包用于處理下載的文件以及轉換和拒絕不合格的數據。對GSE133346數據進行背景校準、標準化以及log2轉換。R語言軟件篩選健康人和MM患者的差異基因,利用Limma數據包代碼設置|log fold change (FC)|>1.5篩選出病患與健康人脂肪基質細胞上的差異基因。
3 差異基因的GO富集分析以及KEGG途徑分析利用DAVID在線分析平臺對篩選后的差異基因進行功能和通路上的富集分析[6]。由DAVID對GO富集功能進行注釋,并對KEGG通路進行注釋,分析后以TXT格式輸出分析。在對差異基因的富集分析過程中,在富集內容條件允許下選取了前20個GO以及KEGG富集內容。
4 蛋白質互作網路分析篩選關鍵差異基因 篩選出差異基因輸入STRING在線數據庫[7],利用STRING預測蛋白相互作用,從STRING下載輸出后輸入Cytoscape離線軟件,分析蛋白互作關系。中心節點(Degree)值取中位數,取Degree值大于中位數的基因。Degree值較高的基因是具有重要生理調節功能的關鍵的候選基因,并利用Cytoscape離線軟件構建蛋白質互作網絡。
5 MM脂肪基質細胞關鍵基因的生存分析驗證利用癌癥數據在線分析、挖掘網站(UALCAN http://www.ualcan.path.edu/index.html)對篩選出的關鍵基因進行驗證[8]。在健康人和MM患者脂肪基質細胞中篩選出關鍵差異基因后,輸入在線工具UALCAN分析關鍵基因的生存預后。關鍵基因輸入UALCAN數據庫后選取較健康來源脂肪間充質干細胞有明顯差異的關鍵差異基因(P<0.05)。
6 統計學分析 利用R軟件對基因資料做統計分析。以穩健的多陣列平均值(RMA)處理樣本,最近鄰居法(KNN)法尋找與有缺失值基因的表達譜相似的其他基因,并填充缺失值。P<0.05為差異有統計學意義。
1 健康人和MM患者脂肪基質細胞差異基因的篩選 通過R語言軟件Limma包從20 458個基因中,以|log fold change (FC)|>1.5以及較健康人來源脂肪間充質干細胞有明顯差異的關鍵差異基因(P<0.05)為標準篩選。差異基因148個,其中上調47個,下調101個(表1、圖1)。
2 差異基因的GO功能和KEGG通路富集分析對篩選出的差異基因通過在線功能和通路分析軟件DAVID分析,選取前20以內的功能富集內容(表2,表3,表4)。內容包括生物過程(biological processes,BP)、 細 胞 成 分 (cellular components,CC)及分子功能(molecular functions,MF)三個方面(圖2)。生物過程相關的前5位內容分別是白細胞遷移、細胞黏附、細胞對成纖維細胞生長因子刺激的反應、口感發展以及細胞外基質組織。細胞成分相關的分別是細胞外泌體、內質網腔、細胞外區域、細胞表面以及質膜。分子功能相關的分別是膠原結合、肌動蛋白結合、血小板衍生生長因子受體結合、細胞外基質結構成分以及微管蛋白結合。差異基因的KEGG通路富集,分別有黏著力、調節肌動蛋白細胞骨架、ECM-受體相互作用、癌癥中的膽堿代謝以及PI3K-Akt信號通路(圖2、表 5)。

圖1 健康人和多發性骨髓瘤患者脂肪基質細胞之間的差異基因表達情況[紅色標記點表示基于倍數變化大于log2(1.5)的差異基因,并且同時P<0.05。綠色標記點表示基于倍數變化小于-log2(1.5),且P<0.05的下調的差異基因,灰色標記點表示無顯著差異的基因]Fig. 1 Differential gene expression of adipose stromal cells in healthy controls and multiple myeloma patients (red dots indicate differential genes based on fold change greater than log2[1.5], with P<0.05. Green dots indicate down-regulated differential genes less than fold change based on -log2[1.5],with P<0.05, gray marked dots indicate genes without signif i cant differences)

表1 健康人和多發性骨髓瘤患者脂肪基質細胞的差異基因Tab.1 Differentially expressed genes in adipose stromal cells in the healthy controls and the multiple myeloma patients

表2 健康人和多發性骨髓瘤患者脂肪基質細胞差異基因的生物過程相關的GO富集分析Tab. 2 Analysis of GO enrichment related to biological processes of differentially expressed genes in adipose stromal cells from the healthy controls and the multiple myeloma patients

圖2 健康人和多發性骨髓瘤患者脂肪基質細胞差異基因的GO功能富集以及KEGG途徑富集A:生物過程; B:細胞成分; C:分子功能; D:KEGG途徑;圖中圓圈顏色指示P值的變化,大小表示差異基因的富集數量Fig. 2 GO function enrichment and KEGG pathway enrichment of differentially expressed genes in adipose stromal cells from healthy controls and multiple myeloma patientsA : biological process ; B: cellular components; C : molecular function; D : KEGG pathway; circled color indication P value change, the size indicates the enrichment amount of the differential genes

表3 健康人和多發性骨髓瘤患者脂肪基質細胞差異基因與細胞成分相關的GO富集分析Tab. 3 GO enrichment analysis of differentially expressed genes and cell components in adipose stromal cells in the healthy controls and the multiple myeloma patients

表4 健康人和多發性骨髓瘤患者脂肪基質細胞差異基因與分子功能相關的GO富集分析Tab. 4 GO enrichment analysis of differentially expressed gene and molecular function in adipose stromal cells in the healthy controls and the multiple myeloma patients

表5 健康人和多發性骨髓瘤患者脂肪基質細胞差異基因的KEGG 通路富集分析Tab. 5 KEGG pathway enrichment analysis of differentially expressed genes in adipose stromal cells in the healthy controls and the multiple myeloma patients
3 蛋白質互作網絡分析關鍵差異基因 在篩選過程中,導出基因Degree值>3的基因,被認為是關鍵基因。關鍵基因30個,其中上調基因14個,下調基因16個。軟件Cytoscape構建30個關鍵差異基因的蛋白質互相作用網絡(圖3)。通過R-heatmap軟件繪制經拓撲學分析后共30個上調以及下調基因(圖4)。
4 關鍵差異基因與腫瘤的關系 關鍵差異基因導入癌癥數據在線分析、挖掘網站(UALCAN http://www.ualcan.path.edu/index.html),選取與健康人來源脂肪間充質干細胞有明顯差異的關鍵差異基因 (P< 0.05)。發現基因 CSRP1、FSTL3、FYN、LAMB1、MYLK、PRRX1與MM發 展 相 關。 其中CSRP1、FYN和MYLK與MM發展正相關,而FSTL3、LAMB1、PRRX1與MM發展負相關(圖5)。
MMBD目前的治療是使用雙膦酸鹽,或在某種程度上配合使用靶向藥物治療[9]。雖然可以在一定程度上改善MM的臨床癥狀,但是療效并不理想。因此開發新的治療策略來對抗MM顯得尤為重要。關于多發性骨髓瘤的治療當前干細胞是一大熱點,干細胞來源有骨髓、脂肪等,干細胞能否通過自體移植的方式治療腫瘤也是當前研究的一個方向[10]。自體來源的骨髓干細胞作為便利的細胞來源得到了人們的關注,但是在實驗中發現骨髓來源的干細胞有促進腫瘤發展的作用[11]。
CSRP1是一種骨架蛋白,與細胞基質降解有關。并且在前列腺癌和腎癌中作為標志物,且在腫瘤的發生中出現表達改變。FSTL1是一種具有多種生物學調節功能的分泌型糖蛋白,近年來相關的文獻報道主要集中在炎癥、自身免疫性疾病、改善缺血/再灌注損傷和免疫調節等方向,發現通過TGFβ1-Smad2/3信號通路可影響FSTL1在結直腸癌中表達[12-13]。FSTL1上調與腫瘤浸潤深度、淋巴結轉移及不良預后相關。FYN是Src激酶家族的59 kU成員,在最近的研究中發現FYN的抑制導致大腸癌細胞的選擇性細胞死亡[14]。LAMB1在大腸癌患者血清樣品中水平顯著升高,為腫瘤的明顯標記物[15-16]。MYLK可能通過激活VEGFA/VEGFR2和下游Ras/ERK信號通路促進膀胱癌的發展[17]。PRRX1的表達降低會刺激SDF-1/CXCR4信號傳導,并與肝細胞癌中血液循環腫瘤細胞相關[18-19]。

圖3 蛋白質相互作用網絡圖(方塊尺寸大小代表蛋白的向關聯數目,顏色的深度代表了不同基因的P值)Fig. 3 Protein interaction network diagram (The size of the square represents the number of related proteins, and the depth of the color represents the P value of different genes)

圖4 篩選后的30個差異基因熱圖[基于以變化倍數大于log2(1.5)且P<0.05,同時Degree值>3]Fig. 4 Heat map of 30 differentially expressed genes after screening based on fold change greater than 1.5 and P<0.05,while degree value>3

圖5 多發性骨髓瘤患者脂肪基質細胞中CRSP1, FSTL3, FYN, LAMB1, MYLK, RRX1表達水平對預后的影響Fig. 5 Effect of CSRP1, FSTL3, FYN, LAMB1, MYLK, PRRX1 expression levels in adipose stromal cells on prognosis of patients with multiple myeloma
在本文中,我們利用生物信息學分析的方法對自體脂肪基質細胞治療MM的方案進一步研究挖掘了自體脂肪干細胞的相關基因改變。我們共尋找到6個相關的關鍵基因,并用在線數據庫做了相應的驗證。但是仍需相關患者標本的進一步實驗驗證。本數據庫一共包括24個樣本,其中12個為正常人,12個為MM患者。雖然樣本量已滿足分析要求,仍然需要其他數據庫的分析后進一步驗證。當前干細胞自體移植治療MM是一種新的方案,MSC在MM治療中的應用仍處于較為基礎階段。
本文中,我們通過對多發性骨髓瘤患者與健康人脂肪基質細胞微陣列數據的分析,得到了差異基因的生物功能相關的特征,并篩選出脂肪基質細胞與腫瘤相關的關鍵差異基因。關鍵差異基因可以為臨床上自體脂肪基質細胞治療MM提供相關的分子生物靶標參考。