李慧,王柯
(1河南省人民醫院河南大學臨床醫學院,鄭州450003;2鄭州大學人民醫院;3鄭州大學附屬洛陽市中心醫院)
皮膚惡性黑色素瘤極具侵襲性且易轉移,預后極差。手術切除是其惟一治愈方式,其他治療手段的失敗提示學者們對黑色素瘤發病的分子機制仍知之甚少,因此有必要更全面地了解黑色素瘤的轉錄圖譜和信號轉導通路。miRNA是內源性非編碼小RNA總稱,可調控基因表達、參與腫瘤發生發展[1]。因此,miRNA有望作為多種疾病診斷或治療的靶點。GEO數據庫(http://www.ncbi.nlm.nih.gov/geo/)[2]由美國國家生物技術信息中心(NCBI)于2000年創建,覆蓋疾病、代謝、藥理學等方面生物學內容。2019年3月,本研究從GEO數據庫中篩選所需數據,篩選原發性皮膚惡性黑色素瘤相關miRNA及其靶基因,并進行生物信息學分析,旨在為原發性皮膚惡性黑色素瘤的深入研究提供一定線索和幫助。
1.1 基因芯片來源 本研究中涉及的基因芯片平臺為GPL15019(Agilent-031181 Unrestricted_Human_miRNA_V16.0_Microarray 030840)和GPL15183(CRUK/Melton lab-Human melanoma-71-v2-miRNA expression profiling)。詳見網址https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi acc=GPL15019和https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi acc=GPL15183。
1.2 差異表達miRNA篩選 經檢索,符合本研究對象的數據集包括GSE34460和GSE35579;進入GEO2R(GEO數據庫自帶數據分析工具)頁面(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi acc=GSE34460),并選擇項目“Analyze with GEO2R”,點擊“Define groups”對皮膚惡性黑色素瘤組織和皮膚良性黑素細胞痣組織進行分組,選擇“Save all results”并保存至TXT文檔。將該TXT文檔以Excel方式打開后,篩選同時滿足adj.P<0.01和|logFC|>1者[3],其中logFC>1者為在惡性黑色素瘤組織中相對良性黑素細胞痣組織中表達上調的miRNA,而logFC<-1者為在惡性黑色素瘤組織中相對良性黑素細胞痣組織中表達下調的miRNA。同樣方法篩選出GSE35579中差異表達miRNA,并與GSE34460中差異表達miRNA分別取交集,得到二者共同差異表達的miRNA[3],以行進一步分析。
1.3 差異表達miRNA靶基因預測 借助miRecords(http://c1.accurascience.com/miRecords/)平臺[4]預測差異表達miRNA的靶基因。為降低軟件預測假陽性,擬定至少同時在5個預測軟件中均有記錄的基因才可作為靶基因[1]。
1.4 差異表達miRNA靶基因功能注釋及通路分析 以用于注釋、可視化和集成發現的數據庫DAVID6.8工具(http://david.abcc.ncifcrf.gov/)為分析平臺,利用“Annotation summary results”中的“Gene Ontology”和“Pathways”功能,對皮膚惡性黑素瘤中差異表達miRNA的靶基因分別進行基因本體論數據庫(GO)功能富集分析和京都基因與基因組百科全書數據庫(KEGG)分析,其中P<0.05提示結果差異有統計學意義[3]。
1.5 miRNA靶基因編碼蛋白相互作用網絡的構建及分析 將皮膚惡性黑素瘤的差異表達miRNA的靶基因導入STRING在線分析軟件(http://string.embl.de/),獲得靶基因編碼蛋白網絡圖,將獨立節點刪除后,繪制差異表達靶基因編碼蛋白質-蛋白質相互作用(PPI)網絡圖。再將上述STRING數據庫中PPI網絡圖數據以TSV格式導出,導入Cytoscape3.4.0軟件[5],并通過“Molecular Complex Detection(MCODE)”工具對PPI網絡進行聚類分析。根據相關文獻設置標準[6],分析完畢后,狀態為“seeds”的對應基因即為核心基因,MCODE得分≥3且結點數≥4的聚類為關鍵聚類。
1.6 以核心基因為靶點的化合物篩選 在比較毒物遺傳學數據庫中篩選能影響核心基因的化合物[7],數據庫網址為http://ctd.mdibl.org/。
2.1 皮膚惡性黑素瘤差異表達miRNA GSE34460芯片中共13個差異表達miRNA,GSE35579芯片中共70個差異表達miRNA;兩組芯片中共同差異表達miRNA共5個,且均表達下調,分別為hsa-miR-183、hsa-miR-200a、hsa-miR-455-5p、hsa-miR-204、hsa-miR-429(P分別為4.04E-06、1.21E-05、6.02E-05、6.05E-03、4.38E-02)。
2.2 差異表達miRNA靶基因預測 hsa-miR-183的靶基因包括IRS1、SCYL3、DCX、SMPD3、SOCS6、SLITRK1、CNTNAP2、FOXO1、MAP3K4等。hsa-miR-200a的靶基因包括ZEB2、CHP、RARB、NAP5、TMEM110、WDFY3、ZNF644、EXOC5等。hsa-miR-455-5p的靶基因包括CACNB4、TAF4、USP9X、HTR2C、TMEM30A、BRD1、NR4A2、DYNC1LI2及C4orf17等。hsa-miR-204的靶基因包括PLAG1、RPS6KC1、EFNB3、ESRRG、MON2、RSPO3、FAM134C、YARS及CHN2等。hsa-miR-429的靶基因包括LRP1B、FAM8A1、KIAA0355、OLIG3、REEP1、SNAP25、AFF3、GPM6A及AP1S2等。
2.3 差異表達miRNA靶基因功能注釋及通路分析 hsa-miR-183靶基因主要存在于胞質,參與蛋白質去磷酸化、多巴胺能神經突觸相關信號通路等。hsa-miR-200a靶基因主要存在于胞質,具有正性調節RNA聚合酶Ⅱ啟動子、結合Ephrin受體等作用。hsa-miR-204靶基因主要存在于胞質囊泡膜,參與調節RNA聚合酶Ⅱ啟動子、雌激素信號通路等。hsa-miR-429靶基因主要位于胞質,可負性調控細胞遷移、參與卵母細胞減數分裂等。hsa-miR-455-5p靶基因主要位于胞質,參與心肌細胞中腎上腺素能信號傳導、Hippo信號通路等。詳見表1~5。

表1 hsa-miR-183靶基因基因功能及通路富集分析結果

表2 hsa-miR-200a靶基因基因功能及通路富集分析結果

表3 hsa-miR-204靶基因基因功能及通路富集分析結果

表4 hsa-miR-429靶基因基因功能及通路富集分析結果

表5 hsa-miR-455-5p靶基因基因功能及通路富集分析結果
2.4 差異表達miRNA靶基因編碼蛋白PPI網絡的構建及分析 hsa-miR-183靶基因編碼蛋白的PPI網絡圖由144個節點構成,連接度為84;核心基因分別為PPP2CB、PLCB4、RNF138、GATAD2B,關鍵聚類為PPP2CA、PPP2CB、PPP2R5C、PPP2R2A。hsa-miR-200a靶基因編碼蛋白的PPI網絡圖由127個節點構成,連接度為95;核心基因為TMEM110,但無符合條件的聚類。hsa-miR-455-5p靶基因編碼蛋白的PPI網絡圖由105個節點構成,連接度為40;MCODE分析顯示僅有2個結點,無法分析核心基因。hsa-miR-204靶基因編碼蛋白的PPI網絡圖由245個節點構成,連接度為274;MCODE分析顯示僅有4個結點,無法分析核心基因。hsa-miR-429靶基因編碼蛋白的PPI網絡圖由20個節點構成,連接度為1;核心基因為CLASP2,但無符合條件的聚類。經Cytoscape平臺分析得到,皮膚惡性黑色素瘤差異表達miRNA靶基因編碼蛋白PPI網絡的核心基因為PPP2CB、PLCB4、RNF138、GATAD2B、TMEM110和CLASP2。
2.5 以核心基因為靶點的毒物篩選 砷劑和二嗪農均可影響PPP2CB基因甲基化,其中二嗪農主要表現為促進作用。氯化鎘可抑制PPP2CB、TMEM110啟動子甲基化。黃曲霉毒素B1可抑制GATAD2B、CLASP2甲基化。三氯乙烯可以促進CLASP2甲基化。因此,以核心基因為靶點的毒物主要通過影響基因甲基化發揮作用。
隨著分子生物學技術的發展,微陣列芯片技術在生物學研究中占有重要地位。基因芯片的廣泛應用產生了海量的數據。通過挖掘數據庫中的數據,再用整合或對照研究等方法挖掘基因或非編碼RNA之間的關聯信息,繼而揭示基因或非編碼RNA之間復雜的作用機理是一種非常值得嘗試的研究策略。目前常用的基因信息數據庫包括TCGA和GEO。本研究所使用的篩選差異miRNA的工具為GEO數據庫自帶的GEO2R在線分析工具。此外本研究也使用了DAVID、STIRNG和Cytoscape等工具。
目前關于原發性皮膚惡性黑色素瘤的研究非常多,但人們對該疾病的認識仍不夠全面。本研究從GEO數據庫中篩選所需數據并借助GEO2R等多種分析工具進行了一系列生物信息學分析,最終得到原發性皮膚惡性黑素瘤組織中差異表達的miRNA靶基因中的核心基因和關鍵聚類。本研究結果顯示,GSE34460和GSE3557兩組芯片中共同差異表達miRNA共5個,分別為hsa-miR-183、hsa-miR-200a、hsa-miR-455-5p、hsa-miR-204和hsa-miR-429,均表達下調。差異表達miRNA的靶基因主要參與蛋白質去磷酸化、RNA聚合酶Ⅱ啟動子調節、結合Ephrin受體、細胞遷移調控、卵母細胞減數分裂、心肌細胞中腎上腺素能信號轉導等過程,涉及通路包括多巴胺能神經突觸相關信號通路、雌激素信號通路、Hippo信號通路等。經Cytoscape平臺分析得到皮膚惡性黑色素瘤差異表達miRNA靶基因編碼蛋白PPI網絡的核心基因為PPP2CB、PLCB4、RNF138、GATAD2B、TMEM110和CLASP2。上述核心基因相關的毒物包括砷劑、二嗪農、氯化鎘、黃曲霉毒素B1、三氯乙烯,主要以影響基因甲基化發揮毒性作用。
2A型蛋白磷酸酶(PP2A)是體內主要的絲氨酸/蘇氨酸磷酸酶,主要參與減數分裂、有絲分裂、精子獲能、細胞凋亡等過程,可調控基因轉錄和生長因子信號轉導[8],并且可能具有腫瘤抑制因子的功能。α異構體(PPP2CA)和β異構體(PPP2CB)是PP2A的催化亞基[9],PPP2CA在惡性黑色素瘤中具有抗凋亡活性[10]。PPP2R5C和PPP2R2A是PP2A的調節亞基,PPP2R5C主要通過對P53蛋白某些位點氨基酸去磷酸化而實現調節細胞增殖和分化的作用[11]。與良性色素痣相比,PPP2R5C在惡性黑色素瘤中表達下調[8]。而PPP2CB及PPP2R2A與惡性黑色素瘤的關系尚未見文獻報道。
已有研究報道PLCB4在皮膚惡性黑色素瘤中突變率為21%~28%[12],可能具有抑癌基因活性。深度測序分析還發現PLCB4基因突變在眼色素層惡性黑色素瘤[12]以及腦膜惡性黑色素瘤[13]的形成中具有重要作用,但具體機制尚未明確。RNF138是E3泛素化連接酶,被其鋅指結構介導募集至DNA損傷位點并泛素化關鍵修復因子,促進同源重組修復[14]。由RNF138介導的RAD51D泛素化可促進DNA交聯損傷修復[15]、同源重組修復[16]和染色體完整性[15],UBE2D-RNF138-CtIP軸也可促進DNA損傷修復[17]。但RNF138與惡性黑色素瘤的關系尚未見文獻報道。
GATAD2B是甲基化-CpG結合蛋白-1復合體(MECP1)的亞基,它可以去乙酰化甲基化核小體和抑制轉錄活性。GATAD2B可能與硬腦膜形成[18]和妊娠、分娩[19]有關。TMEM110是一種跨膜蛋白,它可通過STIM-ORAI信號通路調節內質網-胞質膜連接及其生理學重構[20]。CLASP2可調節細胞損傷和細胞周期,在大腦皮層發育中負責協調Reelin通路功能和細胞骨架形成[21]。GSK3可介導CLASP2磷酸化繼而調節著絲粒[22]。可見,TMEM110和CLASP2均與細胞結構有關,但二者與惡性黑色素瘤的關系尚未明確。
考慮目前基因芯片及高通量測序等測序技術的經濟成本較高,本研究通過篩選GEO數據庫中的資料進行二次分析,所得結果與真實情況難免有一定差異,上述分析結果未來仍需在實驗室中進一步驗證。