付 榮,林澤英
(廣州醫科大學附屬第二醫院風濕科,廣州 510260)
皮膚型紅斑狼瘡(cutaneous lupus erythematosus,CLE)是一種主要累及皮膚和黏膜組織的自身免疫性疾病。70%~80%系統性紅斑狼瘡(systemic lupus erythematosus,SLE)患者出現皮膚損傷,并常以CLE作為其首發癥狀[1]。多達23%的CLE患者會發展為SLE,并且病情在數年時間內有明顯進展[2]。亞急性皮膚型紅斑狼瘡(subacute cutaneous lupus,SCLE)是CLE的一種亞型,其特征表現為排列成銀屑病狀(丘疹鱗狀)或環狀形態的鱗狀紅斑丘疹。約50%的SCLE患者符合SLE的診斷標準[3]。這些患者中嚴重中樞神經系統疾病、腎臟疾病和嚴重全身性血管炎的發生率顯著高于無SCLE表現的SLE患者。目前針對SCLE的治療方案主要包括抗瘧藥、糖皮質激素、免疫抑制劑和使用防曬劑等,雖然這些治療方案在一定程度上改善了SCLE的進展,但缺乏精準性,長期使用可能帶來嚴重的不良反應。
隨著生命科學及信息科學的進展,生物信息學分析工具越來越廣泛地應用于醫學領域。采用先進研究手段深入研究SCLE有助于探討SCLE的發病機制,尋找潛在治療靶點。本研究通過對美國國家生物技術信息中心(NCBI)的基因表達匯編(Gene Expression Omnibus,GEO)數據庫中SCLE的基因芯片數據(GSE81071和GSE109248)進行數據挖掘,結合微陣列技術和生物信息學分析,篩選出SCLE與正常對照組(NC)組間的差異表達基因(differential expressed genes,DEGs)。隨后進一步對DEGs進行功能富集、信號通路、Hub基因識別等分析,并利用CIBERSORT算法進行22種免疫細胞的分析,確定了SCLE皮膚活檢標本中的關鍵信號通路、基因及免疫細胞浸潤情況,為疾病認識、藥物開發等提供新的思路。
GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/)中檢索數據,選擇標準包括:(1)數據集包含正常皮膚活檢和SCLE皮膚活檢;(2)樣本種屬為Homo sapiens;(3)基因表達式矩陣。按照這些標準篩選出2個數據集(GSE81071和GSE109248)。從GEO網站下載基因表達矩陣和探針注釋文檔,然后根據提供的注釋文檔將特定探針轉換為相應的基因名。GSE81071基于GLP19983平臺,包含正常皮膚組織7例,SCLE皮膚組織23例;GSE109248基于GLP10558平臺,包含正常皮膚組織14例,SCLE皮膚組織12例。
利用RStudio1.3.1093軟件通過“Limma”包進行基因表達矩陣的標準化和表達差異分析。篩選出|Log2FC|的差異閾值為1,調整后P<0.05的DEGs。利用“ggplot2”R包繪制火山圖。
GO分析由3個方面組成,即生物學過程(biology process,BP)、分子功能(molecular funtion,MF)和細胞成分(cellular component,CC),可幫助探討基因群的潛在聯系和相互作用[4]。KEGG是另一個生物信息數據庫,用作說明分子生物學意義和功能[5]。GO分析和KEGG通路富集分析利用“clusterProfiler”R包進行[6]。選取調節后P<0.05的通路,利用“ggplot2”R包進行可視化。
利用網站基因分析工具STRING(http://string-db.org)和Metascape(https://metascape.org/gp/index.html)構建DEGs的PPI網絡[7]。利用分子復合物檢測(molecular complex detection,MCODE)[8]篩選出PPI中最顯著模塊。導出PPI分析數據至Cytoscape(版本3.8.2),按degree算法在Cytoscape的插件CytoHubba中計算出前10位節點作為樞紐基因[9]。
數據集GSE81071基因表達矩陣進行標準化后利用RStudio及CIBERSORT網站(http://cibersort.stanford.edu/)進行22種免疫細胞浸潤分析[10]。篩選P<0.05的樣本,利用“pheatmap”R包繪制熱圖,“vioplot”R包繪制小提琴圖。
對GSE81071和GSE109248數據集進行去批次化處理及標準化后,GSE81071數據集篩選出130個DEGs,其中90個上調基因,40個下調基因,見圖1A;GSE109248數據集篩選出1 516個DEGs,其中879個上調基因,637個下調基因,見圖1B。GSE81071上調 |Log2FC|前10位 基因為:KRT6C、CXCL10、CXCL9、PI3、ISG15、OAS1、KRT16、MX1、PARP14和GBP1;下調基因為IGLV3-1、SCGB2A2、RPL21P28、SMR3A、PLEKHA8P1、RPRML、MT1H、IQCA1L、DAPL1和GMFB。GSE109248上調 |Log2FC|前10位基因為APOBEC3A、CXCL10、OASL、IFIT3、TYMP、ISG15、RSAD2、KLHDC7B、HERC6和IFI44L;下調基因為UGT3A2、C9ORF127、MRAP、GSTM5、IL17D、ITGA10、MAOA、PPARGC1A、CLEC4GP1和ACP6。

A:GSE8107火山圖;B:GSE109248火山圖。
兩個數據集的DEGs取交集,得到34個DEGs(圖2A),進行GO分析(包含BP、MF和CC)及KEGG富集分析。GO分析顯示,BP主要包括對病毒的防御反應、對病毒的反應、Ⅰ型干擾素信號通路、對Ⅰ型干擾素的細胞反應和對Ⅰ型干擾素的反應。在CC中,質膜外側組分較有意義。MF主要包括雙鏈RNA結合過程、腺苷酸轉移酶活性、CXCR趨化因子受體結合、核苷酸轉移酶活性及趨化因子活性。KEGG通路富集分析顯示DEGs主要在丙型肝炎、甲型流感、麻疹、EB病毒感染和NOD樣受體(NOD like receptor,NLR)信號通路等富集,見圖2B。GO分析和KEGG通路富集分析結果的前5位,見表1。

A:GSE8107與 GSE109248韋恩圖;B:GO分析與KEGG富集分析。

表1 DEGs的GO分析和KEGG通路富集分析結果
使用STRING構建DEGs的PPI網絡,除去不連貫的分子,有30個節點并形成171個連接邊。將DEGs導入Metascape網站并利用MCODE算法識別密集連接的網絡分子,按P值計算出前3個最有價值通路,見圖3、表2。利用Cytoscape中的CytoHubba選出10個Hub基因CXCL10、DDX58、RSAD2、OAS1、ISG15、OASL、OAS3、MX2、OAS2和GBP1,并繪制交匯網絡,見圖4。在所有DEGs中,CXCL10、DDX58和RSAD2是基于degree算法的核心基因。

圖3 Metascape網站構建的DEGs網絡
按照P<0.05過濾CIBERSORT分析結果后,GSE81071數據集的4例NC和34例SCLE被納入后續分析。22種免疫細胞表達情況繪制熱圖(圖5A),樣本中CD8+T淋巴細胞、CD4+靜息記憶T淋巴細胞、CD4+活化記憶T淋巴細胞、活化的自然殺傷細胞(NK細胞)、M1巨噬細胞和M2巨噬細胞表達水平較高。與NC組相比,SCLE組CD4+活化記憶T淋巴細胞比例明顯升高(P=0.007),而Tregs細胞比例明顯降低(P=0.001),見圖5B。

圖4 PPI網絡中的樞紐基因

A:NC與SCLE 22種免疫細胞熱圖;B:NC與SCLE 22種免疫細胞小提琴圖;B cells naive:初始B淋巴細胞;B cells memory:記憶B淋巴細胞;Plasma cells:漿細胞;T cells CD8:CD8+T淋巴細胞;T cells CD4 naive:初始CD4+T淋巴細胞;T cells CD4 memory resting:CD4+靜息記憶T淋巴細胞;T cells CD4 memory activated:CD4+活化記憶T淋巴細胞;T cells follicular helper:濾泡輔助性T淋巴細胞;T cells regulatory(Tregs):調節性T淋巴細胞;T cells gamma delta:γ-δT淋巴細胞;NK cells resting:靜息自然殺傷細胞;NK cells activated:活化自然殺傷細胞;Monocytes:單核細胞;Macrophages M0:M0巨噬細胞;Macrophages M1:M1巨噬細胞;Macrophages M2:M2巨噬細胞;Dendritic cells resting:靜息樹突狀細胞;Dendritic cells activated:活化樹突狀細胞;Mast cells resting:靜息肥大細胞;Mast cells activated:活化肥大細胞;Eosinophils:嗜酸性粒細胞;Neutrophils:中性粒細胞。

表2 基于MCODE算法的GO通路
生物信息學分析是一種目前廣泛使用的對基因芯片或高通量測序的大數據進行分析的方法。它可以通過比較不同樣本之間在基因組、轉錄組、蛋白組、代謝組等方面的差異,篩選出顯著變化的DEGs,通過富集分析篩選出DEGs及富集通路,進而通過數據平臺、網絡工具構建分子互作網絡,篩選網絡關鍵調控分子。本研究通過對GSE81071和GSE109248數據集的交集進行分析,共篩選出34個DEGs,通過GO分析和KEGG通路富集分析發現:SCLE皮膚組織中Ⅰ型干擾素信號通路和對Ⅰ型干擾素的反應通路明顯富集。對病毒的反應和對病毒的防御反應通路同樣明顯富集,其與Ⅰ型干擾素的釋放和功能也密切相關。這些證據提示Ⅰ型干擾素信號通路在SCLE發病過程中發揮重要作用。既往研究報道證實,SLE患者血清Ⅰ型干擾素明顯升高且與病情嚴重程度呈正相關[11-12]。對SLE患者免疫細胞功能紊亂的研究發現,Ⅰ型干擾素信號通路通過促進SLE患者B淋巴細胞增殖、存活及功能的發揮參與SLE進展[13]。此外,Ⅰ型干擾素信號通路還可以抑制Treg細胞功能,從而增強紫外線照射導致的狼瘡模型小鼠T淋巴細胞的活化[14]。在SLE患者皮膚組織中,由凋亡細胞釋放的DNA和RNA顆粒可誘導漿細胞樣樹突狀細胞產生Ⅰ型干擾素[15-16]。這些研究證據表明,Ⅰ型干擾素信號通路通過調控及募集免疫細胞至病變組織中促進SCLE發生、發展。
本研究進一步通過CIBERSORT探討了SCLE病變組織中免疫細胞浸潤情況。結果顯示,與NC組相比,SCLE組CD4+活化記憶T淋巴細胞比例明顯升高,而調節性T淋巴細胞(Treg)數目明顯降低。近年來Treg作為維持自身免疫耐受的主要免疫細胞類型受到廣泛關注。而一旦免疫反應和耐受性的平衡被打破,則會發生包括紅斑狼瘡在內的免疫紊亂[16-17]。研究表明,SCLE皮膚組織中Treg數目明顯減少,表明皮膚免疫耐受強度減弱,免疫反應相應增強,CD4+活化記憶T淋巴細胞比例明顯升高。有研究表明,在SCLE病變中,趨化因子CXCL9、CXCL10、CXCL11水平與表皮及真皮中CXCR3+CD3+T淋巴細胞分布呈正相關[18]。另一項研究表明,Ⅰ型干擾素誘導的CXCL10及IP10通過募集CXCR3+T淋巴細胞參與CLE皮膚病變的發生、發展[19]。以上證據提示,SCLE病變組織中免疫耐受被破壞,并且顯著升高的Ⅰ型干擾素可通過募集大量活化的T淋巴細胞參與SCLE皮膚病變進展。
本研究還探討了DEGs與疾病譜之間的關系,從側面進一步證明了Ⅰ型干擾素信號通路在SCLE病變發生、發展過程中的重要作用。但狼瘡患者α干擾素(IFN-α)水平較高目前原因尚不明確。外源性和內源性誘導劑在SLE患者Ⅰ型干擾素誘導方面可能都發揮了重要作用,對于外源性誘導物,病毒和細菌病原體可能是罪魁禍首,但研究人員目前仍未確定能夠導致SLE高Ⅰ型干擾素的特定病原體。盡管如此,IFN-α或β干擾素(IFN-β)的產生可能是多種病原體感染或其他外源性Ⅰ型干擾素刺激物誘導或加劇易感個體的全身性自身免疫的常見途徑,如感染或紫外線照射后SLE中常見的情況[18]。NLR信號通路是先天免疫系統的重要組成部分,其屬于細胞內模式識別受體,可通過與細胞內病原微生物產物識別后激活核因子-κB(NF-κB)通路,促發炎癥反應及免疫反應。其中Nod樣受體蛋白3(NLRP3)是NLR亞家族的重要成員。既往研究發現,NLRP3炎癥小體在狼瘡腎炎組織中明顯活化,并參與狼瘡腎炎的進展[19-20],提示靶向NLRP3炎癥小體通路可能成為狼瘡治療的新靶點。
本研究通過基于degree算法的核心基因篩選出CXCL10、DDX58和RSAD2。CXCL10由Ⅰ型干擾素刺激的內皮細胞分泌,其通過與CXCR3受體結合募集炎癥細胞促進炎癥、感染和自身免疫性疾病發生、發展[20-22]。研究報道,在多種自身免疫性疾病中CXCL10水平明顯升高,如類風濕性關節炎(RA)、SLE、系統性硬化癥和冷球蛋白血癥等[23]。在SLE患者中,CXCL10水平與SLE疾病活動度指數(SLEDAI)和腎臟病變活動情況呈正相關[24]。DDX58也稱為RIG-Ⅰ,屬于RIG-Ⅰ樣受體家族,是一種具有925個殘基的細胞質病毒RNA受體[25]。DDX58在樹突細胞、上皮細胞、巨噬細胞等多種細胞表達,并在病毒感染過程中表達增加,被認為是與甲流病毒識別相關的RLR家族中最重要的成員[26]。RSAD2是干擾素誘導基因,參與針對病毒的先天性免疫反應[27-28],可激活免疫反應并與多種自身免疫性疾病有關,如RA和SLE[28-29]。以上證據提示CXCL10、DDX58和RSAD2可能是潛在的預測和治療SCLE的生物標志物。但是CXCL10、DDX58和RSAD2參與SCLE發病的機制目前尚不完全清楚,仍然需要深入、系統的基礎研究進一步探明。
綜上所述,本研究分析了GSE81071和GSE109248數據集NC和SCLE皮膚活檢標本的基因表達譜,篩選出34個DEGs,并進行了GO分析和KEGG通路富集分析,發現SCLE中Ⅰ型干擾素通路顯著活化。利用CIBERSORT進行免疫細胞浸潤分析,發現SCLE中CD4+活化記憶T淋巴細胞比例明顯升高,而Treg比例明顯下降。采用STRING構建PPI網絡,利用Cytoscape中的CytoHubba篩選出CXCL10、DDX58和RSAD2 3個核心基因。本研究為SCLE發病機制的探索提供了理論基礎,并為SCLE的早期診斷和靶向藥物研發提供了新的思路。