李毅勤,姜 瑤,陶華林△,郭永燦
(1.西南醫(yī)科大學附屬醫(yī)院檢驗科,四川瀘州 646000;2.西南醫(yī)科大學附屬中醫(yī)醫(yī)院檢驗科,四川瀘州 646000)
酒精性肝病是全球慢性肝病的主要疾病之一,其主要包括單純性脂肪變性、酒精性脂肪性肝炎(ASH)、進行性肝纖維化(通常始于肝小葉的周圍區(qū)域)、肝硬化和肝癌[1-2]。ASH其病理表現(xiàn)為脂肪變性、肝細胞氣球樣變性和多形核中性粒細胞炎性浸潤共存。雖然,ASH病理改變與非酒精性脂肪性肝炎(NASH)病理改變類似,然而與NASH比較,ASH具有更嚴重的臨床表現(xiàn)和組織學病變[3]。患重度ASH患者1個月病死率可達30%~40%[4]。目前,ASH發(fā)生和發(fā)展的確切分子機制尚不完全清楚。因此,探索ASH的關鍵基因及其分子機制,對發(fā)現(xiàn)更有效的診斷方法及治療靶點非常重要。隨著計算機技術的普及和發(fā)展,高通量平臺在醫(yī)學領域得到廣泛應用,微陣列技術和新一代測序分析作為用于基因表達分析的工具,具有巨大的臨床價值,目前已普遍應用于突變基因檢測、差異基因篩查、腫瘤分型、多態(tài)性檢測等多個方面[5-6]。本研究通過生物信息學方法,從基因芯片公共數(shù)據(jù)庫(GEO)篩選出ASH相關差異表達基因,并對其進行基因本體論(GO)富集分析和 KEGG通路分析,同時分析其蛋白互作網(wǎng)絡結構,以明確差異表達基因的生物學功能,進一步探索與ASH相關的潛在基因和相關分子機制,為ASH的診療提供新的靶標。
1.1材料 本研究應用2個ASH相關基因芯片數(shù)據(jù)GSE28619[7]和GSE103580[8]進行整合分析,均從Gene Expression Omnibus(http://www.ncbi.nlm.nih.gov/geo/)數(shù)據(jù)庫下載[9],其中GSE28619的微陣列數(shù)據(jù)包括15例ASH肝組織標本和7例正常肝組織標本,GSE103580包括13例ASH肝組織標本。
1.2數(shù)據(jù)處理及差異表達基因分析 將原始數(shù)據(jù)轉(zhuǎn)換成表達矩陣,隨后使用perl軟件對2個芯片進行數(shù)據(jù)合并。使用R軟件(版本3.5.3,https:// www.r-project.org/)和Bioconductor軟件包(http:// www.bioconductor.org/)進行合并后對數(shù)據(jù)進行分析,首先使用R軟件中sva包中Combat功能對數(shù)據(jù)進行批次校正。隨后使用R軟件中l(wèi)imma包篩選ASH肝組織和正常肝組織間的差異表達基因。P值及其余參數(shù)計算采用經(jīng)驗性貝葉斯方法。其中|log2FoldChange|>1.2且adjustedP<0.05為差異有統(tǒng)計學意義。
1.3差異表達基因的功能富集分析 在線分析軟件DAVID數(shù)據(jù)庫(david.abcc.ncifcrf.gov/knowledgebase)是為研究人員提供的一套全面的功能注釋工具。本研究使用DAVID工具對差異表達基因進行GO富集分析(包括生物過程、細胞成分和分子功能類別)。應用R軟件中Clusterprofiler包對差異表達基因進行京都基因和基因組百科全書(KEGG)途徑富集分析,以明確其生物學功能及參與的信號調(diào)控網(wǎng)絡。選擇P<0.05為功能富集分析差異有統(tǒng)計學意義。
1.4差異表達基因編碼蛋白的相互作用分析 蛋白質(zhì)相互作用關系數(shù)據(jù)庫(STRING)是最大的蛋白質(zhì)數(shù)據(jù)庫之一,通過STRING分析工具,可以預測蛋白質(zhì)之間的關系并可視化,找出關鍵蛋白質(zhì)。MIRYALA等[10]作為一種生物圖形可視化工具,主要用于生物網(wǎng)絡的研究與設計,如基因表達調(diào)控網(wǎng)絡及蛋白互作網(wǎng)絡等。利用STRING評估差異表達基因之間的相互作用關系,再使用Cytoscape軟件構建蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)網(wǎng)絡圖,利用Cytoscape軟件中插件CytoHubba,綜合12種拓撲分析方法的得分排序篩選出分數(shù)最高的前3個作為核心基因。最后再次使用DAVID數(shù)據(jù)庫對PPI網(wǎng)絡中包含的基因進行GO功能富集分析。
2.1ASH差異表達基因的篩選 對數(shù)據(jù)集GSE28619和GSE103580進行聯(lián)合分析,篩選ASH患者與正常對照組間的差異表達基因,共篩選出28個差異表達基因,見表1。與對照組比較,ASH組中共21個上調(diào)基因,7個下調(diào)基因。

表1 數(shù)據(jù)集GSE28619和GSE103580的28個差異表達基因

續(xù)表1 數(shù)據(jù)集GSE28619和GSE103580的28個差異表達基因
2.2ASH差異表達基因的GO富集分析和KEGG通路分析 利用DAVID軟件對28個差異表達基因進行GO富集分析見表2。GO富集分析結果表明,在生物過程方面,差異表達基因參與了細胞對細胞外刺激的反應及對皮質(zhì)醇的反應。分子功能方面參與Wnt蛋白結合、轉(zhuǎn)錄因子活性、轉(zhuǎn)錄激活因子活性及RNA聚合酶Ⅱ核心啟動子近端區(qū)序列特異性結合等功能。應用R軟件中Clusterprofiler包對差異表達基因進行KEGG通路分析發(fā)現(xiàn),差異表達基因僅富集在唯一一個通路——白細胞介素-17(IL-17)信號通路上。
2.3差異表達基因PPI分析 通過STRING在線數(shù)據(jù)庫評估28個差異表達基因間相互作用關系,再應用Cytoscape構建蛋白互作網(wǎng)絡分析圖,見圖1。利用Cytoscape中插件CytoHubba篩選出核心基因為FOS、CCL20及NR4A2,見圖2。對PPI網(wǎng)絡中的節(jié)點進一步進行GO富集分析發(fā)現(xiàn),差異表達基因的功能最主要富集在信號轉(zhuǎn)導上。

圖1 差異表達基因的PPI網(wǎng)絡

圖2 核心基因的相互作用網(wǎng)絡

表2 差異表達基因的GO富集分析
ASH是一種嚴重的臨床綜合征,主要表現(xiàn)為黃疸、肝大和腹痛[11]。由于對ASH肝臟炎癥的病理生理學仍未完全了解,治療方案受限,患者往往預后較差。因此,了解ASH進展的分子機制對其診斷和治療至關重要。目前,對于ASH大多數(shù)研究都是單個隊列研究,較少有多個隊列研究。而多個隊列研究往往比單一隊列研究具有更低的假陽性率和假陰性率[12],因此,本研究從GEO數(shù)據(jù)庫下載2個芯片數(shù)據(jù)集進行研究,分別為GSE28619和GSE103580,由于GSE 103580未做對照組的基因芯片[8],其對照組數(shù)據(jù)主要參考GSE28619對照組芯片數(shù)據(jù)進行分析。因此,可直接對GSE28619中15個ASH、7個對照組芯片數(shù)據(jù)及GSE103580中13個ASH芯片數(shù)據(jù)進行合并數(shù)據(jù)分析。由于不同芯片數(shù)據(jù)會存在批次效應,故使用R軟件sva包中的Combat功能來消除本研究中的批次效應[13],以此提高差異表達基因鑒定的可信度。對兩組芯片進行聯(lián)合分析,共篩選出28個差異表達基因,包括21個上調(diào)基因和7個下調(diào)基因。為了解差異表達基因的生物學意義,本研究對其進行了GO富集分析和KEGG通路分析。GO富集分析發(fā)現(xiàn),差異表達基因參與了對皮質(zhì)醇反應、Wnt蛋白活性、細胞對細胞外刺激的反應、轉(zhuǎn)錄因子活性、轉(zhuǎn)錄激活因子活性及RNA聚合酶Ⅱ核心啟動子近端區(qū)序列特異性結合等功能。由于R軟件中Clusterprofiler對數(shù)據(jù)的更新速度比DAVID數(shù)據(jù)庫更快,為得到最新的通路分析結果,因此,采用R軟件中的Clusterprofiler進行KEGG通路分析,最后得到一個富集通路,即差異表達基因富集在唯一通路——IL-17信號通路上。
IL-17是一個重要的促炎癥細胞因子,可靶向不同細胞類型以誘導多種促炎介質(zhì),同時也參與自身免疫、慢性炎癥性疾病、纖維化和腫瘤的發(fā)展等過程[14-15],其可以介導炎癥細胞依賴性T細胞受體、粒細胞分化抗原-1及活性氧產(chǎn)生相關氧化酶,從而介導炎癥發(fā)生[16]。目前已發(fā)現(xiàn),IL-17可通過巨噬細胞的極化調(diào)控脂肪性肝病炎癥發(fā)生,加劇并加快肝細胞的損傷,推動脂肪變性到脂肪性肝炎的進展[17]。因此,推測IL-17信號通路可能為促進ASH炎性病變過程中的一條重要通路,靶向調(diào)控IL-17信號通路有望成為ASH治療的新靶點,但尚未找到具體作用于IL-17通路的關鍵基因。隨后對差異表達基因進行PPI分析,找到CCL20、FOS及NR4A2 3個核心基因,與對照組比較,CCL20在ASH中上調(diào),F(xiàn)OS、NR4A2表現(xiàn)為下調(diào)。KEGG通路分析發(fā)現(xiàn),CCL20及FOS均富集在IL-17信號通路上,猜想其可能通過作用于IL-17信號通路介導ASH炎癥的發(fā)生和發(fā)展。
CCL20是趨化因子家族中的重要成員,是肝臟中重要的促炎和促纖維化的趨化因子。CCL20表達水平可隨肝臟組織學(正常<脂肪變性<炎癥<纖維化)變化的嚴重程度而逐漸上升,目前已被證實是病毒性肝炎、酒精性脂肪肝、非酒精性脂肪肝等肝損傷共同途徑中的重要調(diào)控分子[18]。AFFO等[19]研究發(fā)現(xiàn),CCL20是ASH中最上調(diào)的趨化因子,并且在ASH患者的肝臟及血清水平高于NASH、丙型肝炎等其他肝臟疾病,這與本研究結果大致一致,本研究分析得到CCL20在ASH中高度表達。BERINGER等[20]研究發(fā)現(xiàn),IL-17介導的肝臟炎癥主要是通過誘導吸引中性粒細胞的趨化因子,使中性粒細胞發(fā)生局部募集而促進肝臟炎癥發(fā)生,而CCL20就是其中一個被IL-17誘導的趨化因子。AFFO等[21]研究也證實,CCL20可通過促進巨噬細胞和中性粒細胞的肝臟浸潤介導肝損傷后炎癥細胞募集。上述研究均表明,CCL20在肝臟炎癥發(fā)生過程中扮演著重要角色,且與IL-17相關。因此猜想,IL-17信號通路在CCL20介導ASH的形成過程中起重要作用。CCL20通過作用于IL-17信號通路,被誘導激活后促進巨噬細胞、中性粒細胞等炎癥細胞的募集,從而介導ASH炎癥發(fā)生。
目前,對于NR4A2和FOS在肝臟代謝疾病方面的研究較少,缺乏足夠的文獻支持。NR4A2也稱為Nurr1,是孤兒核受體NR4A家族的成員,并且充當轉(zhuǎn)錄因子,主要分布在調(diào)節(jié)分化、增殖和凋亡細胞中,已知其是維持肝葡萄糖穩(wěn)態(tài)及脂質(zhì)代謝的關鍵轉(zhuǎn)錄調(diào)節(jié)因子,其可調(diào)節(jié)肝臟脂質(zhì)平衡及脂肪生成[22],猜想其可能參與ASH形成過程中的脂質(zhì)代謝。FOS蛋白的前體C-FOS基因?qū)儆谠┗騕23]。單獨FOS沒有功能,主要是和Jun家族成員形成異源二聚體組成激活蛋白1轉(zhuǎn)錄因子,從而參與細胞的增殖、分化及凋亡,以及腫瘤中細胞轉(zhuǎn)化、浸潤性生長及遠端轉(zhuǎn)移等過程[24]。目前,對于C-FOS的研究主要集中在腫瘤生長、轉(zhuǎn)移、預后方面及神經(jīng)系統(tǒng)方面對神經(jīng)元的可塑性及陣痛作用[25-26]。對于NR4A2和FOS在ASH形成過程中的具體機制尚不清楚,仍有待更多的體內(nèi)、體外試驗進行驗證。
本研究發(fā)現(xiàn),IL-17這一關鍵信號通路及3個核心基因(CCL20、FOS和NR4A2)可能在ASH的發(fā)生和發(fā)展中起重要作用,其中CCL20可能通過作用在IL-17信號通路,被誘導激活后促進巨噬細胞、中性粒細胞等炎癥細胞的募集,從而介導ASH的炎癥發(fā)生,為進一步了解ASH的分子機制提供了新思路。靶向調(diào)控IL-17信號通路有望成為ASH治療的新型療法,但仍需后期試驗來驗證這種預測結果,充分了解以上基因在ASH作用中的機制。