丁煒光,張瑤,李靜波,丁敏
(1天津市南開區三潭醫院,天津300193;2天津醫科大學代謝病醫院)
糖尿病是臨床上最常見的代謝系統疾病[1],其發病率逐年升高,占用了大量醫療資源和經費[2]。糖尿病腎病(DN)是糖尿病晚期重要的微循環并發癥,也是臨床上終末期腎病的主要原因之一[3]。晚期DN患者出現大量蛋白尿、腎功能衰竭,是糖尿病患者死亡的重要原因。DN的確切發病分子機制并未明確,目前認為DN是涉及多基因、多步驟的異常代謝過程。近年來隨著表達譜芯片及二代測序技術的不斷發展,海量DN相關數據被上傳至多個基因表達數據庫,為從分子層面研究DN提供了基礎[4,5]。對相關基因表達譜芯片中的數據深入分析,探索DN相關基因的信號通路,有助于篩選DN高危人群。本研究采用生物信息技術,分析基因公共表達數據庫(GEO)中關于DN的芯片數據,篩選差異表達基因及其可能的功能和信號通路,以期為DN的早期診斷及靶向藥物研發提供生物信息學基礎。
1.1 數據庫及分析軟件 基因表達譜公共數據庫GEO(https://www.ncbi.nlm.nih.gov/geo/)用于篩選DN差異表達基因。本研究中涉及的基因芯片平臺為GPL8300,芯片數據集為GSE1009詳見網址https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi acc=GSE1009[6]。生物學信息注釋數據庫DAVID(https://david.ncifcrf.gov/)用于對差異表達基因進行生物功能信息注釋。蛋白-蛋白相互作用數據庫STRING(http://string-db.org/cgi/input.pl)用于構建差異表達基因編碼蛋白的相互作用網絡。
1.2 差異表達基因篩選 在GEO中篩選并下載DN相關基因芯片數據,數據搜索條件為“diabetic nephropathy”,物種選擇“human”。利用GEO數據庫提供的在線分析方法篩選出DN患者腎組織與正常人群腎組織中差異表達最為明顯的基因。篩選條件為差異表達上調或下調2倍以上(logFC>2或<-2)、P<0.01。
1.3 差異表達基因功能及信號通路分析 對篩選出的差異表達基因的靶基因進行基因本體論(GO)和京都基因與基因組百科全書(KEEG)分析,預測其可能功能及信號通路。
1.4 差異表達基因編碼蛋白的相互作用分析 用STRING數據庫分析差異表達基因編碼蛋白間的相互作用關系。分析差異表達基因編碼蛋白與其他常見DN致病基因編碼蛋白之間的相互作用關系。篩選條件為蛋白與蛋白相互作用關系置信指數>0.4。

2.1 差異表達基因篩選結果 篩選出9個差異表達最為顯著的基因,分別為PLCE1、CLIC5、PTPRO、熱休克蛋白A12A(HSPA12A)、AIF1、GMDS、SEMA5A、CEP152、FOXC1。除CEP152表達下調外,余8個基因在DN組表達上調。見表1。

表1 GEO數據庫篩選DN差異表達的基因
2.2 差異表達基因功能與相關通路 層次聚類分析顯示,DN組與對照組呈現出明顯的聚類表達,其中有191個基因呈現明顯的差異表達。GO分析顯示,上述差異表達基因的蛋白產物主要位于細胞膜、細胞器等細胞組成成分,主要的分子功能涉及蛋白結合、對細胞刺激反應和細胞信號轉導,主要調控細胞代謝等生物學過程。KEGG通路分析顯示,差異表達基因主要參與細胞代謝途徑、甲狀腺激素信號通路、Rap1信號通路、磷脂酰肌醇信號系統及肌醇磷酸代謝等。見表2、3。

表2 DN差異表達基因的GO分析結果

表3 KEEG基信號通路分析
2.3 差異表達基因編碼蛋白的相互作用網絡分析結果 在STRING數據庫中分析9個差異表達基因編碼蛋白間的相互作用關系,蛋白網絡分析提示HSPA12A、GMDS、CEP152基因編碼蛋白與其他蛋白作用關聯最緊密(節點度≥5)。
DN是臨床上較常見的一類糖尿病微血管并發癥,其病理改變主要為腎小球肥大,腎小管、腎小球基底膜厚度增加,細胞外基質積聚[7~9];病情進展逐漸出現蛋白尿、血肌酐和尿素氮增高,最終發展為尿毒癥、腎功能衰竭[10]。近年來我國2型糖尿病發病率逐漸增高,DN的患病人數也相應增加[11]。
DN的發病機制復雜,目前仍未完全清楚,現有研究認為DN的發生主要與遺傳背景、腎臟血流動力學異常、血糖升高造成的代謝功能紊亂有關[10~14]。DN相關流行病學研究認為,糖尿病患者一級親屬罹患糖尿病的概率明顯高于非糖尿病人群,且有糖尿病家族史的人群罹患DN的風險也明顯高于無家族史的糖尿病患者。同時,移居非洲的高加索人種DN的發病率高于當地居民,而與移居前所在地的人種發病率相當。上述研究均提示DN的發病存在遺傳因素。
近年來,隨著基因芯片及二代次序技術的不斷進展,積累了大量關于DN的數據,為在分子水平上研究DN的發病、危險因素及靶向治療提供了基礎[9,16,17]。本研究中,筆者借助GEO數據庫篩選了9個在DN患者腎組織與正常人群腎組織中差異表達的基因,進行了功能富集、信號通路和共表達網絡分析。共篩選出9個差異表達最為顯著的基因,分別為PLCE1、CLIC5、PTPRO、HSPA12A、AIF1、GMDS、SEMA5A、CEP152、FOXC1。除CEP152表達下調外,余8個基因在DN組表達上調。這些差異表達的基因蛋白產物主要位于細胞膜、細胞器等細胞組成成分,主要的分子功能涉及蛋白結合、對細胞刺激反應和細胞信號轉導,主要調控細胞代謝等生物學過程。蛋白網絡分析提示HSPA12A、GMDS、CEP152基因編碼蛋白與其他蛋白作用關聯最緊密,提示它們在DN的發病機制中可能發揮重要作用。
HSPA12A、HSPA12B都屬于HSP70超家族。不同于與該家族其他成員,HSPA12B有自己特異的結構和功能。HSPA12B主要表達于血管內皮細胞中,隨著內皮細胞功能障礙及凋亡,外周血中HSPA12B可能升高[18]。DN組中HSPA12B表達水平是對照組的4.19倍,表達水平明顯上調。同時,在DN相關差異表達基因編碼蛋白的相互作用網絡中,HSPA12B基因編碼蛋白為關鍵單蛋白,在整個網絡中與其他蛋白相互作用較為緊密,因此HSPA12B在DN的發生發展中可能發揮重要作用。而關于HSPA12A的研究較少,其確切生物學功能并不清楚。本研究發現HSPA12A為DN的關鍵基因,在DN發生發展中可能發揮重要作用,豐富了HSPA12A的生物學功能,下一步也將就此進行深入探索。
甘露糖-4,6-脫水酶(GDP)由GMDS基因編碼。近年來研究顯示,GDP參與體內的糖代謝過程,其表達水平增高大多與血糖水平升高或異常波動有關[19]。長期較高的血糖水平是DN的發病基礎。本研究中GMDS表達水平在DN組中明顯增高,推測抑制GMDS表達有望成為DN治療的新方向。
目前關于CEP152基因及其編碼蛋白的研究報道較少,且主要為其基因序列報道,具體功能并不清楚[20]。本研究結果顯示CEP152在DN患者中表達水平明顯下調,提示其拷貝數降低或編碼蛋白表達水平下降可能是DN的危險因素。
總之,本研究借助生物信息學方法,篩選出了9個在DN腎組織與正常腎組織中差異表達最顯著的基因,這些基因的主要分子功能涉及蛋白結合、對細胞刺激反應和細胞信號轉導,主要調控細胞代謝等生物學過程。其中,HSPA12、GMDS、CEP152基因編碼蛋白為蛋白-蛋白相互作用網絡的中心節點,提示三者可能是DN相關的關鍵基因,其異常表達可能參與了DN的發病。上述研究結果為DN的早期診斷及靶向藥物研發提供了生物信息學基礎。