尹志芳,李玉茹,楊宗梅,劉紅,郝春霞
(天津市北辰醫院,天津300400)
妊娠期糖尿病(GDM)是產科常見并發癥之一[1]。流行病學研究顯示,我國GDM發病率約為2.5%;且隨著妊娠年齡的增高,其發病率明顯升高[2,3]。GDM孕婦妊娠相關并發癥的發生風險及其胎兒死亡風險顯著增加。因此,預防和降低GDM的發生對提高我國出生人口質量,降低孕產婦并發癥和死亡風險有重要意義[4]。然而,GDM發生的確切分子機制目前仍不完全清楚,其危險因素包括肥胖、高齡妊娠、糖尿病家族史等[5~8]。近年隨著分子生物學技術的不斷發展,從分子水平探討GDM的發病機制并對高危人群進行篩查和干預,成為降低GDM發生率的關鍵。2019年2~6月,本研究采用生物信息學篩選GDM患者差異表達基因,探討差異表達基因的生物學功能、在GDM發生中的信號通路及可能機制。
1.1 數據庫選擇 選取Gene Expression Omnibus(GEO)數據庫、蛋白-蛋白相互作用(PPI)數據庫STRING,生物信息學注釋數據庫(DAVID,https://david.ncifcrf.gov/)進行研究。
1.2 差異表達基因篩選 在GEO數據庫中篩選GDM相關表達譜芯片數據集,檢索時間為自建庫至2019年6月,檢索條件為“Gestational diabetes mellitus”,物種選擇“human”。應用GEO數據在線分析功能比較GDM組(確診為GDM的單胎孕產婦)與對照組(無GDM的的單胎孕產婦)基因表達,并下載原始數據,篩查差異表達基因,篩選條件為P<0.05且|Log10FC|>1.5并繪制火山圖分析差異基因分布。同時對多個基因表達芯片數據集進行分析,選取共差異表達的基因作為重點研究對象并繪制Venn圖。
1.3 基因功能與信號通路分析 采用基因本體論(GO)、京都基因與基因組百科全書(KEEG進行)分析。將篩選出的差異表達基因上傳DAVID數據庫,進行GO與KEEG功能富集。GO包含生物學過程、細胞成分、分子功能三個層次,主要對差異表達基因進行定位,對分子生物學功能及可能的生物學過程進行分析。KEEG主要針對差異表達基因的信號通路進行功能富集,同時繪制基因本體輪的氣泡圖。
1.4 PPI分析 將篩選出的差異表達基因上傳蛋白-蛋白相互作用數據庫(STRING),進行PPI分析,探討差異表達基因之間的相互作用,PPI網絡構建條件:數據來源于實驗數據、共表達數據和融合基因,蛋白間相互作用系數>0.4。
1.5 關鍵基因篩選 應用基因分析軟件cyotscape 中的cytohubba插件對差異表達基因蛋白相互作用網絡中的關鍵基因進行篩選,選擇前5個關鍵基因。
1.6 統計學方法 采用SPSS19.0統計軟件差異表達基因篩選,采用GEO在線分析工具(GEO2R)進行分析。P<0.05為差異有統計學意義。
2.1 差異表達基因篩選 選取2個GDM相關基因表達數據集GSE51546(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi acc=GSE51546)、GSE87295(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi)。在2個數據集中,篩選了7個共差異表達基因,分別為CD34、TACSTD2、LDB2、CLDN5、NTN4、COLEC12、IGFBP6。
2.2 基因功能 7個共差異表達基因分子功能主要為細胞外蛋白結合、層黏連蛋白結合、胰島素生長因子受體結合等;生物學過程主要富集于細胞遷移、胰島素生長因子受體信號通路和細胞黏附等。上述基因編碼蛋白主要定位于層黏連蛋白復合體、細胞外基質和基質膜等。
2.3 信號通路 上述基因主要信號通路富集于PI3K-AKT信號通路、糖代謝信號通路、神經系胰島素抵抗相關信號通路等,見表1。

表1 GDM患者共差異表達基因的相關信號通路
2.4 PPI相互作用網絡 PPI相互作用網絡共有47個蛋白node,209個相互作用聯系,平均每個蛋白相互作用關系為8.89,區域聚類指數為0.729,蛋白相互作用富集差異有統計學意義(P<0.05)。
2.5 關鍵基因篩選 根據GDM共差異表達基因的PPI相互作用網絡圖采用cytohubba進行網絡關鍵基因篩選,結果INS、IGF1、IGF2、IGFBP3、IGF1R為PPI網絡中的關鍵基因。
2.6 層次聚類 對篩選出的7個共差異表達基因進行層次聚類分析顯示,7個基因在GDM組與對照組中呈現明顯的聚類。
GDM是臨床較為常見的一類妊娠相關并發癥,其確切發病機制目前仍不十分清楚。但隨著分子生物學機制的深入研究發現,GDM可能是多基因參與的代謝性疾病。因此,篩選并分析GDM差異表達基因、相關生物學功能及信號通路,對于GDM高危人群的鑒別、GDM預防及治療具有重要意義。
本研究采用生物信息學分析方法探討了GDM差異表達基因、其生物學功能及其在GDM發生中的信號通路、可能機制。在2個GDM相關基因表達數據集GSE51546和GSE87295中篩選出共差異表達基因7個,分別為CD34、TACSTD2、LDB2、CLDN5、NTN4、COLEC12及IGFBP6。這7個共差異表達基因可能與GDM的發生有關。進一步功能分析顯示,7個共差異表達基因主要的分子功能為胰島素生長因子調節劑,而相關信號通路主要富集于PI3K-AKT信號通路、糖代謝信號通路、神經系胰島素抵抗相關信號通路等。相關分子功能及信號通路均與糖代謝和胰島素代謝有關,說明上述7個共差異表達基因可能通過糖和胰島素代謝通路影響GDM的發生。同時,對7個共差異表達基因編碼蛋白構建了PPI網絡,INS、IGF1、IGF2、IGFBP3、IGF1R基因為PPI網絡中的關鍵基因,可能在GDM發病機制中發揮重要作用。INS基因為胰島素基因,在GDM患者中存在差異表達,可能是引起GDM患者血糖升高的重要原因。IGF、IGFBP3和IGF1R分別為胰島素生長因子、胰島素生長因子結合蛋白及胰島素生長因子受體。上述基因編碼蛋白均與體內胰島素水平有關,其差異表達導致體內胰島素-血糖代謝異常,從而引發GDM。
GDM患病率逐年增加,可引起巨大兒、胎兒窘迫、胎兒畸形、死胎[9~11],還可使剖宮產率增加等[12]。治療的關鍵是控制孕婦血糖水平,病情較重或血糖控制不良的孕婦,母嬰的近遠期并發癥發生率較高[13,14]。因此,篩選GDM發病關鍵基因,并對其發生的分子機制進行研究,從而篩選GDM高危人群,并進行有效干預,是降低GDM發病率和相關并發癥的重要方法。
綜上所述,本研究篩選出7個GDM發病相關基因,并鑒定出5個GDM發生網絡中的關鍵基因。上述基因在GDM發生發展中可能發揮重要作用,并可能作為GDM發生的分子標志物,為GDM靶向藥物的開發提供潛在靶點。