摘 要 Alzheimers disease是生活中最為常見的老年癡呆癥狀,尤其是近些年來,患者人數在不斷的攀升,給社會造成了巨大的負擔,然而目前的醫學研究人員并不清楚其發病機制。本文所使用的數據來自于NCBIgene數據庫、北京大學生物醫學信息學院開發的TransmiR(http://cmbi.bjmu.edu.cn/transmir)數據庫等數據平臺。本文采用文本挖掘的方法首先從相關已知數據庫中搜集了與病癥有關的異常表達數據和相關表達數據,并進行了數據整理,通過試驗證實構建調控網絡,最后構建了阿爾默海茨病的異常表達網絡以及相關表達網絡。
【關鍵詞】阿爾默海茨病 文本挖掘 老年癡呆 miRNA 轉錄因子
阿爾茨海默病(AD)是一種起病隱匿的進行性發展的神經系統退行性疾病。臨床上以記憶障礙、失語、失用、失認、視空間技能損害、執行功能障礙以及人格和行為改變等全面性癡呆表現為特征,病因迄今未明。65歲以前發病者,稱早老性癡呆;65歲以后發病者稱老年性癡呆。如今,阿爾茨海默病已經成為一個世界性的公共衛生問題,由于人口老齡化情況嚴重,使得阿爾茨海默病的發病率和患者人數成倍增加。據當前數據統計,世界范圍內阿爾茨海默病患者大概有三千多萬,預計到2050年,阿爾茨海默病患者是現在人數的三倍還要多。這些都給我國社會的發展帶來了沉重的負擔。因此,如何有效的對其預防和治療,成為我國面臨重要的健康問題。由于近年來,科學技術的快速發展,使得網絡大數據在醫學上也得到了廣泛的應用,因此本文就利用計算方法構建阿爾茨海默病差異表達網絡以及相關表達網絡,并從中挖掘隱藏的miRNA與阿爾茨海默病的關聯信息。
1 數據搜集
文中的基因數據來自DisGeNET (v4.0) ,MalaCards,Phenopeda和PubMed (http://www.ncbi.nlm.nih.gov/pubmed) 數據庫。miRNA數據來自HMDD (v2.0) ,miR2Disease,PhenomiR和PubMed數據庫。轉錄因子-miRNA數據來自TransmiR(version 1.2)數據庫。轉錄因子-基因數據來自TRANSFAC (v 11.4)和ORegAnno數據庫。miRNA宿主基因來自National Center for Biotechnology Information (NCBI) (http://www.ncbi.nlm.nih.gov/gene/)數據庫。miRNA-基因數據來自Tarbase(v 7.0) ,miRTarBase (v 6)和miRecords (v 4)數據庫。
2 網絡的構建
試驗調控網絡的數據包括以下幾種:轉錄因子miRNA(TFs→miRNAs),轉錄因子基因(TFs→genes),miRNA基因(miRNAs→genes),miRNA(miRNA)以及宿主基因(host gene)。本文就是通過這些試驗數據來構造的轉錄因子和miRNA的聯合調控網絡,這個網絡稱為試驗認證調控網絡。
文章在轉錄因子、miRNA和基因的關聯數據以及試驗認證調控網絡基礎上構造了阿爾茨海默病的相關網絡。首先將節點映射到認證網絡中,其次提取出相關聯的認證數據來構造一個相關調控網絡,最后結合網絡和其他沒有出現在上述網絡中的轉錄因子、基因和miRNA一起構成一個網絡。
繼續使用相似的方法構造了阿爾茨海默病的異常表達網絡。把異常數據(阿爾茨海默病的轉錄因子、miRNA和基因)映射到認證網絡中,從而提取出試驗數據來構建異常表達的網絡,最后也是結合網絡以及其他沒有出現在此網絡中的轉錄因子、miRNA和基因再構成網絡。本文中使用cytoscape軟件把網絡可視化。
3 相關表達網絡的構建
如圖1所示為阿爾茨海默病的相關表達網絡。其中包括了異常調節和非異常調節元素,顯然,相關表達網絡包括了異常網絡。試驗結果顯示14個宿主基因沒有差異表達,它們有可能參與了阿爾茨海默病的相關過程。異常網絡在一定程度上揭示了阿爾茨海默病的發病機制。相關網絡不僅可以在一定程度上顯示出阿爾茨海默病出現的調控機制,還可以說明該病癥的預防和治療策略。
圖1為阿爾茨海默病相關表達網絡。紅色節點代表差異表達的轉錄因子、miRNA和靶基因;藍色節點代表非差異表達以相關的轉錄因子、miRNA和靶基因;白色代表miRNA的宿主基因;圓型代表靶基因;三角形代表轉錄因子;園矩形代表宿主基因;菱形代表miRNA。
本文手動從阿爾茨海默病的相關網絡中提取關鍵網絡基序。其中由阿爾茨海默病的相關表達網絡中的宿主基因、miRNA和靶基因組成的共有10種關鍵網絡基序。其中包括反饋環基序,此基序是癌癥關鍵調控基序。異常表達網絡中包含了45個3節點關鍵網絡基序,15個4節點基序以及26個反饋環基序。而相關表達網絡中包含75個3節點關鍵網絡基序,75個4節點基序,31個反饋環基序。
4 調控網絡的構建
最后獲得了38個預測轉錄因子。其中轉錄因子E2F1,NFKB1 和E2F4是異常表達基因,TCF3 和非異常表達基因有關。圖二顯示出4種轉錄因子在阿爾茨海默病的相關網絡中的調控關系。E2F1 在57個靶基因之間調節,其中13個基因是異常表達的,其他的都是非異常表達。E2F1 在10個miRNA之間調節,其中9個miRNA為異常表達,1個miRNA非異常表達。與此同時,5個轉錄因子調節E2F1 ,6個miRNA也指向了E2F1 。E2F1 的靶基因和這些miRNA構成了38個反饋環和6個前饋環。E2F4在79個靶基因之間調節,其中21個基因是差異表達,其他的基因都是非差異表達,與此同時SMARCA4 調節了E2F4。NFKB1調節了8個miRNA,它們都是差異表達,5個轉錄因子(E2F1, E2F4, GATA2,RBL2 and SMARCA4)調節NFKB1,9個miRNA調節NFKB1,NFKB1的靶基因和6個miRNA構成了6個反饋環。TCF3調節3個靶基因(GLI1, VPREB1 and NR0B2),它們都是非差異表達,4個轉錄因子(E2F1, E2F4, RBL2 and SMARCA4)調節TCF3,2個miRNA(miR-145 and miR-17)調節TCF3。endprint
圖2為阿爾茨海默病調控網絡中E2F1,NFKB1, E2F4 and TCF3的調節關系圖。紅色節點代表差異表達的轉錄因子、miRNA和靶基因,藍色節點代表非差異表達以及相關的轉錄因子、miRNA和靶基因,圓形代表靶基因,三角形代表轉錄因子,菱形代表miRNA。
5 結論
醫學工作者通過多次的重復實驗,發現一些與阿爾茨默病有關的基因和miRNA,根據大量的研究發現,阿爾茨默病的發生不是由單一的或者幾個基因和miRNA造成的。我們可以知道,基因和miRNA可以相互調控,建立調控網絡,可以將它們之間的控制關系清晰的展現出來。轉錄因子,miRNA還有宿主基因都在疾病中占據重要的作用它們可以共同合作調控基因表達。
參考文獻
[1]Xiao F1,Zuo Z,Cai G,et al. miRecords: an integrated resource for microRNA-target interactions [J]. Nucleic Acids Res,2009,37(Database issue):D105-D110.
[2]Havelange V,Stauffer N,Heaphy CC, et al.Functional implications of microRNAs in acute myeloid leukemia by integrating microRNA and messenger RNA expression profiling [J].Cancer,2011,117(20):4696-4706.
[3]劉靜,抑癌基因p14ARF對慢性粒細胞白血病細胞增殖、細胞周期及凋亡的影響機制研究[J].中國醫藥導報,2012,9(35).
[4]蘇乃芳,轉錄因子和microRNA組成的基因調控網絡的生物信息學分析[D].北京:北京大學數學科學學院,2013.
[5]Dohi O1,Yasui K,Gen Y,et al. Epigenetic silencing of miR-335 and its host gene MEST in hepatocellular carcinoma [J].Int J Oncol,2013,42(02):411-418.
[6]Shannon P,Markiel A,Ozier O,Baliga NS,Wang JT,Ramage D,Amin N, Schwikowski B,IdekerT.Cytoscape:a software environment for integrated models of biomolecular interaction networks.Genome Research 2003 Nov;13(11):2498-504.
作者簡介
邢翀(1980-),女,吉林省長春市人。吉林大學計算機科學與技術學院博士畢業,副教授。研究方向為智能計算。
作者單位
長春金融高等專科學校信息技術學院 吉林省長春市 130028endprint