李興燃 趙 惠 仲濟(jì)法 孫 波
1 黑龍江中醫(yī)藥大學(xué) 黑龍江哈爾濱 150040 2 黑龍江中醫(yī)藥大學(xué)附屬第二醫(yī)院 黑龍江哈爾濱 150001
1980年世界衛(wèi)生組織(WHO)首次發(fā)布了43 種針灸適應(yīng)癥[1],在1996年WHO 在意大利米蘭會(huì)議上將針灸適應(yīng)癥擴(kuò)增為64種[2],國(guó)際上對(duì)于針灸治療疾病的認(rèn)可范圍有較大局限。針灸的適應(yīng)癥范圍仍有空間進(jìn)行探索。近年來(lái)國(guó)外涌現(xiàn)出大量基因蛋白數(shù)據(jù)庫(kù),為數(shù)據(jù)挖掘提供了大量研究材料。本文應(yīng)用數(shù)據(jù)挖掘方法,研究與針灸機(jī)制密切關(guān)聯(lián)的神經(jīng)遞質(zhì)五羥色胺(5-hydroxytry-pt,5-HT)[3],探究針灸潛在優(yōu)勢(shì)病種。
1.1.1 研究數(shù)據(jù)庫(kù)及軟件
UniProt 蛋白數(shù)據(jù)庫(kù);String 蛋白互作數(shù)據(jù)庫(kù);MalaCards人類疾病數(shù)據(jù)庫(kù);作圖與統(tǒng)計(jì)軟件Gephi 復(fù)雜網(wǎng)絡(luò)分析軟件版本為0.9.2。
1.1.2 數(shù)據(jù)庫(kù)及軟件簡(jiǎn)介
Uniprot 是一個(gè)已創(chuàng)建多年的數(shù)據(jù)庫(kù)集,研究者能夠從中檢索大量的蛋白質(zhì)序列和功能信息[4]。
String 數(shù)據(jù)庫(kù)旨在收集、評(píng)分和整合所有公開的蛋白質(zhì)相互作用信息來(lái)源,并以計(jì)算預(yù)測(cè)補(bǔ)充這些信息。它的目標(biāo)是實(shí)現(xiàn)一個(gè)全面和客觀網(wǎng)絡(luò),包括直接(物理)和間接(功能)的交互[5]。
MalaCards 是人類疾病及其注釋的綜合數(shù)據(jù)庫(kù)。MalaCards解決了許多源于疾病數(shù)據(jù)的復(fù)雜性和信息源的多樣性的問(wèn)題。這些是通過(guò)采用GeneCards 數(shù)據(jù)庫(kù)建模的復(fù)雜數(shù)據(jù)挖掘策略來(lái)實(shí)現(xiàn)的[6]。
Gephi 復(fù)雜網(wǎng)絡(luò)分析軟件0.9.2 是一款開源免費(fèi)跨平臺(tái)基于JVM 的復(fù)雜網(wǎng)絡(luò)分析軟件,其主要用于各種網(wǎng)絡(luò)和復(fù)雜系統(tǒng),動(dòng)態(tài)和分層圖的交互可視化與探測(cè)開源工具。
1.2.1 針刺5-HT 系統(tǒng)關(guān)系蛋白互作網(wǎng)絡(luò)的構(gòu)建
1)數(shù)據(jù)來(lái)源:應(yīng)用UniProt 蛋白數(shù)據(jù)庫(kù)檢索,選項(xiàng)為UniProtKB,檢索詞為5-HT,選擇物種智人篩選得到5-HT 受體。將檢索到的受體于String 蛋白互作數(shù)據(jù)庫(kù)中檢索,檢索選項(xiàng)為Multiple Proteins by Names,選擇物種智人,設(shè)置檢索相關(guān)蛋白數(shù)量settings:max number of interactors to show“1st shell no more than 50 interacftors;2st shell none”。于Predicted Functional Partners 選取得分0.9500 以上的蛋白,下載檢索到的相關(guān)蛋白數(shù)據(jù),將得到的蛋白互作數(shù)據(jù)于Gephi 軟件內(nèi)分析。
2)數(shù)據(jù)處理:將String 檢索得到的5-HT 相關(guān)蛋白網(wǎng)絡(luò)數(shù)據(jù)導(dǎo)入Gephi 軟件,Excel 常規(guī)選項(xiàng)數(shù)據(jù)類型“邊表格”,輸入設(shè)置:時(shí)間設(shè)置“Intervals”,圖的類型無(wú)向型。形成針刺5-HT 系統(tǒng)相關(guān)蛋白互作的網(wǎng)絡(luò)拓?fù)鋱D。將此圖進(jìn)行進(jìn)一步設(shè)置,于布局中使用“Fruchterman Reingold”算法。該算法為數(shù)據(jù)可視化網(wǎng)絡(luò)拓?fù)鋱D的基本節(jié)點(diǎn)布局算法,可根據(jù)節(jié)點(diǎn)與節(jié)點(diǎn)間的連接,自動(dòng)將連接緊密的節(jié)點(diǎn)向圖形中心集中,連接稀疏的節(jié)點(diǎn)向圖形周圍離散。外觀設(shè)置:顯示節(jié)點(diǎn)標(biāo)簽,節(jié)點(diǎn)顏色統(tǒng)一黑色,節(jié)點(diǎn)大小“度”最小尺寸10、最大尺寸40,節(jié)點(diǎn)標(biāo)簽字體Arial 8 加粗;預(yù)覽設(shè)置:節(jié)點(diǎn)邊框?qū)挾?.0,縮短標(biāo)簽、比例大小,輸出圖片png 格式保存。
1.2.2 基于針刺5-HT 系統(tǒng)的針刺潛在治療病癥預(yù)測(cè)網(wǎng)絡(luò)系統(tǒng)的構(gòu)建
1)數(shù)據(jù)來(lái)源:計(jì)算機(jī)檢索MalaCards 人類疾病數(shù)據(jù)庫(kù),檢索詞為String 蛋白互作系統(tǒng)檢索到的得分0.9500 以上的蛋白,得到蛋白所影響的疾病,下載得到Excel 數(shù)據(jù)。
2)數(shù)據(jù)處理:將Excel 數(shù)據(jù)導(dǎo)入Gephi 軟件作圖分析,源節(jié)點(diǎn)為5-HT 相關(guān)蛋白,目標(biāo)節(jié)點(diǎn)為MelaCards 檢索到的疾病。布局使用”Fruchterman Reingold”;外觀:節(jié)點(diǎn)顏色黑色;預(yù)覽設(shè)置:節(jié)點(diǎn)大小0.1,邊厚度0.0。得到基于針刺5-HT 系統(tǒng)的針刺潛在治療病癥預(yù)測(cè)的網(wǎng)絡(luò)拓?fù)鋱D。統(tǒng)計(jì)方法:本研究選擇平均度為參數(shù)運(yùn)行算法來(lái)篩選網(wǎng)絡(luò)中的重要節(jié)點(diǎn),然后將數(shù)據(jù)輸出Excel,CSV 格式表格,進(jìn)行進(jìn)一步分析。
檢索到5-HT 相關(guān)受體17 種,受體相關(guān)蛋白33 種,5-HT 相關(guān)蛋白共40 種。
利用Malacards 數(shù)據(jù)庫(kù)檢索疾病共3420 種,去重并剔除6度及以下疾病,得到85 種疾病。將85 種疾病于pubmed 中檢索。
得到的85 種疾病有75 種在pubmed 中有報(bào)道。其中便秘、腹瀉、偏頭痛、哮喘與WHO 發(fā)布的適應(yīng)癥重合[1]。57 種為神經(jīng)精神類疾病,可能與5-HT 受體主要分布部位相關(guān)。沒(méi)有報(bào)道的疾病有:精神障礙、特殊性發(fā)育障礙、疼痛失認(rèn)癥、失認(rèn)癥、瘦素缺乏或功能障礙、視覺(jué)性癲癇、成人共濟(jì)失調(diào)和多發(fā)性神經(jīng)病、良性家族性血尿、性心理障礙可以作為針灸適應(yīng)癥的擴(kuò)展指出方向。
本研究仍有很多不足。針灸治療存在許多活性成分,本次研究只研究了其中一種成分,有很大局限性;同時(shí)5-HT 主要參與心血管活動(dòng)、睡眠-覺(jué)醒周期、痛覺(jué)、精神情感活動(dòng)和下丘腦-垂體的神經(jīng)內(nèi)分泌活動(dòng)的調(diào)節(jié),故預(yù)測(cè)疾病的結(jié)果大部分為神經(jīng)精神類疾病;本次研究蛋白為分?jǐn)?shù)0.9500 以上疾病,且剔除出6 度及以下疾病,可將余下疾病作為將來(lái)進(jìn)一步研究方向。