999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用Weka挖掘白血病與基因的關系

2015-03-22 03:18:14
中華醫學圖書情報雜志 2015年1期
關鍵詞:融合

白血病是造血干細胞功能異常的克隆性惡性疾病,是國內十大高發性惡性腫瘤之一。目前醫學界普遍認為白血病的發病機制與感染、放射、化學和遺傳等因素有關,但其確切病因至今尚未明確。近年來,有關基因與白血病關系的研究較熱,文獻也較多。本文利用Weka平臺挖掘文獻中白血病與基因的潛在關系。

1 研究工具

1.1 聚類挖掘平臺Weka

Weka平臺(Waikato Environment for Knowledge Analysis)的全名是懷卡托智能分析環境,是一個公開的數據挖掘工作平臺。它集合了大量能承擔數據挖掘任務的機器學習算法,包括對數據進行預處理、分類、回歸、聚類、關聯規則以及在新的交互式界面上的可視化,是現今最完備的數據挖掘工具之一。Weka的數據格式要求為ARFF(Attribute-Relation File Format)文件,這是一種ASCII文本文件,也是一種二維表格。Cobweb是Weka提供的聚類算法之一,是現在流行的一種簡單增量概念聚類算法。它用分類屬性-值對描述輸入對象,以一個分類樹的形式創建層次聚類[1]。

1.2 數據處理工具BICOMS

書目信息共現分析系統(Bliographic Item Co-Occurrence Mining System,BICOMS) 是文本挖掘的基礎工具,所生成的矩陣可以進一步應用于聚類分析和社會網絡分析等[2-3]。

2 研究步驟和結果

2.1 利用BICOMS抽取高頻詞、生成矩陣

以“leukemia [majr] AND genes [majr]”為檢索策略,檢索PubMed,得到4 069條文獻記錄,并將結果保存成xml文件。利用BICOMS抽取主要主題詞/副主題,設定出現頻次的閾值為100,即頻次大于100的42個詞為高頻詞。這些高頻詞出現9 662次,累計百分比為39.222%(9 662/24 634)。其中排名前10位的高頻詞見表1,出現頻次最高的為原癌基因(706次)。

表1 排名前10位的高頻詞及其出現頻次

再利用BICOMS生成高頻詞的共現矩陣(表2)和零一矩陣(即詞篇矩陣),以txt形式導出,并利用Excel將零一矩陣轉置(表3),再分別保存成Weka所需的csv格式文件。

表2 高頻詞共現矩陣(42行×42列)(部分)

表3 高頻詞詞篇矩陣轉置矩陣4069(行)×42(列)(部分)

2.2 采用Weka中聚類算法Cobweb實現聚類

打開Weka3.6.8,進入Explorer模塊,通過Preprocess的Open功能導入csv文件,以未監督的過濾器NumberToNomal過濾數據,然后保存成ARFF文件以用于聚類分析。

選擇Weka提供的聚類算法Cobweb,根據研究需要設置不同參數,對比聚類結果,選擇聚類結果最優時的參數設置為Weka.clusters.Cobweb -A 1.0 -C 0.0028209479177387815 -S 42,聚類模型選擇use training set,選擇store clusters for visualization以保存聚類結果用于可視化。運行后得到的聚類樹結果如圖1所示。

圖1 聚類樹結果

2.3 對聚類結果進行優化

Cobweb共進行了7次聚合,5次剪切,形成一棵節點數為12、葉子數(即主題詞數)為42的聚類樹。分析得出各葉子節點,具體數據見表4。

表4 高頻詞的Cobweb聚類結果

注:此結果是經過加工優化的結果

3 分析和討論

3.1 聚類效果分析

本文的目的是試圖找出各類白血病與各個基因之間的關系,因此理想的聚類結果是每類中都有白血病高頻詞和相關基因,且越多越好。從表5可見,第1,2,4,5類中沒有白血病或基因高頻詞,聚類效果較差;其余類既有白血病相關高頻詞,也有基因相關高頻詞,聚類效果較好。

表5 各類聚類效果比較

注:染色體和泛指的基因名詞也算基因;聚類率=(白血病數+基因數)/該類總葉子樹,且越大越好

聚類結果較差的原因有三:一是高頻詞中存在非白血病相關主題詞或基因相關主題詞,二是因Cobweb把所有高頻詞看作要聚類的屬性而不能百分之百地將基因和白血病聚在一起,三是數據存在局限性。本文使用的42個高頻詞中,白血病數與基因數分布不均,白血病數(11)小于基因數(15)。

3.2 基因關系研究分析

根據聚類結果,查閱并分析每類,即聚類效果較好的第3,6,7類文獻,得出白血病與基因關系的研究熱點和方向,總結如下。

第3類聚類結果表明B淋巴細胞白血病和骨髓增生異常綜合癥與免疫球蛋白基因和癌基因融合及表達相關。Yone J等[4]發現,bcl-2基因第五側翼區是免疫球蛋白基因重排的一個端點集中區。與14號染色體長臂第32個基因和18號染色體長臂第21個基因易位影響bcl-2基因第三區域相比,bcl-2基因第五區域不僅能融合重鏈基因,也能融合兩條輕鏈基因位點。他們克隆并測定了11條B淋巴細胞腫瘤中的bcl-2基因第五側翼區與免疫球蛋白的融合鏈,這些腫瘤細胞由長距離聚合酶鏈式反應聚合而來。bcl-2基因第五區域與免疫球蛋白融合基因的異構解剖激活bcl-2基因。特異性癌基因-免疫球蛋白基因重組的形成機制與14號染色體和18號染色體易位不同。

第6類聚類結果表明實驗性白血病、成人T細胞白血病和成紅細胞細胞白血病與病毒基因、abl基因和bcr-abl融合蛋白及其轉錄相關。Kamihire S等[5]將人類T細胞白血病病毒整合成人T細胞白血病細胞基因組DNA,發現Ⅰ型人類T細胞白血病病毒是成人T細胞白血病的病原體,且白血病細胞總是攜帶前病毒基因組,以單克隆的方式與宿主基因組同一序列位點整合,稱為單克隆整合。部分前病毒基因組缺失最先出現在gag區域,然后擴散到pol和env區域,而且長末端重復和pX區域幾乎總是守恒的。前病毒狀態的分析可提供有用的診斷和病毒學—腫瘤學信息,包括成人T細胞白血病和Ⅰ型人類T細胞白血病病毒的病理學,尤其是pX基因在腫瘤形成中重要作用的信息。

第7類結果表明淋巴瘤與人類第11號染色體、原癌基因和ras基因突變及表達相關。自然殺傷細胞腫瘤是一種很罕見的疾病,已經報道的常見異常腫瘤抑制基因有Rb,p53,p15INK4B和p14ARF。Sugimoto KJ等[6]用DNA印記法、聚合酶鏈式反應單核苷酸多態性檢測法、蛋白質印跡法和免疫組織化學著色法分析N-ras,K-ras,H-ras,c-myc,n-myc和mdm2等癌基因的狀態,發現ras基因家族沒有發生點突變,c-myc和N-myc沒有發生突變,c-myc蛋白沒有過度表達,但mdm2蛋白在一部分案例中表達度很高,且mdm2蛋白的過度表達與p14ARF,p53和Rb基因不相關。最后得出結論:mdm2的過度表達可能與自然殺傷細胞腫瘤有關,尤其是有攻擊性的子類。

4 結論

本文利用Weka軟件平臺對PubMed數據庫中的白血病與基因相關數據進行Cobweb聚類挖掘分析,得出白血病在基因方面的3個研究熱點。根據癌癥基因組圖譜研究網(The Cancer Genome Atlas Research Network)發表于國際權威雜志NEJM 2013年5月30日在線版上的成果[7],9種基因與白血病有關。

它們分別是轉錄融合基因、編碼核仁磷蛋白的基因(npm1)、腫瘤抑制基因、DNA甲基化相關基因、信號轉導基因、染色質修飾基因、黏連蛋白復合物基因、隨性轉錄因子基因和剪接體復合物基因。本文得出的白血病研究相關熱點基因均在其列。

猜你喜歡
融合
一次函數“四融合”
兩個壓縮體融合為一個壓縮體的充分必要條件
村企黨建聯建融合共贏
今日農業(2021年19期)2022-01-12 06:16:36
融合菜
寬窄融合便攜箱TPFS500
寬窄融合便攜箱IPFS500
從創新出發,與高考數列相遇、融合
寬窄融合便攜箱IPFS500
《融合》
現代出版(2020年3期)2020-06-20 07:10:34
“四心融合”架起頤養“幸福橋”
福利中國(2015年4期)2015-01-03 08:03:38
主站蜘蛛池模板: 亚洲第一区欧美国产综合| 日本AⅤ精品一区二区三区日| 婷婷亚洲视频| a免费毛片在线播放| 精品伊人久久久香线蕉 | 国产一区二区网站| 玩两个丰满老熟女久久网| 国产另类乱子伦精品免费女| 国产成人综合亚洲网址| 精品无码日韩国产不卡av| 四虎精品黑人视频| 3D动漫精品啪啪一区二区下载| av在线手机播放| 又爽又大又光又色的午夜视频| 亚洲国产清纯| 国产主播喷水| 亚洲美女高潮久久久久久久| 婷婷色狠狠干| 亚洲无线观看| 亚洲男人的天堂网| 国产精品久久久精品三级| 激情无码视频在线看| 在线观看av永久| 国产正在播放| 精品国产成人三级在线观看| 欧美区一区| 国产又大又粗又猛又爽的视频| 区国产精品搜索视频| 欧美在线精品怡红院| 91精品国产一区| 亚洲一区国色天香| 亚欧成人无码AV在线播放| 亚洲娇小与黑人巨大交| 国产精品亚洲欧美日韩久久| 日韩专区欧美| 中文字幕啪啪| 久久香蕉国产线看观| 2020精品极品国产色在线观看 | 国产成人精品18| 国产成人精品高清不卡在线| 亚洲天堂视频在线观看| 色窝窝免费一区二区三区 | 在线观看国产精品第一区免费| 夜夜操国产| 成人午夜网址| 久久久久青草大香线综合精品| 在线人成精品免费视频| 国产91无码福利在线| 黄色三级网站免费| 国产永久在线视频| 免费播放毛片| 亚洲一区无码在线| 一级黄色欧美| 无码中字出轨中文人妻中文中| 992tv国产人成在线观看| 国产在线小视频| 影音先锋丝袜制服| 亚洲一区毛片| 人妻无码中文字幕一区二区三区| 真实国产乱子伦视频| 91麻豆精品国产91久久久久| 亚洲美女AV免费一区| 亚洲av无码牛牛影视在线二区| 国产精品亚洲一区二区三区在线观看| 五月天久久婷婷| 欧美成一级| 超薄丝袜足j国产在线视频| 无码专区在线观看| 超碰色了色| 国产成人精品高清不卡在线| 农村乱人伦一区二区| 99精品久久精品| 亚洲中文字幕在线观看| 久久免费看片| 高清国产va日韩亚洲免费午夜电影| 色综合热无码热国产| 欧美日韩一区二区三区在线视频| 黄色成年视频| 中文字幕精品一区二区三区视频| 欧美中日韩在线| 国产精品久久久久久久久kt| 国产精品无码AV片在线观看播放|