999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

任務驅動法在醫學數據挖掘中的應用
——以帕金森綜合征的預測為例

2021-01-11 09:29:16肖偉昌聶小英
科教導刊·電子版 2020年33期
關鍵詞:數據挖掘模型

余 維 肖偉昌 聶小英 彭 微

(湖北科技學院 湖北·咸寧 437100)

0 引言

目前,很多高校結合自己的優勢進行轉型發展,其中不乏向應用型進行轉型,更加注重培養應用型人才。針對理工多學科交叉專業,比如醫學信息工程專業的專業課教學,傳統的理論教學面臨重大的挑戰。傳統的理論教學往往是學生被動填鴨式的接受知識,雖然能讓學生學到很多理論知識,但是在解決實際問題時十分茫然,不能做到舉一反三。因此有必要以任務驅動為導向,在結合案例教學的基礎上增加學生的主動性,將教師與學生的角色互換,充分發揮學生的主觀能動性,讓學生享受學習的過程,在提高學習成效的同時提高理論與實踐應用的能力。

目前,人口老年化一直呈現出上升趨勢,而帕金森綜合征是一種常見的神經系統退行性疾病,常見于老年人。發病平均年齡約為60歲,帕金森病在40歲以下的年輕人中很少見。大多數帕金森病患者是散發性的,只有不到10%的人有家族病史。

本文從加州大學歐文分校(UCI)的機器學習庫①中的帕金森綜合征數據集入手,對其數據進行分析并構建一個帕金森綜合征預測模型,以供決策者提高診斷效率及準確率。根據所要解決的問題,按照數據挖掘的流程,本文所得到預測帕金森綜合征的分類模型是通過數據獲取、數據預處理、挖掘建模、模型評估等幾個階段完成的。通過對理論與實踐操作,學生能對數據挖掘過程中的每個階段有更深刻的認識。

1 數據挖掘過程

1.1 數據獲取

本文選取的公開數據集來自伊斯坦布爾大學醫學院神經內科188例帕金森綜合征患者(男性107例,女性81例),年齡從33歲到87歲不等(65.1±10.9)歲。對照組為64例健康人(男23例,女41例),年齡41-82歲(61.1±8.9)歲。在數據收集過程中,麥克風設置為44.1kHz,并根據醫生的檢查,從每個受試者中收集元音/a/的持續發音,并進行三次重復(見表1)。

表1:帕金森病分類數據集

1.2 數據預處理

對于龐大的數據量,原始數據集中的數據或多或少是存在質量下降的現象,直接利用該數據進行數據挖掘,不僅會增加挖掘工作的難度,還會影響挖掘效果的準確性。為了減輕影響數據挖掘的多種因素,提高用來挖掘的數據質量,通常獲取數據后需對數據集進行預處理,以使混亂無序的數據變為容易分析處理的數據。對獲取的數據進行預處理步驟通常包括數據清洗、數據集成、數據變換、數據精簡等。

1.3 算法建模

要解決的問題是通過對帕金森綜合征數據集進行數據挖掘,分類得到能有效判斷罹患帕金森綜合征的預測模型。基于python的第三方工具庫中,sklearn作為機器學習領域知名的模塊之一,包含了很多重要的數據挖掘算法。鑒于此,考慮選用兩種常用分類算法(如KNN算法和決策樹算法)對帕金森綜合征數據集進行分析預測,并在python語言編程環境下結合sklearn庫進行建模②。

1.3.1 決策樹算法建模

將采集到的188例帕金森綜合征患者數據分成兩部分:一部分作為訓練集,用來構建模型;另一部分作為測試集,用來評估模型的準確性。利用sklearn庫中的train_test_split生成訓練集和測試集,利用sklearn庫中的Decision Tree Classifier生成決策樹,得到決策樹模型的核心代碼如下:

1.3.2 KNN算法建模

與上述決策樹算法建模操作相似,將188例帕金森綜合征患者數據集分成訓練集和測試集,利用sklearn庫中的train_test_split生成訓練集和測試集,利用sklearn的KNeighbors-Classifier方法對KNN算法進行建模,得到KNN算法模型的核心代碼如下:

1.4 模型評估

利用1.3節對188例帕金森綜合征患者數據集分離出的訓練集生成出對應的決策樹算法模型和KNN算法模型后,用相應的測試集對生成的兩種模型進行精確度評估。通過驗證,得到兩種不同模型的預測精度。

1.4.1 決策樹算法模型評估

利用predict對測試數據集x_test進行預測,y_predict為預測結果,借助y_test,利用sklearn庫中的metrics.confusion_matrix生成混淆矩陣結果并對y_predict進行分析,核心代碼如下:

結果見表2決策樹算法模型混淆矩陣表。通過表2所示的混淆矩陣,計算出模型的準確率和錯誤率見表4。

表2:決策樹算法模型混淆矩陣表

1.4.2 KNN算法模型評估

與1.4.1節類似,通過測試集對模型進行預測,并對預測結果進行分析,核心代碼如下:

結果見表3 KNN算法模型混淆矩陣表。通過表3所示的混淆矩陣,計算出模型的準確率和錯誤率見表4。

表3:KNN算法模型混淆矩陣表

表4:算法模型準確率和錯誤率

由表4能看出,兩種不同的模型中,決策樹模型對帕金森綜合征的預測更加準確。

2 小結

通過對公開的帕金森綜合征數據集入手,對目標任務進行分析,構建一個帕金森綜合征預測模型。針對該分類問題,本文利用python編程環境和相關工具庫完成了帕金森綜合征數據挖掘,包括數據獲取、數據預處理、算法建模與模型評估等四個階段。利用機器學習領域著名的 sklearn庫實現了決策樹算法模型和KNN算法模型,并對188例帕金森綜合征數據集分離出的測試集進行模型評估。通過對比決策樹模型和KNN模型的精確度,能夠得出決策樹算法在帕金森綜合征數據挖掘上的應用優于KNN算法的結果。與單純理論教學相比,課堂學習中,將實踐與理論結合,使學生在學習理論的同時加強編程的練習,能有效提高學生理解并掌握所學的數據挖掘方法在臨床工作中的應用。

注釋

① http://archive.ics.uci.edu/ml/index.php

② https://scikit-learn.org/stable/

猜你喜歡
數據挖掘模型
一半模型
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
3D打印中的模型分割與打包
一種基于Hadoop的大數據挖掘云服務及應用
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: 亚洲中文字幕av无码区| 456亚洲人成高清在线| 精品剧情v国产在线观看| 国产综合另类小说色区色噜噜| 国产成本人片免费a∨短片| 伊大人香蕉久久网欧美| 国产自无码视频在线观看| 国产成人欧美| 亚洲天堂网视频| 一区二区理伦视频| 国产高清国内精品福利| 日韩无码黄色网站| 日韩无码视频网站| 91极品美女高潮叫床在线观看| 欧美伊人色综合久久天天| 99视频在线观看免费| 亚洲视频免费在线看| 毛片网站观看| 91精品aⅴ无码中文字字幕蜜桃 | 亚洲中文字幕97久久精品少妇| 伊人激情综合网| 欧美视频免费一区二区三区 | 呦视频在线一区二区三区| 国产一区二区三区在线精品专区| 欧美精品成人一区二区视频一| 99伊人精品| 精品在线免费播放| 国内精品免费| 成人在线综合| 国内精品免费| 老司机久久精品视频| 高潮毛片无遮挡高清视频播放| 亚洲一区二区三区中文字幕5566| 日韩免费毛片视频| 69av免费视频| 毛片手机在线看| 青青操国产视频| 亚洲综合色婷婷中文字幕| 国产真实乱子伦视频播放| 欧美不卡二区| 中文字幕色在线| 欧美激情第一区| 538国产在线| 国产精品免费露脸视频| 亚洲高清日韩heyzo| 亚洲天堂免费在线视频| 米奇精品一区二区三区| 激情六月丁香婷婷四房播| 亚洲日本中文字幕天堂网| 国产亚洲精品自在久久不卡| 最新亚洲av女人的天堂| 国产第八页| 中文字幕在线永久在线视频2020| 欧美三级日韩三级| 广东一级毛片| 最新亚洲人成无码网站欣赏网| 色综合激情网| 免费无码AV片在线观看国产| 欧美日韩成人| 毛片在线区| 伊人久久影视| 欧美一区二区自偷自拍视频| 午夜丁香婷婷| av在线人妻熟妇| 在线观看精品自拍视频| 亚洲综合色婷婷中文字幕| 2021国产精品自产拍在线| 嫩草在线视频| 亚洲欧洲自拍拍偷午夜色| 亚洲欧美极品| 国产麻豆91网在线看| 很黄的网站在线观看| 亚洲一级毛片免费观看| 91人妻日韩人妻无码专区精品| 亚洲区欧美区| 欧美综合中文字幕久久| 成人毛片免费观看| 亚洲第一黄色网址| 欧美成人在线免费| 国产精品美人久久久久久AV| 日本人妻丰满熟妇区| 亚洲国产AV无码综合原创|