姜明
摘? 要:在國民體質測試中,數據處理一直是測試工作的重點內容,對各項有價值的數據不能夠及時掌握,影響了測試的準確性。數據挖掘是發掘具有潛在價值的數據,并且能夠指出數據之間的內在聯系,對國民體質測試具有重要意義。隨著我國國民體質測試中大量數據的堆積,數據挖掘的作用越來越明顯,因此要重視國民體質測試中數據挖掘的價值。本文就當前數據挖掘的應用進行分析。
關鍵詞:國民體質測試? 數據挖掘? 應用分析
中圖分類號:G80? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? 文章編號:2095-2813(2019)04(a)-0222-02
2016年《“健康中國2023”規劃綱要》的提出,標志著我國國民體質發展進入了一個新的階段。自2000年起,我國落實每5年一次的國民體質測試工作,積累了大量國民體質測試數據,傳統的數據處理辦法不能夠完全發掘出數據的價值,對國民體質的健康狀況的測試準確率不足,難以進行科學評價。數據挖掘,是對數據庫進行分析,挖掘所需信息并予以處理,是發現所需知識的方法,具體包括數據分析、預處理及轉換等。現階段,我國在開展體質測試中,對數據挖掘這一技術的應用研究較少,以致這一方法推廣中遇到阻礙。本文運用關聯規則對數據挖掘算法進行研究,以期為這一技術的應用提供參考。
1? 研究對象與方法
1.1 研究對象
本次研究對象為西安市某高校學生3660人,數據來源與西安市體質測試研究中心,體質測試與2015年8~11月完成。
1.2 研究方法
(1)首先構建高校學生體質測試的數據庫,所用軟件為SQL Server 2008數據庫,每個學生體質測試的項目類型多樣。
(2)試驗通過BI Dev Studio軟件,包括數據分析服務SSAS,數據集成服務SSIS,構建起關聯規則的數據挖掘模型,創建決策樹模型。
2? 關聯規則數據挖掘
2.1 數據預處理
目前,國民體質測試的數據庫內,儲存有海量數據,首先應實施預處理,對數據有出入之處加以糾正。數據預處理工作內容復雜,過程為:數據清理、數值化,前者是將缺失值清除,對離群值進行分析。而數據的數值化是將體質測試的總評結果分為優秀、良好、合格、不合格4個層級。
2.2 建立數據庫
對于原始數據進行了數據預處理之后,留下了3482個測試數據其中男性1985人,女性1497人,個人信息涵蓋體重、身高、年齡、性別、姓名、跳躍、肺活量,體前屈、引體向上、臺階指數、反應時間、仰臥起坐,對每個測試對象進行編號。根據《國民體質測定標準》對原始數據處理,每個指標還需將體質等級、測試總分涵蓋其中。
3? 結果分析
3.1 挖掘結果
伴隨挖掘數據量的提高,數據挖掘出的知識量也在增加,對其加以篩選,發掘出其中有用的知識。本次數據挖掘的結果如表1所示,表中體現了國民體質測試中單項指標與體質總評之間的關聯規則,為本次研究決策提供參考依據。關聯規則數據挖掘中,通過規則形式來對結果進行表達,各關聯規則內均須有相應的重要性、概率分析、適用對象及規則結果。
本次國民體質測試中數據挖掘出的關聯規則包括新知識規則、驗證性規則,這些規則在分析知識一般規律中,有重要價值,為國民體質測試后進行決策提供了重要的參考依據。
3.2 規則解析
表1中列舉的規則,可對不同單項指標給體質總評造成的影響予以反映。規則1表明,在體質總評結果為優秀的男生中,65.1%的跳躍能力與肺活量測試指標為優;規則2則表明52.3%的跳越能力較為優秀的男生體質總評成績為良好;規則3表明有89.2%的總評成績為優秀的女生跳躍能力與仰臥起坐測試成績都較為優秀;規則4反映出有45.4%總評成績為良好的女生仰臥起坐成績優秀;規則5表明有65.4%總評良好的女生仰臥起坐成績優秀,其身高體重規則也較為優秀;規則6表明48.9%的總評為良好的男生身高體重規則較為優秀,肺活量測試成績也較為優秀;規則7反映出有47.5%的進行臺階運動測試成績為優秀的女生總評結果為良好;規則8表明有44.7%總評成績為良好的女生肺活量測試成績較為優秀;規則9表明有62.4%總評成績為優秀的男生引體向上與反應時間都較為優秀。
4? 結語
根據數據挖掘的結果,對男女生需要采用不同的體質鍛煉方法,男生著重于耐力與心肺功能的鍛煉,輔助以爆發力與協調能力的鍛煉,女生則著重于爆發力與心肺功能,輔助以協調與耐力的鍛煉。本次數據挖掘結果得出的決策來自于數據挖掘出的相關規則,可以看出關聯規則的數據挖掘在國民體質測試中具有較為優秀的表現,因此相關測試者在進行測試時,可以采用數據挖掘的方法進行體質測試,這樣能夠在大量的數據中準確地發現有價值的數據,從而能夠更為便捷地進行數據分析,為國民體質提升做出較為精準的決策,全面提升體質測試的效果。
參考文獻
[1] 胡精超,王莉.數據挖掘在國民體質測試中的應用研究[J].哈爾濱體育學院學報,2017,35(2):6-11.
[2] 胡精超,王莉.數據挖掘在大學生體質健康測試中的應用研究[J].吉林體育學院學報,2017,33(3):8-11.
[3] 馬強.數據挖掘中決策樹算法的優化應用研究[J].電子測試,2016(4X):30-31.