□吳培莎
(華南師范大學數學科學學院 廣東 廣州 510631)
探究城鎮居民生活及健康狀態同心臟病的聯系
□吳培莎
(華南師范大學數學科學學院 廣東 廣州 510631)
本文基于一份心臟病調查數據,探究個體的生活習慣以及健康狀態同心臟病之間的聯系。首先,基于APRIORI關聯規則算法得出客觀指標和健康指標之間的強關聯規則;然后,根據提升度的排序以及結合客觀事實刪除客觀指標中與健康指標強相關的變量;最后,將剔除了相關變量的數據集進行K-Means聚類,得出保持愉悅情緒,不宜過度疲勞以及控制飲食清淡,調節血糖、血壓、血脂在正常狀況對于心臟健康的重要性。
APRIORI關聯規則;K-Means聚類
本文所使用的數據是一份心臟病調查數據。總共有220個樣本。數據集包含20個指標,其中有12項為客觀指標,分別是:性別,年齡,工作強度,婚姻,擁有車的數量,鍛煉頻率,飲食,熬夜頻率,是否有寵物,抽煙頻率,家族藥物史;8項為健康指標,分別是:情緒,疲勞度,血壓,肥胖,血糖,血脂,是否患糖尿病,是否患心臟病8項,其中“是否患有心臟病”是本文的研究變量。
首先,將除年齡外的11個客觀指標列為關聯規則的前項,除是否患有心臟病的7個健康指標列為關聯規則的后項。選擇10%的最小支持度和80%的最小置信度,得到47條關聯規則,這些關聯規則的提升度都大于1,故都為有效的規則。按提升度降序排列,可以精煉為一下幾條比較符合常理的規則:
(1)工作高強度、很少鍛煉、經常熬夜者、有家族醫藥史的個體容易感到緊張壓力大。工作強度中等且經常運動者,則情緒比較平靜。這說明工作強度、鍛煉頻率、熬夜頻率、是否有家族醫藥史與個體的情緒存在很大關聯。
(2)工作強度中等且有家族醫藥史者,經常熬夜且有家族醫藥史者,運動不定期但工作強度中等者,血壓會比較高。可以看到,是否有家族醫藥史,熬夜頻率以及鍛煉頻率與個體的血壓有比較大的關聯。
(3)工作高強度、很少鍛煉經常熬夜者,經常抽煙但很少鍛煉且有家族醫藥史者比較容易有高血脂。同情緒一樣,工作強度、鍛煉頻率、熬夜頻率、是否有家族醫藥史同高血脂存在一定的關聯,另外,抽煙的頻率越高,越容易得高血脂。
為了確定K-Means聚類的簇數,本文采用所有樣本到聚類中心距離的均值為判斷標準。研究結果顯示,當聚類個數達到5h,樣本到中心點的距離均值趨于一個比較穩定的值,所以確定k為5。5個簇類樣本占總樣本的比例分別為34.1%,20%,17.3%,15.9%,12.7%,這5個簇類犯心臟病的概率分別為2.67%,31.82%,13.16%,14.29%,71.43%。
觀察聚類1,犯心臟病的概率只有2.67%,這類人群幾乎血壓、血脂、血糖都是正常,幾乎不患糖尿病,且60%以上的人飲食比較清淡,不養寵物,情緒和疲勞程度都比較正常。
觀察聚類5,犯心臟病的概率達到了71.43%,這類人中血壓和血脂雙高的人達到了85.7%,他們口味比較重,而且80%以上的人時常感覺到緊張和壓力大,而且極度的疲勞。這說明血糖和血脂這些指標是可能患心臟病的危險信號;情緒上的緊張、高壓力和極度的疲勞也會危害人的心臟健康;另一方面,飲食上偏油膩也可能是患心臟病的因素之一。聚類1和聚類5的人大部分都不養寵物,這說明犯心臟病的概率高低和是否養寵物不存在極大的關聯。
聚類2中犯心臟病的概率為31.82%,這類人同聚類五中的人一般,血壓和血脂雙高,且飲食大都比較油膩,但是68.2%的人情緒一般,77.3%疲勞程度正常。將其與聚類5聯系起來,可以說明當在血壓、血脂偏高的情況,保持愉悅的心態,工作和生活不要過度疲勞,可以降低一半以上患心臟病的概率。
聚類3和聚類4患病的概率接近,聚類3犯病的概率會比聚類4偏低,但是聚類3中血壓和血脂雙高的人都達到了78.9%以上,而聚類4中68.6%血壓正常,血脂高的人占97.1%,其他指標相差不大。這說明血脂高比血壓高更危險一點。
個體的生活習慣,狀態影響著其患心臟病的比率,控制清淡飲食,保持適當的工作量但不能過于疲乏,緩解緊張情緒,壓力不適宜過大,可以在一定程度上維持心臟健康。個體應多關注自己的血壓、血糖、血脂的狀況,在這些指標不正常的情況下及時調節,保持良好心態,有助于降低患心臟病的比率。
1004-7026(2017)15-0110-01
R195
A
10.16675/j.cnki.cn14-1065/f.2017.15.072
吳培莎(1995-),女,漢族,廣東汕頭人,華南師范大學數學科學學院,2014級本科生,研究方向:金融數學。