黃靜煜
摘要:以北方某縣的門診大數據為依據,運用專業的統計軟件統計患者的基本情況,交叉分析年齡、性別、各類疾病的分布情況,準確把握該區域人口患病的特征,利于更有針對性地選擇健康教育方式,推送全方位的健康教育信息。
關鍵詞:大數據;疾病;人口特征
中圖分類號:TP3 文獻標識碼:A 文章編號:1009-3044(2018)02-0264-02
Analysis of Disease and Demographic Characteristics of Medical Big Data
HUANG Jing-yu
(College of Software, Jilin University, Changchun 130000,China)
Abstract: Based on the outpatient big data of some county in the north, using the professional statistical software, the basic situation of the patients and cross analysis among age, diseases, and gender are analyzed, which accurately grasp the characteristics of the population sick of the region and it is helpful to choose more targeted health education mode and push comprehensive health education information.
Key words:big data; disease; demographics
目前,大數據已經成為國內外研究的焦點[1]。大數據時代,人們正在以“分析全樣本、接收非精確”的新思維探索世界[2]。伴隨國民經濟與科學技術的迅猛發展,我國醫療領域也迎來大數據的發展時代。不管是開展醫療工作,還是醫學研究,都面臨著處理數據的需求[3]。因此,在大數據背景下進行醫療數據統計及開發是非常重要的[4]。就中醫而言,在中醫基礎的大數據里,從數據流通的各個環節之中建立中醫基礎大數據系統框架,通過對數據的挖掘和處理,發現中醫基礎的學術規律[5]。
本文利用北方某縣22家衛生院、衛生所、社區衛生站、社區衛生服務中心等各門診數據,通過專業統計軟件分析患者癥狀與年齡、性別等人口特征的分布情況。
1 門診大數據分析方法
北方某縣的門診數據是基于2016年1月6日至2017年2月25日期間的大數據,數據總數為65535個。針對要分析的性別、年齡、疾病等變量,對其類別分別進行賦值并統計。其中男性為1,女性為2;患者的年齡以9為等距分為10組,分別賦值為1-10;關于門診患者疾病的數據包括疾病的具體名稱和診斷疾病ICD,但是各醫療機構在錄入診斷名稱時對疾病名稱的描述不同,例如同時存在“高血壓”和“高血壓病”兩種相同的疾病名稱,因此根據國際疾病分類標準ICD-10查詢系統,通過ICD序號的關聯性統計各類疾病的發生頻數。
2 大數據的疾病與人口特征分析
根據門診人數統計,其中男性患者為31274人,占到總人數的47.72%,女性患者為34261人,占比為52.28%。相比較女性患者較多一些。各年齡組診斷的人數,如圖1所示。
從圖1可以看出,在這一年左右的時間里,各年齡組門診總人數為65459人,患者年齡在40-69歲之間的人數最多,占到總人數的63.84%。這也說明,當年齡在40歲及以上時,人的身體各項機能都在逐漸呈現“下坡”的狀態,各種身體不適均會出現,因此前來門診看病的人數較多。年齡在90-99歲的人數只有81人;0-9歲、10-19歲、70-79歲年齡組的診斷人數也相對較少。
通過疾病ICD序號關聯性,統計得到診斷名稱頻率位于前十名的疾病名稱,表明此區域人口的常發疾病;與患者的性別和年齡組進行交叉分析,分布情況如表1所示。
從表1可以看出,所有疾病在30-69歲之間的發生頻數近年來均呈上升趨勢,男性、女性發生各類疾病的頻率大致相等。0-69歲之間男性、女性患者患心臟病、頭痛、糖尿病、高血壓病的概率隨年齡增加而增加。排名第一的為呼吸系統疾病,0-9歲間的兒童為易感染人群,且男孩發生頻率較高,為本年齡組發病頻數最高的疾病,占到此年齡組總人數的32.43%;在30-69歲之間,發病頻率存在上升趨勢,意味著30歲之后,隨著年齡的增長,人們對相關呼吸系統疾病的抵抗力逐漸下降;進一步的統計顯示,呼吸系統疾病中上呼吸道疾病的發生頻率最高,占到46.78%,并且是所有疾病中發生頻數最高的疾病。循環系統疾病以11027人的發生頻數位于第二,40-79歲之間女性發病的頻率要高于男性;此類疾病中缺鐵性心臟病、腦血管病和高血壓病發生的頻數較高。
此區域診斷疾病中,第三大、第四大疾病各年齡組男、女分別以頭痛、胃炎發生的頻率最高,分別為32.8%、42.43%,且在10-19歲年齡組內青少年患病的比例相對其他疾病較高。
糖尿病屬于內分泌、營養和代謝類疾病,男、女患者人數在40-69歲之間頻數急劇增加,且在50-69歲間達到發病最高峰。由于損傷和其他外因造成的身體疾病,各年齡段男性發生的頻率均高于女性。
3 結論
醫療領域的大數據迫切需要專業的挖掘和分析。本文以北方某縣的門診數據為依據,統計分析該區域人口常發疾病,以及不同年齡組,不同性別患者疾病的特點。通過分析以上各類的分布情況,有利于針對性地選擇健康教育的方式,推送個性化的健康教育信息,以便為潛在患者提供更好的服務。
參考文獻:
[1] 梁爽. 大數據,大變革[J]. 未來與發展,2014(11):7-9.
[2] 賀威,劉偉榕. 大數據時代的科研革新[J]. 未來與發展,2014(2):2-5.
[3] 楊學. 醫療大數據時代對醫院統計工作的思考[J]. 經營管理者,2017(133):440.
[4] 晏資湘. 大數據背景下醫療數據的統計及開發[J]. 電腦知識與技術,2017:13-14.
[5] 李正熙,孫毅,李小輝. 中醫基礎中應用大數據技術的實踐研究[J]. 電子技術與軟件工程,2017:186.endprint