安徽財經(jīng)大學(xué)管理科學(xué)與工程學(xué)院 候夢如
基于醫(yī)療數(shù)據(jù)挖掘的營養(yǎng)配餐系統(tǒng)的設(shè)計與實現(xiàn)
安徽財經(jīng)大學(xué)管理科學(xué)與工程學(xué)院 候夢如
近年來,營養(yǎng)配餐成為越來越多人的飲食理念。針對人們對通過營養(yǎng)配餐來保障健康的迫切需求,設(shè)計一個基于醫(yī)療大數(shù)據(jù)的營養(yǎng)配餐系統(tǒng)。當(dāng)下信息技術(shù)的飛速發(fā)展,使得醫(yī)療數(shù)據(jù)成為人們健康飲食中的一項重要參數(shù),本系統(tǒng)以對醫(yī)療數(shù)據(jù)的數(shù)據(jù)挖掘結(jié)果為數(shù)據(jù)基礎(chǔ),結(jié)合系統(tǒng)數(shù)據(jù)庫以及配餐算法,實現(xiàn)針對用戶個人的個性化營養(yǎng)配餐功能,對于幫助人們預(yù)防、遠(yuǎn)離疾病,更健康的生活有一定的現(xiàn)實意義。
營養(yǎng)配餐;數(shù)據(jù)挖掘;個性化
隨著我國慢性病患者人數(shù)的快速增長,慢性病成為人們?nèi)找鎿?dān)憂的問題。我國成人超重、肥胖、血脂異常、高血壓、糖尿病等慢性病已滲入到普通群眾的日常生活中[1],據(jù)稱現(xiàn)確診患者2.6億人,也就是說將近每五人當(dāng)中就有一個是慢性病患者。慢性病給人們帶來不便和威脅,成為普遍存在的公共健康問題,而專家稱其根源是人體內(nèi)營養(yǎng)元素的失衡。合理的膳食可以保證人體內(nèi)各種營養(yǎng)元素的均衡,使得身體機能正常運行,從而達(dá)到預(yù)防和緩解慢性病的效果,所以營養(yǎng)配餐成為越來越多人的需求。
近年來關(guān)于營養(yǎng)配餐的研究有許多,比如:劉文杰和徐堅英開發(fā)的中醫(yī)食療與營養(yǎng)配餐系統(tǒng),此系統(tǒng)能夠根據(jù)用戶的病情、療效及食物的營養(yǎng)成分等信息提供相應(yīng)疾病的日常食譜,可使用戶通過飲食進(jìn)行治療;學(xué)者王向紅研究的模擬退火算法實現(xiàn)了針對合并癥患者的營養(yǎng)配餐等等[2]。而隨著信息技術(shù)的飛速發(fā)展,大數(shù)據(jù)已成為社會各領(lǐng)域的共同特征,利用先進(jìn)的數(shù)據(jù)挖掘技術(shù)對醫(yī)療領(lǐng)域的大數(shù)據(jù)進(jìn)行處理,分析出慢性病與人體內(nèi)的營養(yǎng)元素之間的關(guān)系,為設(shè)計出更符合患者個人的營養(yǎng)配餐系統(tǒng)提供了新的思路。本文擬在以數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則算法對醫(yī)療數(shù)據(jù)挖掘得出的慢性病與營養(yǎng)元素的關(guān)系為數(shù)據(jù)基礎(chǔ),設(shè)計出更個性化的營養(yǎng)配餐系統(tǒng)。
(1)根據(jù)最小支持度閾值找出所有的頻繁項集。
(2)通過對頻繁項集支持度和置信度閾值的過濾找到有價值的關(guān)聯(lián)規(guī)則[3]。
其中,找出頻繁項集是整個挖掘的重點。在關(guān)聯(lián)規(guī)則算法中比較經(jīng)典的是Apriori算法,Apriori算法已經(jīng)廣泛且有效的應(yīng)用于醫(yī)療領(lǐng)域,比如同濟(jì)大學(xué)附屬醫(yī)院的馮波等人通過對大量糖尿病患者的脂肪組織含量、肌肉組織、骨密度等數(shù)據(jù)進(jìn)行分析,利用數(shù)據(jù)挖掘技術(shù)得到了若能提高糖尿病患者體內(nèi)肌肉和脂肪組織含量就可以降低髓骨骨折的可能性的結(jié)論[4]。
由于頻繁項集的獲取是整個挖掘的重點和難點,而Apriori算法中針對頻繁項集提出的逐層搜索方法簡單且方便,所以本營養(yǎng)配餐系統(tǒng)也采用Apriori算法對各種慢性病和營養(yǎng)元素之間的關(guān)系進(jìn)行數(shù)據(jù)挖掘。逐層搜索方法包括以下兩個步驟[5]:
(1)自連接獲取候選集。第一輪的候選集就是確定的某一數(shù)據(jù)集中的項,而其他輪次的候選集則是由前一輪次頻繁集自連接得到(頻繁集由候選集剪枝得到)。
(2)對于候選集進(jìn)行剪枝。對于候選集的每一條記錄,如果它的支持度小于最小支持度,那么就會被剪掉;
2.1 克氏原螯蝦品質(zhì)變化 使用液體冷卻介質(zhì)急速凍結(jié)和常規(guī)冷凍克氏原螯蝦并在色澤、體表、肌肉、氣味以及湯汁方面對其進(jìn)行評定,結(jié)果如圖1所示。由圖1可見,使用液體冷卻介質(zhì)急速凍結(jié)的克氏原螯蝦在-18 ℃冷凍貯藏30 d后,感官品質(zhì)顯著高于常規(guī)冷凍克氏原螯蝦組(P<0.05)。
此外,如果一條記錄的子集有不是頻繁集的,也會被剪掉。該算法的終止條件是,如果自連接得到的已經(jīng)不再是頻繁集,那么取最后一次得到的頻繁集作為結(jié)果。
2.1 系統(tǒng)總體結(jié)構(gòu)
本系統(tǒng)主要由3個模塊構(gòu)成:數(shù)據(jù)庫模塊:存儲和管理所需的各種數(shù)據(jù);系統(tǒng)配餐模塊:為用戶配出個人營養(yǎng)套餐;人機交互模塊:用于各種信息的交互。系統(tǒng)的總體結(jié)構(gòu)如圖1所示。

表3 食物分配表

表4 配餐結(jié)果表

圖1 系統(tǒng)結(jié)構(gòu)圖
2.2 系統(tǒng)功能模塊
本系統(tǒng)設(shè)計的根本目標(biāo)是為患者提供符合個人身體狀況的營養(yǎng)餐進(jìn)而達(dá)到幫助患者恢復(fù)健康、改善身體狀況的目的。為更準(zhǔn)確、更合理的為患者配餐,本系統(tǒng)實現(xiàn)獲取用戶信息、用戶反饋、數(shù)據(jù)庫運行、以多元線性回歸數(shù)學(xué)模型為思想的算法配餐等功能。
(1)獲取用戶信息:用戶輸入個人信息,包括年齡、身高、體重、性別、疾病、工作、所在地區(qū)等資料。
(2)用戶反饋:用戶提交用戶食用后調(diào)查表。
(3)數(shù)據(jù)庫運行:在系統(tǒng)程序執(zhí)行時提供高效、準(zhǔn)確的各種數(shù)據(jù)支持,本系統(tǒng)中主要有慢性病與人體內(nèi)營養(yǎng)元素含量的關(guān)系表、營養(yǎng)素數(shù)據(jù)表、食物數(shù)據(jù)表、菜譜信息表、食物分配表、用戶個人信息表、用戶用餐記錄表、用戶食用后調(diào)查表等。
(4)算法配餐:此算法以多元線性回歸數(shù)學(xué)模型為思想,能夠準(zhǔn)確的為患者配餐。
2.3 系統(tǒng)算法的數(shù)學(xué)模型
回歸分析是一種研究變量之間關(guān)系的方法,能夠通過易知的、可控的變量來有效的估計出未知的人們想要的隨機變量的值,現(xiàn)已廣泛應(yīng)用于社會各研究領(lǐng)域。多元線性回歸一般用來研究兩個及兩個以上的影響因素作為自變量與因變量之間的線性關(guān)系問題[6],是相對簡單的一種回歸形式,但它很多情況下都能非常好的滿足需求。
對營養(yǎng)配餐系統(tǒng)中各種變量進(jìn)行分析時,發(fā)現(xiàn)患者每日食用多種食物、多種營養(yǎng)素,通過獲取食物中的營養(yǎng)素來達(dá)到理論上要求的每一種營養(yǎng)素的日需量,所以將每種食物實際攝入的重量視為自變量,把對每一種營養(yǎng)素的總需求量作為因變量時,則兩者之間存在密切的線性關(guān)系2。
我們以糖尿病患者為例,研究此線性關(guān)系。假設(shè)有m種食物,早餐食物為(F1,F2,F3,...Fi),午餐為(Fi+1,Fi+2,Fi+3,...Fi+j),晚餐為(Fi+j+1,Fi+j+2,Fi+j+3,...Fm);假設(shè)共n中營養(yǎng)素,根據(jù)用戶個人信息,在《慢性病與人體內(nèi)營養(yǎng)元素含量的關(guān)系表》中查詢到該用戶作為糖尿病患者其體內(nèi)個營養(yǎng)素的含量情況,并結(jié)合《營養(yǎng)素表》進(jìn)行數(shù)據(jù)分析后得到該用戶每日每種營養(yǎng)素參考攝入量分別為C1,C2,C3,...Cn;配平的結(jié)果為m種食物分別需要攝入的重量X1,X2,X3,...Xm。顯然,可以得到以下多元線性回歸方程[7]:

式中apq表示每單位樣本中第p中食物關(guān)于第q種營養(yǎng)素的含量;
由于該用戶為糖尿病患者,遵循之前數(shù)據(jù)分析得出的相關(guān)結(jié)果,其三餐熱量分配按照1:2:2進(jìn)行分配[8],可得到關(guān)系式:

上式可分解為:

則本系統(tǒng)的線性回歸模型可表示為:

針對此多元線性回歸方程組,本系統(tǒng)采用生物遺傳算法來進(jìn)行求解。遺傳算法是一類借鑒生物界自然選擇和進(jìn)化規(guī)律演化形成的隨機、自動搜索方法,由于其具有高效的全局尋優(yōu)能力,且運算過程只需要目標(biāo)函數(shù)和適應(yīng)度函數(shù),所以很適應(yīng)于本系統(tǒng),可以幫助求得最優(yōu)的一組食物分配結(jié)果[9]。
2.4 系統(tǒng)測試結(jié)果分析
為檢驗本系統(tǒng)的可行性,對營養(yǎng)配餐系統(tǒng)進(jìn)行如下測試:
用戶首次使用時輸入個人基本信息,系統(tǒng)獲取用戶信息后,調(diào)用系統(tǒng)配餐算法和數(shù)據(jù)庫為用戶配餐,首先得到推薦給用戶的全天所需食物種類及各自用量的食物分配表,如表3所示;然后系統(tǒng)根據(jù)此食物分配表在菜譜信息表中查詢相關(guān)的菜譜,得到多種配餐結(jié)果,表4為供用戶選擇的配餐結(jié)果中的一種。

表2 用戶信息
為驗證以上配餐結(jié)果的合理性,本系統(tǒng)針對菜譜進(jìn)行各營養(yǎng)素的分析[10],并與標(biāo)準(zhǔn)量進(jìn)行對比,結(jié)果如表5所示,從表中可得出各營養(yǎng)素的實際含量與標(biāo)準(zhǔn)量之間差別很小,所以能夠很好的滿足用戶的身體需求,從而本系統(tǒng)的配餐符合實際營養(yǎng)標(biāo)準(zhǔn)。

表5 結(jié)果分析表
基于醫(yī)療數(shù)據(jù)挖掘的營養(yǎng)配餐系統(tǒng)根據(jù)數(shù)據(jù)挖掘技術(shù)獲取的慢性病與營養(yǎng)元素之間的關(guān)系,結(jié)合患者的病情、體質(zhì)、工作、飲食習(xí)慣等數(shù)據(jù)通過高效的配餐算法為患者提供針對其個人的營養(yǎng)配餐,能夠有效地幫助患者恢復(fù)健康。但是也有很多可以改進(jìn)的地方,比如增加用戶自己的配餐設(shè)置、添加多人用餐時的配餐設(shè)置,提供一些專家的建議和健康飲食的小常識等等。總之,本系統(tǒng)通過醫(yī)療數(shù)據(jù)挖掘的方式為營養(yǎng)配餐研究提供了一個新思路,對于指導(dǎo)人們更健康飲食、遠(yuǎn)離疾病有很大幫助,也有一定的經(jīng)濟(jì)效益和社會效益。
[1]張云渡.數(shù)據(jù)挖掘技術(shù)在營養(yǎng)配餐系統(tǒng)中的應(yīng)用研究[D].北京工業(yè)大學(xué),2014.
[2]寇文心.智能營養(yǎng)配餐系統(tǒng)及其核心算法的研究[D].北京工業(yè)大學(xué),2015.
[3]Savasere A,Omiecinski E R,Navathe S B.An efficient algorithm for mining association rules in large databases[J].1995.
[4]馮波,倪亞芳,孫勤,等.糖尿病患者肌肉和脂肪組織含量與其骨密度的關(guān)系[J].中華物理醫(yī)學(xué)與康復(fù)雜志,2002,24(7):414-416.
[5]何月順.關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究及應(yīng)用[J].南京航航天大學(xué),博[學(xué)位論文],2010.
[6]Wang H,Shangguan L,Wu J,et al.Multiple linear regression modeling for compositional data[J].Neurocomputing,2013,122:490-500.
[7]魏鳳梅,胡文.基于模擬退火算法營養(yǎng)膳食優(yōu)選的研究[J].哈爾濱商業(yè)大學(xué)學(xué)報:自然科學(xué)版,2006,22(6):80-83.
[8]梅正欽.糖尿病醫(yī)學(xué)營養(yǎng)管理系統(tǒng)的功能設(shè)計與實現(xiàn)[D].廣州醫(yī)科大學(xué),2014.
[9]崔珊珊.遺傳算法的一些改進(jìn)及其應(yīng)用[D].合肥:中國科技大學(xué),2010.
[10]陸遙,魏皎,陳麗果.基于 Web 的個性化營養(yǎng)評估保障系統(tǒng)設(shè)計與實現(xiàn)[J].計算機技術(shù)與發(fā)展,2010,20(3):1-4.
候夢如,大學(xué)本科,現(xiàn)就讀于安徽財經(jīng)大學(xué)。