李 爽,張慧妍,+,王 立,,王小藝,,董銀卯,孟 宏
1.北京工商大學 計算機與信息工程學院,北京 100048 2.北京工商大學 中國化妝品研究中心,北京 100048
多屬性皮膚指標的中醫體質模糊優化分類模型*
李爽1,張慧妍1,2+,王立1,2,王小藝1,2,董銀卯2,孟宏2
1.北京工商大學 計算機與信息工程學院,北京 100048 2.北京工商大學 中國化妝品研究中心,北京 100048
LI Shuang,ZHANG Huiyan,WANG Li,et al.Fuzzy optimization classification model in Chinese medicine constitution of multi-attribute skin indexes.Journal of Frontiers of Computer Science and Technology,2016, 10(7):995-1002.
探索面部皮膚指標與人體內在的中醫體質類型間的隱形關聯關系并確定體質類型,可為皮膚養護與診療提供新途徑。選取中國化妝品研究中心實測的具有多屬性特性的皮膚本底樣本值及由中醫體質問卷確定的體質分類結果作為建模匹配數據對,依據Spearman相關性進行主成分分析,實現了皮膚指標降維,而后依據模糊統計方法得到皮膚指標對體質的模糊隸屬度,實現了非標準化數據的智能化劃分。在此基礎上,提出了一種融合主客觀信息的模糊優化組合賦權法,用以降低分類誤差,建立多屬性皮膚指標的中醫體質模糊優化分類模型。針對新樣本的測試結果表明,模型分類正確率達到80%,從而證明了模糊分類模型具有較好的實用性及有效性,并可為其他非標準化與個性化數據的模糊多屬性分類與評價問題的深入研究提供新思路。
模糊分類;組合賦權;統計分析;中醫體質
依據中醫理論,體質是人體生命過程中,在先天稟賦和后天生活習慣基礎上所形成的形態結構、生理功能和心理狀態方面綜合的、相對穩定的固有特質[1]。體質作為皮膚表征的重要物質基礎,對皮膚的顏色、光澤、質地、水分、彈性、平滑度等眾多屬性具有影響[2]。目前研究將人體劃分為平和質、氣虛質、陽虛質、陰虛質、痰濕質、濕熱質、血瘀質、氣郁質、特稟質九大體質,其中平和質的人群膚色潤澤,唇色紅潤,精力充沛,屬于健康人群,而其他8種則歸類為偏頗體質,其對應的皮膚或多或少存在一些問題。研究皮膚與體質的潛在聯系,對于皮膚保養及人體健康診療具有重要意義。
黃沖等人[3]采用樸素貝葉斯分類和最小距離分類兩種分類方法,從數理統計角度對王琦教授《中醫體質分類與判定》標準問卷中的答案進行判別研究,建立了中醫體質分類模型;戰文翔等人[4]通過統計學方法對36 486例調查對象的問卷答案進行分類,結果顯示中老年人偏頗體質占多數,達到98.45%,平和體質僅占1.55%;馬建偉等人[5]通過問卷調查獲取了200名中國飛行員的體質類型后,采用多元Logistic回歸分析確定了體質與生活習慣、周圍環境等因素的相互關系,為后續提高飛行員的健康水平提供了理論指導。李建民等人[6]對中醫體質與皮膚水分和酸堿度的關系進行了研究,結果表明相較于平和體質,其他體質的水分含量和PH值都相對較高;王雪等人[7]研究了黑龍江地區女性皮膚黑色素、血紅素與中醫體質的關系,發現與平和質相比,其他各類體質的黑色素、血色素值均較小;曲建寧等人[8]在對測試者皮膚狀態打分的基礎上,根據其體質類型統計數據,指出平和體質人群各項皮膚指標得分均最高,偏頗體質會影響皮膚指標得分,其中對指標影響最大的是陽虛質和氣郁質。
本文基于反映專家診療經驗的調查問卷及實測數據挖掘外在皮膚品質特征與內在人體中醫體質的信息關聯,建立判定個體屬于平和體質及偏頗體質的二分類模型,為后續進行皮膚狀態改善和人體健康診療提供理論支撐與決策依據,為信息技術處理模糊多屬性數據以更好地服務民生拓展了新的思路。
2.1人體面部皮膚指標體系建立
目前,常用的人體面部皮膚指標包括水分含量、水分散失、油脂、黑紅色素等。本文根據皮膚領域背景知識和中醫理論,從水潤度、白皙度、平滑度、緊實度等角度確定能夠充分全面衡量人體面部皮膚狀態的指標體系如圖1所示。

Fig.1 Index system of human facial skin圖1 人體面部皮膚指標體系
2.2基于Spearman相關性的主成分分析
皮膚指標體系中的指標維數較多,為了避免分類、評價研究中皮膚指標存在冗余,在處理指標數據前先通過主成分分析法對指標降維。
由于人體面部皮膚指標數據具有離散型、非標準化與個性化的特點,樣本間差異較大,在小樣本條件下無法滿足正態分布,故選擇對分析變量不需要正態性假設的Spearman秩相關系數來度量指標間的相關性[9],一般認為 ρs大于0.4的指標間相關性較強。參照文獻[10]所述的方法,依次計算20個指標兩兩之間的Spearman秩相關系數,篩選出相關系數大于0.4的指標,采用主成分分析法對其進行降維[11]。具體計算步驟如下:
(1)標準化各指標數據;
(2)求解標準化后指標數據的相關系數矩陣;
(3)求解相關系數矩陣的特征根;
(4)求解特征根對應的特征向量,其中最大特征根的特征向量對應第一主成分的系數向量,以此類推;
(5)計算各主成分的貢獻率,取累計貢獻率大于70%的主成分作為綜合后的新指標,并結合實際給對應指標賦予新的含義。
2.3模糊統計確定指標對體質的隸屬度
皮膚指標數據受內外影響存在一定的波動性,區間邊界附近的指標值在重復測試中可能被劃分到不同區間,這從根本上制約了標準化分類與評價研究工作的開展。因此,本文提出采用模糊統計方法確定皮膚指標對中醫體質的隸屬度,實現數據的規范化。
以水分散失指標為例,考察n個人的水分散失數據,其中通過調查問卷確定p個人屬于平和體質,f個人屬于偏頗體質,則根據水分散失數據確定對平和體質的隸屬度計算步驟如下:
(1)將p個平和體質人群的水分散失值按照從小到大的順序進行排序,然后分成合適的正整數h組,分別對應h次的模糊統計實驗。其中第1組由個值組成,第2組增加了個值,以此類推,h組即包含了所有p個樣本值。

(3)將p個人的水分散失值依次帶入式(1)中,計算出每個人在水分散失指標下對平和體質的模糊隸屬度矩陣l(p)1。
(4)依次將余下h-1組數據帶入步驟(2)、(3),計算出h-1個模糊隸屬度矩陣。
(5)將h次模糊統計實驗計算出的模糊隸屬度矩陣取平均,得到水分散失對平和體質的平均相對隸屬度矩陣為:

從中醫角度對人體面部皮膚狀態進行直觀評判目前主要依據水潤、白皙、緊實及平滑這4個維度進行,其指標權重的確定對分類的準確性具有重要影響。若能結合實測數據對指標權重進行調整,則有利于體質與皮膚之間客觀規律的提取。因此本文提出一種融合主客觀信息的模糊優化分類算法對指標進行賦權,以提高分類準確率。
3.1層次分析法與熵值法組合賦權
熵值法是一種客觀賦權方法,它通過計算信息熵求解出各指標的差異系數,進而根據指標的差異系數對整體的影響來決定指標的權重。其中,信息熵的計算步驟如下。
(1)計算第j項指標下,第i個測試對象的特征比重:

(2)計算第j項指標的熵值:

層次分析法是易于吸取領域專家經驗,對定性問題進行定量分析的一種簡便、靈活而又實用的多準則決策方法[12]。熵值法可以充分挖掘指標數據所蘊含的信息,結果相對客觀,層次分析法則集成了專家的經驗和知識,主觀隨意性相對較大[13-14]。因此,本文采用將二者結合的組合賦權法確定各指標權重,設二者的比例系數分別為a和b,則組合賦權法計算步驟如圖2所示。

Fig.2 Flowchart of determining index weight圖2 指標權重確定流程圖
其中,a和b的計算原理如下:
設sj、cj分別為熵值法和層次分析法計算出的某指標xj的權重系數,則稱

是具有同時體現主客觀信息集成特征的權重系數。
依據上述測試樣本的模糊隸屬度計算易知,平和質受測對象pi的第j個指標對屬于平和體質與偏頗體質的隸屬度之差為l(p-f)ij,則偏頗體質受測對象fi的第j個指標對偏頗體質與平和體質的隸屬度之差為l(f-p)ij,則構成的lij矩陣如式(6)所示,反應第i個受測對象的第j個指標對兩類體質的隸屬程度之差:

顯然有lij>0,對各指標加權后可得:

為提高分類模型準確率,本文提出比例系數a和b,優化的目標函數為:

可見,目標函數取值越大表明用于體質分類的參數取值越適當。此外,參數a、b滿足的約束條件為:

應用Lagrange條件極值原理,即可求得a、b的最優解。

3.2體質分類
在通過組合賦權法確定皮膚指標的權重后,進行中醫體質的二分類研究則僅需計算出樣本的多屬性指標綜合后對兩類體質的隸屬度之差lw,進而判定對應的分類結果。lw定義為:

若加權綜合后的lw>0,則這個人屬于平和體質,否則屬于非平和體質。
4.1樣本來源
選取北京工商大學化妝品研究中心于2014年11月測試獲得的175組皮膚本底樣本數值,測試對象為京津冀地區年齡在18~35歲之間的女性,體質分類結果根據中醫體質問卷調查確定。實驗采用德國CK公司專業的皮膚測試儀器對受測者的水分含量、水分散失、油脂、黑色素MI、光澤度、彈性、粗糙度等20項指標進行測試,其中每個指標又分別測試額頭、左眼角、左臉頰和下巴4個部位。測試過程中保證了受測者皮膚清潔,環境恒溫等測試條件。
隨機挑選155組樣本數據為建模的訓練樣本,余下20組為測試樣本。其中,訓練樣本包含平和體質51組,偏頗體質104組;測試樣本包含平和體質6組,偏頗體質14組。
4.2體質分類模型的建立
在建模過程中為充分利用全部的面部皮膚信息,將每位受測者的4個部位指標值進行加權,依據專家意見對其權重分別設定為額頭0.1、左眼角0.2、左臉頰0.5、下巴0.2,加權后每個指標得到一個綜合值。
計算155組訓練樣本中20個皮膚指標兩兩之間的Spearman秩相關系數,篩選出相關系數大于0.4的指標。分析計算結果可得,{MI、EI、L、A、B、IAT}、 {R2、R5、R7}、{LR、Ra、Rz、Rt}、{PO2、PCO2}間具有較強相關性。對上述4組指標分別采用主成分分析法進行降維,得到的第一主成分貢獻率均大于70%,故將4組指標分別綜合為第一主成分所對應的新指標,分別命名為色度、彈性、粗糙度和氣血。最后獲得的人體面部皮膚指標體系包括水分含量、水分散失、油脂、色度、光澤度、彈性、PH值、粗糙度和氣血9個指標。
首先,依次對155位受測者的上述9個皮膚指標進行模糊統計,將51位平和體質受測者的各項指標值分成5組,104位非平和體質受測者的各項指標值分成8組,每組等分為5個區間。參照2.3節所述的實驗步驟,計算各指標對兩類體質的平均相對模糊隸屬度。以水分散失對偏頗體質的模糊隸屬度為例展示模糊統計結果如圖3所示。可以看出,隨著實驗次數的增多,模糊隸屬度趨于穩定。
然后,構建融合主客觀信息的人體面部皮膚狀態層次結構模型如圖4所示。本次參加測試的皆為年輕人,其皮膚大多較光滑,緊實度高,因此領域專家給出的準則層皮膚狀態考量4個維度的權重排序依次為:水潤度>白皙度>平滑度>緊實度。
這樣,依據專家意見構造判斷矩陣,經過一致性檢驗,表明具有較好的一致性。同時,按照圖2所示的計算步驟,基于實測數據采用熵值法進行指標權重計算。
為優化確定組合權重系數,需要將上述獲得的各指標權重值和其對兩類體質的模糊隸屬度帶入式(4)~(7),這樣便可計算出歸一化后的比例系數a、b,求得a=0.51,b=0.49。具體皮膚指標權重結果詳見表1。依據式(8),即可確定每位受測者的體質類型。對20組測試樣本,分別將3類賦權方法的結果帶入已經建好的分類模型中,分類輸出與問卷調查結果相對比,可發現組合賦權法分類準確率最高,達到80%,層次分析法和熵值法均有所下降,只達到75%。分類模型的詳細分類情況見表2。分析實驗結果可知,采用本文提出的基于組合賦權的模糊優化體質分類模型與基于專家診療經驗的體質問卷分類結果吻合度較高。

Fig.3 Average relative membership degree of water loss to non-gentle constitution圖3 水分散失-非平和體質平均相對隸屬度

Fig.4 Hierarchical structure model of skin圖4 皮膚狀態層次結構模型

Table 1 Results of analytic hierarchy process&entropy method combination weighting表1 層次分析法-熵值法組合賦權結果

Table 2 Output of classification model表2 分類模型輸出
本文依據中醫理論——“有諸內,必形于外”,探索人體面部皮膚狀態多屬性指標與體質之間的隱性關聯關系。由于人體面部皮膚指標與性別、地域、季節、年齡,甚至測試前的睡眠狀況等都關聯密切,本次測試僅針對京、津、冀地區,年齡在18~35歲之間的女性集合進行。考慮影響因素的復雜性與隨機干擾,采用模糊優化方法融合調查問卷獲取專家關于體質分類的經驗及皮膚指標實測數據,對多屬性皮膚指標進行中醫體質分類研究。首先對常規的皮膚指標體系采用基于Spearman相關性的主成分分析法進行降維,然后通過模糊統計獲得各指標對中醫體質的模糊隸屬度,最后提出采用分類偏差最小化原則優化確定組合權重,以建立分類精度較高的中醫體質分類模型。該模型的分類結果與體質問卷調查結果具有良好的一致性,能夠比較客觀地描述皮膚狀態和體質間的潛在聯系,具有較好的實際應用與理論參考價值,分類模型簡潔、高效,易于推廣。后續,考察其他地域、年齡人群的皮膚指標與中醫體質關聯關系時,可借鑒本文方法并結合特定人群皮膚測試數據集進行深入研究。
[1]Wang Ji,Zhang Huimin,Li Lingru,et al.Theory of skin relating to constitution put forward by professor WANG Qi and its application in dermatology[J].Journal of Beijing University of Traditional Chinese Medicine,2013,36(7): 476-477.
[2]Zhang Haidi,Dong Yinmao,Meng Hong.TCM constitution and skin health[J].Beijing Daily Chemical,2011(3):14-19.
[3]Huang Chong,Liu Zhuojun.Astudy about constitution catagories in traditional Chinese medicine based on statistic analysis[J].Chinese Journal of Management Science,2012,20 (S1):120-125.
[4]Zhan Wenxiang,Shen Fangfang,Shen Wei,et al.A study of TCM constitution classification in 36486 cases of wrinkly[J]. Chinese Journal of Clinical Research,2014,27(9):1150-1152.
[5]Ma Jianwei,Dong Jing,Xu Limei,et al.Study on the characteristics of TCM constitution classification of pilots[J]. Beijing Journal of Traditional Chinese Medicine,2011,30 (5):337-339.
[6]Li Jianmin,Wang Xue,Qi Yonghua,et al.Study on the relationship between traditional Chinese medicine constitution and skin’s water,pH value[J].Acta Chinese Medicine and Pharmacology,2012,40(4):81-82.
[7]Wang Xue,Xu Yanming,Zhang Ning,et al.Study on the relationship between traditional Chinese medicine constitution and skin?s melanin,protoheme[J].Chinese Journal of Aesthetic Medicine,2012,21(5):764-766.
[8]Qu Jianning,Wang Ji,Zhao Ya,et al.A relevant research on facial skin conditions of Chinese urban females and TCM constitutional types[J].Chinese Journal of Information on TCM,2014,21(10):22-23.
[9]Bickel D R.Robust cluster analysis of microarray gene expression data with the number of clusters determined biologically[J].Bioinformatics,2003,19(7):818-824.
[10]Liu Di,Cho S Y,Sun Dongmei,et al.A Spearman correlation coefficient ranking for matching-score fusion on speaker recognition[C]//TENCON 2010-IEEE Region 10 Conference,Fukuoka,Japan,Nov 21-24,2010.Piscataway,USA: IEEE,2010:736-741.
[11]Costa J F P D,Alonso H,Roque L.A weighted principal component analysis and its application to gene expression data[J].IEEE/ACM Transactions on Computational Biology &Bioinformatics,2011,8(1):246-252.
[12]Du Changxiao,Li Xiaohong,Shi Hong,et al.Security evaluation method for the architecture of J2EE applications[J]. Journal of Frontiers of Computer Science and Technology, 2014,8(5):572-581.
[13]Ma Xiyuan,Sun Yuanzhang,Fang Hualiang,et al.Scenariobased multi-objective decision-making of optimal access point for wind power transmission corridor in the load centers[J]. IEEE Transactions on Sustainable Energy,2013,4(1):229-239.
[14]Gu Zhenli.Research on an evaluation model of the MCAI software based on the improved entropy method[J].Computer Engineering&Science,2010,32(7):134-136.
附中文參考文獻:
[1]王濟,張惠敏,李玲孺,等.王琦教授“膚-體相關論”的提出及其在皮膚病診療中的應用[J].北京中醫藥大學學報,2013,36(7):476-477.
[2]張海娣,董銀卯,孟宏.中醫體質學與皮膚養生[J].北京日化,2011(3):14-19.
[3]黃沖,劉卓軍.基于統計分析的中醫體質分類研究[J].中國管理科學,2012,20(S1):120-125.
[4]戰文翔,申芳芳,沈偉,等.36486例中老年人中醫體質分類研究[J].中國臨床研究,2014,27(9):1150-1152.
[5]馬建偉,董靜,徐麗梅,等.飛行員中醫體質分類特征的研究[J].北京中醫藥,2011,30(5):337-339.
[6]李建民,王雪,祁永華,等.中醫體質與皮膚水分及pH值的關系研究[J].中醫藥學報,2012,40(4):81-82.
[7]王雪,徐艷明,張寧,等.中醫體質與皮膚黑色素和血紅素的關系研究[J].中國美容醫學,2012,21(5):764-766.
[8]曲建寧,王濟,趙亞,等.中國城市女性面部皮膚狀態與中醫體質類型相關性研究[J].中國中醫藥信息雜志,2014, 21(10):22-23.
[12]杜長霄,李曉紅,石紅,等.J2EE應用軟件的架構安全評估方法[J].計算機科學與探索,2014,8(5):572-581.
[14]谷震離.基于改進熵值法的MCAI軟件評價模型研究[J].計算機工程與科學,2010,32(7):134-136.

LI Shuang was born in 1992.She is an M.S.candidate at Beijing Technology and Business University.Her research interest is data analysis and modeling.
李爽(1992—),女,北京人,北京工商大學碩士研究生,主要研究領域為數據分析與建模。

ZHANG Huiyan was born in 1973.She is an associate professor at Beijing Technology and Business University. Her research interest is data modeling,classification and evaluation.
張慧妍(1973—),女,黑龍江齊齊哈爾人,博士,北京工商大學副教授,主要研究領域為數據建模、分類與評價。

WANG Li was born in 1983.She is an associate professor at Beijing Technology and Business University.Her research interest is statistical analysis and forecast.
王立(1983—),女,北京人,博士,現為北京工商大學副教授,主要研究領域為統計分析與預測。

WANG Xiaoyi was born in 1975.He is a professor at Beijing Technology and Business University.His research interest is modeling and forecasting based on data.
王小藝(1975—),男,山西新絳人,博士,北京工商大學教授,主要研究領域為基于數據的建模與預測研究。

DONG Yinmao was born in 1963.He is a professor at Beijing Technology and Business University.His research interess include Chinese medicine constitution and skin health cosmetics.
董銀卯(1963—),男,河北辛集人,博士,北京工商大學教授,主要研究領域為中醫體質,皮膚養生化妝品。

MENG Hong was born in 1969.She is a professor at Beijing Technology and Business University.Her research interest is skin medical health technology(traditional Chinese medical science).
孟宏(1969—),女,山東菏澤人,博士,北京工商大學教授,主要研究領域為皮膚醫學養生技術(中醫)。
Fuzzy Optimization Classification Model in Chinese Medicine Constitution of Multi-Attribute Skin Indexes*
LI Shuang1,ZHANG Huiyan1,2+,WANG Li1,2,WANG Xiaoyi1,2,DONG Yinmao2,MENG Hong2
1.School of Computer and Information Engineering,Beijing Technology and Business University,Beijing 100048,China 2.China Cosmetic Research Center,Beijing Technology and Business University,Beijing 100048,China +Corresponding author:E-mail:zhanghuiyan369@126.com
This paper explores the invisible incidence relation between facial skin indexes and traditional Chinese medicine(TCM)constitution to determine constitution types,which can provide new ways for skin diagnosis and treatment.Multi-attribute skin background sample values tested by China Cosmetics Research Center and the constitution classification results determined through constitution questionnaire are selected as model matching data.Firstly,principal component analysis based on Spearman correlation is adopted to reduce the dimension of indexes.Then,fuzzy membership degrees of indexes to constitution are gotten by statistical experiment to realize intelligent classification of non-standardized data.On this basis,this paper proposes a fuzzy optimization combination weighting method fused by subjective and objective information to reduce classification error,and establishes TCM constitution fuzzyoptimization classification model of multi-attribute skin indexes.Testing results of new samples show that classification accuracy of model reaches 80%.Thus the fuzzy classification model in this paper has good practicality and validity,which can provide new ideas for further research on fuzzy multi-attribute classification and evaluation of other non-standardized and personalized data.
fuzzy classification;combination weighting;statistical analysis;Chinese medicine constitution
2015-10,Accepted 2016-01.
10.3778/j.issn.1673-9418.1510035
A
TP182
*The Key Project of Science and Technology Development Plan of Beijing Municipal Education Commission under Grant No. KZ201510011011(北京市教委科技計劃重點項目);the Comprehensive Reform Project of Personnel Training of Beijing Technology and Business University-Research Center of Chinese Cosmetic Collaborative Innovation under Grant No.19008001060(北京工商大學促進人才培養綜合改革項目-中國化妝品協同創新研究中心).
CNKI網絡優先出版:2016-01-27,http://www.cnki.net/kcms/detail/11.5602.TP.20160127.1635.002.html