夏克強
摘 要 本文建立了葡萄酒評價的符號秩檢驗和灰色聚類分析模型。為了得到每組評酒員對各個酒樣品的客觀評價分數,對每組評酒員對酒樣品的評價分數做平均值,得到該酒樣品總體評分,然后將兩組評酒員的評價結果作差,得到的差值作成對數據的符號秩檢驗,最后采用SAS軟件計算出符號秩檢驗中 = 0.0085,小于顯著性水平 = 0.05,故不接受原假設,即兩組評酒員的評價結果有顯著性差異;對于置信度的問題,我們對各個評酒員對酒樣品的評分作方差分析,分別計算出第一、二組評分結果的方差和分別為1409.3、821.1,易知第一組的方差和遠大于第二組,所以第二組的評價結果更穩定,也更可信。將第二組評酒員對紅葡萄酒的評價結果進行等級分類,再采用灰色聚類分析的方法對紅葡萄的樣品進行分級,結合其釀造出的葡萄酒的品質,即該葡萄樣本所釀造的葡萄酒的級別,來確定該葡萄酒的級別。
關鍵詞 葡萄酒評價 符號秩檢驗 灰色聚類分析
中圖分類號:TS262.6 文獻標識碼:A DOI:10.16400/j.cnki.kjdkz.2015.12.066
Abstract This paper established a signed rank test and gray clustering model wine evaluation. In order to get each group wine-tasting each wine sample an objective evaluation score for each group of wine-tasting wine samples for the evaluation scores do mean to give the wine sample overall score, and then the evaluation results of the two groups for wine-tasting poor, made the difference to get the data signed rank test, and finally the use of SAS software to calculate the signed-rank test = 0.0085, and less than the significance level = 0.05, it does not accept the original hypothesis that the evaluation results of two wine-tasting are significant differences; For the question of confidence, and we each wine-tasting wine samples ratings for variance analysis, were calculated first and second set of score results of variance and were 1409.3,821.1, easy to know and much larger than the first group variance The second group, so the evaluation results of the second group is more stable and more reliable. The second group of wine-tasting red wine for the evaluation of the results will be classification, then using gray cluster analysis of the samples were graded red grapes, combined with its wine is quality, both in the grape samples wines level, to determine the level of the wine.
Key words wine evaluation; signed rank test; grey cluster analysis
1 問題重述
1.1 研究課題背景
針對主觀性評價問題和多目標問題,由于其繁瑣性和主觀性,對我們來說,很難透過現象看本質,雖然層次分析法在PHP中可以通過得分函數構成。但就其缺點而言,我們認為對這類模糊性問題采取多目標分層次的解決方式,而利用統計分析里的方差分析和灰色關聯度分析能夠合理處理此類問題。對于未來預測性和多目標問題可以得到很好的預見性效果。同時也為多領域多目標問題中提供一個較好的模型。
本文的模型也可適當地對研究人事、招聘及高校評選的處理方法有所幫助和提高。
2 問題分析
因為兩組品酒員對酒樣的評分是成對比較,且對評分并不要求成對數據之差服從正態分布,只要求對稱分布,故我們采用統計學中Wilcoxon符號秩檢驗來解釋兩組品酒員對葡萄酒的評價有無顯著性差異。
假設兩組品酒員對葡萄酒的評價有顯著性差異,就需要確定哪組品酒員的評價更可信,為此對品酒員評價數據做置信度分析——方差分析,由于葡萄酒評價數據無法進行復測,就要利用matlab軟件的信度分析功能,分別對第一組和第二.組的評分進行可信度分析,最后通過圖形直觀的反映結果。
3 模型建立
3.1 符號秩檢驗模型的建立
將兩組評酒員分別看作兩個整體、,對每個紅葡萄酒樣品進行評價,對每個紅葡萄酒樣品的評價結果通過組內每一位品酒員的評分的均值 = 來刻畫,同樣對每個紅葡萄酒樣品的評價結果用均值 = 來刻畫,從而得到兩組評酒員對每種樣品酒的評價結果,建立兩組評酒員對紅葡萄酒的評價。
對同一酒樣品得到一對數據。可知兩對數據之間差異是由各種因素,如葡萄酒的外觀、香氣、口感、材料成分等因素引起的。由于各酒樣品的特性有廣泛的差異,就不能將第一組評酒員對27 種紅葡萄酒的評價結果看成是同分布隨機變量的觀測值。因而表1中第一行不能看成是一個樣本的樣本值,同樣第二組的數據也不能看成是同一個樣本的樣本值,而同一對中兩個數據是同分布隨機變量的觀測值,他們的差異是由于兩組品酒員的水平引起的。為鑒定他們的評價結果有無顯著性差異,可使用基于成對數據的逐對比較法。以紅葡萄酒樣品為例,有27對相互獨立的評價結果:(,),(,),…,(,),令 = , = ,…, = ,則,,…,相互獨立,所以我們對,,…,進行單因素的符號秩檢驗。
再對和中的元素分別求和得到方差和,用方差和對比得到對于同一批紅葡萄酒兩組的不同評價水平。方差和小的穩定性好,相對來說比另一組的評價結果更可信。
3.3 灰色聚類分析模型的建立
在附件2中我們可以得到,對于紅葡萄酒,有對應的30個一級指標,為了使結果更具有客觀性,我們將葡萄酒的質量也作為一級指標。對于這31個一級指標,其中多酚氧化酶活力、褐變度、總酚、固酸比、出汁率這5個指標與葡萄酒質量呈負相關,其余26個指標都與葡萄酒質量呈正相關。
4 模型求解
4.1 符號秩檢驗模型的求解
對于該模型,我們首先作出同一酒樣品分別由兩組品酒員,得到的評價結果之差,列于表1的第三行。根據建立模型的需要假設
: = 0,:≠0
我們取 = 0.05,并采用SAS軟件編程處理,具體程序見附錄程序1。
在SAS中運行的結果如圖1:
結果顯示符號秩檢驗對應的P為0.0085,小于顯著性水平0.05,故不接受原假設,即認為這兩組品酒員分別對紅葡萄酒的評分有顯著性差異。
4.2 方差分析模型的求解
運用MATLAB軟件編程求解,得到,。
對于紅葡萄酒而言:元素的和為1409.3,元素的和為821.1。由此可以得出,第一組的方差和遠遠大于第二組。
4.3 灰色聚類分析模型的求
我們先對紅葡萄酒質量的評價結果按評分從小到大排列得到表1:
根據等級分級標準:高級葡萄酒:9、23、20;上等葡萄酒:3、17、2、26、14、19、5、21、4、24、27、22;中等葡萄酒:16、10、13、1、12、25、6、15、7、8;下等葡萄酒:18、11。
對于每類葡萄中的元素,結合該葡萄樣本所釀造的葡萄酒的級別,來確定該葡萄的級別。然后再根據每類葡萄中葡萄樣本級別的比例來確定該類葡萄的級別。對應葡萄酒的等級分類,我們根據葡萄的聚類分析也將葡萄分成高級、上級、中級、下級。
紅葡萄的分類結果:高級紅葡萄:9、23、4、20;上級紅葡萄:3、17、12、15、18、24、5、19、13、21、2、26;中級紅葡萄:10、16、27、1、14、25、6、7、22、8;下級紅葡萄:11。
參考文獻
[1] 韓中庚.數學建模方法及其應用.高等教育出版社,2005.
[2] 姜啟源等.數學建模.高等教育出版社,2011.