999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聚類分析方法在食堂消費數據中的應用研究

2015-01-14 07:29:56
科技視界 2015年12期
關鍵詞:分析

張 琳

(遵義師范學院計算機與信息科學學院,貴州 遵義563000)

1 聚類分析方法

聚類分析(cluster analysis)是一組將研究對象分為相對同質的群組(clusters)的統計分析技術[1]。聚類分析方法具有簡單、直觀的特點,主要應用于探索性的研究,其中變量的選擇有較大的影響。

2 聚類分析基本思想

以學生的消費記錄為研究對象,使用聚類分析知識進行研究,主要使用K-Means算法[2]:

輸入:聚類個數k以及包含n個數據對象的數據集;輸出:滿足目標函數值最小的k個聚類。

(1)計算任意兩個數據對象間的距離d(xi,xj);

(2)計算每個數據對象的密度參數,把處于低密度區域的點刪除,得到處于高密度區域的數據對象的集合D;

(3)把處于最高密度區域的數據對象作為第1個中心z1;

(4)把z1距離最遠的數據對象作為第2個初始中心z2,z2∈D;

(5)令 z3 為滿足 max(min(d(xi,z1), d(xi,z2)), i=1,2,…,n 的數據對象 xi,z3∈D;

(6)令 z3 為滿足 max(min(d(xi,z1), d(xi,z2)), d(xi,z3)), i=1,2,…,n 的數據對象 xi,z4∈D;

(7)令 zk 為滿足 max(min(d(xi,zj))), i=1,2,…,n, j=1,2,…,k-1 的 xi,zk∈D;

(8)從這k個聚類中心出發,應用k-means聚類算法,得到聚類。

一般采用均方差作為目標測度函數:其中E是數據集中所有對象的均方差之和;p是代表對象的空間中的一個點。

3 聚類分析方法在食堂消費數據中的應用

本文主要使用SPPS工具來進行聚類分析與研究。

SPSS(Statistical Product and Service Solutions,統計產品與服務解決方案),是一種實現數據分析的多功能軟件[3]。

SPSS for Windows是一種運行在Windows系統下的社會科學統計軟件包,從1968年由美國斯坦福大學開發使用至今,在全球已經擁有數以萬計的用戶,在通信、醫療、銀行、證券、保險、制造、商業、市場研究、科學教育等眾多的行業領域都得以有效的應用,目前,SPSS已成為世界上應用最廣泛的專業統計軟件之一。SPSS軟件包采用窗口操作界面,用戶操作使用方便,包括數據整理、分析過程、結果輸出等功能。面對龐大的數據量,SPSS軟件的功能不斷完善,其統計分析方法不斷充實,涵蓋面越來越廣,輸出數據表格圖文并貌,大大提高了統計分析工作的效率。

SPSS的基本功能包括數據管理、統計分析、圖表分析、輸出管理等,具體內容包括描述統計、列聯分析,總體的均值比較、相關分析、回歸模型分析、聚類分析、主成份分析、時間序列分析、非參數檢驗等多個大類,每個類中還有多個專項統計方法。SPSS設有專門的繪圖系統,可以根據使用者的需要將給出的數據繪制各種圖形,能夠滿足用戶的不同需求[4]。

聚類分析工具的應用:

1)打開SPSS軟件,并輸入數據,設置變量名稱,在學生消費數據中選擇了三十名學生的月消費情況作為分析目標,如下圖所示為部分消費情況,其中男女各15名,將性別男、女處理為二值型數據分別標記為 1、2。

2)每個變量設置的部分格式:

(1)名稱:學號,類型:字符串,長度:11,對齊方式:左,測量單位:名稱;

表1 待處理的數據

(2)名稱:性別,類型:數值,長度:1,對齊方式:右,測量單位:名稱;

(3)名稱:月消費額,類型:數值,長度:6,對齊方式:右,測量單位:尺度;

(4)名稱:交易次數,類型:數值,長度:5,對齊方式:右,測量單位:尺度。

3)選擇“分析”—“聚類分析”—“快速聚類K”進行分析,則在出現的界面中進行如下設置:

將”變量”設置為:性別、月消費額、交易次數。

將“方法”設置為:迭代與聚類。

將“聚類數目”設置為:2。

4)對“方法”、“迭代”選項進行設置,點擊“確定”即出現運算過程及相應結果:

(1)初始聚類中心

“1”類:性別為“2”(女),月消費額為 278.90,交易次數為 155。

“2”類:性別為“1”(男),月消費額為 520.10,交易次數為 171。

(2)迭代過程

在聚類中心的變化分別為63.006、51.977。

由于最大絕對坐標的變化是.000,當前迭代是2,最小距離是241.732,初始中心實現了最小的變化。

(3)最終聚類中心

“1”類:性別為“2”(女),月消費額為 341.33,交易次數為 164。

“2”類:性別為“1”(男),月消費額為 468.13,交易次數為 170。

從上述運算結果可看到30個觀測量都有效,并沒有丟失任何一個觀測量。最終,通過以上分析可以看出學生的消費情況可以分為兩類,第一類性別為2,即女生每月消費大概為341.33元,平均交易164次,而第二類性別為1,即男生每月消費大概為468.13元,平均交易170次。從上我們可以看出男生與女生的每月消費情況是不同的,男生消費較多,平均交易也自然的較多,針對食堂來說就應該針對男女生不同的特點,合理安排消費類別,促進學生進行消費。

總之,使用SPSS軟件中的聚類功能對校園一卡通數據進行分析,能有效地快速分析出學生消費的一些特征,對這部分知識的研究這里僅進行了粗略的分析,在今后的時間里再進行深入研究。

[1]李響.數據挖掘技術淺析[J].計算機光盤軟件與應用,2012(12):46.

[2]袁方,周志勇,宋鑫.初始聚類中心優化的 k-means算法[J].計算機工程,2007,33(3):65-66.

[3]劉震.SPSS統計分析與應用[M].電子工業出版社,2011:4.

[4]陳良英.關于SPSS軟件在市場調查統計應用的研究[J].中小企業管理與科技,2008(11):19.

猜你喜歡
分析
禽大腸桿菌病的分析、診斷和防治
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
經濟危機下的均衡與非均衡分析
對計劃生育必要性以及其貫徹實施的分析
現代農業(2016年5期)2016-02-28 18:42:46
GB/T 7714-2015 與GB/T 7714-2005對比分析
出版與印刷(2016年3期)2016-02-02 01:20:11
中西醫結合治療抑郁癥100例分析
偽造有價證券罪立法比較分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 欧美三級片黃色三級片黃色1| 精品伊人久久久大香线蕉欧美| 亚洲中文字幕国产av| 91免费片| 亚洲欧美日韩成人在线| 国产精品美人久久久久久AV| 国产精品第页| 九九热视频精品在线| 99视频精品全国免费品| 国产一区二区三区夜色| 夜夜操狠狠操| 久久久久久久久久国产精品| 欧美在线黄| 又粗又硬又大又爽免费视频播放| 欧美激情成人网| 国产高清不卡视频| 日韩欧美国产精品| 国产99热| 亚洲成人77777| 国产综合日韩另类一区二区| 国产一区二区三区日韩精品| 国产成人精品日本亚洲| 亚洲无码在线午夜电影| 国产成人久久综合777777麻豆| 全裸无码专区| 亚洲国产精品一区二区第一页免| 亚洲欧美h| 亚洲日韩AV无码一区二区三区人| 亚洲综合片| 亚洲人在线| 色综合热无码热国产| 综合社区亚洲熟妇p| 亚洲伊人久久精品影院| 沈阳少妇高潮在线| 免费观看成人久久网免费观看| 乱系列中文字幕在线视频| 精品人妻一区二区三区蜜桃AⅤ| 91年精品国产福利线观看久久 | 国产又粗又猛又爽视频| 亚洲无码91视频| 亚洲一区二区日韩欧美gif| 免费全部高H视频无码无遮掩| 成人午夜福利视频| 国模视频一区二区| 黄色在线不卡| 无码乱人伦一区二区亚洲一| 免费国产在线精品一区| 中文无码精品A∨在线观看不卡| 国产福利一区视频| 精品夜恋影院亚洲欧洲| 国产精品无码影视久久久久久久 | 中美日韩在线网免费毛片视频 | 国产91高跟丝袜| 丁香六月激情婷婷| 98超碰在线观看| 99人妻碰碰碰久久久久禁片| 亚洲欧美日韩视频一区| 无码'专区第一页| 国产91麻豆免费观看| 亚洲天堂成人| 成人看片欧美一区二区| 国产成人av一区二区三区| 亚洲人成网站18禁动漫无码| 91无码网站| 网久久综合| 精品伊人久久久香线蕉 | 国产免费久久精品99re丫丫一| 精品国产免费观看一区| 亚洲第一香蕉视频| 久久这里只精品国产99热8| 99精品国产高清一区二区| 亚洲不卡av中文在线| 国产精品护士| 亚洲成人黄色在线| 免费国产不卡午夜福在线观看| 成人中文字幕在线| 美女毛片在线| 国产成人AV男人的天堂| 国产无码精品在线播放| 天天色天天操综合网| 91精品久久久无码中文字幕vr| 在线观看国产网址你懂的|