999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于食堂信息的數據挖掘應用初步設計

2008-12-31 00:00:00李明東黃曉燕
電腦知識與技術 2008年30期

摘要:大學食堂的數據信息分析系統采用WAKE數據分析工具,數據庫采用MYSQL進行設計,采用面向對象的程序設計方法。設計過程中采用組件的方法尋找合適的分析算法,將其嵌入到WAKE中去,討論建立合適的模型。對學生飲食情況能夠實時掌握,了解,能夠更好的為學生提供服務,保證學生有更好的身體情況,更充分精力來學習。

關鍵詞:數據挖掘;數據倉庫;食堂信息;CRISP-DM

中圖分類號:TP311文獻標識碼:A 文章編號:1009-3044(2008)30-0543-02

Based on the Information Canteens Preliminary Design Data Mining Application

LIU Chao,LI Ming-dong, HUANG Xiao-yan

(School of Computer,China West Normal University,Nanchong 637002,China)

Abstract: University canteen data analysis system used WAKE data analysis tool, used MYSQL database design, using object-oriented programming methods. Components used in the design process to find a suitable method analysis algorithm, its embedded into WAKE, so as to discuss the establishment of a suitable model. The students can immediately grasp the situation diet, understanding, can provide better services for students, ensure that the students have better physical condition, more energy to learning.

Key words: Data Mining; Data Warehouse;Information Canteen;CRISP-DM

1 簡介

數據挖掘已經有了很長的發展時間,現在已在各行各業有了很多的應用,像檢測欺騙,評估風險,產品零售,醫療,氣象等方面,尋找有效的分類和大量數據之間的聯系。在國家安全領域,數據挖掘作為一種工具可以識別潛在洗錢信息,可以通過旅途記錄或移居信息跟蹤有可能的恐怖襲擊。數據挖掘作為一個先進的工具在使用過程中有很多的限制,一個是數據挖掘可以揭示部分間的聯系,但他不能告訴用戶的這些部分的價值和意義,這些部分的決定必須依靠用戶。第二個是可以證明交易和變量之間的聯系,但無法證明不經意的聯系。

數據挖掘過程中我們應盡可能的注意以下幾個方面的問題,數據質量在分析中的的作用,能不能代表實際情況,噪聲大不大,能不能顯示意外情況;還有就是數據挖掘軟件和數據倉庫的協調問題,他們很多都是使用了不同的代理;數據挖掘的問題延伸,使用數據庫得到的目的發現偏離本來的目的,即在工程進行中發現了更有價值的目標;第四個方面是隱私方面的問題,會不會產生影響個人生活的問題,比如國家的安全部門會使用商業數據,到處安裝的攝像頭對一部分人來說就很不習慣。

2 系統需求分析

現在的高校食堂逐步走向社會,壟斷地位開始動搖,提高服務,爭強競爭力的任務刻不容緩。高校食堂與學生的生活,學習息息相關,從中發現與學生的問題或相關聯的方面應該成為提高學生素質的一個重要參考方面。

我們針對學校食堂出現的很多問題,比如學生在高峰時間排隊時間過長,但上千萬的學生天天,月月如此,累加時間巨大不能忽略,如果此時間能有20%轉化為學習時間,類比與工時,將會創造出巨大的財富。食堂信息系統與學生信息數據庫連接,嘗試是否能夠發現學生的飲食與成績之間的關系,學生的飲食習慣對學生的學業等各方面是否會造成直接的影響;根據學生的在食堂的就餐情況嘗試能否發現學生是否出現異常情況,如果開始一個階段飲食比較差,但后來提高上去了,可能是該學生有了工作機會;反之,如果原來比較好,后來水平降了下去,可能就是有問題出現了,這時可能就需要特別的關注,學生比較多,輔導員不可能面面俱到,但我們通過該生的飲食變化就可以發現問題。

3 系統架構

我們擬用SQL Server 2005建立關系型的的數據倉庫,因為它的數據庫引擎包含一些對數據倉庫樣式應用程序設計和維護大有幫助的功能。并且還有很多功能,比如:

1) 對于超大型的表而言,表分區可快速數據的加載速度,并簡化維護過程;2) 輕松創建報告服務器;3) Transact-SQL 方面的改進包括新增的數據類型和新增的分析功能;4) 聯機索引操作;5) 細化備份/還原操作;6) 快速初始化文件。

做接口和界面時我們使用VC作為開發工具,效率比較高。運行系統為WINDOWS XP 個人版。

4 數據挖掘過程

在數據挖掘項目實施的過程中,業界有一個公認的方法論CRISP-DM(Cross Industry Standard Process for Data Ming,跨行業數據挖掘標準流程),從名稱上可以看到,此模型的定義比較通用 ,CRISP-DM流程模型包括了六個步驟,涵蓋了數據挖掘的整個過程,它們是:商業理解、數據理解、數據準備、建立模型、模型評估、模型部署。我們依此過程來對食堂信息進行數據挖掘。

4.1 商業理解(Business Understanding)

即為進行更詳盡的需求分析,最初的階段集中在理解項目目標和從業務的角度理解需求,同時將這個知識轉化為數據 ,挖掘問題的定義和完成目標的初步計劃。

這個過程主要是對需求的分析,在這個過程中我們確定我們的目標是獲取從食堂信息中得到的關于學生的就餐信息,以方便以后改進服務質量等。

4.2 數據理解 (Data Understanding)

數據理解階段從初始的數據收集開始,通過一些活動的處理,目的是熟悉數據,識別數據的質量問題,首次發現數據的內部屬性,或是探測引起興趣的子集去形成隱含信息的假設。

我們從搜集到的數據發現其中只有卡號,交易日期,交易金額,交易設備號,余額等幾個有用的信息,數據比較高,很完整,沒有缺少某個屬性的現象。

4.3 數據準備 (Data Preparation)

數據準備階段包括從未處理數據中構造最終數據集的所有活動。這些數據將是模型工具的輸入值。這個階段的任務有個能執行多次,沒有任何規定的順序。任務包括表、記錄和屬性的選擇,以及為模型工具轉換和清洗數據。

我們使用SSIS(SQL Server Integration Services Samples)對數據進行數據清洗,SSIS提供了多個組件對數據清洗,這里我們采用C#編寫自定義組件,然后嵌入SSIS工具箱,這樣功能比較強大,而且靈活。

4.4 建模(Modeling)

在這個階段可以選擇和應用不同的模型技術,模型參數被調整到最佳的數值。有些技術在數據形成上有特殊要求,因此需要經常跳回到數據準備階段。

這個過程中我們使用powerdesigner進行建模,微軟的Visio也挺易用,不過用的較少。這個過程不是一步完成的,建成后需要使用評分函數進行反復評估,多次對模型進行改造,使用不同的數據樣本對模型進行評測,直到得出最適合的模型。

4.5 評估(Evaluation)

到項目的這個階段,你已經從數據分析的角度建立了一個高質量顯示的模型。在開始最后部署模型之前,重要的事情是徹底地評估模型,檢查構造模型的步驟,確保模型可以完成業務目標。

我們使用預測型評分函數對模型進行評估,在這個過程中我們對所建立的模型進行評估,看是否能達到我們所需要的程度,關鍵目的是確定是否有重要業務問題沒有被充分的考慮。在這個階段結束后,一個數據挖掘結果使用的決定必須達成。

4.6 模型部署 (Deployment)

通常,模型的創建不是項目的結束。模型的作用是從數據中找到知識,獲得的知識需要便于用戶使用的方式重新組織和展現。根據需求,這個階段可以產生簡單的報告,或是實現一個比較復雜的、可重復的數據挖掘過程。在很多案例中,這個階段是由客戶而不是數據分析人員承擔部署的工作。

此時我們生成圖形化的表示方式,以便能直觀的看到我們對數據的分析結果。

5 數據挖掘結果分析處理

根據得出的圖形結果我們發現很多問題,比如從結果中我們能看到在某一時間段內,某臺設備對應了很多卡號,得出此處浪費了比較多的時間,這時候就需要食堂方面做一些分流工作,以便學生能節約較多的時間。

我們還可以得到平時飲食消費在中等的同學學習成績比較好一點,根據食堂的消費標準,我們可以發現用這種消費屬于飲食上葷素搭配比較均勻的那一種,由此我們可以指導學生進行科學就餐。

同樣,我們甚至可以通過就餐的消費來確定貧困生的補助,因為只有貧困生才會經常性的在食堂打消費額很低的飯菜,或者關注偶爾來食堂打飯,同樣消費額很低的學生,這部分可能都沒有經濟條件來食堂吃飯。

食堂方面根據食堂的消費額的變化可以發現食堂那個窗口出了問題,可能是此窗口的飯菜不和學生口味,或者此窗口的工作人員態度不好引起反感,導致此窗口效益下降,從而能都有針對性的提高服務質量。

6 總結

在此初步設計過程中,我們發現了需要很多方面的綜合知識,其中在需求分析中與食堂管理人員的交流,征求他們的對問題的態度意見是此項目成功的關鍵開始。而且在考慮到以后做評分函數時所需要設定的參數值,和專業管理人員的交流顯得尤其重要。在開發過程中全部使用微軟開發的技術,避免兼容,格式轉化等一些額外的問題。

本文是在開發初始階段對項目過程的設計,在開發過程中會遇到更多的問題,比如三個方面的數據整合,屬性的值得設定就是比較困難的地方。可以想像該項目的復雜性及困難性,在開發過程中需要各方面的支持與幫助。作為一個信息分析,輔助決策系統,更是需要在以后的應用中不斷進行更新,不斷的完善。

注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文

主站蜘蛛池模板: 97在线公开视频| 精品无码人妻一区二区| 欧美www在线观看| 国产成人亚洲综合A∨在线播放| 亚洲最黄视频| 91小视频在线播放| 日本一区高清| 91国语视频| 五月婷婷综合色| 国产又粗又猛又爽视频| 精品无码一区二区三区在线视频| 香蕉eeww99国产在线观看| 亚洲无限乱码一二三四区| 免费国产无遮挡又黄又爽| 亚洲成肉网| 国产香蕉97碰碰视频VA碰碰看 | 亚洲国产日韩在线成人蜜芽| 波多野结衣一区二区三区四区| 国产剧情国内精品原创| 欧美色图久久| 久久久久九九精品影院| 亚洲男人的天堂视频| 国产不卡在线看| 久久久亚洲国产美女国产盗摄| 亚洲国产精品一区二区高清无码久久| 日本精品视频一区二区| 国内精品伊人久久久久7777人| 国产主播在线一区| 成年人免费国产视频| 高清精品美女在线播放| 中文字幕亚洲另类天堂| 免费播放毛片| 久久香蕉国产线看精品| 国产主播在线一区| 91在线中文| 91久久国产热精品免费| 国产欧美日韩另类精彩视频| 久久黄色免费电影| 国内99精品激情视频精品| 成人在线视频一区| 免费一级α片在线观看| 欧美成人手机在线视频| 久久亚洲美女精品国产精品| AV无码无在线观看免费| 小说区 亚洲 自拍 另类| 人妻丰满熟妇av五码区| 亚洲大尺码专区影院| 欧美日韩北条麻妃一区二区| 日本一区二区三区精品视频| 亚洲欧美日本国产综合在线 | 美女无遮挡免费网站| 亚洲国产午夜精华无码福利| 亚洲精品无码抽插日韩| 亚洲精品无码久久久久苍井空| 国产精鲁鲁网在线视频| 久久综合色视频| 欧美无专区| 国产特一级毛片| 亚洲精品中文字幕午夜| lhav亚洲精品| 婷婷伊人五月| 欧美性色综合网| 性欧美久久| 中文字幕人妻av一区二区| 国产成人午夜福利免费无码r| 成人国产精品网站在线看| 无码内射中文字幕岛国片| 国产精品大尺度尺度视频| 手机精品视频在线观看免费| 玖玖精品视频在线观看| 亚洲娇小与黑人巨大交| 亚洲中文字幕97久久精品少妇| 99视频只有精品| 伊人久久福利中文字幕| 欧美日韩国产系列在线观看| A级全黄试看30分钟小视频| 免费视频在线2021入口| 欧美国产日韩在线| 一区二区三区在线不卡免费| 久久黄色影院| 成人噜噜噜视频在线观看| 久久人人妻人人爽人人卡片av|