999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘技術(shù)在高校網(wǎng)站信息的實踐應(yīng)用研究

2022-02-06 19:11:28何文東
產(chǎn)業(yè)與科技論壇 2022年9期
關(guān)鍵詞:數(shù)據(jù)挖掘數(shù)據(jù)庫用戶

□何文東

高等教育信息化是教育現(xiàn)代化的重要形式之一,由于計算機網(wǎng)絡(luò)技術(shù)、大數(shù)據(jù)技術(shù)在教育領(lǐng)域得到廣泛應(yīng)用,高校網(wǎng)站紛紛進行轉(zhuǎn)型,以形象建設(shè)窗口轉(zhuǎn)變?yōu)楦咝P畔⒌妮d體,旨在為高校的內(nèi)外用戶提供針對性的、個性化的信息,并通過數(shù)據(jù)發(fā)掘技術(shù)來適配多元化的數(shù)據(jù)需求。在實踐應(yīng)用層面理論也層出不窮,本文在這一趨勢下結(jié)合數(shù)據(jù)挖掘技術(shù)的發(fā)展情況及技術(shù)特性,針對其在高校網(wǎng)站信息的實踐應(yīng)用進行研究。

一、相關(guān)概念綜述

(一)數(shù)據(jù)發(fā)掘技術(shù)概念。數(shù)據(jù)挖掘技術(shù)一般是指在大量數(shù)據(jù)中利用算法搜索隱藏的、隱含的信息的技術(shù),與計算機科學(xué)緊密相關(guān),例如統(tǒng)計技術(shù)、在線分析技術(shù)、情報檢索技術(shù)、智能學(xué)習(xí)技術(shù)、模式識別等技術(shù)。

數(shù)據(jù)挖掘技術(shù)是從大量的數(shù)據(jù)集中識別有效的、新穎的、潛在有用的過程叫做數(shù)據(jù)挖掘技術(shù)。它涉及面很廣,包括機器學(xué)習(xí)、數(shù)據(jù)庫、模式識別、粗糙集、模糊數(shù)學(xué)等相關(guān)技術(shù)。通過對計算機系統(tǒng)內(nèi)的數(shù)據(jù)進行分析、分類,找到數(shù)據(jù)在運行和存儲時的規(guī)律,數(shù)據(jù)挖掘技術(shù)主要包含三個步驟,目標(biāo)數(shù)據(jù)、提煉規(guī)律、規(guī)律體現(xiàn)。第一步整理目標(biāo)數(shù)據(jù),從相關(guān)數(shù)據(jù)源中選取必要的數(shù)據(jù)整合成用于數(shù)據(jù)挖掘的數(shù)據(jù)集合;第二步是通過統(tǒng)計技術(shù)、在線分析技術(shù)等方法將數(shù)據(jù)集合中所蘊含的規(guī)律找出來;第三步將數(shù)據(jù)結(jié)合用戶需求,借助用戶可理解的形式,將規(guī)律可視化。數(shù)據(jù)挖掘技術(shù)按任務(wù)特點進行分類,主要分為關(guān)聯(lián)數(shù)據(jù)分析、聚類數(shù)據(jù)分析、分類數(shù)據(jù)技術(shù)、異常數(shù)據(jù)分析、特異群組數(shù)據(jù)分析及演變數(shù)據(jù)分析等。根據(jù)數(shù)據(jù)挖掘技術(shù)處理對象差異,共有3種結(jié)構(gòu)挖掘、內(nèi)容挖掘、使用挖掘為常見的運用模式方式,在高校網(wǎng)站中也得到普遍運用,在數(shù)據(jù)挖掘過程中一般關(guān)聯(lián)數(shù)據(jù)技術(shù)、分類數(shù)據(jù)技術(shù)使用較多,網(wǎng)站數(shù)據(jù)相對于傳統(tǒng)數(shù)據(jù)庫,具有內(nèi)容龐雜、呈現(xiàn)復(fù)雜的特點,這就要求對每個站點都需要獨立設(shè)計結(jié)構(gòu)。

由于數(shù)據(jù)挖掘技術(shù)是一種綜合技術(shù),通常用在網(wǎng)站數(shù)據(jù)采集上,也就是通過數(shù)據(jù)技術(shù)獲取網(wǎng)站數(shù)據(jù),并進行初步篩選和整理,在一定程度上數(shù)據(jù)挖掘可通過歸納單個用戶及眾多用戶的行為數(shù)據(jù)針對用戶的后續(xù)行為進行預(yù)測,在一定程度上有助于數(shù)據(jù)使用者作出決策和判斷,并且有助于優(yōu)化網(wǎng)站使用者的使用體驗。

(二)高校網(wǎng)站信息重要技術(shù)環(huán)節(jié)分析。現(xiàn)在高校網(wǎng)站技術(shù)普遍使用半結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu),半結(jié)構(gòu)數(shù)據(jù)化數(shù)據(jù)模型是一種適于數(shù)據(jù)庫集成的數(shù)據(jù)模型,通常適合于描述包含在兩個或多個數(shù)據(jù)庫中的數(shù)據(jù),作為一種標(biāo)記服務(wù)的基礎(chǔ)模型,通常用于Web上共享信息。構(gòu)建適用于半結(jié)構(gòu)化數(shù)據(jù)源模型,在高校網(wǎng)站信息數(shù)據(jù)服務(wù)中是亟待解決的問題之一,這是數(shù)據(jù)挖掘中最重要的技術(shù)環(huán)節(jié)。

二、數(shù)據(jù)挖掘技術(shù)在高校網(wǎng)站信息的實踐應(yīng)用

(一)關(guān)于數(shù)據(jù)的篩選及整理。數(shù)據(jù)發(fā)掘技術(shù)的應(yīng)用基礎(chǔ)是對數(shù)據(jù)進行搜集和初步篩選,需要明確的是需要研究用戶的表達方式,由于表達方式的差異在通常會造成數(shù)據(jù)量的不確定性和顯著差異性。因此在數(shù)據(jù)挖掘前需要針對數(shù)據(jù)做一定的預(yù)先處理,處理用戶針對網(wǎng)站進行訪問時的最初原始數(shù)據(jù),以此保證算法能夠有效提取相應(yīng)數(shù)據(jù),同時,在網(wǎng)站設(shè)計時就需要一并將數(shù)據(jù)預(yù)處理及數(shù)據(jù)挖掘考慮在內(nèi),從而有針對性提升數(shù)據(jù)的使用效率。

一般而言高校網(wǎng)站服務(wù)器具有網(wǎng)站日志記錄功能,而這也是數(shù)據(jù)最基礎(chǔ)、最簡單、最直接的來源,具體是根據(jù)用戶的訪問頻次、訪問時長、訪問習(xí)慣等相應(yīng)訪問數(shù)據(jù)會被網(wǎng)站日志記錄。將網(wǎng)站日志充分利用并有意識的存儲使用,與此同時,也需要將收集到的信息進行預(yù)處理,從而降低數(shù)據(jù)的失真程度。并且針對瀏覽頁面及用戶設(shè)定頁面的訪問路徑進行完善。

(二)構(gòu)建完整的數(shù)據(jù)挖掘模式。通過運用成熟的數(shù)據(jù)發(fā)掘算法針對高校網(wǎng)頁流量數(shù)據(jù)分析來構(gòu)建完整的數(shù)據(jù)模式。尤其是要著重挖掘時間序列相關(guān)數(shù)據(jù),時間序列建模及時間預(yù)測是構(gòu)建完整的數(shù)據(jù)模式的基礎(chǔ)目標(biāo),針對高校網(wǎng)站訪問量的整體趨勢和訪問規(guī)律特點的把握是具體數(shù)據(jù)測量的重要節(jié)點。此外,數(shù)據(jù)模式的構(gòu)建需要參考整體網(wǎng)站的結(jié)構(gòu),在高校網(wǎng)站首頁的訪問中首頁是最高頻的訪問頁面,而且大部分高校內(nèi)用戶如教師、學(xué)生們因為便利性普遍將首頁加載在各類瀏覽器的收藏夾,但是在首頁的停留時間普遍較低,首頁起到的是導(dǎo)航和分配流量的作用,這需要在構(gòu)建及數(shù)據(jù)挖掘模式時充分考慮到首頁的作用。

以高校網(wǎng)站信息在高校招生的作用為實例,建立高校招生數(shù)據(jù)虛擬倉模型時,旨在通過數(shù)據(jù)及數(shù)據(jù)挖掘優(yōu)化招生決策及效率,需要利用概念模型、邏輯分析模型及物理模型構(gòu)建招生系統(tǒng)、教務(wù)系統(tǒng)及學(xué)生管理、院系系統(tǒng)四位一體的綜合數(shù)據(jù)倉,從而構(gòu)建起完整的招生數(shù)據(jù)挖掘模式。

(三)選擇合理的關(guān)聯(lián)規(guī)則算法。仍以高校招生舉例,在高校招生期間,高校網(wǎng)站傳達出的信息在一定程度上決定了招生工作的成敗。而需要大量的數(shù)據(jù)分析來佐證高校網(wǎng)站信息透傳的有效程度,不僅要充分考慮到學(xué)生、學(xué)生家長的信息數(shù)據(jù)需求,還要給其擇校擇專業(yè)提供信息支持,并將挖掘出來的信息和現(xiàn)有的院系專業(yè)情況及社會就業(yè)前景等信息相結(jié)合給予其全面的參考,幫助高校在招生期間有的放矢地宣傳招生政策,為學(xué)生及家長給予較為專業(yè)的擇校擇專業(yè)指導(dǎo)。這就需要綜合運用關(guān)聯(lián)規(guī)則算法,從用戶提供的各種數(shù)據(jù)找出數(shù)據(jù)間的關(guān)聯(lián)點,以此為起點構(gòu)建圖形,從而給予其可視化的數(shù)據(jù)呈現(xiàn)和有效信息。

(四)高校網(wǎng)站信息不斷迭代。對于高校網(wǎng)站的不斷優(yōu)化和改進,一般在數(shù)據(jù)挖掘維度需要使用模式分析法來分析,針對已有的數(shù)據(jù)模型不斷迭代,在原有的數(shù)據(jù)基礎(chǔ)上,針對新收集的信息進行整理和統(tǒng)計,將新的模式融入到高校網(wǎng)站信息的迭代中去,用挖掘出來的數(shù)據(jù)更好地服務(wù)用戶。不斷了解高校網(wǎng)站的內(nèi)部及外部用戶的真實需求及使用趨勢,將固有的數(shù)據(jù)挖掘模式不斷擴充,完善原有的模式,并從不同的數(shù)據(jù)挖掘模式中將最有價值的模式加以利用。例如在高校招生中,研究發(fā)現(xiàn)高校的校外用戶以某城市人群較為集中,則學(xué)校可在招生期間聯(lián)合該城市政府在相關(guān)網(wǎng)站上采取一定的廣告及媒介推介措施增加高校在當(dāng)?shù)氐钠毓饬Χ龋宰畲笙薅任?dāng)?shù)貙W(xué)生,從而實現(xiàn)信息的價值化。

(五)提升高校網(wǎng)站信息的有效性。此外還需要意識到高校網(wǎng)站本身是一個對外展示的窗口及教育資源平臺,因此數(shù)據(jù)挖掘在高校網(wǎng)站自身功能的提升上也具有重要的作用。另外,數(shù)據(jù)挖掘技術(shù)要做好數(shù)據(jù)保密加密工作,同時,將學(xué)校師生納入到其中,通過數(shù)據(jù)傳輸?shù)谋C苄詠硖嵘咝YY源的利用效率,針對例如實驗數(shù)據(jù)、資源數(shù)據(jù)等進行有效保護和綜合利用。

(六)數(shù)據(jù)挖掘技術(shù)在高校網(wǎng)站信息安全的應(yīng)用。高校計算機網(wǎng)絡(luò)病毒在傳播過程中具有一定的規(guī)律性,通過數(shù)據(jù)挖掘可以獲得相關(guān)數(shù)據(jù)進行分析,找到一些蛛絲馬跡,從而進行處理。數(shù)據(jù)挖掘技術(shù)的應(yīng)用非常復(fù)雜,需要分為多個步驟和模塊來進行。創(chuàng)建計算機網(wǎng)絡(luò)病毒防御系統(tǒng),對數(shù)據(jù)進行篩選,從數(shù)據(jù)源和數(shù)據(jù)流中獲得樣本,然后尋找網(wǎng)絡(luò)病毒的入侵特點,將找到的數(shù)據(jù)存入數(shù)據(jù)庫中,進行實時記錄和分析,從中找出入侵行為,防止病毒的攻擊。保證數(shù)據(jù)庫中的數(shù)據(jù)充足,全面收集數(shù)據(jù)和數(shù)據(jù)包。在數(shù)據(jù)庫數(shù)據(jù)相互匹配時再應(yīng)用。如果匹配度較低,說明數(shù)據(jù)庫中存在某種新型病毒,則要將其形成新的數(shù)據(jù)病毒類別,加入數(shù)據(jù)庫。數(shù)據(jù)挖掘模塊是數(shù)據(jù)挖掘系統(tǒng)的核心部分,主要由數(shù)據(jù)挖掘算法和事件庫構(gòu)成。通過構(gòu)建模塊,采集需要的數(shù)據(jù),再將數(shù)據(jù)整理歸納放入事件庫中。然后對事件庫中的數(shù)據(jù)進行深度挖掘,提升病毒防范的透明性。檢測到入侵計算機網(wǎng)絡(luò)的病毒后,還要再進一步進行防御處理,將入侵的具體情況反饋給用戶。此外,后續(xù)處理模塊還能夠如實監(jiān)控系統(tǒng)實時數(shù)據(jù),向管理員發(fā)送郵件進行反饋,方便管理人員進行實時管理和處理。管理員在接到反饋后,可以分析網(wǎng)絡(luò)病毒的類型及其特點,及時更新病毒數(shù)據(jù)庫,逐漸提升計算機系統(tǒng)防御效果。

三、結(jié)語

數(shù)據(jù)挖掘技術(shù)是實踐高校網(wǎng)站信息化的重要舉措之一,將此項技術(shù)和高校網(wǎng)站建設(shè)積極融合其中,并針對實踐運用中出現(xiàn)的問題需求技術(shù)化的整套解決方案是其核心重點。高等教育信息化是教育現(xiàn)代化的重要形式之一,由于計算機網(wǎng)絡(luò)技術(shù)、大數(shù)據(jù)技術(shù)在教育領(lǐng)域得到廣泛應(yīng)用,高校網(wǎng)站紛紛進行轉(zhuǎn)型,以形象建設(shè)窗口轉(zhuǎn)變?yōu)楦咝P畔⒌妮d體,旨在為高校的內(nèi)外用戶提供針對性的、個性化的信息,并通過數(shù)據(jù)發(fā)掘技術(shù)來適配多元化的數(shù)據(jù)需求。在實踐應(yīng)用層面理論也層出不窮,本文在這一趨勢下結(jié)合數(shù)據(jù)挖掘技術(shù)的發(fā)展情況及技術(shù)特性,針對其在高校網(wǎng)站信息的實踐應(yīng)用進行研究,共有五大實踐應(yīng)用方向:一是關(guān)于數(shù)據(jù)的篩選及整理,數(shù)據(jù)挖掘前需要針對數(shù)據(jù)做一定的預(yù)先處理,處理用戶針對網(wǎng)站進行訪問時的最初原始數(shù)據(jù);二是構(gòu)建完整的數(shù)據(jù)挖掘模式,構(gòu)建完整的時間序列;三是選擇合理關(guān)聯(lián)規(guī)則算法,需要通盤考慮;四是有利于高校網(wǎng)站信息不斷迭代;五是提升高校網(wǎng)站信息的有效性。

猜你喜歡
數(shù)據(jù)挖掘數(shù)據(jù)庫用戶
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
主站蜘蛛池模板: 国产一区二区人大臿蕉香蕉| 欧美亚洲综合免费精品高清在线观看 | 精品福利视频网| 国产在线小视频| 特级做a爰片毛片免费69| 欧美亚洲一区二区三区导航| 久久福利网| 特级欧美视频aaaaaa| 18禁色诱爆乳网站| 亚洲成人播放| 国产一区二区三区夜色| 二级特黄绝大片免费视频大片| 国产福利影院在线观看| 99久久人妻精品免费二区| 国产免费观看av大片的网站| 久久国产精品无码hdav| 色窝窝免费一区二区三区| 国产亚洲精品无码专| 国产成人无码播放| 亚洲 成人国产| 99re这里只有国产中文精品国产精品 | 久久久久人妻一区精品| 澳门av无码| 91午夜福利在线观看| 色哟哟精品无码网站在线播放视频| 嫩草国产在线| 美女黄网十八禁免费看| 伊人久久精品亚洲午夜| 日韩中文字幕免费在线观看| 色成人亚洲| 成人毛片免费观看| 久草中文网| 国产人在线成免费视频| h网站在线播放| 亚洲精品福利网站| 国产迷奸在线看| 亚洲精品在线观看91| 国产精品亚欧美一区二区三区 | 凹凸精品免费精品视频| 97在线免费视频| 国产精品中文免费福利| 亚洲福利网址| 91亚洲精选| 97se亚洲综合在线天天 | 久久免费视频6| 亚洲欧美日韩高清综合678| 国产精品深爱在线| 午夜少妇精品视频小电影| 综合亚洲色图| aⅴ免费在线观看| 一级毛片网| 欧美一区精品| 一级毛片在线直接观看| 国产女人爽到高潮的免费视频 | 国产微拍一区二区三区四区| 亚洲午夜国产精品无卡| 麻豆精品在线视频| 波多野结衣在线se| 国产另类视频| 99久久精品国产精品亚洲| 亚洲黄网视频| 国产真实乱子伦视频播放| 一区二区理伦视频| 91精品啪在线观看国产91九色| 欧美色视频在线| 伊人成人在线视频| 日本人妻一区二区三区不卡影院| 福利小视频在线播放| 久久精品国产电影| 一级全黄毛片| www.av男人.com| 久久国产精品电影| 久久视精品| 亚洲swag精品自拍一区| 亚洲色无码专线精品观看| 亚洲国产av无码综合原创国产| 亚洲精品视频网| 欧美日本在线观看| 亚洲制服丝袜第一页| 日韩中文精品亚洲第三区| 欧美va亚洲va香蕉在线| 亚洲第一区在线|