999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Web數(shù)據(jù)挖掘系統(tǒng)的設(shè)計及關(guān)鍵技術(shù)研究

2019-07-14 00:06:56
關(guān)鍵詞:頁面數(shù)據(jù)挖掘數(shù)據(jù)庫

西南科技大學(xué) 四川 綿陽 621000

在Web上有著大量的信息,當(dāng)前數(shù)據(jù)挖掘領(lǐng)域所面臨的新問題就是如何從非格式化的數(shù)據(jù)信息中挖掘出有用的信息,與數(shù)據(jù)庫中所存在的信息不同,Web上的數(shù)據(jù)信息,沒有統(tǒng)一的格式,因為他無法向數(shù)據(jù)庫一樣,有著規(guī)范的結(jié)構(gòu),另外,對于數(shù)據(jù)對象的處理,Web挖掘技術(shù)與傳統(tǒng)數(shù)據(jù)挖掘技術(shù)之間也完全不同,一些異質(zhì)的非結(jié)構(gòu)化信息是傳統(tǒng)數(shù)據(jù)挖掘技術(shù)的死角,但自從Web挖掘技術(shù)應(yīng)用以后,大量的Web信息資源,不再能夠用數(shù)據(jù)模型來表示,因為這些數(shù)據(jù)大部分是非結(jié)構(gòu)化,或者是半結(jié)構(gòu)化,因此,必須以很多個數(shù)據(jù)倉庫挖掘技術(shù)來進行Web的數(shù)據(jù)挖掘,顯然,這挑戰(zhàn)性是非常強的。

一、Web挖掘的概念

眾所周知,Web挖掘是數(shù)據(jù)挖掘的過程,在這個挖掘過程中主要針對的內(nèi)容是Web頁面內(nèi)容,用戶訪問信息,用戶注冊信息以及電子商務(wù)交易信息等等,在數(shù)據(jù)挖掘方法下,Web挖掘能夠獲取到很多有用的知識,借助Web挖掘技術(shù),人們可以對站點設(shè)計進行改進,確保個性化服務(wù)能夠得到有效提供。因此一般情況下加等不利弊挖掘分為三種,分別是內(nèi)容挖掘使用挖掘以及結(jié)構(gòu)挖掘。

1.1 Web內(nèi)容挖掘 所以Web內(nèi)容挖掘指的就是對Web頁面的內(nèi)容進行挖掘,Web頁面內(nèi)容中包括以音頻數(shù)據(jù),圖像數(shù)據(jù)或文本數(shù)據(jù)為主的非結(jié)構(gòu)化的數(shù)據(jù),另外還包括這些數(shù)據(jù)相融合的多媒體數(shù)據(jù)等。

文本挖掘是Web挖掘的基礎(chǔ),因此,在內(nèi)容挖掘上,這種方式也占據(jù)主導(dǎo)地位,通常情況下,平面文本挖掘功能和方法與之相類似,相對于數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù)來說,Web文檔的結(jié)構(gòu)是比較有限的,甚至有的Web文檔根本沒有結(jié)構(gòu),這些是文本信息資源的主要特征,現(xiàn)有的很多數(shù)據(jù)挖掘技術(shù)之所以無法在文本上進行預(yù)處理,都與這些文本信息源的特征有關(guān),為了成為文檔,中間的表現(xiàn)形式可以在挖掘過程中抽取其特征,并采用結(jié)構(gòu)化的形式進行保存。以文本特征表示為基礎(chǔ),對特征子集進行提取,文檔特征在子集算法上一般會選取一個評價函數(shù),針對特征進行獨立的評估,這樣確保每一個特征都會有一個屬于自己的評估分,按照評估分的大小進行排序,選擇預(yù)訂數(shù)目最佳的特征,作為最終的結(jié)果,當(dāng)Web文本實現(xiàn)結(jié)構(gòu)化以后,Web上的大量文檔內(nèi)容都可以進行總結(jié)分類,這一系列的挖掘工作都能夠得以實現(xiàn)。

1.2 Web結(jié)構(gòu)挖掘 對web頁面內(nèi)部或者是之間的結(jié)構(gòu)進行挖掘的基本思想,指的就是Web結(jié)構(gòu)挖掘,Web,結(jié)構(gòu)挖掘?qū)嶋H上,可以將其看做一個有相圖,W頁面是它的頂點,有相圖的編制的就是頁面間的超鏈接,結(jié)合圖論,對Web的拓樸結(jié)構(gòu)進行分析,Web,結(jié)構(gòu)的基本算法是hs,它有兩部分構(gòu)成,分別是構(gòu)造紙圖和迭代計算,Web結(jié)構(gòu)挖掘以一個網(wǎng)頁的歸類為基礎(chǔ),展開不同頁面關(guān)聯(lián)度與像素信息的獲取。

總的來看,Web文本挖掘與Web結(jié)構(gòu)挖掘的局限性還是比較大的,前者對于頁面的拓撲結(jié)構(gòu)信息沒有進行充分的考慮,后者對于Web,數(shù)據(jù)挖掘的文本信息沒有得到充分考慮,因此,在使用過程中,Web文本挖掘和Web結(jié)構(gòu)挖掘進行結(jié)合,可謂是最好的使用方法,兩者結(jié)合對于Web頁面能夠?qū)崿F(xiàn)更好的評價。

1.3 Web日志挖掘 從Web訪問日志中發(fā)現(xiàn)到用戶的訪問模式,從而對用戶的測覽行為進行預(yù)測,就是Web的日志玩具,雖然Web屬于一個比較龐大的信息,但是每一個Web服務(wù)器中,訪問日志都得以保留,而且Web服務(wù)器中的日志結(jié)構(gòu)非常完,你要用戶訪問Web戰(zhàn),間頁面用戶的相關(guān)信息都能夠在日志中有所記錄,因此,Web日志挖掘主要是挖掘Web用戶訪問時的痕跡。

二、基于數(shù)據(jù)挖掘的Web挖掘系統(tǒng)

2.1 Web挖掘系統(tǒng)的邏輯架構(gòu) 以數(shù)據(jù)挖掘為基礎(chǔ)的Web挖掘系統(tǒng)模型為Web挖掘提供了一個良好的集成環(huán)境,這環(huán)境中,整個挖掘系統(tǒng)的整體性能得到有效提高,Web挖掘系統(tǒng)原型Web MS的三個邏輯層次。數(shù)據(jù)獲取層的主要功能是對半結(jié)構(gòu)化的Web數(shù)據(jù)進行模型抽取和調(diào)換,并用結(jié)構(gòu)化的數(shù)據(jù)來表示,最終抽取和轉(zhuǎn)換的結(jié)果,利用結(jié)果建立起多層次的Web數(shù)據(jù)庫,采用預(yù)籌里的手段,對Web服務(wù)器的日志數(shù)據(jù)進行處理,這樣Web日志數(shù)據(jù)庫就形成了。在數(shù)據(jù)存儲層多層Web數(shù)據(jù)庫,以及Web日志數(shù)據(jù)庫都被稱作Web信息庫。

2.2 Web MS原型 Web MS是Web,數(shù)據(jù)挖掘系統(tǒng)的原型,WebMS的基本挖掘功能多面性更強,使Web內(nèi)容挖掘和使用挖掘在整個系統(tǒng)中得得到集成,在Web MS中多種挖掘算法都實現(xiàn)了嵌入,并且與系統(tǒng)中的其他模塊之間實現(xiàn)了緊密配合,結(jié)合Web挖掘方法庫調(diào)用方法以及接口規(guī)范,使Web挖掘能夠共同完成。

在整個系統(tǒng)內(nèi)部中各個模塊之間的功能是相對獨立的,他們在使用過程中又產(chǎn)生了一定的協(xié)同配合,用戶的需求下,數(shù)據(jù)采集對Web資源進行搜索,在相關(guān)處理器過濾器的處理下,形成數(shù)據(jù)存儲形式,挖掘綜合器并能夠?qū)@些數(shù)據(jù)進行使用,結(jié)合挖掘要求,挖掘綜合器可以在方法庫中選擇恰當(dāng)?shù)姆椒▽ζ溥M行挖掘,并輸出挖掘結(jié)果,用戶根據(jù)結(jié)果,來判定是否結(jié)束任務(wù),如果用戶滿意,那么任務(wù)就會隨時截止,如果用戶不滿意,則會對挖掘要求進行調(diào)整,從而進行新的挖掘,可以在系統(tǒng)維護過程中實現(xiàn)新挖掘方法的加入,這樣系統(tǒng)并能夠?qū)崿F(xiàn)升級。

總結(jié)

Web挖掘可謂是當(dāng)今最熱門的研究領(lǐng)域,而且伴隨著信息技術(shù)的不斷發(fā)展,這么個領(lǐng)域的應(yīng)用前景非常廣闊,無論是在技術(shù)上,還是在工具上Web挖掘都具有無限的潛力,因此,在Web的挖掘上還應(yīng)該更深入。

猜你喜歡
頁面數(shù)據(jù)挖掘數(shù)據(jù)庫
大狗熊在睡覺
刷新生活的頁面
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究
主站蜘蛛池模板: 在线免费a视频| 久久99精品久久久久久不卡| 国产精品欧美亚洲韩国日本不卡| 国产成人精品综合| 欧美在线网| 亚洲日韩精品欧美中文字幕 | 亚洲国产成人久久77| 美女被操黄色视频网站| 手机在线看片不卡中文字幕| 在线观看国产精美视频| 欧美日韩另类国产| 國產尤物AV尤物在線觀看| 夜夜操狠狠操| 激情六月丁香婷婷四房播| 理论片一区| 欧美日本二区| 国产亚洲视频播放9000| 国产95在线 | 亚洲欧美日韩高清综合678| 日韩123欧美字幕| 久久国产V一级毛多内射| 国产成人一区| 国产精品自拍露脸视频| 亚洲 欧美 中文 AⅤ在线视频| 亚洲无码在线午夜电影| 国产成人久久综合777777麻豆| 一边摸一边做爽的视频17国产| 国产成熟女人性满足视频| 漂亮人妻被中出中文字幕久久| 亚洲精品黄| 久久精品这里只有国产中文精品| 国产精品3p视频| 久久精品波多野结衣| 日本国产精品一区久久久| 一级毛片中文字幕| 91探花在线观看国产最新| 中文字幕 91| 精品伊人久久久久7777人| 国产欧美日韩视频怡春院| 成人一级黄色毛片| 亚洲久悠悠色悠在线播放| 五月天在线网站| 午夜激情福利视频| 国产免费久久精品99re丫丫一| 秋霞午夜国产精品成人片| 欧美日韩国产在线播放| 黄网站欧美内射| 中文无码日韩精品| 美女啪啪无遮挡| 91蝌蚪视频在线观看| 亚洲天堂精品视频| 亚洲综合中文字幕国产精品欧美| 国产第八页| 永久免费AⅤ无码网站在线观看| 亚洲黄色激情网站| 欧美一道本| 欧美精品色视频| 欧美日本不卡| 日韩无码黄色| 欧美色综合网站| 久久精品66| 欧美中出一区二区| 丁香婷婷激情网| 国产日韩久久久久无码精品| 国产小视频a在线观看| 一区二区三区精品视频在线观看| 国产va欧美va在线观看| 中文字幕在线观| 欧美v在线| 亚洲第一在线播放| 国产无码制服丝袜| 国产毛片片精品天天看视频| 色成人亚洲| 中文字幕欧美日韩高清| 精品丝袜美腿国产一区| 国产在线97| 99人体免费视频| 国产精品高清国产三级囯产AV| 日本人又色又爽的视频| 亚洲无码视频喷水| 55夜色66夜色国产精品视频| 欧美日韩国产系列在线观看|