999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于互聯(lián)網(wǎng)的數(shù)據(jù)挖掘技術(shù)在競爭情報收集中的應(yīng)用

2011-04-13 12:20:32車榮海梁志恒
科技傳播 2011年6期
關(guān)鍵詞:搜索引擎排序數(shù)據(jù)挖掘

車榮海,梁志恒

沈陽師范大學(xué) 科信軟件學(xué)院,遼寧 沈陽 110034

1 Internet情報收集子系統(tǒng)概述

一個企業(yè)要進(jìn)行競爭情報的研究,應(yīng)該建立自己的基于網(wǎng)絡(luò)環(huán)境的競爭情報系統(tǒng)——競爭情報網(wǎng)絡(luò)系統(tǒng)是圍繞企業(yè)的經(jīng)營戰(zhàn)略目標(biāo),以現(xiàn)代信息技術(shù)(尤其是網(wǎng)絡(luò)技術(shù))為主要手段,對企業(yè)內(nèi)部和外部的競爭要素,競爭環(huán)境以及競爭對手的信息進(jìn)行收集、存儲、處理與分析研究的新一代綜合性網(wǎng)絡(luò)系統(tǒng)。系統(tǒng)有3部分組成:競爭情報收集子系統(tǒng)、競爭情報分析子系統(tǒng)和競爭情報服務(wù)子系統(tǒng)。競爭情報收集子系統(tǒng)是根據(jù)事先確立的情報課題,收集、整理各種信息,初步篩選,同時作好文件、記錄等資料的保管及定期歸檔工作。競爭情報分析子系統(tǒng)是應(yīng)用恰當(dāng)?shù)姆治龇椒ㄅc技術(shù),深入分析競爭情報收集子系統(tǒng)的信息,生產(chǎn)競爭情報產(chǎn)品。競爭情報服務(wù)子系統(tǒng)是以各種適當(dāng)?shù)姆绞桨b競爭情報產(chǎn)品,及時將產(chǎn)品傳送到情報用戶手中去,并為企業(yè)決策層提供快捷的瀏覽、查詢服務(wù)和情報服務(wù)。以企業(yè)現(xiàn)有技術(shù)和信息資源為核心, 以網(wǎng)絡(luò)為基礎(chǔ)的現(xiàn)代競爭情報系統(tǒng)共分3個層次:第一個層次是企業(yè)內(nèi)部網(wǎng)。它利用Internet技術(shù)把企業(yè)內(nèi)部所有的信息資源集成起來,把各子公司、各部門聯(lián)系起來,實(shí)現(xiàn)企業(yè)內(nèi)部的信息共享與協(xié)同作業(yè);第二層次是企業(yè)外聯(lián)網(wǎng),它將Internet技術(shù)應(yīng)用于企業(yè)間的信息系統(tǒng),把與企業(yè)有業(yè)務(wù)合作關(guān)系的交易伙伴、合作對象、相關(guān)公司以及主要客戶連成一體;第三層次是因特網(wǎng),它是覆蓋全世界范圍的網(wǎng)絡(luò),通過它可以使國內(nèi)外企業(yè)、遠(yuǎn)程用戶、異地資源得以聯(lián)合,實(shí)現(xiàn)資源共享,溝通合作。

2 數(shù)據(jù)挖掘技術(shù)在Internet情報收集子系統(tǒng)的應(yīng)用

2.1 公共信息挖掘系統(tǒng)

隨著Internet的迅速發(fā)展,在Internet上儲備了大量的信息,這些信息是零散的分布在全球的各個位置上,也就是分布在各個不同的計算機(jī)服務(wù)器上,那么我們?nèi)绾蝸砀玫恼业讲⒗眠@些信息,成為了競爭情報工作中一個非常重要的課題研究。競爭情報工作除了要挖掘自身門戶網(wǎng)站的知識,Internet上的各種各樣的公共信息的利用同樣也不容忽視。公共信息挖掘系統(tǒng)就是企業(yè)通過在Internet上免費(fèi)的信息獲得有價值的信息的系統(tǒng)。通過查閱大量的資料提出一個公共信息挖掘系統(tǒng)的模型如下:

圖1 公共信息挖掘系統(tǒng)模型圖

Web上的數(shù)據(jù)與傳統(tǒng)的數(shù)據(jù)庫中的數(shù)據(jù)不同,傳統(tǒng)的數(shù)據(jù)庫都有一定的數(shù)據(jù)模型,可以根據(jù)此模型來具體描述特定的數(shù)據(jù)。而Web上的數(shù)據(jù)非常復(fù)雜,沒有特定的摸模型描述,每一站點(diǎn)的數(shù)據(jù)都各自獨(dú)立設(shè)計,且數(shù)據(jù)本身具有自述性和動態(tài)可變性。傳統(tǒng)數(shù)據(jù)挖掘技術(shù)是用來處理保存在數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù),但是Internet上的大量數(shù)據(jù)都是半結(jié)構(gòu)化和非結(jié)構(gòu)化。因此,要在競爭情報工作中充分利用Internet的信息,數(shù)據(jù)由非結(jié)構(gòu)化和半結(jié)構(gòu)化轉(zhuǎn)化為結(jié)構(gòu)化形式是關(guān)鍵,從而就涉及到情報檢索和WEB挖掘兩個領(lǐng)域的研究。

2.1.1 元搜索引擎

搜索引擎按其工作方式主要可分為3種,分別是全文搜索引擎目錄索引類搜索引擎和元搜索引擎。元搜索引擎,被稱為搜索引擎之上的搜索引擎。用戶只需遞交一次檢索請求,由于元搜索引擎負(fù)責(zé)轉(zhuǎn)換處理后提交給多個預(yù)先選定的獨(dú)立搜索引擎,并將所有查詢結(jié)果經(jīng)過處理后集中起來以整體統(tǒng)一的格式呈現(xiàn)到用戶面前。由于采用了一系列的優(yōu)化運(yùn)行機(jī)制,能夠在盡可能短的時間內(nèi)提供給搜索者相對全面、準(zhǔn)確的信息,能夠更好的滿足搜索者的需要,但顯示給搜索者的信息也是不能達(dá)到100%,可以通過擴(kuò)展調(diào)用多個搜索引擎來提高搜索的全面性。值得推薦的元搜索引擎有Dogpile、InfoSpace、Vivisimo等。為了在大范圍的檢索中取得較好的效果,本模型采用元搜索引擎。

2.1.2 WEB結(jié)構(gòu)挖掘(鏈接分析)

目前的大多數(shù)搜索引擎在進(jìn)行分類的時候都是利用內(nèi)容的相關(guān)性進(jìn)行排序的,所謂的內(nèi)容相關(guān)性排序就是根據(jù)網(wǎng)頁的內(nèi)容進(jìn)行分類,處理的辦法一般是進(jìn)行分詞、詞頻統(tǒng)計,根據(jù)統(tǒng)計的結(jié)果進(jìn)行分類和進(jìn)行相關(guān)性排序。這樣的分類不能反映人們對該網(wǎng)頁內(nèi)容的分析與看法,缺乏一定的主觀性。在使用元搜索引擎技術(shù)后,調(diào)用己有的搜索引擎,因此返回的搜索結(jié)果是進(jìn)行了基于內(nèi)容相關(guān)性的相關(guān)性排序。這些結(jié)果中包含指向的結(jié)果頁面的超級連接(URL網(wǎng)址),不同的搜索引擎的結(jié)果不同,那么它們的超級連接也是不同的,其中有部分內(nèi)容是重復(fù)的。我們知道通過超級連接能夠反映某個頁面是不是權(quán)威頁面,也就可以根據(jù)某個頁面被引用的次數(shù)可以知道這個頁面是不是權(quán)威頁面,也就是基于超級鏈接的相關(guān)性排序。因此我們可以對處理結(jié)果中的各個超級鏈接的URL地址進(jìn)行排序,在原有的基于內(nèi)容排序的基礎(chǔ)上加入了基于超級鏈接的相關(guān)性排序,通過鏈接分析,提高搜索結(jié)果的精度。Brin和Page提出了的Page-rank算法,并將它應(yīng)用于搜索引擎谷歌。

2.2 門戶網(wǎng)站挖掘系統(tǒng)

隨著互聯(lián)網(wǎng)的飛速發(fā)展,現(xiàn)在很多的企業(yè)擁有自己的門戶網(wǎng)站。如果企業(yè)納入電子商務(wù)的運(yùn)營模式,門戶網(wǎng)站更加是必不可少。基于Internet的競爭情報工作的研究應(yīng)該首先把瀏覽本企業(yè)的網(wǎng)站時所保存下來的數(shù)據(jù),進(jìn)行挖掘分析。通過對網(wǎng)站本身的Web挖掘,對于競爭情報工作主要會產(chǎn)生以下3方面優(yōu)勢:1)理解客戶行為:通過理解訪問者的動態(tài)行為來優(yōu)化電子商務(wù)網(wǎng)站的經(jīng)營模式;獲得個人訪問者的興趣愛好;了解從訪問者到客戶的轉(zhuǎn)化率;發(fā)現(xiàn)客戶和訪問者對于網(wǎng)頁的瀏覽模式;發(fā)現(xiàn)客戶群對于不同業(yè)務(wù)的行為特征;發(fā)現(xiàn)網(wǎng)站上客戶之間的關(guān)系;2)判斷站點(diǎn)的效率:發(fā)現(xiàn)站點(diǎn)上不同業(yè)務(wù)量;設(shè)計網(wǎng)站不依靠專家定性指導(dǎo),根據(jù)對訪問者路徑分析等手段修改、設(shè)計網(wǎng)頁結(jié)構(gòu)和布局;對于不同客戶提供個性化服務(wù);3)評估電子商務(wù)模式的成功:將客戶按照模式分類;測評廣告的投資回報率;得到可靠的市場反饋。

2.3 行業(yè)監(jiān)視挖掘系統(tǒng)

分析競爭對手的目的是了解每個競爭對手的戰(zhàn)略和目標(biāo),評估其優(yōu)勢與劣勢以及競爭反應(yīng)模式,從而制定自己的競爭戰(zhàn)略。如今公司擁有自己的門戶網(wǎng)站再平常不過了。現(xiàn)在的網(wǎng)站不僅僅對企業(yè)做簡單的介紹、發(fā)布新聞,更多的是把網(wǎng)站作為與客戶進(jìn)行交流的前沿陣地。因此,通過對競爭對手門戶網(wǎng)站的分析,可以尋找到許多有價值的信息。不僅可以關(guān)注競爭對手或潛在對手的信息,通常每個行業(yè)都有自己的網(wǎng)站,這些網(wǎng)站上的數(shù)據(jù)統(tǒng)計信息都是很有價值的。但是有時更新速度快,因此需要及時進(jìn)行發(fā)現(xiàn)。對于如何從其他網(wǎng)站進(jìn)行有效的數(shù)據(jù)挖掘,目前還有些困難,隨著技術(shù)的發(fā)展,門戶網(wǎng)站會成為企業(yè)競爭戰(zhàn)略的重點(diǎn)。

[1]李子方.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則在競爭情報系統(tǒng)中應(yīng)用[J].微計算機(jī)信息,2007.

[2]董獻(xiàn)洲,胡曉峰.信息可視化技術(shù)在情報分析中的應(yīng)用研究[J].計算機(jī)工程與應(yīng)用,2006(34).

猜你喜歡
搜索引擎排序數(shù)據(jù)挖掘
排序不等式
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
恐怖排序
節(jié)日排序
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
網(wǎng)絡(luò)搜索引擎亟待規(guī)范
基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
廣告主與搜索引擎的雙向博弈分析
主站蜘蛛池模板: a毛片在线播放| 国产日本一线在线观看免费| 国产成人久久综合一区| 国产欧美视频在线观看| 国产麻豆精品在线观看| 呦系列视频一区二区三区| 国产好痛疼轻点好爽的视频| 亚洲综合久久成人AV| 欧美成人午夜在线全部免费| 日韩人妻无码制服丝袜视频| 亚洲一区二区日韩欧美gif| 99久久精品无码专区免费| 成人日韩视频| 国产青青操| 亚洲人成色77777在线观看| 欧美日韩国产精品va| 国产精品页| 91无码人妻精品一区二区蜜桃| 国产欧美日韩18| 亚洲美女AV免费一区| 国产综合精品日本亚洲777| 蜜芽国产尤物av尤物在线看| 亚洲成在线观看| AV不卡国产在线观看| 一本大道AV人久久综合| 国产波多野结衣中文在线播放 | 亚洲一区二区无码视频| 一级毛片免费不卡在线| 超薄丝袜足j国产在线视频| 中文无码毛片又爽又刺激| 国产91久久久久久| 婷婷伊人五月| 久久一级电影| 亚洲欧美另类日本| 蝴蝶伊人久久中文娱乐网| 色播五月婷婷| 国产成人免费高清AⅤ| 欧美翘臀一区二区三区| 美女裸体18禁网站| 色综合手机在线| 精品欧美一区二区三区久久久| 中文无码日韩精品| 日本人又色又爽的视频| 午夜视频在线观看免费网站| 日本一本正道综合久久dvd| 亚洲国产精品成人久久综合影院| 99热精品久久| 91年精品国产福利线观看久久 | 国产福利在线观看精品| 日韩欧美中文字幕在线韩免费 | 精品少妇人妻一区二区| 欧美国产菊爆免费观看| 3D动漫精品啪啪一区二区下载| 久久91精品牛牛| 99久久国产综合精品2023| 一级一级特黄女人精品毛片| 激情国产精品一区| 成人小视频在线观看免费| 久久综合五月| 亚洲综合极品香蕉久久网| 色网在线视频| 人妻丰满熟妇啪啪| 谁有在线观看日韩亚洲最新视频| 中文字幕久久波多野结衣| 欧美日韩免费| 久久综合亚洲鲁鲁九月天| 色综合a怡红院怡红院首页| 四虎影视国产精品| 午夜视频免费一区二区在线看| 国产一级毛片网站| 久久99这里精品8国产| 亚洲女人在线| 伊人久久大线影院首页| 在线观看网站国产| 综合色区亚洲熟妇在线| 丁香婷婷久久| 国产在线小视频| 白浆免费视频国产精品视频| 中文字幕永久在线观看| 伊人91视频| 欧美日韩中文国产va另类| 久久婷婷色综合老司机|