999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于搜索引擎和數(shù)據(jù)挖掘的博客營(yíng)銷

2008-01-01 00:00:00徐禾芳何振輝
商場(chǎng)現(xiàn)代化 2008年2期

一、基于搜索引擎和數(shù)據(jù)挖掘的博客營(yíng)銷模式

博客的影響力越來(lái)越大,為企業(yè)的營(yíng)銷活動(dòng)打開(kāi)了新的一扇窗。基于搜索引擎和數(shù)據(jù)挖掘的博客營(yíng)銷模式的技術(shù)結(jié)構(gòu),就是結(jié)合當(dāng)今世界上主流的搜索引擎技術(shù)和數(shù)據(jù)挖掘技術(shù),提取博客中市場(chǎng)營(yíng)銷所需要的信息。

1.基于搜索引擎和數(shù)據(jù)挖掘的博客營(yíng)銷模式的應(yīng)用系統(tǒng)結(jié)構(gòu)

文中給出了網(wǎng)絡(luò)信息挖掘技術(shù)實(shí)現(xiàn)的總體流程圖, 分別對(duì)其中的每個(gè)步驟解釋如下:

第一步:確立目標(biāo)樣本, 即由用戶選擇目標(biāo)文本, 作為提取用戶的特征信息。

第二步:提取特征信息, 即根據(jù)目標(biāo)樣本的詞頻分布, 從統(tǒng)計(jì)詞典中提取出挖掘目標(biāo)的特征向量并計(jì)算出相應(yīng)的權(quán)值。

第三步:網(wǎng)絡(luò)信息獲取,即先利用搜索引擎站點(diǎn)選擇待采集站點(diǎn), 再利用Robot程序采集靜態(tài)Web頁(yè)面, 最后獲取被訪問(wèn)站點(diǎn)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中的動(dòng)態(tài)信息,生成WWW資源索引庫(kù)。

第四步:信息特征匹配,即提取索引庫(kù)中的源信息的特征向量, 并與目標(biāo)樣本的特征向量進(jìn)行匹配, 將符合閾值條件的信息返回給用戶。

2.基于搜索引擎和數(shù)據(jù)挖掘的博客營(yíng)銷模式可采用的實(shí)現(xiàn)技術(shù)

(1)搜索引擎的主要技術(shù)。搜索引擎一般由搜索器、索引器、檢索器和用戶接口4個(gè)部分組成。①搜索器:其功能是在互聯(lián)網(wǎng)中漫游,發(fā)現(xiàn)和搜集信息。它要盡可能多、盡可能快地搜集新信息和定期更新舊信息,以避免死聯(lián)接和無(wú)效聯(lián)接,為此搜索器的實(shí)現(xiàn)常采用分布式、并行計(jì)算技術(shù),以提高信息發(fā)現(xiàn)和更新的速度。②索引器:其功能是理解搜索器所搜索的信息,從中抽取出索引項(xiàng), 用于表示文檔,以及生成文檔庫(kù)的索引表。索引器可以使用集中式索引算法或分布式索引算法。③檢索器:其功能是根據(jù)用戶的查詢?cè)谒饕龓?kù)中快速檢出文檔,進(jìn)行文檔與查詢的相關(guān)度評(píng)價(jià),對(duì)將要輸出的結(jié)果進(jìn)行排序,并實(shí)現(xiàn)某種用戶相關(guān)性反饋機(jī)制。④用戶接口:其作用是輸入用戶查詢、顯示查詢結(jié)果、提供用戶相關(guān)性反饋機(jī)制, 分為簡(jiǎn)單接口和復(fù)雜接口兩種。

(2)WEB信息挖掘中的關(guān)鍵技術(shù)。網(wǎng)絡(luò)信息挖掘系統(tǒng)采用向量空間模型(Vector SpaceModal, VSM),用特征詞條(T1,T2,…,Tn) 及其權(quán)值Wi代表目標(biāo)信息,在進(jìn)行信息匹配時(shí), 使用這些特征項(xiàng)評(píng)價(jià)未知文本與目標(biāo)樣本的相關(guān)程度。特征詞條及其權(quán)值的選取稱為目標(biāo)樣本的特征提取,特征提取算法的優(yōu)劣將直接影響到系統(tǒng)的運(yùn)行效果。一個(gè)有效的特征項(xiàng)集應(yīng)該既能體現(xiàn)目標(biāo)內(nèi)容, 也能將目標(biāo)同其他文檔相區(qū)分, 因此詞條權(quán)重的正比于詞條的文檔內(nèi)頻數(shù), 反比于訓(xùn)練文本內(nèi)出現(xiàn)該詞條的文檔頻數(shù)。

我們?cè)賮?lái)討論中文分詞處理。首先建立詞典庫(kù)。中文詞的切分問(wèn)題是網(wǎng)絡(luò)信息挖掘中的一項(xiàng)關(guān)鍵的技術(shù)之一,中文不像英文詞之間有空格分割,中文詞的切分的好壞也就直接影響著主題的提取。《中國(guó)分類主題詞表》由于其學(xué)科體系的完整性和規(guī)范性,非常適合于作為詞庫(kù), 當(dāng)然對(duì)于專業(yè)要求較高的數(shù)據(jù)挖掘,以及在實(shí)際使用中出現(xiàn)的不符合要求的地方, 可在該詞表的基礎(chǔ)上進(jìn)行擴(kuò)充和修改;另外, 應(yīng)當(dāng)包括一個(gè)臨時(shí)的詞庫(kù)以統(tǒng)計(jì)用戶的檢索信息, 用于修正詞表。在進(jìn)行詞頻統(tǒng)計(jì)時(shí), 考慮到自然語(yǔ)言的多樣性, 系統(tǒng)建立并使用相應(yīng)的同義詞典、相關(guān)詞詞典等輔助詞典, 以提高信息匹配的準(zhǔn)確度。

二、基于搜索引擎和數(shù)據(jù)挖掘的博客營(yíng)銷模式的應(yīng)用

下面以Google 為例, 剖析網(wǎng)絡(luò)信息挖掘技術(shù)在搜索引擎中的應(yīng)用。Google 的搜索機(jī)制是:幾個(gè)分布的Crawler(自動(dòng)搜索軟件)同時(shí)工作, URL服務(wù)器則負(fù)責(zé)向這些Crawler提供URL 的列表。Crawler 所找到的網(wǎng)頁(yè)被送到存儲(chǔ)服務(wù)器(Store Server)中。存儲(chǔ)服務(wù)器把這些網(wǎng)頁(yè)壓縮后存入一個(gè)知識(shí)庫(kù)(repository)中。每個(gè)網(wǎng)頁(yè)都有一個(gè)關(guān)聯(lián)ID——doc ID,當(dāng)一個(gè)新的URL 從一個(gè)網(wǎng)頁(yè)中解析出來(lái)時(shí), 就被分配一個(gè)doc ID。索引庫(kù)(Indexer)和排序器(Sorter)負(fù)責(zé)建立索引, 索引庫(kù)從知識(shí)庫(kù)中讀取記錄, 將文檔解壓并進(jìn)行解析。每個(gè)文檔就轉(zhuǎn)換成一組詞的出現(xiàn)狀況(word occurrences),稱為hits。hits記錄了詞、詞在文檔中的位置、字體大小、大小寫(xiě)等。索引庫(kù)把這些hit又分成一組“barrels”,產(chǎn)生經(jīng)過(guò)部分排序后的索引。索引庫(kù)同時(shí)分析網(wǎng)頁(yè)中所有的鏈接并將重要信息存在Anchors文檔中。這個(gè)文檔包含了足夠信息,可以用來(lái)判斷一個(gè)鏈接被鏈入或鏈出的結(jié)點(diǎn)信息。

URL分解器(URL Resolver)閱讀Anchors文檔,并把相對(duì)的URL轉(zhuǎn)換成絕對(duì)的URLs,并生成doc ID,它進(jìn)一步為Anchor文本編制索引,并與Anchor 所指向的doc ID建立關(guān)聯(lián)。同時(shí),它還產(chǎn)生由doc ID 對(duì)(pairs of doc ID)所形成的數(shù)據(jù)庫(kù)。這個(gè)鏈接數(shù)據(jù)庫(kù)(Links)用于計(jì)算所有文檔的頁(yè)面等級(jí)(Pagerank)。排序器會(huì)讀取barrels,并根據(jù)詞的ID號(hào)(word ID)列表來(lái)生成倒排擋。一個(gè)名為DumpLexicon的程序則把上面的列表和由索引庫(kù)產(chǎn)生的一個(gè)新的詞表結(jié)合起來(lái)產(chǎn)生另一個(gè)新的詞表供搜索器(Searcher)使用。這個(gè)搜索器就是利用一個(gè)Web服務(wù)器, 并使用由DumpLexicon所生成的詞表, 并利用上述倒排擋以及頁(yè)面等級(jí)來(lái)回答用戶的提問(wèn)。

Google搜索的最大特色體現(xiàn)在它所采用的對(duì)網(wǎng)頁(yè)Links信息的挖掘技術(shù)上。實(shí)際上,網(wǎng)絡(luò)信息挖掘是目前網(wǎng)絡(luò)信息檢索發(fā)展的一個(gè)關(guān)鍵。

三、結(jié)束語(yǔ)

博客營(yíng)銷作為企業(yè)營(yíng)銷的新工具,正受到越來(lái)越多企業(yè)的關(guān)注,目前,大多數(shù)企業(yè)在博客營(yíng)銷領(lǐng)域的實(shí)踐還處于探索階段。隨著XML作為在Web上交換數(shù)據(jù)的一種標(biāo)準(zhǔn)方式的出現(xiàn)、用戶信息需求的多樣化、網(wǎng)絡(luò)信息挖掘研究的不斷深入,“智能化”的搜索引擎將會(huì)涌現(xiàn), 面向Web的網(wǎng)絡(luò)信息挖掘也將會(huì)變得非常輕松。

參考文獻(xiàn):

[1]克里斯·安德森:長(zhǎng)尾理論.中信出版社,2006

[2]托馬斯·弗里德曼:世界是平的.東方出版社,2006

[3]杰里米·萊特:《博客營(yíng)銷》.中國(guó)財(cái)政經(jīng)濟(jì)出版社,2007

[4]唐小鵬:博客營(yíng)銷應(yīng)用初探.科技資訊,2007年第7期

主站蜘蛛池模板: 欧美精品在线免费| 亚洲天堂成人| 午夜精品区| 欧美日韩久久综合| 人人澡人人爽欧美一区| 精品国产aⅴ一区二区三区| 日本欧美视频在线观看| 成人在线欧美| 91精品啪在线观看国产60岁 | 中文字幕亚洲专区第19页| 色综合中文| 91系列在线观看| 日韩a级毛片| 99er精品视频| 免费高清毛片| 无码精品福利一区二区三区 | 自拍欧美亚洲| 成人欧美在线观看| 露脸一二三区国语对白| 亚洲欧美日韩高清综合678| a毛片免费在线观看| 国模视频一区二区| 亚洲人成日本在线观看| 国产精品真实对白精彩久久 | 婷婷色狠狠干| 波多野结衣一区二区三区四区| 91亚洲影院| 亚洲天堂成人在线观看| 国产av无码日韩av无码网站| 午夜啪啪网| 亚洲无线国产观看| 小蝌蚪亚洲精品国产| 国产欧美视频综合二区| 成人年鲁鲁在线观看视频| 国产另类视频| 成人福利在线视频免费观看| 女同国产精品一区二区| 午夜一级做a爰片久久毛片| 亚洲综合经典在线一区二区| 怡春院欧美一区二区三区免费| 亚洲国产理论片在线播放| 无码国内精品人妻少妇蜜桃视频 | 亚洲日本一本dvd高清| 日韩视频福利| 第一页亚洲| swag国产精品| 国产av一码二码三码无码| 国产熟女一级毛片| 中文字幕日韩久久综合影院| 一本一本大道香蕉久在线播放| 国产精品v欧美| 欧美一级在线播放| 国产乱人伦偷精品视频AAA| 亚洲三级成人| 久久人妻xunleige无码| 国产男人天堂| 国产91小视频在线观看| 日韩乱码免费一区二区三区| 国产午夜福利亚洲第一| 在线精品自拍| 国产精品毛片一区视频播| 四虎永久免费地址在线网站| 夜夜爽免费视频| 国内精品视频在线| 亚洲成人动漫在线| 国产黄在线观看| 精品久久人人爽人人玩人人妻| 夜夜拍夜夜爽| 亚洲三级片在线看| 香蕉99国内自产自拍视频| 欧美成人午夜影院| av尤物免费在线观看| 午夜爽爽视频| 中文字幕久久波多野结衣 | 欧美乱妇高清无乱码免费| 日本欧美视频在线观看| 一本久道久综合久久鬼色| 精品小视频在线观看| av午夜福利一片免费看| 亚洲国产成人自拍| 免费一级毛片不卡在线播放| 国产jizz|