999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

搜索引擎反作弊技術及應用解析

2020-10-21 13:06:46李亞
科學導報·學術 2020年29期
關鍵詞:搜索引擎應用研究

李亞

摘?要:互聯網時代人們檢索信息的主要方式都是利用搜索引擎完成的,不管是通用的全文搜索引擎,還是分類別的垂直搜索引擎,面臨的主要行為就是作弊行為,網頁作弊成為當前搜索引擎面臨的一個重大挑戰,很多作弊者利用各種作弊技術來騙取虛假或排名。信息時代的不斷發展,作弊行為也各種各樣,而搜索引擎需要通過不斷的優化和完善內部排序算法來有效杜絕作弊行為。

關鍵詞:搜索引擎;反作弊技術;應用研究

優化網頁,自然排名才能夠有效地靠前,很多網頁通過騙術騙過搜索引擎,獲得絕佳排名,但是搜索引擎通過學會這些騙術,提高自己防騙能力,這就是反作弊算法。網絡作弊的直接后果就是導致搜索引擎的質量直線下降。在當前網頁作弊主要分為內容作弊,鏈接作弊和隱藏技術。網絡網頁作弊的大量泛濫會影響搜索引擎正常工作,也給用戶在獲取信息過程中帶來極大麻煩,因此通過研究各種網頁作弊的技術和方法。將當前反作弊技術分為三大類,分別是基于網頁特征分析方法,基于網絡鏈接分析方法和檢測各種隱藏技術的方法。

一、作弊網頁的危害概述

搜索引擎是通過收取網絡中主要信息進行索引,構建用戶的搜索請求提交給搜索引擎后,搜索引擎會通過搜索系統選出符合條件的網頁。網站的盈利就主要是借助于流量,網站流量越大,網站就可以拉到更多廣告投放,實現大面積的盈利,因此就有很多網站站長為了提高自身網站流量而進行作弊,利用一些非正常的手段提高網站搜索引擎內部排名[1]。作弊網頁的存在對搜索引擎的威脅是非常明顯的,它不僅會增加搜索引擎的負擔,而且嚴重降低了用戶對搜索引擎的信任程度。經過研究證明網頁作弊同時具備多樣性和復雜性的特點,這給搜索引擎帶來極大的困難。隨著時代的發展,網絡作弊具備多樣性和復雜性的特征,很多情況下是幾種作弊方式相互結合的情況,這給搜索引擎工作帶來了極大的困難。所以需要通過反作弊技術和算法做好一定的作弊檢測,減少作弊網頁的危害。

二、反作弊技術和算法的基本研究

反作弊技術主要分為基于網頁特征分析的方法,基于網絡鏈接分析的方法,以及檢測各種隱藏技術的方法。

(一)基于網頁特征分析的方法

基于網頁特征分析技術,這種方法就是從大規模的網頁實驗中提取網頁特征,通過統計的方法對特征進行分析,發展作弊網頁和正常網頁之間的不同特點,根據這些特征建立好一個網頁分類器,實現當網頁自動分為作弊網頁和正常網頁。這是作為一項非常基礎的反作弊技術,通過對網頁主機名組成,主機和IP個數比例入鏈和出鏈數站點網頁的平均更新率內容等信息進行有效的研究,發現其中蘊含的特征:有些域名很長,域名中還有一些特殊的字符,同時頻繁更換內容,那么這些網頁就極有可能是作弊網頁。通過對這些特征進行有效的識別研究,就能夠對作弊網頁和正常網頁進行有效的區分,但是由于時代的不斷發展,這些作弊網頁的技術也在不斷發展,因此要想利用網頁特征分析的方法,有效的實現反作弊技術的發展,那么網頁特征分析的方法也需要與時俱進,不斷更新[2]。搜索引擎在抓取網頁時對網頁正文標題標簽進行分析,如果發現某個站點內存在大量重復內容或者是網頁的出現,那么就可以判斷是一個作弊網頁。比如在一個網頁中出現超級和免費電影等詞語,這些詞語出現是單一的那么就不能判定為作弊網頁,但是這些詞語出現的頻率極高,出現多次這樣的詞語,那么就可以判定為作弊網頁,利用這種相關性的評分方式,能夠對這樣的網頁進行評測

(二)基于網絡鏈接分析的方法

基于頁面鏈接分析的方法主要有兩種思路,分別是從正面出發的HillTop算法和TrustRank算法,以及從反面出發的Bad Rank算法,HillTop算法是在2001年提出的,這種算法認為主題相關的網頁之間的鏈接對于權重計算貢獻應該比主題不相關,鏈接的價值更高,所以這種算法就是假設網絡中的文檔,所指向的網頁不會是作弊頁面,專家頁面指向排序應該更高。但是這種算法存在著一個致命弊端就是,如果找不到數量足夠的專家,文檔至少有兩個,那么該算法就失效。TrustRank算法是在2004年提出的,利用這種算法衡量網頁的可信度,從中挑出那些可能使用鏈接作弊的網頁,由人工判別是否在排名中降權,這種算法的依據是好的頁面很少會有鏈接指向作弊頁面。但是需要有反作弊專家挑選網頁中的一個好的集合,根據這些集合中的鏈接關系,找到同樣好的網頁,將好的網頁也放在集合中。BadRank算法和提到的以上兩種算法是完全不同的,它是從反面出發,發現那些肯定是作弊的網頁。主要流程就是維持一個作弊網易的黑名單,這個黑名單是通過用戶舉報或利用技術獲得的,然后內容就是黑名單發現其他的作弊網頁。

(三)檢測各種隱藏技術的方法

結束語:

總結全文,網頁作弊成為搜索引擎的重大威脅,作弊網頁在搜索引擎檢索中獲得較高排名,獲取流量,利用多種作弊方式欺騙搜索引擎。伴隨著信息化時代的發展,新的作弊技術不斷出現,甚至互相融合,給搜索引擎帶來了極大的困難,為了進一步增強反作弊技術,凈化網絡環境,給用戶帶來更好的搜索功能體驗,需要對檢測作弊技術進行不斷的更新,結合用戶的行為習慣,不斷地改善排序算法,提高搜索引擎的反作弊效率。

參考文獻

[1]?高尚建,魏國,楊功.網站搜索引擎優化策略研究[J].科學技術創新,2020(18):98-99.

[2]?顧惠超.大數據分析下智能搜索引擎的構建研究[J].信息與電腦(理論版),2020,32(04):125-126.

[3]?王慶福,王興國.搜索引擎反作弊方法研究[J].電腦知識與技術,2016,12(15):202-203.

猜你喜歡
搜索引擎應用研究
現代機械制造工藝與精密加工技術的應用分析
“黑農”大豆育種技術及應用研究
進駐數字課堂的新興教學媒體
AG接入技術在固網NGN的應用研究
空域分類關鍵技術及應用研究
分層教學,兼顧全體
考試周刊(2016年76期)2016-10-09 08:38:18
網絡搜索引擎亟待規范
中國衛生(2015年12期)2015-11-10 05:13:38
Nutch搜索引擎在網絡輿情管控中的應用
警察技術(2015年3期)2015-02-27 15:37:09
基于Nutch的醫療搜索引擎的研究與開發
廣告主與搜索引擎的雙向博弈分析
主站蜘蛛池模板: 福利视频99| 亚洲中文字幕国产av| 一本色道久久88亚洲综合| aaa国产一级毛片| 精品久久久久成人码免费动漫| 欧美精品亚洲精品日韩专区| 久久国产精品77777| 中文字幕乱妇无码AV在线| 中文字幕自拍偷拍| 国产第二十一页| 亚洲一区毛片| 色综合成人| 亚洲精品国产综合99| 亚洲欧美日韩高清综合678| 中文字幕在线不卡视频| 欧美在线观看不卡| 99久久国产综合精品2023| 奇米影视狠狠精品7777| 欧美成一级| 最新国产你懂的在线网址| 国产精品9| 欧美中出一区二区| 一边摸一边做爽的视频17国产| 国产91透明丝袜美腿在线| 日韩人妻精品一区| 热99re99首页精品亚洲五月天| 国产偷国产偷在线高清| 在线看片免费人成视久网下载| 妇女自拍偷自拍亚洲精品| 欧美区一区二区三| 毛片网站免费在线观看| 91探花在线观看国产最新| 婷婷色丁香综合激情| 国产精品入口麻豆| 国产三级毛片| 中文字幕乱码中文乱码51精品| 亚洲三级电影在线播放| 成人免费视频一区| 国产美女一级毛片| 国产第一页亚洲| 国产人成乱码视频免费观看| 国产免费高清无需播放器| 日韩中文精品亚洲第三区| 91亚洲精品第一| 成人国产免费| 男女男免费视频网站国产| 尤物成AV人片在线观看| 美女扒开下面流白浆在线试听 | 国产精品99r8在线观看| 日韩在线2020专区| 另类综合视频| 亚洲丝袜第一页| 欧美在线一级片| 国产激爽大片高清在线观看| 亚洲男人的天堂在线观看| 激情综合婷婷丁香五月尤物 | 99中文字幕亚洲一区二区| 婷五月综合| 国产午夜精品一区二区三区软件| 欧美特黄一免在线观看| 日韩国产亚洲一区二区在线观看| 国产精品亚欧美一区二区| 国产在线拍偷自揄拍精品| 波多野结衣视频网站| 久久中文字幕2021精品| 久久精品视频一| 亚洲色大成网站www国产| 久久久久无码国产精品不卡| 国模沟沟一区二区三区| 国产特级毛片aaaaaa| 国产91在线|日本| 人人看人人鲁狠狠高清| 日本一本正道综合久久dvd| 国产毛片久久国产| 无码网站免费观看| 日韩国产黄色网站| 天天操精品| 中文字幕亚洲专区第19页| 国产97视频在线| 欧美精品v| 国产视频a| 亚洲大尺码专区影院|