999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大型網(wǎng)站之搜索系統(tǒng)

2016-11-18 16:22:43穆海明齊斌劉盼
藝術(shù)科技 2016年9期
關(guān)鍵詞:搜索引擎界面用戶

穆海明 齊斌 劉盼

摘 要:平時(shí)經(jīng)常上網(wǎng)查閱資料的我們,對(duì)搜索一詞一定會(huì)有非常深刻的印象,本篇文章主要說(shuō)明尋找信息的一種形式:搜索。搜索是相當(dāng)廣闊、挑戰(zhàn)性十足,而且眾所周知的領(lǐng)域,本文將會(huì)淺談搜索系統(tǒng)。主要把討論內(nèi)容限制在搜索系統(tǒng)的組成、何時(shí)該執(zhí)行搜索系統(tǒng),以及某些設(shè)計(jì)搜索界面和顯示搜索結(jié)果的實(shí)施建議。雖然對(duì)于小型網(wǎng)站的搜索功能,涉及不到這樣深遠(yuǎn)的一個(gè)話題,但通過(guò)這樣的一個(gè)探討,有利于對(duì)大型網(wǎng)站的設(shè)計(jì)和搜索系統(tǒng)的全面了解。

關(guān)鍵詞:搜索系統(tǒng);網(wǎng)站設(shè)計(jì)

1 選擇要搜索什么

假設(shè)我們已經(jīng)選擇了一種搜索引擎。哪些內(nèi)容應(yīng)該做索引以供搜索?顯然,把搜索引擎指向網(wǎng)站,告訴搜索引擎把它找到的每一份文件的全部文字都索引起來(lái),這是搜索系統(tǒng)最大的價(jià)值:可以無(wú)所不包,有能力很快就包含很多的內(nèi)容。但是,把每樣?xùn)|西都做索引,不見(jiàn)得能滿足用戶。在龐大而復(fù)雜的網(wǎng)站環(huán)境中,會(huì)含有異質(zhì)的子網(wǎng)站和數(shù)據(jù)庫(kù),建立搜索區(qū)域可以減少這些風(fēng)馬牛不相及的效果,讓用戶能夠集中他們的搜索;搜索區(qū)域中應(yīng)包含較具有同質(zhì)性的內(nèi)容。選擇要讓什么可以搜索,是不應(yīng)該受限于只選擇正確的搜索區(qū)域的。對(duì)一群文件或記錄而言,每一文件和記錄都有某種結(jié)構(gòu),無(wú)論是以HTML、XML或數(shù)據(jù)庫(kù)字段表示。這些結(jié)構(gòu)會(huì)儲(chǔ)存內(nèi)容組件:就是內(nèi)容的元素,通常比文件小。結(jié)構(gòu)中某些東西可以被搜索引擎使用,如作者姓名;而某些可以被忽略掉,如每底端的法律聲明。最后我們需要對(duì)什么內(nèi)容是“好的”有感覺(jué),可能會(huì)以手動(dòng)或其他機(jī)制為有價(jià)值的內(nèi)容貼上標(biāo)簽。當(dāng)用于搜索時(shí),應(yīng)該先把“好”的東西展現(xiàn)出來(lái),例如,電子商務(wù)網(wǎng)站上大部分的用戶都在搜索的產(chǎn)品,這些產(chǎn)品就能視為默認(rèn)的搜索對(duì)象,然后此搜索可以再擴(kuò)展到全站,作為一個(gè)修訂過(guò)的搜索選項(xiàng)。

2 搜索算法

2.1 模式匹配算法

大部分搜索算法采用匹配的方法,也就是說(shuō),它們會(huì)比對(duì)用戶的查詢字符串與網(wǎng)站文件全文的索引,以尋找符合的文本字符串。找到吻合字符串時(shí),來(lái)源文件就加進(jìn)搜索集合中。所以,如果用戶輸入查詢字符串“electric guitar”時(shí),任何文件只要含有“electric guitar”,就會(huì)被檢索出來(lái)。聽(tīng)起來(lái)相當(dāng)簡(jiǎn)單,但是這個(gè)比對(duì)過(guò)程可以用很多不同方式運(yùn)作,以產(chǎn)生不同的結(jié)果。有些算法傳回很多的結(jié)果,而這些結(jié)果各有不同的相關(guān)性,有些算法只傳回高質(zhì)量的結(jié)果。變動(dòng)范圍的兩個(gè)極端術(shù)語(yǔ)就是查全率和查準(zhǔn)率。甚至還有公式可以計(jì)算他們:查全率=#檢索出來(lái)的相關(guān)文件/#集合中的所有文件,查準(zhǔn)率=#檢索出來(lái)的相關(guān)文件/#集合中的相關(guān)文件。那么是否可以兼顧兩者呢,可惜,魚(yú)與熊掌不可兼得,考慮大到用戶的利益,我們需要在兩者間取得平衡,然后,根據(jù)選擇一種搜索引擎,其算法是偏向查全率或者查準(zhǔn)率視情況而定。

2.2 其他做法

當(dāng)你有“好”文件在手上時(shí),有些算法會(huì)把該文件轉(zhuǎn)換得相當(dāng)于一個(gè)查詢(這種做法通常稱為文件相似度)。例如“the”“is”“he”這些停用詞會(huì)從好文件中抽掉,留下一組語(yǔ)義豐富的術(shù)語(yǔ),足以代表文件即可。然后,這些術(shù)語(yǔ)會(huì)轉(zhuǎn)換成一種查詢字符串,而這種查詢字符串可以讓你檢索出類似的結(jié)果。另一種做法展示那些已經(jīng)使用相類似的元數(shù)據(jù)做過(guò)索引的結(jié)果。當(dāng)然,一定還有其他的搜索算法,但重點(diǎn)是這些算法的主要目的是找出最好的文件集合作為搜索結(jié)果。但是,“最好”是相當(dāng)主觀的,而且必須了解什么人想在你的網(wǎng)站上找到什么。

3 分組結(jié)果

盡管我們可以用各種方式列出結(jié)果,卻沒(méi)有一種是完美的。像Google的混合式做法就很有希望,但是,通常必須介入搜索的設(shè)計(jì)工作,才可能擁有這樣的工具。無(wú)論是哪種情況,我們的網(wǎng)站通常是越來(lái)越大,因此,搜索結(jié)果也會(huì)變大。同時(shí),當(dāng)用戶放棄再看時(shí),那些就只是理想中的。然而另一種替代排序和排名的做法看來(lái)是有希望的:依照某個(gè)共同的方面把結(jié)果聚集起來(lái)。當(dāng)結(jié)果按類別和等級(jí)分組時(shí),可以改善效果。我們?cè)趺捶纸M結(jié)果?可惜,明顯的方式都沒(méi)什么用:我們可以使用現(xiàn)有的元數(shù)據(jù),諸如文件類型以及文件建立/修改日期,讓我們把搜索結(jié)果分成幾個(gè)組群。比較游泳的是從手工添加的元數(shù)據(jù)衍生出來(lái)的組群,諸如主題、用戶、語(yǔ)言,以及產(chǎn)品家族。可惜,根據(jù)手工添加的做法會(huì)貴到嚇人。有些自動(dòng)化工具可以得到比較有用的主題類型組群,通常可以滿足用戶所需。這些組群為結(jié)果提供了情境,你可以選擇你最感興趣的目錄,就能夠?yàn)g覽相當(dāng)小的一群搜索集合,以及一群相同主題領(lǐng)域的文件(理想上)。這種做法很類似動(dòng)態(tài)產(chǎn)生的搜索區(qū)域。

4 設(shè)計(jì)搜索界面

用戶差異性大,搜索技術(shù)也花招百出,所以實(shí)在沒(méi)有什么單一化的理想搜索界面。在web早起,很多搜索引擎都是在模仿在線圖書(shū)館目錄和以CD-ROM為主的數(shù)據(jù)庫(kù)中所采用的“傳統(tǒng)”搜索引擎功能,這些傳統(tǒng)系統(tǒng)多半提供給研究者、圖書(shū)館員及專業(yè)人士,而用戶通常要懂得復(fù)雜語(yǔ)言才能使它們。在web的用戶爆炸增長(zhǎng)之后,全方位的搜索經(jīng)驗(yàn)和專長(zhǎng)下降到最低點(diǎn),新生代的用戶沒(méi)那么多耐性。用戶通常只會(huì)輸入一兩個(gè)術(shù)語(yǔ),不會(huì)包含任何運(yùn)算符,然后就按下“搜索”鈕,并希望能得到最佳的結(jié)果。搜索引擎開(kāi)發(fā)人員的做法是,把老式的花俏找事隱藏在“高級(jí)搜索”界面之中。由于以上理由,最終又會(huì)晃回老路,支持受到挫折的用戶可以用更多的搜索語(yǔ)言,而且他們也愿意花時(shí)間學(xué)習(xí)復(fù)雜的搜索界面,并構(gòu)造出查詢字符串。但是就目前而言,假設(shè)最好的做法是讓搜索界面盡可能簡(jiǎn)單,而這也是相當(dāng)合理的。

參考文獻(xiàn):

[1] Peter Morville,Louis Rosenfeld(美).Web信息架構(gòu)[M].陳建勛,譯.電子工業(yè)出版社,2013.

[2] Thomas H,Cormen Charles E,Leiserson Ronald L,Rivest Clifford Stein(美).算法導(dǎo)論[M].殷建平,徐云,王剛,劉曉光,蘇明,鄒恒明,王宏志,譯.機(jī)械工業(yè)出版社,2013.

作者簡(jiǎn)介:穆海明(1994—),男,天津人,沈陽(yáng)理工大學(xué)學(xué)生。

齊斌(1994—),男,遼寧盤(pán)錦人,沈陽(yáng)理工大學(xué)學(xué)生。

劉盼(1994—),男,山西運(yùn)城人,沈陽(yáng)理工大學(xué)學(xué)生。

猜你喜歡
搜索引擎界面用戶
國(guó)企黨委前置研究的“四個(gè)界面”
基于FANUC PICTURE的虛擬軸坐標(biāo)顯示界面開(kāi)發(fā)方法研究
關(guān)注用戶
人機(jī)交互界面發(fā)展趨勢(shì)研究
關(guān)注用戶
關(guān)注用戶
網(wǎng)絡(luò)搜索引擎亟待規(guī)范
手機(jī)界面中圖形符號(hào)的發(fā)展趨向
新聞傳播(2015年11期)2015-07-18 11:15:04
如何獲取一億海外用戶
基于Nutch的醫(yī)療搜索引擎的研究與開(kāi)發(fā)
主站蜘蛛池模板: 制服丝袜 91视频| 亚洲性一区| 亚洲中文无码av永久伊人| 欧美色图久久| 国产一区亚洲一区| 国产一级二级三级毛片| 亚洲综合色婷婷中文字幕| 亚洲男人的天堂在线| 国产主播在线一区| 国产精品成人久久| 国产成年女人特黄特色大片免费| 中文字幕久久精品波多野结| 久久精品视频一| 久久中文字幕av不卡一区二区| 久久国产亚洲欧美日韩精品| 亚洲天天更新| 成人伊人色一区二区三区| 中文字幕一区二区人妻电影| 久久亚洲国产一区二区| 国产精品自在在线午夜区app| 久久黄色影院| 台湾AV国片精品女同性| 最新亚洲人成无码网站欣赏网| 国产高清在线观看| 在线精品自拍| 中文字幕亚洲乱码熟女1区2区| 亚洲日本中文综合在线| 无码福利视频| 亚洲黄网在线| 无码精品国产dvd在线观看9久| 亚洲天堂网2014| 欧美成人午夜影院| 欧美专区日韩专区| a天堂视频| 97影院午夜在线观看视频| 一级片免费网站| 国产亚洲欧美在线中文bt天堂| 在线无码九区| 免费欧美一级| 亚洲天堂免费观看| 丰满人妻一区二区三区视频| 亚洲一级毛片免费观看| 亚洲天天更新| 99re精彩视频| 亚欧成人无码AV在线播放| 伊人欧美在线| 久精品色妇丰满人妻| 亚洲无限乱码一二三四区| 天堂成人在线| 成人综合在线观看| 日韩 欧美 国产 精品 综合| 欧美日在线观看| 国产精品三级专区| 一本无码在线观看| 国产精品lululu在线观看| 亚洲综合婷婷激情| 美女无遮挡免费网站| 中文字幕永久视频| 日韩精品成人在线| 久久精品电影| 婷婷色狠狠干| 久久久亚洲国产美女国产盗摄| 秋霞一区二区三区| 午夜日韩久久影院| 国产99视频精品免费视频7| 看av免费毛片手机播放| 日韩欧美国产综合| 青草视频网站在线观看| 国产亚洲视频免费播放| 毛片一级在线| 国产成人无码AV在线播放动漫| 伊人色天堂| 亚洲天堂首页| 国产啪在线| 亚洲精品视频免费看| 欧美国产中文| 欧美在线伊人| 欧美一级黄片一区2区| 黄色一级视频欧美| 亚洲青涩在线| 九九这里只有精品视频| 亚欧美国产综合|