999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

網絡標簽的檢索效率分析

2012-02-16 04:12:54張軍雄
圖書館學刊 2012年5期
關鍵詞:網絡資源分類效率

張軍雄

(廣東海洋大學圖書館,廣東 湛江 524088)

張軍雄 男,1972年生。本科學歷,副研究館員。研究方向:數字化圖書館。

1 引言

網絡時代,Tag不再是新鮮事物,在新聞、博客、論壇、視頻網站中都可以看到Tag的身影。Tag是Web2.0技術發展的產物之一,它具有信息分類和信息傳播的功能。Tag的出現為信息處理提供了一種新的分類手段,使信息分類工作由專業化走向社會化,由規范化走向自由化。由此引起了人們對Tag的關注和重視,許多專業人士從各個方面對Tag展開研究,從而使Tag在信息組織領域、網絡傳播領域扮演著越來越重要的角色,對其檢索效率的研究愈顯迫切。

2 Tag概述

Tag作為一種網絡分類方式,也稱為開放式分類或大眾分類,是一種對網絡日志進行個性化整理的民間分類方式,具有平面化、社會化、人性化以及隨意性、聚合性、自適應性等特點。它是一種靈活、開放的分類方式,是用戶為自己的文章、圖片、音頻、視頻等一系列文件所定義的一個或多個描述。因此Tag可用來組織個人網絡信息資源,如果不同的用戶使用同樣的Tag來描述、組織相關內容的信息資源,則可將這些信息資源進行聚合。同樣,對于同一內容或者具有相關性的內容,用戶用來描述、組織這些內容的Tag可以進行匯聚。[1]大眾分類法為信息組織工具的設計提供了一種新的視角,將組織資源的權力由權威、專業人員轉交給大眾用戶,一方面應對網絡資源的海量、異構、分布式和高動態等特征,另一方面真實反映用戶的詞匯,充分發揮用戶在信息檢索系統中的作用,以滿足用戶的個性化需求。[2]

隨著Tag應用范圍的擴展,其數量激增,形成了網絡“標簽云”,使Tag的性質也隨之發生變化,演化成聚合信息、聚合人群、分享信息的工具。海量的信息被自由分類到不同的Tag中,為了查找自己感興趣的東西,就需要通過檢索來實現,Tag也就因此具備了檢索功能。由于網絡Tag是不受規則控制的分類產物,因此其檢索效率并沒有得到事先保障,對其檢索效率的研究也相對滯后。但作為網絡環境下一種新的信息組織方式,我們有必要對其檢索效率進行探討和研究,使其與傳統的信息組織方式相得益彰,使信息組織更加多樣化和簡單化,使網絡資源得到更好的組織與應用。

3 Tag標引的特性分析

3.1 Tag標引的優勢

3.1.1 Tag的選詞靈活,網民可以任意選詞,且詞匯處于動態變化之中,能及時吸納各種新名詞,反映用戶的觀點和最新網絡資源,在網絡環境下,比主題詞標引顯得更加靈活有效。

3.1.2 用戶可以自主控制專指度,必要時可選取專指性較強的語詞來作為Tag。標引的專指性較高,有利于更深入準確地揭示文獻內容,為提高查準率創造條件。

3.1.3 網絡上的新事物、新名詞較多,Tag可以彌補詞表收詞量不足和更新不及時等缺點,能及時使用新名詞術語標引與新概念有關的文獻,還能對圖片、視頻等信息進行標引,更加符合用戶的實際需要。

3.1.4 Tag的時效性強,能夠及時反映網絡流行資訊,還可對新事物、新技術、新概念進行標引,有利于實現對信息資源的快速聚合,體現網絡時代的便捷性,為用戶檢索提供方便。

3.1.5 Tag簡單易用,有利于網絡資源的推廣,使網絡資源的建設和使用大眾化。因此用戶不需要進行檢索技能培訓就能夠快速適應,從而使網絡信息得到最大化共享。

3.2 Tag標引的缺點

3.2.1 Tag中存在大量同義詞,致使同一主題下的文獻較分散,容易造成漏檢,從而降低了檢全率。

3.2.2 漢語中的一詞多義現象不可避免,用戶在選取Tag時一般不會對這種語詞加以限定或說明,容易產生歧義,導致在檢索某種主題文獻時把該詞其他含義的主題文獻一并檢索出來,從而造成誤檢。

3.2.3 Tag中的語詞是平面關系,關聯性能差,詞間關系不明確,無法清晰表達概念之間的關系,不利于擴檢或縮檢。

3.2.4 用戶選詞存在模糊性和不確定性,語義表達不準確,造成概念表達出現交叉模糊現象,無形中增加了檢索難度。

3.2.5 在Tag標引和檢索過程中,標引用戶和檢索用戶在分詞上可能存在不一致,導致詞組處理困難,檢索難度加大。尤其是有些用戶喜歡使用專指度高或不常用的詞組作為Tag,這就更加影響檢索的準確性。

4 Tag的檢索效率分析

4.1 Tag的檢索屬性分析

4.1.1 Tag是一種分類系統

Tag是用戶根據自己的需要自由選擇詞匯對網絡資源進行標注而產生的,每添加一個詞匯即為對資源添加一個Tag,每個Tag相當于用戶對資源的一個分類,資源根據不同的Tag被組織到不同的分類之下,所有用戶的資源存在于一個共享的平臺上,相同的Tag還能夠聚合不同用戶相同分類下的資源,是一種普通人運用自由定義關鍵字的方式進行協作分類的活動。[3]

傳統的分類法是由專業人員利用規范化詞表進行分類,而自由分類法則由網民利用自由詞進行分類,不需要專業分類技術,自由選擇關鍵詞,不受詞表控制。它的分類由社會大眾完成,適用于網絡海量數據的處理,對新學科、新事物具有很強的兼容性,而且信息分類的成本低、效率高。缺點是分類質量參差不齊,分類目錄散亂。因為Tag不遵循傳統的樹狀分類規律,而是一種平面化的分類體系,這種分類體系在網絡信息急劇增長的今天,具有無限的發展潛力。

4.1.2 Tag是一種自由信息組織技術

Tag是用戶為了方便選用自由詞作為自己的Tag,對網絡信息資源的內容進行描述和揭示,而不需要遵循任何規則的分類方法。用戶根據自己的需要,用個性化語言來標記網絡資源,而后通過互聯網用戶的大量交換以及相關的內容匹配實現信息的社會化傳播。其實Tag的出現,就是把網絡信息組織的工作由專業人員轉向了社會大眾,使海量信息的組織變得簡單便捷,不需要專業隊伍,也不需要專業規則,使網絡信息資源的加工成本大大降低。

4.1.3 Tag是自由詞

Tag就是一個個用于標識網絡信息的詞匯,這些詞匯都是由網民自己選取的,或選取于文章,或來源于文章之外,只要作者認為這些詞匯能概括自己的信息內容即可,不需要遵守任何規則,可以隨心所欲地發揮。因此Tag實際上就是自由詞,具有自由詞的屬性和特征,即具有隨意性、彈性大、標引簡單,但同時也不可避免地造成標引數據的不一致性,使信息組織散亂,不利于文獻集中。

4.2 Tag檢索效率的影響因素

檢索效率是每個檢索系統都需要考慮的重要因素,其評價指標包括檢全率、檢準率、檢索的便捷性、響應速度以及檢索成本等,其中,檢全率和檢準率是最重要的指標。Tag作為一種網絡資源分類方式,其檢索效率受以下因素影響。

4.2.1 選詞過于隨意,標引不夠準確

由于網民的文化知識水平參差不齊,因此Tag不像科技文獻中的關鍵詞那樣通過認真篩選,能夠準確表達文獻主題。有些Tag的概念表述不明確,與文章內容的相符程度不高,這就會給檢索活動帶來困難,容易造成漏檢或誤檢。

4.2.2 專指性太強,使用詞組過多

網絡上有些Tag使用了過多的詞組來標注,使Tag的專指性很高,表面上看起來有利于提高檢準率,但由于專指度過高,使概念相同或相似的文獻不能集中在同一個Tag下,被分散于多處,用同一個Tag進行檢索時,就會漏檢一些文獻,從而影響了檢全率。另外,過高的專指度也未必能提高檢準率,由于幾個Tag都是詞組,表達的概念范圍非常狹窄,若用同義詞進行檢索,也無法將該文獻檢索出來。同時有些Tag所選的詞組不能準確表達文獻的主題內容,檢索更加困難。

4.2.3 分類等級不明顯

Tag本身具有分類功能,但Tag分類不同于傳統的分類法,沒有嚴格的等級關系。由于Tag生成的不確定性,導致分類體系較為凌亂,沒有系統的分類組織,Tag的歸類處于分散狀態,不利于進行族性檢索。如果從分類角度來檢索相關文獻,就容易造成漏檢,同時還會檢出一些不相關的主題,造成誤檢。

4.2.4 Tag的數量

一般來說,采用3~8個關鍵詞能較好地表達文章內容,而網絡上的一些文章所用Tag過少,僅用一兩個詞來表達,難以準確概括文章內容,導致檢準率低。如果Tag語詞太多,除非每個詞都選得比較準確,否則不但沒有起到準確表達文章主題的作用,反而造成干擾,增加了檢索噪音,從而增加了檢索的難度,影響檢索效率。

4.2.5 分類穩定性差

Tag不是按照傳統的學科來進行分類,而是按照專題來分,而有些專題是不固定的,隨時可能發生變化,為檢索帶來困難。以新浪博客為例,如文化、生活、產經等欄目是固定的,而有些欄目是根據新聞事件的需要臨時設置的,事件過后專題就被取消了,與之相關的文章也就難以檢索了。

4.2.6 不同的專題

網站上不同的專題聚集了不同的人群,他們的文化層次、思維方式各不相同,因此,不同專題的人群選取Tag的結果也不盡相同。有些專題的Tag比較準確嚴謹,有些則較為隨意。而各專題涉及內容的范圍也各有差異,也會對Tag的選取造成不同的影響。有些專題內容比較單一,Tag選取就比較簡單,有些專題涉及的內容較廣,Tag選取的難度就高一點。另外,有些網民為了提高自身的關注度和點擊率,在選取Tag時標新立異,采用一些容易吸引眼球的詞匯,而這些詞匯并不能準確表達文章的內容,導致檢索效率下降。

除此之外,檢索響應時間隨著系統的升級而不斷加快,網站界面越來越友好,算法越來越科學,檢索的便捷性較好,響應時間較短。而檢索成本則因用戶而異,對于專業檢索的用戶來說,由于對檢索結果的要求高,因此感覺檢索成本較高;而對于普通用戶來說,由于對檢索結果的要求不高,而Tag檢索操作簡單,易于使用,故感覺檢索成本較低。

5 Tag的發展前景分析

隨著網絡資源的不斷豐富,Tag的使用越來越廣泛,將成為一種有效的網絡信息資源分類工具。Tag應用技術將不斷進步,網民的Tag水平也會越來越高。而要提高Tag的檢索效率,關鍵在于加強Tag的后臺控制技術,比如對同義詞、多義詞進行合并或指引,并加強詞間關聯。另外,對網民使用Tag的技術和習慣進行適當指引和幫助,也是非常必要的。目前,國內外越來越多的人從資源描述、協同技術、排序技術、聚類分析等對Tag進行了深入研究,這將促進Tag技術的不斷進步,也將促使Tag檢索效率的不斷提高。

[1]徐憶南.近年來Tag分類問題研究述略與展望[J].內蒙古民族大學學報,2010(11).

[2]隆捷.基于Tag的互聯網自由分類法研究[D].北京大學,2007.

[3]梁桂英,李記旭.Folksonomy 初探[J].圖書館雜志,2006(4).

[4]張立彬.基于Tag的個性化信息服務新方式[J].情報科學,2008(10).

[5]鞠福琴,等.從自由分類法看網絡信息的分類組織[J].情報探索,2008(5).

[6]程慧榮,等.國外基于大眾標注系統的Tag研究[J].圖書情報工作,2009(1).

[7]馬狄倫,吳丹.自由分類法的社會效應分析[J].圖書館學研究,2009(12).

[8]顏瑜.網絡信息檢索效率分析[J].科技情報開發與經濟,2009(5).

[9]朱咫渝.通俗分類的發展與應用[J].情報資料工作,2008(3).

[10]Hsu Ming-Hung,Chen Hsin-His.Efficient and Effective Prediction of Social Tags to Enhance Web Search.Journal of the American Society for Information Science and Technology,2011(62).

[11]Trattner Christoph,Helic Denis,Strohmaier Markus.On the Construction of Efficiently Navigable Tag Clouds Using Knowledge from Structured Web Content.Journal of Universal Computer Science,2011(17).

猜你喜歡
網絡資源分類效率
分類算一算
提升朗讀教學效率的幾點思考
甘肅教育(2020年14期)2020-09-11 07:57:42
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
網絡資源在高中班級管理中的運用
談網絡資源在大學計算機教學中的應用
跟蹤導練(一)2
“錢”、“事”脫節效率低
中國衛生(2014年11期)2014-11-12 13:11:32
對等網絡資源搜索模型研究
主站蜘蛛池模板: 国内精品九九久久久精品| 亚洲日韩日本中文在线| 天天操天天噜| 欧美日韩亚洲综合在线观看| 国产成人综合久久| 四虎亚洲精品| 极品国产在线| 国产av剧情无码精品色午夜| 精品视频一区二区观看| 亚洲免费黄色网| 九九热精品视频在线| 色婷婷在线播放| 小说区 亚洲 自拍 另类| 欧美啪啪精品| 黄色一级视频欧美| 色综合激情网| 国产成人AV男人的天堂| 国产日韩欧美一区二区三区在线| 99re在线视频观看| 99精品影院| 福利一区在线| av天堂最新版在线| 精品久久高清| 国产性爱网站| 农村乱人伦一区二区| 激情乱人伦| 99青青青精品视频在线| 亚洲成人手机在线| 国产精品夜夜嗨视频免费视频| 久久国产拍爱| 四虎影视8848永久精品| 一级福利视频| 欧美亚洲国产一区| 大香伊人久久| 亚洲人妖在线| 大学生久久香蕉国产线观看| 国产成人精品18| 亚洲最新地址| 亚洲永久视频| 国产精品免费电影| 有专无码视频| 98精品全国免费观看视频| 不卡视频国产| 99re这里只有国产中文精品国产精品 | 萌白酱国产一区二区| 狠狠色婷婷丁香综合久久韩国| 中文字幕第1页在线播| 日韩东京热无码人妻| 香蕉精品在线| 久久人人97超碰人人澡爱香蕉| 亚洲av综合网| 婷婷五月在线视频| 国产精品毛片一区| 亚洲国产成人自拍| 操国产美女| 5555国产在线观看| 国产精品久久久久久久久久久久| 日韩在线观看网站| 色成人综合| 国产视频大全| 无码AV动漫| 成年免费在线观看| 黄色片中文字幕| 毛片最新网址| 欧美精品1区2区| 日韩不卡高清视频| 福利在线不卡| 久久人搡人人玩人妻精品| 超碰免费91| 国产色爱av资源综合区| 91在线精品麻豆欧美在线| 日韩第九页| 制服丝袜国产精品| 国产91久久久久久| 国产99视频精品免费视频7| 嫩草在线视频| 国产视频你懂得| 一级爱做片免费观看久久| 亚洲av日韩综合一区尤物| 日韩成人在线一区二区| 97色伦色在线综合视频| 99偷拍视频精品一区二区|