999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Folksonomy的網絡性質分析

2009-04-29 00:00:00
現代情報 2009年7期

〔摘 要〕Folksonomy是Web2.0環境下一種有效的網絡信息組織方式。本文分析了Folksonomy的網絡性質,基于社會化書簽系統delicious數據集,發現了標簽網絡具有的兩個基本性質:(1)網絡的平均最短路徑為3.16,聚集系數0.63,遠大于相同參數下的隨機網絡,這揭示了標簽網絡的小世界效應;(2)網絡中標簽的度大體上呈冪律分布,表明標簽網絡具有無標度特性。

〔關鍵詞〕Folksonomy;標簽;復雜網絡;小世界;無標度

〔中圖分類號〕G255.51 〔文獻標識碼〕A 〔文章編號〕1008-0821(2009)07-0061-03

Analysis of Network Properties of FolksonomyLi Jing

(Library,Henan Normal University,Xinxiang 453007,China)

〔Abstract〕Folksonomy is a new kind of information organization methods emerging in Web2.0 environment.This paper analyzed network properties of folksonomy.Based on the dataset of social bookmarking site delicious,two fundamental characteristics were discovered.(1)Average node degree was 3.16 and clustering coefficient was 0.63,which exhibited a typical small world effect.(2)The degree distribution of tag network followed a power law distribution,i.e.,the scale free property.

〔Key words〕Folksonomy;tag;complex network;small-world;scale-free

社會化書簽(Social Bookmarking)服務(如Del.icio.us、CiteULike、Flickr等)是Web2.0的標志性應用之一。Folksonomy(分眾分類法)是基于社會化書簽系統的一種新型信息組織方法,它帶來了全新的信息交流與資源分享方式。作為一種自由而有效的網絡信息組織方法,Folksonomy為傳統的網絡信息分類和傳播方法帶來了新的理念,體現了互聯網所推崇的共享與協作精神,開創了互聯網信息傳播的新階段。對Folksonomy的研究也在計算機科學、情報學等多種學科中迅速展開。

在社會化標簽系統中,用戶通過標簽對資源進行標注的行為,使標簽,資源和用戶之間產生了一定的聯系,在拓撲上形成網絡結構。本文旨在對基于Folksonomy的標簽網絡進行研究,從復雜網絡研究的角度分析標簽網絡具有的特性。

1 Folksonomy概述

1.1 Folksonomy的概念

社會化書簽系統是Folksonomy的運行環境。社會化書簽系統為用戶提供了基于標簽(Tag)技術的信息組織和管理方式,幫助用戶存儲和管理個人信息資源,并提供分享和交流的平臺。在社會化書簽系統中,用戶根據個人的需要自由選擇詞匯對資源進行標注,每添加1個詞匯被稱為對資源添加1個“標簽(Tag)”。用戶、資源和標簽組成了社會化書簽系統的3個基本元素。

在社會化書簽系統中,用戶使用標簽對資源進行標注,每個標簽相當于用戶對資源的一個分類,資源根據不同的標簽被組織到不同的分類之下;所有用戶的資源存在于一個共享的平臺上,相同的標簽還能夠聚合不同用戶相同分類下的資源。這種信息組織方式具有2個明顯的特征:一是在對資源添加標簽的過程中,用戶不需要遵循任何事先制定的分類法或者詞表;二是每個用戶的活動空間不是孤立、封閉的,而是開放、共享的,因此也是互相影響的。信息構建專家Thomas Vander Wal將這種在基于互聯網的社會環境中、由大眾用戶產生的信息分類組織方式命名為“Folksonomy”[1](中文名稱被譯為“分眾分類法”、“自由分類法”、“大眾分類法”、“通俗分類法”或“社會分類法”等)。從語源學上講,Folksonomy是由“Folk”和“Taxonomy”2個單詞組成的,表示由“群眾”制定的分類法。它是用戶自發的用標簽對資源進行標注和分類,并與他人共享標簽的過程和結果。用戶添加標簽的行為是“在一個社會化的環境中進行,即這個環境是開放和共享的”[2]。標簽是Folksonomy形成和使用的基礎,也是Folksonomy詞匯體系的基本構成單元。

1.2 Folksonomy的內涵與功能

Folksonomy的內涵與功能主要包括3個方面:

(1)普通用戶參與和主導信息的組織,用戶間通過協作完成對信息的分類組織;用戶能夠對資源的意義進行標注,以便于再次查找和使用,同時使個人的資源能夠被其他用戶發現和分享。從結構上來講,Folksonomy是一種平面的結構,沒有等級體系。

(2)Folksonomy具有社群聚合的功能,并且能夠反映不同社群對相同事物的不同認識,從而建立不同知識體系間的聯系,具有強大的知識聚合及共享功能。

(3)Folksonomy賦予了用戶基于標簽的檢索、瀏覽和定制功能。Folksonomy能夠通過特定的標簽聚合整個信息空間中的相似內容,在資源極其豐富的背景下,Folksonomy能夠幫助用戶發現感興趣的內容。

1.3 Folksonomy與相關概念

1.3.1 Folksonomy與傳統文獻分類法

傳統的文獻分類法以學科聚類,類目的等級結構是文獻分類法的重要特征。等級列舉式分類法和分面組配式分類法是文獻分類法的兩種基本形式。前者具有固定的類目等級結構,僅支持單一的檢索途徑,不能進行多角度的檢索,難以增加新的類目;而后者可以調整分面的組配次序,支持多途徑多角度的檢索,也容易通過分面組配表達新產生的概念。根據以上特征,文獻分類法的結構可以被比喻成一棵樹,擁有枝干和樹葉,等級列舉式分類法具有穩定的分枝,分面組配式分類法的每條枝干則能夠動態地移植、嫁接;與之相對的Folksonomy中的標簽離散地分布在一個平面中,則可以被視為一堆樹葉。

此外,文獻分類法在標引資源時采用特定的符號系統,而Folksonomy卻是直接使用詞匯,因此Folksonomy也可以被看作一個詞匯的集合。

1.3.2 Folksonomy與元數據

元數據和Folksonomy都是為了高效地組織信息以方便用戶的使用而發展起來的,前者的實施主體是相關專業人士,而后者則依靠的是廣大網民。元數據經過10余年的發展,標準越來越復雜,在語義網的導向下更是從“大眾的元數據”變成了“機器程序的元數據”,操作和維護成本相當高,在應用中幾乎停滯不前。

Folksonomy是普通用戶對資源描述的結果,這些用戶可能是資源的作者也可能是使用者,因此自由分類法在某種意義上可以被視為一種用戶產生的元數據。這種用戶產生的元數據提供了資源的描述、定位、權限管理等多種功能,同時結構非常簡單,完全采用自然語言,既沒有區分主題、作者或來源等元素,也沒有受控詞表的限定。與傳統元數據相比,依賴于大眾參與的Folksonomy難以形成某種通用或供推薦的標準,它需要在特定的環境中運行和發揮作用。它的價值在于由廣大的用戶以協作的方式對分布式、迅速增長的網絡信息資源進行描述和標引,為這些資源提供新的檢索途徑,而不是僅僅依賴于互聯網服務的提供者或搜索引擎。

2 Folksonomy的復雜網絡性質

自然界中存在的大量復雜系統都可以通過網絡進行抽象和描述。原則上講,任何包含大量組成單元的復雜系統,當把構成單元抽象成節點、單元之間的相互關系抽象為邊時,都可以當作復雜網絡來研究[3]。復雜網絡突出強調了系統結構的拓撲特征,通過對網絡結構特征的分析和網絡模型的構建,可以理解網絡結構與網絡行為之間的關系,進而調整和改善網絡行為。小世界現象和無標度特性是目前兩類最典型的復雜網絡特征。

在社會化標簽系統結構圖中,可以看到,用戶通過標簽對資源進行標注的行為,使標簽、資源和用戶之間產生了一定的聯系,在拓撲上形成網絡結構。其中標簽之間可以通過對資源的標注形成標簽-標簽網絡等。若標簽t1和t2標注了同一個資源,稱t1和t2同現(co-occurrence)。若兩個標簽經常用于標注相同的資源,則它們在一定程度上具有相似的語義。標簽之間的同現關系形成網絡結構,可以通過圖來表示。通過同現分析和網絡分析,從標簽關聯角度發掘網絡的性質,將有助于對Folksonomy性質的深入分析,深層次的挖掘用戶、標簽和資源間的關系。

2.1 小世界現象

小世界現象揭示了客觀世界許多復雜網絡運動中最為有效的信息傳遞方式之一,即一個高度聚集的包含了“局部連接”節點的子網,連同一些有助于產生短路徑的長距離隨機連接。小世界現象目前還沒有精確的定義,一般認為,如果網絡具有小的平均路徑長度和大的聚集系數,則稱該網絡具有小世界現象。平均路徑長度和聚類系數是考察網絡小世界現象的兩個重要指標[4]。

平均最短路徑長度是網絡中兩節點之間的平均距離。具有小世界性質的網絡的平均最短路徑會很短,遠小于網絡規模(這也是“小世界”命名的原因)。一個節點的聚集系數反映了其相鄰節點所構成集合的聚集程度。整個網絡的聚合系數C是每個節點i的聚合系數Ci的平均值(0≤C≤1)。

2.2 無標度特性

對復雜網絡進行考量的另一個重要方面是節點的度分布。節點的度是指與節點i直接相連的邊的數目ki,平均節點度是網絡中所有節點度的平均值。度值的分布特征是網絡的重要幾何性質。網絡中節點的度分布用分布函數p(k)來表示,其含義為一個隨機選定的節點恰好有k條邊的概率。

網絡的無標度特性指網絡缺乏一個特征度值,或平均度值,即節點度值的波動范圍相當大。節點度滿足冪律分布的網絡具有無標度特性,相應網絡稱為無標度網絡[5]。節點度服從冪律分布,指具有某個特定度的節點數目與這個特定的度之間的關系可以用一個冪函數近似地表示,即p(k)∝k-λ,其中λ是冪律指數。與常見的鐘型分布(如正態分布、Poisson分布)不同,冪律分布有一條長尾,是一種重尾分布,其隨機量有明顯的兩極分化傾向。把冪函數的兩邊取對數得到logp∝-λlogk,即在雙對數坐標下,變量關系是一條直線。在網絡中冪律分布表示大多數節點僅有少量連接,而少數節點擁有大量連接。

成長性和優先連接性是無標度網絡度分布呈現冪律的兩個最根本的原因。成長性是指網絡節點數的增加,即網絡規模不斷擴大同時其自身在不斷演化;優先連接性是指新加入的節點總是優先選擇與度值較高的節點相連,表現出“馬太效應”。這兩個性質導致了復雜網絡中節點的度分布服從冪律分布,存在少量度相對很高的節點,但絕大多數節點的度相對很低(即存在所謂的“長尾”)。

3 實驗與分析

筆者使用使用Java Html Parser[6],于2008.11.25-27日抓取了delicious.com頁面數據,經過數據清理和處理,得到數據集如下所示:

3.1 標簽網絡的小世界現象

網絡平均節點度為16.5,聚集系數為0.63,平均路徑長度為3.16??梢园l現,標簽網絡具有小的平均路徑長度和較大的聚集系數,呈現典型的“小世界網絡”特征。

標簽網絡具有比較小的平均路徑長度,說明任意兩個標簽都可以通過網絡比較方便地連接,某個標簽的使用行為可以通過網絡輕易地傳遞,影響其他標簽的使用。同時它又具有比較大的聚集系數,說明標簽的“相鄰標簽”的簇內部的網絡連接完備程度比較高。在Folksonomy中可以隨意選用標簽,并可以只用很短的路徑就能從一個標簽到達另一個標簽。這樣,Folksonomy網絡一方面能夠從規模上保證標簽用詞的豐富性,另一方面很好地保證了標簽的選用效率。

3.2 標簽網絡的無標度特性

標簽網絡中的某個標簽的節點度即為與該標簽同現的標簽數目,在雙對數坐標下度分布如圖1所示。可以發現各個數據點散落在雙對數平面上的一條直線附近,可以用一條冪率函數擬合(y=2.5x-1.19,R2=0.812),即標簽網絡的度分布遵循冪律分布,呈現無標度特性。標簽網絡的無標度特性表明了該網絡的的規模是不斷增長的,有大量的新標簽加入到網絡,而且新增加的標簽傾向于選擇具有高連接度的節點,即用戶在標注特定的資源時,傾向于選擇已用于標注該資源的高頻標簽。

4 結束語

本文研究了基于Folksonomy的標簽網絡的小世界現象和無標度特性。對Folksonomy的網絡特性的分析,將幫助我們對Folksonomy有更深入的理解,也從一個側面印證了復雜網絡的普適性。在此基礎上,后續研究將進一步探索網絡中標簽的語義關聯和社群結構,充分發掘Folksonomy在信息資源組織和知識管理等領域的潛在價值。

參考文獻

[1]Adam Mathes.Folksonomies-Cooperative Classification and Communication throughShared Metadata[EB/OL].http:∥www.adammathes.com/academic/computer-mediated-communication/folksonomies.html.

[2]Gene Smith.Folksonomy:social classification[EB/OL].http:∥atomiq.org/archives/2004/08/folksonomysocialclassification.html.

[3]Newman M E J.The structure and function of complex networks[J].SIAM Review,2003,45(2):167-256.

[4]Watts D J,Strogatz S H.Collective dynamics of‘small-world’networks[J].Nature,1998,393:440-442.

[5]Barabási A L,Albert R,Jeong H.Mean-field theory for scale-free random networks[J].Physica A,1999,272:173-187.

[6]Java Html Parser[EB/OL].http:∥htmlparser.sourceforge.net/.

主站蜘蛛池模板: 日韩天堂网| 97久久超碰极品视觉盛宴| 日本免费福利视频| 亚洲女同一区二区| 欧美无专区| 51国产偷自视频区视频手机观看| 九九久久精品免费观看| 日韩天堂在线观看| 亚洲av日韩综合一区尤物| 伊人久久精品亚洲午夜| 久久久久亚洲av成人网人人软件| 无码一区18禁| 亚洲男人天堂久久| 国产亚洲欧美日韩在线一区| 日韩欧美在线观看| 国产成人综合日韩精品无码首页| 亚洲天堂精品视频| 欧美日韩第三页| 国产第四页| 永久免费无码日韩视频| 18黑白丝水手服自慰喷水网站| 国产免费久久精品99re不卡 | 亚洲日韩第九十九页| 在线观看无码av免费不卡网站| 亚洲精品无码AⅤ片青青在线观看| 福利在线不卡| 日本免费精品| 久久性视频| 亚洲精品制服丝袜二区| 亚洲国产在一区二区三区| 欧美日韩高清在线| 亚洲人成在线免费观看| 国内精品久久久久鸭| 2024av在线无码中文最新| 欧美午夜视频在线| 全部毛片免费看| 国产一区二区三区精品欧美日韩| 乱色熟女综合一区二区| 婷婷五月在线| 天天婬欲婬香婬色婬视频播放| 亚洲精品无码在线播放网站| 一本一道波多野结衣一区二区| 中文字幕亚洲另类天堂| 99热国产在线精品99| 久久久久青草大香线综合精品 | 欧美一级特黄aaaaaa在线看片| 91精品人妻一区二区| 国产情精品嫩草影院88av| 免费观看无遮挡www的小视频| 综合色88| 欧美日在线观看| 波多野吉衣一区二区三区av| 国产成人亚洲欧美激情| 理论片一区| 久久亚洲国产一区二区| 国产91精品调教在线播放| 伊人久久大香线蕉综合影视| 免费毛片在线| 全裸无码专区| 999国产精品| 强奷白丝美女在线观看| 久青草国产高清在线视频| 久久国产精品影院| 欧美五月婷婷| 99视频精品在线观看| 国产自在线播放| 国产精品亚洲一区二区三区z| 国产精品亚洲а∨天堂免下载| 午夜日b视频| 五月天天天色| 波多野结衣在线se| 好紧好深好大乳无码中文字幕| 日韩免费毛片| 手机在线看片不卡中文字幕| 国产区精品高清在线观看| 69av在线| 精品视频91| аⅴ资源中文在线天堂| 六月婷婷精品视频在线观看 | 欧美日在线观看| 欧美不卡视频在线| 国产97公开成人免费视频|