999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

互聯網信息生命周期研究

2015-06-28 15:42:27朱建軍
鐵路計算機應用 2015年3期
關鍵詞:信息研究

朱建軍,周 強

(中國鐵道科學研究院 電子計算技術研究所,北京 100081)

網絡技術

互聯網信息生命周期研究

朱建軍,周 強

(中國鐵道科學研究院 電子計算技術研究所,北京 100081)

互聯網信息生命周期描述了從信息產生并隨時間推移而演變的整個過程。文中界定了互聯網信息生命周期的研究范圍,并綜述了信息數量、信息效用價值、輿情熱度等互聯網信息生命指標方面的相關理論及其適用性。對現有信息增長、信息效用價值、輿情熱度進行歸納評述。文章最后討論了進一步研究所面臨的挑戰及未來的研究方向。

信息生命周期;信息效用價值;輿情熱度

現有研究指出互聯網信息呈現指數級、爆炸式增長[1],例如頁面 數 量從 2002 年的 1.6 億個增長至2008 年的 160 億個。與此同時,網站數量也從 37.2萬個增長至 287 萬個。面對日益增長的互聯網信息資源,分析其生命周期,從而對互聯網信息加以控制及管理顯得尤為重要。

1 互聯網信息生命周期化趨勢概述

互聯網的廣泛應用,形成了大量互聯網信息。由于互聯網信息具備不同于傳統文獻信息的特點,使互聯網信息生命周期雖然與傳統文獻生命周期大致相當,但在許多方面也發生了巨大的變化。

1.1 互聯網信息

1.1.1 互聯網信息的界定

目前,國內對互聯網信息比較明確的定義是劉佳在《網絡文獻的界定與評價》[2]中提出的:互聯網信息是指依附于計算機存儲設備,可以在網上傳輸、識別、利用的,可穩定獲取,在一定時間內可固定訪問的信息單元。包括:互聯網報刊、互聯網數據庫、互聯網圖書等信息集合,以及以HTTP協議傳遞的網頁、利用專用通信線路訪問的數據庫。不包括那些在互聯網上以 Telnet協議傳遞的人機互動信息,如聊天、私人發布的新聞帖以及以 FTP、Email協議傳遞的私人文件等。

1.1.2 互聯網信息的特點

(1)具備非結構性。互聯網信息在內容上包括學術信息、商業信息、政府信息、個人信息等。每個數據元都是異構的,各站點間的信息和組織都不一樣。其次,在形式上包括文本、圖像、聲音、軟件、數據庫等,沒有嚴格的結構模式。(2)具備動態性?;ヂ摼W信息是一個動態變化的系統。任何互聯網信息都可以在短期內生成、更新、刪除。(3)具備共享性。互聯網信息的傳遞不受空間和時間的限制,任何組織或個人都可以在互聯網上發布、搜索信息,實現了信息全球共享。(4)具備質量參差性。由于網上信息發布具有很大的自由度和隨意性,導致有的互聯網文獻的數據是不完整的、冗余的、稀疏的甚至是錯誤的。同時傳播中的噪聲往往會使傳播信息失真。

1.2 互聯網信息生命周期的界定

互聯網信息生命周期的定義,國內最早由羅賢春[3]提出:互聯網信息生命周期包括信息的產生(創造 /發布)、采集、組織、開發、利用處置。馬費城、夏永紅[4]則將互聯網信息生命周期定義為:互聯網信息從產生到失去效用價值所經歷的各個階段和整個過程。

但是,對于互聯網信息生命周期的界定應綜合上述學者的觀點,即互聯網信息生命周期是指從互聯網信息產生到最后利用處置的過程中,信息數量、效用價值、熱度等信息“生命指標”的變化。對于互聯網信息生命周期的研究,不但包括對信息生命周期階段的劃分,還包括對信息“生命指標”的定量分析,從而更加客觀、全面的反映互聯網信息生命周期的整個過程。

1.3 互聯網信息生命周期特征

1.3.1 周期短

由于互聯網信息本身的動態性和共享性,網絡信息的生命周期所具備的最明顯的特征就是周期短。馬費城、夏永紅[4]的網絡信息實證研究表明中外論文平均3年進入衰退期,而各類論壇的帖子、新聞3天左右就進入衰退期。雖然不同類型的網絡信息生命周期長短有差異,但整體的演進趨勢大致相同。

1.3.2 可重新激活(網絡信息價值具有波動性)

在網絡信息生命周期中,信息的效用價值隨著生命周期階段的不斷演進而發生變化,在短期發展到一定程度后,總體應呈遞減趨勢,如馬費城、夏永紅[4]提出的網絡信息的生命周期曲線如圖1所示。

圖1 網絡信息的生命周期曲線圖

然而,生命周期中存在很多不確定性。在信息的效用價值衰減的過程中,有可能會因為信息更新或外部環境變化等因素,網絡信息效用價值突然被激活,網絡信息重新進入新的生命周期中,即圖1中M點所示。

1.3.3 各階段存在顯著差異性

馬 費 城[18]利 用 Pareto/NBD 模 型 對按引 用 期、發展期、穩定期、衰退期、失效期劃分的網絡信息計算衰老率、邊際利用率、累計利用率,發現衰老率能很好地區分引入期和衰退期,邊際利用率可以很好地區分引入期和發展期,累積利用率則能夠較好地區分發展期和穩定期。

1.3.4 受用戶影響大

梁芷銘[17]利用微觀(被引)半衰期和普賴斯指數兩個指數,通過對新浪微博的實證研究以及結合圖1網絡信息的生命周期曲線,從用戶的角度,認為人是認識網絡信息和實現網絡信息價值最大化的主體,主體對網絡信息的需求和利用程度決定了其所處的生命周期階段。主體對于現有網絡信息的不滿足和對新信息的需求成為網絡信息產生的內在動力,能夠提升網絡信息的效用價值。隨著主體對網絡信息的充分認識和應用,網絡信息的效用價值逐漸衰減,并最終脫離社會實踐需要,網絡信息失效。

除了用戶對信息本身的需求,用戶的行為習慣也對網絡信息的生命周期階段演進,特別是生命周期較短的網絡信息有較大影響。例如:由于 2:00 ~7:00 時段大部分用戶都在休息,此時段內發布的微博評論量會明顯減少或信息的成長期明顯延長,較晚進入成熟期。

2 互聯網信息擴張角度

運用互聯網計量學的基本理論,一些學者提出了互聯網信息擴張模型。J.Hagel等人[5]認為,互聯網的潛在收益,會隨著互聯網節點數量的增加而成指數增長。即在無限的網絡環境下,假設信息的擴散不受任何條件限制,如網站數量、傳播速度、訪問限制等,則信息就能發揮其內生增長能力,網頁數量迅速增加,呈現指數增長規律,也稱為“J”型增長。

一 些 學 者[6]分 析 網 頁 數 量 受 到 外 界 條 件 限 制,不可能一直維持幾何級數增長。因此提出了運用Logistic 模型來描述網頁數量隨時間推移的變化規律,即互聯網信息S型增長模型。

另外,侯經川、趙榮英[7]則參照貨幣擴張規律,以“信息轉發假設”和“信息創新假設”為基礎,提出互聯網信息總量增長模型、互聯網真實信息量增長模型、互聯網泡沫信息量增長模型和互聯網信息乘數擴張規律。同時,還證明了指數增長模型是將“信息創新假設”由有限創新能力改為無限創新能力時的特殊情況。

3 互聯網信息效用價值角度

3.1 從引文分析角度

引文分析法是利用數學和統計學的方法以及比較、歸納、抽象、概括等邏輯方法,對科學期刊、論文、著作等各種分析對象的引用或被引用現象進行分析,以揭示其數量特征和內在規律的一種文獻計量研究方法。

引文分析法的一項重要應用是性能評估,它基于這樣一個假設,即引用顯示出被引用文獻對于后來研究的正的價值。一些研究[8]表明,針對互聯網文獻這一假設同樣成立。Zhao Dangzhi[9]通過基于文獻的 SCI與基于互聯網的 CiteSeer搜索 XML 智能結構領域的論文,得出了對于互聯網出版物實施引文分析法能夠更好地分析出研究趨勢的結論。

3.2 基于互聯網鏈接分析法

鏈接分析法就是運用互聯網數據庫、數據分析軟件等工具,利用數學和情報學方法,對互聯網鏈接自身的屬性、鏈接對象、鏈接互聯網等各種對象進行分析,揭示其數量特征和內在規律。

Mckiernan 于 1996 年首先提出了互聯網鏈接分析(sitation)這一新術語,用以研究網頁之間的引用關系。Rousseau R.也在其著作[10]里提出利用互聯網鏈接分析法的可行性,運用 Lotka 方程描述了域名和網站間鏈接的分布。1999 年,IBM 的阿爾馬登(Almaden)研究中心、康柏系統研究中心和AltaVista 公司研究小組的 Andrei Broder等人利用兩個 AltaVista 的“互聯網蜘蛛人”,調查了 2 億個網頁及 15 億條鏈接,他們的研究結果[11]表明,互聯網鏈接數的分布是符合帕雷托分布的:網頁中具有i個引用鏈接的比率為 r,r=1/i;設擁有 s 個指向外部的鏈接的網頁比率為 v,v=1/sz。

互聯網影響因子也是常用的信息效用指標。它是指:假設某一時刻鏈接到互聯網上某一特定網站或區域的網頁數為 a,而這一網站或區域本身所含的網頁數為b,其互聯網影響因子的數值可以表示為WIF=a/b[12]。這樣可以計算出 Web 空間 3 個 WIF:

自我鏈接 Web 影響因子:測量所測 Web 空間自身頁面之間的鏈接,其值為 L1/D。

外部 Web 影響因子:測量外部鏈接到所測 Web空間的鏈接,其值為 L2/D。

整體 Web 影響因子:測量到 Web 空間的所有鏈接,其值為 L/D。

其中,D :表示對特定空間里整個網頁數的估計。L:表示對空間里網頁的所有鏈接。L1:表示自我鏈接數目。L2:表示外部鏈接數目。

4 互聯網輿情熱度角度

互聯網輿情是指網上公眾發表的意見,包括網上各種傳統媒體延伸的新聞言論和網民在互聯網上表達的輿論[13]。

張虹、鐘華[14]等人對由帖子的點擊數(或回復數)所形成的原始時間序列進行小波多尺度分析,產生一系列子序列并進行評價,并通過BP神經網絡進行類別訓練,找出使得內距離最小、類距離最大的若干系數作為特征系數,以此對網絡論壇話題的熱度趨勢進行預測。

李雯靜、許鑫[15]提出了用主題署名度指標、主題發布者影響指標、主題關注度指標、主題地區范圍指標來度量輿情熱度。李東方、愈能海等人[16]利用熱量傳遞模型對用戶在互聯網上的信息活動建模,提出適用于 Web2.0 環境下的話題抽取與熱度評價算法。

5 互聯網信息的發展趨勢

5.1 網絡信息融合與集成

隨著大數據時代的到來,網絡信息異構的情況逐漸增加。各個系統和資源庫多平臺運行、數據庫模式各不相同、數據被割裂在不同的設備上,這樣多方式運行的弊端,不僅造成網絡信息浪費重疊,同時也造成網絡資源和數據無法共享,平臺之間信息交流和共享十分困難。如何使互聯網信息融合與集成成為網絡信息發展的趨勢。

信息融合應做到:提高信息的完整性,排除冗余與噪聲;降低不確定性,提高信息的精確度和可靠性;去偽存真,提高信息的一致性和可信度。目前對異構信息融合與集成的研究,側重對結構化、半結構化和非結構化這種結構級的融合和集成,而因為各信息源的分布自治性,語義級的異構的融合和集成鮮有成熟的方法和技術,語義級的異構的融合和集成是異構信息有效融合與集成瓶頸。

為提高融合方法的性能或擴大其適應面,陳科文、張祖平、龍軍[19]提出應用 Web Service 可為異構信息服務的集成與融合提供很好的解決方案。

5.2 動態管理

網絡信息在利用的初期,信息價值得到不斷挖掘和發揮,但衰退期利用情況大幅度下降,直至被不斷新生產出來的信息覆蓋,以致在較長時間得不到利用后,便判斷為失效信息。這個時候,那些某些網絡信息個體往往還有較多的剩余價值沒有得到發揮就 轉 成 了 隱 性 價值。 馬 費成[18]認 為 這種情況的發生大多來源于信息獲取渠道的不暢通(比如被不斷更新的信息覆蓋),網絡信息管理者應采取相應的干預策略,比如置頂、加精華以及熱度排行等。但目前管理者采取行動的標準一般是單一的累積點擊率排行,而這種排行沒有考慮到網絡信息的動態性所帶來的誤判概率的提高,這種管理實踐行為不但粗放而且缺乏科學依據。因此應構建生命階段模糊識別模型,實施動態管理,采用基于相對指標的定量識別模式來實現對網絡信息生命狀態的定位,可以根據網絡信息的相對利用情況以及目前所處的生命階段,采取單期或多期的推送策略來適當延長網絡信息的生命周期,以實現其價值的最大化發揮。

6 未來研究方向

從信息效用價值測算角度,引文分析法、鏈接分析法都存在明顯的不足。引文分析法主要研究網絡文獻生命周期的效用價值變化,而鏈接分析法也因為目前搜索引擎搜索范圍有限而存在分析結果未能代表整體網絡情況的問題。因此,在未來的研究中,應逐步擴展引文分析法的適用范圍,或者運用網絡計量學提出新的互聯網信息效用價值指標。同時應完善搜索引擎技術,特別是元搜索技術及智能搜索技術,爭取在盡可能全面地覆蓋互聯網的同時提供穩定的搜索結果。

互聯網輿情熱度研究是一個需要整合多個學科的知識和研究技術、研究方法的跨學科、綜合性研究。但從目前的研究情況來看,人文社會科學的學者和理工科的學者在有關互聯網輿情研究方面未能很好地整合和對接,這也制約了互聯網輿情熱度研究成果的廣度、深度以及有關研究成果的應用價值、社會效益和社會影響。對于互聯網輿情熱度的研究應積極進行跨學科的交叉合作研究,以期在研究內容和方法上取得突破。同時,雖然近幾年互聯網輿情熱度的相關研究已經有所增加,但大多停留在概念討論、算法思考階段,相關實證研究則相對較少。因此,在未來的研究中,除構建符合互聯網信息規律的輿情熱度演變模型,還應結合實際互聯網情況,進行模型的驗證。

互聯網信息擴張模型、互聯網信息效用價值模型、互聯網輿情熱度模型從不同角度研究了互聯網信息生命周期的規律。但對于互聯網生命周期綜合性的研究仍處于初級階段,有關互聯網生命周期管理模型的研究也處于理論研究階段。由于互聯網信息非結構性、動態性的特點,使得互聯網信息生命周期的研究也較為復雜。今后的研究應在現有研究的基礎上,進一步結合現實網絡環境,更加深入、全面的對互聯網信息生命周期進行剖析。

7 結束語

本文提出互聯網信息生命周期是從互聯網信息產生到最后利用處置的全過程中,信息數量、效用價值、熱度等信息“生命指標”的變化;利用并改進現有相關研究,綜合應用了“生命指標”。最后提出了互聯網信息未來研究的方向。

[1]Zhou Ming.Multi-Language Search[EBOL].http://www.docin. com/p-42528663.html,2009.

[2] 劉 佳 . 互聯網文獻的界定與評價 [J]. 情報科學, 2003,9(7):994-997.

[3] 羅賢春 . 互聯網信息生命周期 [J]. 圖書館學研究, 2004(2):51-53.

[4] 馬費城,夏永紅 . 互聯網信息的生命周期實證研究 [J]. 情報理論與實踐, 2009(32).

[5] J.Hagel, A.G.Armstrong. Net Gain: Expending Markets through Virtual Communities[J]. Harvard Business School Press, 1997 (13): 55-65.

[6] 魏玖長 . 危機事件社會影響的分析與評估研究 [D]. 合肥:中國科學技術大學,1997.

[7] 侯經川,趙榮英 . 互聯網信息的增長機制研究 [J]. 情報學報,2003, 22(3):267-272.

[8] Cronin Blaise. Bibliometrics Beyond: Some Thoughts on Webbased Citation Analysis[J]. Journal of Information Science, 2001, 27(1): 1-7.

[9] Zhao Dangzhi. Can Citation Analysis of Web Publications Better Detect Research Fronts[J]. Journal of the American Society for Information,2007,58(9):1285-1302.

[10]R.Rousseau.Sitation:An Exploritory Study[J].Cybermetrics, 1997, 1(1).

[11] 吳國柱,李東洋,曾利玲 . 互聯網超鏈接分析初探 [J].圖書情報工作,2002(11).

[12] Ingwersen Peter. the Calculation of Web Impact Factors[J]. Journal of Documentation,1998, 55(2):236-243.

[13] 譚 萍 . 中國網絡輿論現狀及引導方略 [D]. 鄭州:鄭州大學,2005.

[14] 張 虹,鐘 華,趙 兵 . 基于數據挖掘的網絡論壇話題熱度趨勢預報 [J]. 計算機工程與應用, 2007, 43(31).

[15] 李雯靜,許 鑫,陳正權 . 網絡輿情指標體系設計與分析[J]. 圖書情報工作網刊,2008(11).

[16] 李東方,愈能海,尹華罡 . 一種 Web2.0 環境下互聯網熱點挖掘算法 [J]. 電子與信息學報,2010,32(5):1141-1145.

[17] 梁芷銘 . 基于新浪微博的網絡信息生命周期實證研究 [J].新聞界,2014(3):60-64.

[18] 馬費成 . 網絡信息生命階段的模糊識別研究 [J]. 情報科學,2009,9(30):1277-1283.

[19] 陳科文,張祖平,龍 軍 . 多源信息融合關鍵問題、研究進展與新動向 [J]. 計算機科學,2013,8(40):6-13.

責任編輯 方 圓

Overviews on Internet information life-cycle

ZHU Jianjun, ZHOU Qiang
( Institute of Computing Technologies, China Academy of Railway Sciences, Beijing 100081, China )

Internet information life-cycle described the information generation and the whole process of evolution. The paper def i ned the research areas on the life-cycle of the Internet information, given the overview on the latest researches of the life index of Internet information including the amount of information, information utility value and public opinion heat. The paper also integrated the researches of the expansion of information, the utility value of information and public opinion from the perspective of life-cycle management. Finally the paper discussed challenges and directions of future research.

information life-cycle; information utility value; public opinion heat

U285∶TP39

:A

1005-8451(2015)03-0045-05

2014-10-23

朱建軍,副研究員;周 強,助理研究員。

猜你喜歡
信息研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 三上悠亚在线精品二区| 天天综合色天天综合网| 欧美日韩动态图| 国产美女叼嘿视频免费看| 欧美日韩综合网| 久久国产成人精品国产成人亚洲 | 免费无码网站| 中国国产A一级毛片| 午夜无码一区二区三区| 她的性爱视频| 亚洲制服丝袜第一页| 性欧美精品xxxx| 亚洲综合香蕉| 欧美成人午夜视频免看| 日韩一区精品视频一区二区| 国产综合精品日本亚洲777| 综合色天天| 国产欧美在线| 色欲色欲久久综合网| 蜜芽国产尤物av尤物在线看| 亚洲国产系列| AV网站中文| 亚洲国模精品一区| 国产男人的天堂| 亚洲欧美在线精品一区二区| 亚洲精品va| 人妻丰满熟妇啪啪| 热九九精品| 国产自无码视频在线观看| h视频在线观看网站| 国产无人区一区二区三区| 亚洲福利一区二区三区| 亚洲精品波多野结衣| 久久综合结合久久狠狠狠97色| 欧美一级夜夜爽| 久久精品中文字幕少妇| 欧美日韩一区二区在线播放 | 91精品国产一区自在线拍| 97se亚洲综合不卡| 97在线观看视频免费| 国产永久免费视频m3u8| 97视频在线观看免费视频| 国产97区一区二区三区无码| 亚洲成a人片在线观看88| 亚洲国产成人麻豆精品| 91最新精品视频发布页| 日本不卡在线播放| 99re在线免费视频| 精品无码视频在线观看| 国产一级妓女av网站| 伊人天堂网| 综合色88| 久99久热只有精品国产15| 亚洲 成人国产| 国产精品成人第一区| 日韩精品亚洲人旧成在线| 亚洲一级毛片在线观播放| 成人无码一区二区三区视频在线观看 | 国产精品久久自在自线观看| 国产69精品久久| 免费在线看黄网址| 97影院午夜在线观看视频| 狠狠五月天中文字幕| 91久久偷偷做嫩草影院电| 亚洲无码视频喷水| 亚洲人成电影在线播放| 一级毛片免费观看久| 中文字幕乱码中文乱码51精品| 日韩毛片免费视频| 国产精品偷伦视频免费观看国产| 日本人妻丰满熟妇区| 国产精品污污在线观看网站| 91视频国产高清| 58av国产精品| 中文字幕乱妇无码AV在线| 国产情精品嫩草影院88av| 亚洲日产2021三区在线| 秘书高跟黑色丝袜国产91在线| 亚洲成人网在线播放| 亚洲欧美色中文字幕| 91精品视频播放| 国产高清不卡视频|