胥橙庭 張蓓 張彤

[摘 要] 根據大數據特征,從編輯應熟悉并應用種類豐富的信息載體、篩選和甄別高度復雜的不確定信息、建立信息網資源庫三方面分析大數據時代編輯的信息處理能力。
[關鍵詞] 大數據 編輯 信息處理能力 信息資源庫
[中圖分類號] G232 [文獻標識碼] A [文章編號] 1009-5853 (2016) 06-0040-02
[Abstract] The characteristics of the big data are analyzed. The information processing abilities of the editor in big data age are discussed, i.e., familiar with various information carriers and skilled in the use of them, screening highly complex uncertain information, and building the resource library of information network.
[Key words] Big data Editor Information processing ability Information databases
隨著大數據時代的到來,科技期刊作為傳統的科技信息的載體與傳播途徑,無疑已經并且還會持續地受到強烈的沖擊,從而引起整個行業的徹底變革[1]。作為科技期刊編輯,如何改變舊有的工作模式,迅速找到適合大數據時代的工作方法就成了最大的挑戰。面對復雜多變的大數據,如何采用全新的理念及技術,迅速有效地處理信息,是科技期刊編輯面臨的最急迫的任務[2]。
1 大數據的信息特征
目前,對大數據還沒有統一的標準定義,業界存在幾種不同的定義[3]。一般情況下,大數據是指無法在一定時間內用傳統IT技術和軟硬件工具進行感知、獲取、管理、處理和應用的海量、復雜的數據集合。大數據的主要信息特征有三點[4]。
1.1 信息的復雜性
信息的復雜性體現在兩方面:一是信息載體多種多樣,從互聯網遍布物聯網、移動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器;二是數據模型變化多端,從傳統的文本信息轉變為圖形、圖像、音頻、視頻等各種多媒體信息。信息的復雜多樣性給傳統的信息處理方式帶來挑戰。
1.2 信息的不確定性
信息的不確定性源于兩方面因素:一是由信息固有的復雜性帶來的原始數據的不準確性;二是由于傳統數據處理方式在數據采集處理粒度、應用需求與數據集成和展示等方面的局限所導致的信息不同程度的不確定性。信息的不確定性要求編輯創新確認信息的方式。
1.3 信息的涌現性
大數據時代,每時每分每秒都有大量的信息產生,信息呈現前所未有的涌現性,使得數據信息的度量、研判與預測難以駕馭。如何在海量信息中保證目的性、時效性,是編輯面臨的最大挑戰。
2 大數據背景下科技期刊編輯應具備的信息處理能力
編輯的信息處理能力是指其對信息的敏感性、辨識性和把握信息的能力,以及正確而又精準地分析、選擇、利用信息的能力。它是編輯在長期的編輯活動中,培養發展起來的一種捕捉、篩選、轉換和利用信息并改變固有信息環境的能力。在大數據時代,編輯應具備以下信息處理能力。
2.1 熟悉并應用種類豐富的信息載體的能力
大數據時代信息載體的復雜性要求科技期刊編輯要熟悉并能熟練使用各種新型科技信息來源,如微博、微信、臉書等社交媒體。很多原來在科技會議、個人主頁上率先發布的科學動態,可能演變為微博、微信、臉書中的一兩句話,或者是網絡公開課中的某一段落。科技期刊編輯不僅應當掌握這些碎片化信息的載體來源,還應當熟悉一些大型的科研工作者的個人社交平臺,如researchgate、crossref等國際主流科研交流社區,要能迅速在科研工作者的數字圈中找到自己的位置,并憑借自身在專業上的敏感度,迅速獲取原始信息。
不僅是個人媒體的發展帶來變革,一些傳統的大型數據庫也不斷推陳出新,為科技信息檢索的定向性、個性化提供新鮮的技術。計算機科學的發展從一開始就與科技信息的傳播息息相關。作為科技期刊的編輯,歸根結底,就是要具備不斷探索、不斷學習的能力,這樣才能在日新月異的技術變革中立于不敗之地。
2.2 篩選和甄別高度復雜的不確定信息的能力
在大數據時代,信息來源紛繁復雜,編輯不再只是從官方網站、權威數據庫以及紙質期刊上獲得經過鑒別、可信的數據,還要從各種載體上獲得未經證實的不確定信息。這就要求編輯依靠過硬的專業背景,提取隱藏的、潛在的有效信息,篩選、甄別并進行整合,經過分析、處理,提煉出需要的、有價值的信息。
篩選和甄別的過程,不僅需要編輯具備專業理論知識,還需要編輯掌握各種信息處理工具。信息的鑒別可以通過一些信息技術手段,如圖形圖像處理、視頻提取、文本語義甄別等技術進行交叉驗證,但這些都是客觀技術,最終還是要靠編輯自身的專業素養、能力、信息敏感性等各方面的綜合素質,才能使編輯在數據海洋中迅速準確地找到需要的信息。
2.3 建立信息網資源庫的能力
大數據的最大特征是涌現性。海量的數據似乎存在自身的智慧,通過對來自大量自發個體的語義進行互相融合和連接而形成語義,整個過程隨著數據的變化而持續演進[5]。可見大數據中不同類型、不同載體、不同結構的數據之間在進行著聯絡和發展,形成元數據網絡。科技期刊編輯獲得不同的信息之后,也應當借助元數據信息固有的特性,通過先進技術及專業知識的加工處理,形成本期刊、本專業特有的信息網絡模型。在此基礎上,為以后各種海量信息的處理提供標準、高效的流程。圖1說明了大數據環境下編輯處理海量信息形成信息網絡的過程。
所建立的信息網絡可以根據自身的要求,網羅各種前沿科技動態、學者個人專業動向及國家政策調整、出版行業最新規劃等各種信息,互相交叉,相互服務,為期刊的整體發展指明方向。
3 結 語
大數據環境下,編輯要具備信息處理能力,包括熟悉并應用種類豐富的信息載體的能力,篩選和甄別高度復雜的不確定信息的能力,建立信息網資源庫的能力。在此基礎上,編輯才能自如地駕馭信息。海量信息的大數據時代對編輯獲取信息的能力提出了挑戰,同時也給編輯獲取信息提供了更多的機會和便利。只要善加利用,大數據會給編輯注入新的能量。
注 釋
[1]柴英,馬婧.大數據時代學術期刊功能的變革[J]. 編輯之友,2014(6):28-31
[2]胥橙庭,孫松茜,張彤,等.大數據時代編輯的信息獲取能力初探[J].科技與出版,2015(3):43-44
[3]夏雪.基于大數據的科技情報研究芻議[J].江蘇航空,2014(2):21-22
[4]王元卓,靳小龍,程學旗.網絡大數據:現狀與展望[J].計算機學報,2013,36(6):1125-1138
[5] 周傲英,金澈清,王國仁,等.不確定性數據管理技術研究綜述[J].計算機學報,2009,32(1 ):1-16
(收稿日期:2016-01-27)