文/王羽佳,吉林市經濟廣播電臺
計算機技術的普及以及大數據科技的迅速發展,曾經只能用專門受過培訓的新聞從業人員進行新聞各類流程的工作,而現在逐漸開始出現利用計算機進行新聞報道。隨著電腦科學技術水平的提升,利用計算機來進行新聞的制作已經可以變為現實。目前,在美國出現通過研發新聞編寫計算的軟件而進行新聞報道的公司,這些新聞報道技術公司把軟件不斷改進和訓練,使之寫出高品質的作品。這些軟件從一定程度來說做了一些曾今需要記者來完成的任務,因此,我們也叫這樣的軟件為“機器人”記者。
自動寫作技術公司的創始人兼總裁克瑞思迪安?哈蒙德就曾做好大膽的預測:將來由計算機生產出的新聞會占新聞行業新聞生產比例的九成,而且,不超過五年的時間,類似該創作類型的作品還會榮獲普利策新聞獎。 雖然我們當前沒有辦法斷定他的言論究竟是夸大其詞了還是有灼見的見解,但是通過自動寫作技術公司運營經驗可以看出,這個曾經幾乎由記者進行新聞采訪制作所掌控的行業,也開始漸漸受到了計算機的進攻。
在目前來說,中國雖然還沒有借用電腦技術制作新聞內容的專業公司,可是在前幾年也有過相關領域的探索。從2004年至今,谷歌、百度的新聞消息平臺,就開始出現了依靠收集技術手段和電腦來制作新聞,并且通過歸納以后在網站上進行展示。比如:國內使用最廣泛的媒體社交平臺新浪微博就是運用電腦技術手段搜索微博出現頻率最高的變為熱門話題,正是將此種技術充分巧妙地加以運用。其簡單的原理就是通過計算機計算,尋找列出平率最高的熱門詞匯,然后根據詞匯出現頻率高低來確定討論活躍的事件,最高頻率的詞匯自然被認定成熱烈討論的內容了。
我們看到不僅要看到機器撰寫新聞的優勢,同時也要清楚認識到其存在的劣勢。機器撰寫新聞高性價比的背后也存在其自身的局限性。比如之前文中提到的目前機器只能撰寫經濟類型和體育類型的新聞,在其他領域的涉足還相當有限,由于經濟類型和體育類型的新聞本身就需求大量動態的數據,并且已經形成固定的模板,因此撰寫起來也相對簡單。在更廣泛的領域用機器進行報道,需要繼續改進和探索。但是克里斯迪安也對此做出了大膽的預測,預計自動寫作技術公司在未來的20年之內能夠做到撰寫任何類型任何領域的文章,甚至是深度報道。同時,我們也要知道,自動寫作技術公司撰寫的文章并不是百分之百正確,它也有出現錯誤的時候,例如比賽次數統計錯誤等等,但這種可能極為之少。
英國《衛報》數據新聞采寫者錫門?洛戈思表示說,數據新聞不僅要分析數據,還要不斷的查閱數據的真實度以及新聞價值,然后利用個各種方式和手段進行報道。英國伯明翰城市大學教授布拉德肖根據傳統新聞學“倒金字塔”結構理論,提出數據新聞采編流程“雙金字塔”結構。自上而下的倒金字塔包括數據搜集、清洗、情境化、合并等等四個步驟。然后以傳播為基礎,再變為一個自下而上的正金字塔,包括視覺、敘事、社會、人性化、個性化、應用化等六個步驟。在布拉德肖看來,所有的數據新聞生產流程中的數據收集、數據處理以及數據呈現這三個環節都必不可少,即便是數據新聞大量用于不同的社會化媒體,并且用戶也能根據自己的喜好制訂相應的內容,這三個環節同樣不可缺少。
大數據時代大規模的數據源源不斷,可以為新聞生產提供了許多的題材。新聞從業者能夠借助大數據技術將各類媒體所產生的海量數據進行線索的采集以此來摸清讀者熱衷或者關心的事情,然后再從中分析出具有意義的新聞內容。在大數據技術盛行的今天,云計算可以提供新聞搜集并加以提煉的技術,把大規模的數據和信息從新聞媒體中提煉出來,通過發現和整合相關數據資源最終成為新聞。
在收集數量夠大的數據以后,以保證采集的樣本的品質和新聞內容的真實度,這就要求記者把采集到的樣本內容整體做出認真分析。事實上。采集到的數據自身不一定是全部客觀的,其通過解碼這些訊息數據的各種高科技機器也不可能做到整體真實的客觀。所以,記者們在處理分析這些數據的時候不能完全相信數據訊息,對待數據始終保持質疑,同時要有規范統一的處理方法。
信息圖表是對文本型和數值型信息形象化、互動化的呈現,包括圖表、圖解、圖形、表格、地圖和列表等,用以展示數據、提示要點、梳理進程、揭示關系、表達觀點等。
隨著電腦科技的愈來愈發達,新聞當中用圖片來表現新聞訊息的技術手段也變得越來越純熟。從傳統的新聞圖片向具有動感的、深層含義的數據圖片轉變,讀者還可以參與圖表,進行互動。信息表圖是一種文字和數字信息可視化、互動化的表現。比如圖表、圖形、地圖等都屬于信息圖表。其作用在于顯示數據、重點提示、指出要點、理順環節、揭示內部存在關系、提出建議等。
大數據時代產生的大量數據也對數據存儲方式提出了變革。數據具有碎片化、密度低以及構造多重化的特點。新聞業無時無刻在收受各種繁冗復雜的訊息,這些訊息要么是隨機出現的,要么是實時出現的。要把這些不同形式構造的數據統計起來,細致分化,然后變為有價值的信息是一項難度極其巨大的工程。這就要求媒體行業對數據存儲的方式進行變革重塑。只有能夠高效率、集中化的把數據進行歸納重整成為媒體行業新的難題。這一難題的解決。不僅需要徹底在新聞業落實這種重塑,還需要給與充分的時間。但是就目前大數據技術發展情況來看,實現低成本、高效率、集中整合的信息存儲技術在不遠的將來一定可以得到實現。
[1]彭蘭.“大數據”時代:新聞業面臨的新震蕩[J].編輯之友.2013,第1期:8-10.
[2]張瑜月.制度化的新聞客觀性——兼評《紐約客》駐華記者的報道[EB/OL].人民網.