999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“自動化新聞”如何推動算法撰寫新聞的行業趨勢

2017-09-27 09:11:44農毅慧
科學家 2016年10期

農毅慧

摘要 2014年7月,“美聯社用機器人代替記者寫稿”的新聞引發討論熱潮。“機器人新聞”一詞以訛傳訛,實際反映了公眾乃至新聞從業者對新聞技術現狀的誤解。本文通過聚焦于最新發布的哥倫比亞大學研究報告,嘗試解讀算法撰寫新聞的行業趨勢與前景。

關鍵詞 自動化新聞;算法新聞;分析性思維;責任與挑戰

1什么是“自動化新聞”

美國哥倫比亞大學下屬的數據新聞研究中心TowCenter于2016年1月發布的《自動化新聞指南》采用術語“自動化新聞”來概括這一媒體行業的新動向。“自動化新聞”指在初期算法編程完畢后,不經人為干預,軟件或算法即可自動生成新聞故事的過程。因此,一旦算法生成,從收集和分析資料,到實際的撰寫和發布新聞,新聞生產的每個環節都可以自動完成。自動化新聞也可以被稱作算法新聞。自動化新聞適用于某類特定的新聞:這些故事以事實為主,且存在有效的、結構化的、可靠的數據可供使用。此種情況下,算法能夠生產大批量的新聞內容,并針對每個讀者做出個性化處理。算法比人類新聞記者更迅速、成本更低廉,而且很可能更少犯錯誤。

2自動化新聞的簡史與現狀

自動化新聞的概念看似新鮮,實則在新聞領域亦有跡可尋。該行業趨勢發源于近半個世紀前的天氣預報領域。一種能夠處理天氣預報模型數據(風速、降雨量、氣溫等)的軟件可將數據按照重要性排列(例如數值是否超過或低于某個閾值范圍),并使用事先寫好的約80個短語生產出一篇“措辭嚴謹的天氣預報”。另一個已經長期采用自動化模式的領域是以信息速度論高下的財經新聞。舉例來說,路透社和彭博社等機構都從新聞稿件中提取關鍵數據,將它們嵌入事先寫好的模板,為其客戶自動生成新聞提醒。近年來,福布斯、非營利性新聞調查網站ProPublica等紛紛開始采用自動化新聞技術,2014年美聯社使用Automated Insight創建的“語言大師”(Wordsmith)平臺來撰寫公司季度財報,這一消息更使自動化新聞前所未有地走進公眾視野。目前在全球范圍內研發自動化新聞軟件的11家公司,其中5家在德國(Ax Semantics:Text On:2txt NLG:Retresco:Textomatic),2家在美國(Narrative Science:Automated Insights),2家在法

國(syllabs:Labsense),1家在英國(Arria),1家在中國(騰訊)。

3自動化新聞的意義與影響

3.1新聞記者:應當更關注那些算法完成不了的任務

自動化新聞經常被看作是針對傳統新聞業的威脅,因而也毫無意外地吸引眾多記者的關注。新聞記者通常認為自動化新聞產品的寫作質量較差、他們認為復雜的敘事能力是人類寫作的競爭優勢。首先,“講故事”原本不是新聞記者視為至關重要的職業技能。他們強調的恰恰是算法更勝一籌的那些能力,例如,客觀性、簡潔、速度。更重要的是,新聞記者的爭論忽略了以下事實:自動化新聞在重復性、常規化且基于事實的新聞故事中最為有用。在此類作品中,寫作質量并非至關重要。例如,在瀏覽財經新聞時,讀者傾向于快速獲取信息。此時復雜、精妙的寫作手法反而費力不討好,使得讀者理解信息更加困難。

新聞記者應當更關注那些算法完成不了的任務。未來,人類和自動化新聞可能會緊密結合,算法將負責分析數據,尋找有趣的新聞題材,撰寫新聞初稿。記者則負責為稿件增添深度分析,采訪關鍵人物,并在幕后進行報道。

新聞記者也將在自動化新聞生產流程中扮演新的角色。例如,美聯社近期聘請了一位“自動化”編輯,其工作為嘗試辨別出可以轉為自動化的生產流程。開發新聞算法的一大挑戰便是定義出算法應當遵循的條件與規則。此類工作要求記者具備分析性思維,創造性,并且對統計學有一定的了解。

3.2新聞讀者:新體驗。新訴求

首先,記者撰寫的新聞比自動化新聞在可讀性方面評分更高。其次,自動化新聞在可信度方面評分更高。最后可能也是最關鍵的一點是,受眾對人類新聞和自動化新聞的質量評估差異很小。盡管讀者受眾認為記者的文章的確比自動化產生的文章更有可讀性,但他們本來就不太喜歡閱讀該類新聞。

自動化新聞在常規化、重復性的新聞領域足以與人類記者的寫作質量抗衡。有些新聞議題不單單包含基本事實,此時記者通過提供解讀、推理和主觀意見來發揮己用。目前還沒有自動化新聞能夠處理如此復雜的問題。

在富有爭議的報道領域,例如,采用自動化新聞作品分析投票數據來分析候選人贏得選舉的機率,讀者或某些利益群體很可能會質疑新聞故事的基本事實,或者抨擊新聞故事采取的視角。與之相似,如果算法針對每個讀者生成個性化的新聞故事,用戶也許會希望知道算法有多了解他們的需求,或者他們看到的新聞與其他人有何不同。用戶是否對算法透明度有要求還尚未可知,畢竟很可能極少有讀者了解算法在新聞界所起到的關鍵作用。

首先,我們需要更好地理解用戶對算法透明度的需求,以及如何能使公開信息服務于公眾利益;其次,需要尋找不干擾用戶體驗的信息公開方式,特別是針對那些對此類信息不感興趣的讀者。

3.3新聞機構:責任與挑戰

首先,新聞機構不僅需要擁有修改和公布源數據的法律權利,而且要確保這些數據足夠準確。新聞機構需要執行數據管理和核查的流程,自動完成或者由編輯人工完成均可。其次,如果基本數據或算法存在錯誤,自動化過程可能在轉瞬間生成大量疏漏百出的新聞故事,從而對機構的名譽帶來災難性的影響。新聞機構因此需要在發布自動化新聞之前進行徹底的測試。專家建議最好在作品發布前由編輯事先進行核查。再次,針對最終的新聞成品,自動化新聞的寫作風格需遵循機構的官方風格指南,并且應當能夠針對不同的故事采取多樣的措辭。新聞機構也必須維持最起碼的透明度,表明某個新聞故事是算法自動生成的,比如添加信息說明數據來源,以及該內容的生產方式。最后,還需明確法律責任。如同其他任何數學模型,生成自動化新聞的算法也依賴數據和先驗的假設,兩者均可能存在偏差或疏漏。此類錯誤可能導致意想不到的結果,最終造成新聞故事包含不準確或錯誤信息。

出錯時,新聞機構也許會迫于壓力公開自動化背后的源代碼。至少,他們需要解釋這篇錯誤新聞是如何生成的。從法理角度看,算法不能對錯誤負責。責任應當由自然人擔負,可能是發布者,也可能是導致算法或數據出錯的具體員工。

3.4社會:公眾輿論的未來

自動化新聞很可能會使新聞的數量大幅度增加,使得用戶在尋找與自身最相關的信息時遇到更多困難。為了解決信息超負荷的問題,搜索引擎和諸如“谷歌新聞”的個性化新聞聚合應用,其重要性都會與日俱增。

自動化新聞數量增加和完善,要求未來的研究必須著手解決更加寬泛的議題。我們能否相信,算法這一機制能夠促進新聞信息的核查與平衡,辨別重要的新聞議題,并且為民主進程中公眾輿論的形成設立共同議程?更重要的是,今后的研究需要了解,如果算法替代新聞業成為政府監督者,這一趨勢對民主意味著什么。盡管將自動化新聞的普及還尚待時日,其擁護者認為該領域將會迅速增長。Alexander Siebert是研發自動化新聞技術的德國公司Retresco的創始人,他認為在五年內自動化新聞將與人類撰寫的新聞別無二致。美國公司Narrative Science的創始人之一Kristian Hammond預測,未來10年內,超過90%的新聞將會走向自動化。endprint

主站蜘蛛池模板: 毛片在线播放网址| 国产亚洲精| 亚洲熟女中文字幕男人总站| 亚洲精品制服丝袜二区| 啪啪国产视频| 都市激情亚洲综合久久| 高清色本在线www| 日韩精品一区二区三区swag| 国产成人91精品免费网址在线| 婷婷午夜影院| 一级一毛片a级毛片| 中文成人在线视频| 4虎影视国产在线观看精品| 亚洲无码久久久久| 亚洲精品免费网站| 久久综合婷婷| 伊人成人在线视频| 欧美日韩理论| 国产精品视频白浆免费视频| 欧美成人午夜在线全部免费| 亚洲视频四区| 国产人前露出系列视频| 真实国产乱子伦高清| 久久无码高潮喷水| 99久久亚洲综合精品TS| 亚洲高清国产拍精品26u| 久久无码av三级| 欧美日韩激情在线| 男女男免费视频网站国产| 久久黄色影院| 免费毛片全部不收费的| 啪啪免费视频一区二区| 伊人成人在线| 亚洲IV视频免费在线光看| 欧美啪啪视频免码| 在线免费观看a视频| 2022精品国偷自产免费观看| 亚洲中文字幕无码mv| 刘亦菲一区二区在线观看| 日本不卡视频在线| 国产精品开放后亚洲| 熟妇人妻无乱码中文字幕真矢织江 | 欧美色99| 在线va视频| 欧美亚洲欧美| 久久精品国产91久久综合麻豆自制| AV老司机AV天堂| 国产日韩AV高潮在线| 日韩麻豆小视频| 成年人免费国产视频| 久久精品午夜视频| 又粗又大又爽又紧免费视频| 五月婷婷综合色| 国产麻豆91网在线看| jizz亚洲高清在线观看| 欧美色图第一页| 国产成人一区二区| 国产精品一线天| 91久久国产热精品免费| 在线色国产| 亚洲日本在线免费观看| A级毛片高清免费视频就| 国产亚洲视频在线观看| www中文字幕在线观看| 久久黄色小视频| 国外欧美一区另类中文字幕| 老司机精品久久| 2020最新国产精品视频| 午夜福利在线观看入口| 亚洲综合精品第一页| 一本大道香蕉久中文在线播放| 九九精品在线观看| 亚洲AⅤ波多系列中文字幕| 青青青视频蜜桃一区二区| 久久精品国产一区二区小说| 日韩精品亚洲人旧成在线| 婷婷成人综合| 国产在线日本| 精品福利网| 国产女人在线视频| 亚洲三级影院| 在线免费不卡视频|