朱昊煜
[摘要]人工智能時代,算法新聞成為網絡新聞的主流分發模式。本文在分析算法新聞的運行模式的基礎上,肯定了算法模型是新聞傳播領域中在技術與觀念層面的重大突破,也重點闡述了算法新聞的發展困境。本文指出,在享受算法新聞帶來的新式閱讀方式的同時,關于信息繭房、技術偏見和社會主流價值缺失的問題也應被重視。在算法模型以及其他的人工智能的實踐中,技術價值與技術倫理均不可偏廢。
[關鍵詞]算法新聞?新聞傳播?倫理風險
中國互聯網信息中心在2017年發布的一篇研究報告指出,“算法分發”逐漸取代傳統的編輯分發,成為現在網絡新聞的主流的分發模式。不可否認,算法新聞在新聞市場中具有明顯的優勢。相比人工編輯,算法能夠在繁雜的信息中更快的挑選出關鍵點,更高效地生成新聞內容,實現信息的用戶的“專業定制”。它改變了傳統新聞的傳播方式,打破了新聞場域內的原有權力關系。但是,算法新聞也引起了許多爭議。首先就是完全取決于用戶偏好的“個性化定制”可能帶來的“信息繭房"問題。其次,依托人為設計的公式和模型而生的算法技術是否完全中立客觀?第三,如果算法新聞是為了迎合用戶偏好而設計的,那么它是否存在特定的價值觀?最后,如果算法新聞平臺是為了它背后公司盈利而服務,那么新聞產生利潤和新聞的人文價值應該和平衡?
算法就是通過收集數據,自動運算,最后得出結論,以此來解決一系列問題的計算機指令。通常算法自動運行的模式是遵照過濾,分類,排序,關聯這四個步驟。算法新聞的運行流程也是基于這個基本模型,在哥倫比亞大學新聞學院的研究報告中有明確對算法新聞流程的介紹[foot-note?Ref,這里作簡要分析:
收集大量數據。該數據分為兩大類,首先是有關新聞本身的數據,例如一場球賽的比賽地點和時間球員名字、最終比分等;其次就是用戶的信息,如社交媒體中某用戶的賬戶名、年齡、職業、關注標簽、搜索記錄、對何種消息點贊轉發,這些信息可以透露出該用戶的偏好與關注重點,算法的目的就是要讓被推送的新聞與用戶偏好契合。
計算新聞的價值。新聞的價值一般在于它所報道的事情的“異常性”。例如在天氣預報中,會重點突出高于或低于歷史記錄的溫度;在比賽報道中,會強調精彩進球或是重大失誤;更常見的是在娛樂新聞中,原本特別恩愛的明星夫婦突然爆出出軌丑聞等等。當算法判定這些信息與歷史信息不符,呈現出一種“異常性”,那么這些信息就具備新聞性。
選取新聞角度。新聞角度的選擇與新聞“異常性”緊密相關,因為“異常性”是新聞價值所在,所以應選取最容易也最完美向讀者傳達新聞“異常性”信息的角度。以體育比賽為例,衛冕、復仇賽、拉鋸戰等都是吸引讀者注意力的角度。由于用戶使用社交媒體時會在在短時間內接收大量信息,其中大部分在用戶眼中就只會是一個模糊圖像。為獲得點擊率,算法新聞會配有十分夸張的標題。
將相關細節放人新聞框架中。例如將一場球賽中的每個球員名字和得分情況放人到新聞框架中。因為互聯網的超文本性,現在許多算法新聞還可以將每一位球員的照片,曾經的比賽經歷,甚至他的私人生活情況的頁面鏈接放在新聞中。所以這就出現了一個問題,當用戶閱讀某一新聞時,他有可能去點擊新聞下方的鏈接,接收了一些他本來不準備接收的信息,這種算法新聞的“強制性”是很難被察覺到的。
對自動生成的算法新聞進行自然語言的潤色。例如使用人類自然語言替代機械語言,增強新聞的可讀性;或者在其中增加一些表達態度的詞匯或句子,改變新聞的敘述語氣。例如加入一些負面詞匯就會讓新聞顯得不確定,加入一些積極的,表肯定和自信的詞匯就會讓新聞變得更有說服性。
通過這一系列步驟生成的算法新聞一般與人工編輯的新聞并沒有什么差別,用戶在閱讀時也很難分辨兩者。算法新聞就是將新聞內容的編輯、新聞價值的判斷交予計算機,幾乎可以算是人工智能在傳統新聞界掀起的一場革命。
(一)算法新聞的意義
相較于傳統新聞的線性傳播方式,算法新聞更強調個性化定制。目前常用到的算法新聞策略有三種:內容推薦、協同過濾推薦熱門推薦。內容推薦是指根據用戶平時的搜索和瀏覽記錄,關注的標簽和話題,來繪制該用戶的興趣圖譜。之后計算每條新聞與這名用戶喜好的匹配性,將匹配度最高的新聞推送給他。協同過濾推薦需要先將目標用戶劃分到某一興趣小組,在這一興趣小組中,所有成員都有相似的偏好,例如都關注體育新聞,再將該興趣小組中其他成員關注的新聞推送給目標用戶。熱門推薦則是基于新聞的點擊量和轉發量向用戶進行推薦。這三種推薦策略給傳統新聞業帶來了兩個重要的影響:

1.改變了用戶信息行為和新聞傳播模式。傳統用戶行為過程是先確定用戶需求,根據需求獲取信息,最后吸收信息并解決問題。這個過程中,用戶處于主動狀態,所有的信息收集,構建信息圖表都是由用戶自己完成。這里有一個問題就是,受主觀因素影響,用戶不一定能認識到并準確表達出自己的潛在需求,因此信息需求,信息提問,信息獲取不可能是完全一致的。但是算法新聞可以解決這個問題。算法新聞是計算機通過分析用戶的興趣圖譜,智能地演算推測出用戶的潛在需求,將潛在需求作為目標,制定針對該用戶的個性化推薦。因為興趣圖譜可以很好的反映出用戶的潛意識想法和偏好,所以這種方式不僅節省了信息制作成本和時間,同時也實現了信息需求、信息提問、信息獲取三者的統一。新聞傳播模式的轉變也是基于此,傳統新聞媒體是將所有新聞全部都呈現給用戶,用戶從中挑選自己喜歡或關注的信息;算法新聞是在用戶接觸到信息之前就將他們可能不關注的內容過濾掉,只呈現用戶感興趣的部分。
2.新聞場域內權力關系的變動。運用布迪厄的場域理論分析可以知道,新聞場就是一個由新聞生產者、消費者、投資家等各種社會力量組成的關系網。他在“關于電視”一文中指出,新聞場受制于經濟力量(收視率),同時也收到來自政治、科學、藝術等領域的影響。
(二)算法新聞面臨的倫理風險
算法新聞雖然比傳統人工編輯新聞更強調個性化和交互性,但它也存在一些局限,這些局限性有的是因為算法初始公式本身不夠完善引起的,有的是算法運算過程中自主產生的“黑箱”。這些局限性主要包括:
1.信息繭房。信息繭房是指因為公眾對信息的需求并不是全方位的,而互聯網加強人們對信息的自主選擇的權力,因此人們就只注意自己想看的想聽的信息,拒絕那些讓自己不愉快的消息,久而久之,就會將自己束縛在一個像蠶繭的封閉空間中。算法新聞或者說算法推送信息模式的出現,無疑使用戶“信息繭房”問題變得更嚴重。以中國社交媒體平臺一微博為例。當注冊一個新的微博賬號時,會有一個專門的步驟:讓用戶選擇自己想要關注的標簽。注冊完成之后,在微博內呈現的信息就是該用戶選擇的標簽內容。除此之外,微博還會根據用戶搜索和瀏覽記錄來選擇下一次的推送內容,例如用戶在微博搜索框內輸人某一明星的名字,瀏覽了這名明星的新聞之后,接下來很長一段時間,該用戶的微博首頁大部分都會是這名明星的消息。設想一下,當用戶在微博上輕微的表現出對一些社會現象的負面情緒時,他的微博首頁會通過這些記錄不間斷的給他推送負面消息,強化加深他的這種固有印象,最后導致他產生極端觀點。還有一種情況就是,人們一般會選擇加入與自己觀點一致的團體,在這個團體中會有“團體共識",當面對不符合“團體共識”的信息時,成員會集體抵制拒絕它們。在這個“信息繭房”中,成員會受到群體壓力的作用,盡量讓自己和其他成員達成共識,但有時候這種共識并不是正確的。然而在“信息繭房”中,這種錯誤的概念會不停的被強化,導致最后錯誤的概念也會被曲解為正確的。這種“回音壁效應”很容易滋生極端意識,網絡暴力就是后果之一。
2.算法偏見。前文有說到,算法最初是一種數學運算模型,因為其“技術的中立性“讓一部分人認為算法新聞可以實現新聞客觀報道。但也有許多研究調查表明算法也會產生偏見和歧視。那么算法偏見是如何產生的?根據前文對算法運算流程的分析可以繪制下圖:
(1)算法設計偏見。算法設計偏見指的是算法設計師在設計算法時,無意識將自己的偏見帶人到算法中。算法設計的過程十分復雜,其中包括目標問題的確定、算法公式模型的搭建、算法運算的流暢度、檢驗算法的運算效率等。這每一步都是由以設計師為核心的算法設計小組人工完成。而只要涉及到人工作業,就肯定不是完全的中立公正。對目標問題的理解模擬數據的選取算法完成度的衡量標準等的判斷結果都是因人而異,最終呈現出來的算法也會反映設計者的觀念和態度。
(2)數據偏見。一方面,數據是算法的唯一輸人指令,所有信息和資料都要先轉換成由代碼組成的數據,然后在算法中運算,因此數據與現實世界的重合程度就是這個算法的可靠程度。但事實上,現實世界的信息和資料的更新是早于它們轉換為數據這一步驟的,也就是說,算法在當時可依賴的數據很有可能是有缺陷的,這就會導致最后的結果存在偏見。人的思維更為復雜,興趣愛好對待事情的態度、價值觀念都有可能隨時發生改變,而算法新聞的需要處理的對象又剛好是這些復雜的人的思維圖,因此輸人的數據的可靠性會更低。這也就是為什么算法需要不斷的完善,數據庫的內容需要不斷更新的原因。另一方面,算法將復雜的新聞寫作簡化為單一的數據輸人,這樣的做法會讓新聞失去原來的精準描述的表達。與此同時,新聞的價值還在于它是否能滿足精英階層和名人需要,或是它是否有足夠大的受眾面,和讀者的生活是否切實相關,是否符合新聞從業者的利益等。這些信息是無法全部通過計算機中的代碼和數據來表達的,因此當使用算法來描述一個有深度的,有意義的新聞時,最后呈現的結果必然存在偏差。
(3)新聞社會責任的消失。《報刊的四種理論》一書指出,自由是伴隨著義務的;而享有我們政府特權地位的報刊,就對社會承擔當代社會的公眾通訊工具的某種主要職,能。在社會責任理論下報刊需要做到以下幾點:報紙要盡可能做到準確,不能說謊;報紙應當是一個交換批評與意見的平臺;報紙應當正確的,客觀的描繪各個社會集團;報刊要負責介紹和闡明社會目標和美德;報刊要使人們能快速獲得當天的信息。
這里指出的是,這五點不僅是報刊,也是所有新聞媒體都要承擔的社會責任。中國的新聞媒體現狀是,諸如微博,今日頭條這樣的媒體已經成為新聞發布的主流渠道,許多地級刊物,省級刊物甚至國家級刊物都有它們的官方微博賬號,重大的政治新聞也會通過這些新媒體進行報道。換句話說,這些新媒體上傳播的信息已經具備一定的權威性,但是它們并沒有履行應當承擔的社會責任。如上文所說,算法新聞是基于人們想知道的,而不是人們需要知道的,這一點就造成了刺激的、獵奇的虛假新聞的盛行。這些負面的信息和虛假的新聞不能傳達給人們一種積極的價值觀,也無助于社會公共道德的建設。算法新聞太過于強調用戶的自由性,過于迎合大眾的口味,而忽視了它作為新聞本身應該履行的責任。
近年來網絡新聞市場的變化讓越來越多的媒體開始重視算法分發和新聞的個性化推薦。進人互聯網時代后,人們接觸到的信息量急速增多,而且這些信息也魚龍混雜,傳統新聞的人工編輯模式很難高效的從眾多垃圾信息中抓住重點,因此將算法技術引入到新聞業中是有重要意義的。它真正的實現了用戶與信息的相互耦合,同時因為減少了對人工編輯的依賴程度,打破了新聞場域中新聞生產者和投資者對信息的控制。但是,也正是因為減少了人工對系統的糾正和調試,算法機器只能實施已輸人的指令,它本身并不能根據最新情況進行自我更新,尤其是對于新聞這樣不存在絕對的正確答案或錯誤答案的領域,算法難以識別信息的真正內涵。
另一方面,算法被引入新聞業也是迎合了商業需求。算法新聞這種以用戶為導向,完全釋放新聞生產能力,壓縮人工成本的新聞模式可以帶來巨大的商業利益。像美國的Facebook,中國的今日頭條,這些平臺都是以滿足用戶需求為目標,用戶的態度是衡量信息是否有價值的標準。盡管它們都不愿意承認自己是“媒體”而是“信息聚合平臺”,但是在當下算法技術逐漸成為主流的時代,既然已經接手信息“把關人”的工作,就更應該有一個明確的價值觀,并且承擔引導主流價值走向的任務。
應當明確的是,算法技術是有價值觀的,取決于使用者用它來做什么。當算法新聞平臺默默無聞,沒有得到大眾認可時,算法技術可以被用來盈利;但當它們開始有社會影響力時,算法技術就需要考慮它帶來的文化導向。人工智能也是如此,發明人工智能的目的應該是讓人類生活變得更輕松便捷,幫助人們看到不曾看到的風景,對問題的思考有更深的理解,而不應該是將人們的思想禁錮在一個“信息繭房”中,甚至剝奪他們的思考能力。
參考文獻:
[1] Beer, D. Power through the algorithm? Participatory Web cultures and the technological?unconscious 0].New Media & Society, 2009, 11(6): 985- 1002.
[2] Carlson, M. Facebook in the news: Social media,?journalism,and public responsibility following the 2016Trending Topics controversy []. Digital Journalism, 2017,6(1): 4- 20.
[3] Diakopoulos, N. The Anatomy of a Robot Journalism [online]. Available: https:/ / towcenter org/the - anato-my-of- a- robot- journalist/. 201 4/06/12
[4] Gillespie, T. Can an algorithm be wrong? TwitterTrends,the specter of censorship, and our faith in the al-gorithms around us. Culture Digially Blog [online]. Avail-able: http://culturedigitally.org/ 2011/10/can -an -algorithm -be-wrong/.2011/10/19
[5]中國互聯網信息中心.‘2016年中國互聯網新聞市場研究報告.網址:http://www.199it.com/archives/558868.html.2017/01
[6]鄧建國:《機器人新聞:原理,風險和影響》,《新聞記者》2016年第9期
[7]姜紅、魯曼:《重塑“媒介”:行動者網絡中的新聞算法》,《新聞記者》2017年第4期
[8]王茜:《打開算法分發的“黑箱”——基于今日頭條新聞推送的量化研究》,《新聞記者》2017年第9期
[9]趙平喜、吳聞鶯:《新聞場域視野下的信息環境建構》,《新聞記者》2009年第7期
[10]張超:《作為中介的算法:新聞生產中的算法偏見與應對》,《中國出版》2018年第1期