姚庚君
摘? 要? 隨著大數據和機器學習算法等人工智能相關技術的發展,數據新聞、機器新聞寫作等新聞生產領域的新樣式對“質化”理解的傳統新聞真實概念提出挑戰。文章試圖通過對傳統新聞真實性概念在現實技術環境下的挑戰的分析,指出對新聞真實性概念的理解由“質化”向“量化”轉型的必要性,并且借助對中外新聞學研究史中新聞真實性概念發展的梳理,以及國內外對新聞真實概念的測量案例的分析,指出這種量化轉向的可行性。
關鍵詞? 新聞真實性;可測量化;人工智能;數據新聞
中圖分類號? G210? ? ? 文獻標識碼? A? ? ? 文章編號? 2096-0360(2019)02-0018-02
2017年12月15日,假新聞(Fake News)當選“柯林斯詞典年度熱詞”。柯林斯詞典對“假新聞”的定義如下:偽裝成新聞報道的、虛假的、聳人聽聞的信息。根據其旗下相關機構統計,這個詞自2016年以來使用量增加了365%。“假新聞成為年度熱詞”這一事件雖然不能讓本文得出有關于當前新聞媒體報道真實性狀況的準確結論,但是這至少說明一個事實,那就是:作為新聞專業主義的核心概念與規范,新聞媒體的真實性現在正在面臨質疑。
與此同時,數據新聞,機器新聞寫作以及自動化驗證等人工智能相關技術的發展也給從19世紀中期以來依靠行業自覺與行業規范[1]而形成的新聞真實性定義提出了挑戰。所以,本文將通過對國內外的相關研究進行梳理也再研究,從以下方面分析這種挑戰。并提出相關解決方案。
1? 形式化挑戰
馬特·卡爾森的“算法三部曲”作為現階段對于算法在新聞生產中的應用的突破性研究。他的研究表明:算法新聞對傳統新聞專業主義的模糊性提出了挑戰,他指出:“在數字新聞時代,新聞業的邊界仍然具有一定的可滲透性,同時也更容易受到外界的影響。因此,要單單依靠專業主義為新聞業提供一定的邊界保護越來越不可能。”[2]
馬特·卡爾森還認為,算法在某些情境內獲得了自己的“主體性”[2]。清華大學新聞與傳播學院彭蘭教授更是表明,在未來“萬物皆媒”的時代,“新聞信息存儲、分析、加工系統可能脫離專業媒體獨立存在”[3]。事實上,不論是機器新聞寫作還是自動化驗證技術,實際的行業應用都證明中外兩位學者的判斷是正確的,比如大數據專家Julia Goldstein和Mike Ghoul就通過文本挖掘等技術設計出來一種能夠識別假新聞的算法。在這些特點中,機器算法與人最大的不同在于其判斷方式的規則性與機械性,原因在于算法的本質是一系列形式語言的符號,它與人類基于意識與行為經驗的判斷方式具有明顯的差異。這個問題反映到對新聞真實性的判斷上,可以被表達為:對于算法而言,想要讓它遵從新聞真實性的規范和要求,一方面,我們需要精確而嚴格地定義新聞真實,另一方面這個定義需要被用精確而嚴格的形式語言表達出來。
形式化表達更加深刻的意義在于:一方面它可以促進人機之間的溝通與協作,另一方面它能夠將人類的價值觀,并且引導算法向著良性的方向發展。
2? 量化挑戰
這種量化挑戰可以從信息結構層面的方面來理解。信息結構主要是針對數據新聞的。因為對于數據新聞,使用數據并使得報道更加的精確和嚴格是它非常重要的功能。吳小坤教授在其論文中對數據新聞的維度進行了如下定義:新聞性、統計性、工具性、生產流程標準化、新聞行業創新性[4]。其中“統計性維度”說明數據新聞的數據處理需要服從統計學對于“真”的定義的某些規則,但是這就使得傳統新聞真實性即將面對一個重要的挑戰那就是可量化挑戰,正如方潔老師指出“傳統的新聞采編的記者往往是一種‘非規范的定性思維,擅長簡單的歸納、數據的總結,容易在采訪中主觀先行。數據新聞則是以一種‘比較偏向量化的研究思路做新聞,新聞事實的產生是基于數據挖掘和分析。”[5]
比如,在傳統新聞真實性觀念中,“對于新聞真實的量度,仍然主要是一個定性范圍的概念,不是一個純粹的可以計算的數量概念。”[6]李良榮教授就表明:“要做到整體真實是相當有難度,尤其是難以準確地評估。”[7]我們雖然不能僅僅用數據新聞的整體真實涵蓋整個傳統新聞真實性理論中有關于整體真實的全部內涵,但是在數據新聞的現實要求下,對于新聞真實性的量化定義可以在一定程度上幫助數據新聞確定某些統計意義上的真實,而這種量化定義下,“真實性”這種性質判斷用語將被“真實度”,“確證度”以及“置信程度”等具有統計意義的量化用語取代。
3? 中外新聞學研究中有關“真實性”的測量問題
事實上,有關“新聞真實”的自動化測量一直是全世界學者所關注的問題。
20世紀60年代,基于統計理論以及社會科學實證方法的精確新聞學是這方面的開創性研究之一,菲利普·梅耶就明確表示要通過嚴格的統計學方法,精確地估測一些無法直接測量但是卻很有新聞價值的事件。
到了數據新聞時代,隨著計算機的廣泛使用,伯明翰大學的Paul Bradshaw認為,“計算機式思維”將是引領下一波數據新聞浪潮的重要思維工具,在他的設想當中,“計算機式思維”應該包括如下特征:問題分解、模式識別、抽象化及算法。其中抽象化與本文提到的形式化的內涵有相通之處,只不過本文中提到的形式化不僅僅是一種新聞工作者的思維方式,更是一種新聞學的發展方向。
經歷了如上學術積淀,新聞真實性的可測量化最終在最近得到了突破。圣克拉拉大學馬庫拉應用倫理中心的真實性核實量化標準體系就是其中的代表。該項目發布了一份信托指標,一套標準化的公開性原則,旨在為出版物的標準、工作流程和記者的背景提供清晰的信息,幫助受眾輕松評估新聞的質量和可信度。信任指標是標準化的披露,提供清晰的新聞機構的道德標準和其他公平性和準確性的標準[8]。該項目發布了一份信托指標,一套標準化的公開性原則,旨在為出版物的標準、工作流程和記者的背景提供清晰的信息,幫助受眾輕松評估新聞的質量和可信度。信任指標是標準化的披露,提供清晰的新聞機構的道德標準和其他公平性和準確性的標準。世界各地主要媒體公司,以及Google、Facebook、Bing和Twitter,都開始使用這些指標,來給人們提供更多關于他們所讀故事的信息,幫助他們識別高質量的新聞。
在國內方面,青年學者胡華濤運用非形式邏輯與概率系統,通過信念修正的方法來部分形式化與量化地定義真,使得對“真”的判斷變成了基于邏輯的概率判斷[9],進而實現對新聞真實性的量化。
所以,通過以上分析,我們可以得出以下結論:將新聞真實性由相對“質化”的理解轉為“量化”的理解既是新聞學發展的可能方向,又是應對現實技術挑戰的必要措施。而可行的方法應該是將新聞表達的語言邏輯與統計經驗相結合,并不斷通過與受眾的相互協調,完成學理概念,實踐操作與溝通互動三方面的結構性統一。而且隨著媒體技術的發展,我們或許可以展望在不久的將來,新聞的客觀性、時效性等更加復雜的新聞價值概念也可以通過一種嚴格而精密的量化規則來進行定義。從這個意義上來講,新聞真實性概念的量化轉向很有可能僅僅是這一系列新聞學基本概念量化轉向的開始。
參考文獻
[1]黃旦.新聞專業主義的建構與消解:對西方大眾傳播者研究歷史的解讀[J].新聞與傳播研究,2002(2):2-9.
[2]馬特·卡爾森.自動化判斷?算法判斷、新聞知識與新聞專業主義[J].張建中,譯.新聞記者,2018(3):83-96.
[3]彭蘭.智媒化:未來媒體浪潮——新媒體發展趨勢報告(2016)[J].國際新聞界,2016(11):6-24.
[4]吳小坤.數據新聞:理論承遞、概念適用與界定維度[J].新聞與傳播研究,2017(10):120-126.
[5]黃志敏,王敏,李薇.數據新聞教育調查報告[J].新聞與寫作,2017(9):17-24.
[6]楊保軍.新聞真實論[M].北京:中國人民大學出版社,2006:45.
[7]李良榮.新聞學導論[M].北京:高等教育出版社,1999:128.
[8]Markkula Center for Applied Ethics,Leading news outlets establish transparency standards to help readers identify trustworthy news sources,Santa Clara University official website[EB/OL]:https://www.scu.edu/ethics/focus-areas/journalism-ethics/programs/the-trust-project/trust-project-launches-indicators/.
[9]胡華濤.當代新聞邏輯學導論——新媒體時代新聞推理與論證的現代性研究[M].武漢:武漢大學出版社,2015:75.