張 旦
(四川外國語大學 新聞傳播學院,重慶 400031)
近年來,隨著大數據和人工智能技術的發展,新聞業也積極探索應用大數據挖掘和人工智能技術改進新聞生產方式,新聞算法應運而生。新聞算法的出現改變了傳統的新聞生產方式,重塑了新聞生產與分發這兩個維度,使得數字新聞業經歷“算法轉向”,即從人工編輯形式走向更為高級的智能算法階段,在業界、學界和社會各界都引起了很大震動。本文通過梳理歐美新聞算法應用的最新進展和主要案例,以期為我國新聞算法的發展提出可能的研究方向和思路。
首先,歐美新聞算法應用時間較早。早在2001年,谷歌就開始采用個性化新聞推薦,這是媒體首次將算法應用到新聞生產之中。其次,應用領域比較廣泛,在歐美地區,新聞算法較多被互聯網巨頭、初創型科技公司以及傳統媒體等機構采用。谷歌、臉譜網早已在新聞搜索、推薦、分發等系統服務中應用算法技術。初創型技術企業,如敘事科學和自動化洞察等公司主要研發一些自動化的寫作軟件,并通過這些軟件生成財經資訊、體育資訊等類型報道。主流媒體和通訊社也嘗試通過采納算法來改造傳統的新聞生產和新聞分發過程。[1]
再次,算法技術比較成熟。新聞算法在前期的應用中只推送用戶喜歡的信息,逐漸形成了“信息繭房”的窘境。人工智能針對算法的革命就在于對現有推薦系統的不斷優化。一方面,考慮普遍相關性;另一方面,照顧個體差異,使用戶有機會接觸更多可能感興趣的內容。比如,英國《泰晤士報》和《星期日泰晤士報》正在開發一個名為“詹姆斯”(James)的全新推薦系統,它將針對用戶的個人偏好進行學習,不僅根據用戶經常點擊的內容進行推薦,更重要的是堅持新聞標準。對算法的改進是當前人工智能應用于新聞業的主要技術路徑。
算法是指一系列非常復雜的數學規則,通過預先設定的步驟解決特定問題的計算機程序。[2]其最大的特征就是新聞生產的自動化。以敘事科學公司的新聞算法為例,這個流程主要包括五個步驟:一是讀入大量結構化和標準化的數據;二是測量數據中的“新聞性”;三是找出合適的報道角度,如果有多個角度,則按照重要性排序;四是將報道角度與數據中的具體事實相匹配;五是生成報道文本。[3]通過以上的工作原理可以看出,當前新聞算法在新聞報道中依然處于輔助地位,用于處理一些有清晰數據支撐、報道程式簡單明確的新聞題材。
在歐美地區,新聞算法較多地被應用到新聞的寫作、選編、審核和分發等領域,本文結合歐美的具體應用案例進行討論。
1.算法選編:機器自動對新聞排序。算法通過對用戶行為進行分析后確定其內容偏向,篩選出最具商業價值的新聞,然后根據這些標準推送讀者感興趣的內容?!缎l報》于2014年推出了一份名為“#Open001”的紙質報紙,算法機器會自動將社交網絡上的分享熱點進行內容篩選、編輯排版和印刷,最后生成一份報紙?!都~約時報》研發的機器人Blossom采用算法幫助編輯挑選出最適合推送的文章和內容。路透社名為“Open Calais”的算法機器人和《紐約時報》推出的“R&D Editor”利用算法完成了算法排序、識別關鍵詞、找出熱門內容、文章標簽自動化等工作。[4]總之,算法機器給新聞界帶來了更多的想象空間。
2.算法寫作:人機互動的前瞻。2013年,美聯社采用人工智能算法,讓程序自動撰寫體育報道類新聞稿件?;诿缆撋珙A先編輯好的寫作結構,在幾秒鐘之內生成1篇150~300字的新聞快訊。之后,越來越多的媒體開始采用算法機器寫稿?!堵迳即墪r報》推出了支持災難報道和犯罪新聞報道的機器人;法國《世界報》通過和Syllabs公司合作,用機器人記者報道選舉活動;[4]《華盛頓郵報》在里約奧運上派出了機器人Heliograf進行賽事報道。利用算法機器寫稿,極大地節省了記者的時間,可以讓記者專注于深度采訪和高質量的報道。
3.算法審查:自動核實新聞內容。早在2012年年末,《華盛頓郵報》就啟動了名為“truth teller”(吐真者)的實時新聞核查項目。它能全程記錄新聞報道中的文字、語音等信息,隨后與“打假”數據庫進行對比,一旦發現異常便會發出警報?!都~約時報》則應用了一套能夠自動審查過濾用戶評論的人工智能軟件,大大降低了人工審查的成本。Google也推出了人工智能新工具Perspective,它能夠通過機器學習來檢測網絡上的惡意或有害的評論,既可以有效地幫助各大媒體機構進行騷擾和負能量內容的處理,也可以幫助網民識別有害信息,凈化網絡空間。[4]
4.算法推送:信息私人定制的個性化推送。2001年,谷歌開始采用算法進行個性化新聞推薦,即由算法決定給哪些用戶推送什么內容。之后,Facebook采用了News Feeds算法的協同過濾機制,其目的是把用戶真正關心的內容找出來。Twitter采用算法推薦機制,將推文推送給對內容存在潛在興趣的用戶。這種機制的本質是為用戶打造私人定制信息,即所謂的“個性化報紙”。[5]國外知名的個性化新聞推送應用News Republic和Flipboard也是通過智能編輯、數據分析等手段向全球用戶提供最廣泛的個性化新聞內容推薦。算法推送實現內容的個性化推薦,有效強化了傳播效果。
國內算法領域的主要嘗試者是技術型公司和傳統媒體,算法主要被這些公司用于新聞的生產與分發。在算法寫作領域,騰訊推出的Dream writter機器人利用算法能自動生成稿件,并能在第一時間將重要資訊推薦給用戶。2015年9月,騰訊用它創作了一條財經新聞《8月CPI同比上漲2% 創12個月新高》。還有新華社的“快筆小新”,阿里巴巴與第一財經聯合推出的DT稿王,今日頭條的新聞寫作機器人“張小明”。
算法在個性化新聞推薦上的應用早已為人熟知,《移動互聯網2017春季報告》指出,網絡新聞活躍用戶數量排名前三的是騰訊新聞、今日頭條和一點資訊??v觀當下國內資訊類APP市場,算法似乎已經成為資訊類APP的核心標配。今日頭條、一點資訊、天天快報都將其作為平臺的核心配置。[6]目前,個性化新聞推送在我國新聞市場擁有極高的市場占有率,有用戶黏結性強、滲透率高等特點。
1.應用領域有限。不同于國外,算法在國內的起步時間較晚,技術發展也不太成熟,因此在新聞業的應用領域也相對有限。國內新聞算法領域的主要嘗試者是技術性公司,傳統媒體略有采納算法技術,但應用程度不高。[1]目前,算法在我國新聞業的應用主要集中于機器寫作和智能分發兩個領域。相比國外媒體將算法應用于分析、寫作、選編、審核、推送等整個新聞生產流程,我國新聞算法的應用發展還有很長的路要走。
2.算法寫作存在的局限性。算法寫作是基于既定的模板將收集好的數據信息嵌入生成的新聞稿件,在當前國內算法寫作的新聞實踐中,主要被用來撰寫財經、體育、災難事故等領域的新聞,應用領域較少,還未進行解釋性報道和深度報道。同時,算法新聞的生產主要是通過自動化模板和數據分析與挖掘技術實現的,因此雖然語句流暢,但缺乏思想深度和縝密的邏輯思維,單純依靠模板生成的內容容易千篇一律,缺乏人文關懷、理性思考。
3.算法分發存在的倫理問題。國內的新聞客戶端會利用算法技術對用戶的個人數據進行統計和處理,算法技術能夠精準分析并解讀用戶的閱讀習慣和興趣,并以此刻畫出每一個用戶的“畫像”,從而為用戶提供量身定制的新聞產品,滿足了人們的個性化需求。但技術是一把雙刃劍,在帶來好處的同時,也引發了“算法黑箱”“信息繭房”以及用戶隱私泄露、價值觀缺失等技術倫理等問題。
隨著算法技術對新聞業和社會的影響越來越大,我國很有必要進一步重視新聞算法的研究與應用。展望未來,我國的新聞算法應用需要重點在以下幾方面拓展與深入。
在歐美國家,政府一直積極推動人工智能新技術的發展,因而歐美的新聞算法起步時間較早,應用領域也更為廣泛。目前,我國的算法技術還處于起步階段,新聞算法在應用的過程中有很多不足,因此政府必須主動承擔責任,而其承擔責任的主要形式就是提供長期持續的資金支持和應用鼓勵。首先,加大對新聞算法研究的資金投入和支持,當前算法產生的一些倫理風險究其根本是技術的發展水平不夠高,因而要不斷優化算法技術,規避現階段造成的“信息繭房”等風險;其次,率先進行應用推廣,目前算法只是在平臺型媒體中應用,傳統媒體的應用程度不高,未來可以鼓勵更多的傳統媒體機構采納新聞算法,將其應用到搜集信息、審核信息等領域。
新聞算法作為人工智能技術與新聞業融合的產物,在未來的發展過程中需要大量的人才資源。歐美國家為應對人工智能的發展建立了相當龐大的人才資源庫,這一點對于我國具有極大的借鑒意義。人工智能的人才需要三個層面的體系化隊伍,一是在技術層面有精深的技術專家和相應的人才隊伍;二是在社會層面,有對人工智能透徹理解的社會治理領域的應用專家;三是有能夠把握技術趨勢和未來社會發展的未來學專家,從而構建從技術到社會治理領域的有效溝通,不斷研判通向未來的道路。[7]而新聞算法研究涉及的領域包括基礎數學、信息科學、自動化控制和新聞傳播學等。只有建立全方位的人才庫,才能更好地應對人工智能時代算法的發展需求。
在我國,算法推送是后Web2.0時代的一個新事物,關于這一領域的規制研究基本上還是一片空白,尤其是針對用戶數據泄露、不良信息傳播等問題,缺乏相應的法律法規。[8]歐美地區的法律體系和監管體系相對完備,如歐盟于2016年推出了《一般數據保護條例》,對數據主體享有的權利進行了細致劃分,規定數據主體享有對個人數據的“刪除權”或“被遺忘權”。因此,在算法時代制定新的倫理和法規很有必要。從宏觀層面而言,國家應制定和完善嚴格的法律法規,盡快將數據立法提上日程,明確互聯網條件下個人隱私的邊界;從中觀層面而言,企業自律非常重要,應當建立更加完善的分發機制,協調好工具理性和價值理性,主動承擔社會責任,關注人的發展。
[1]章震,周嘉琳.新聞算法研究:議題綜述與本土化展望[J].新聞與寫作,2017(11):18-23.
[2]鄧建國.機器人新聞:原理、風險和影響[J].新聞記者,2016(9):10-17.
[3]Kumar P B, Chhotray A, Parhi D R. Anatomical Characterization of a Humanoid Robot[A]. International Conference on Progressive Engineering, Technology & Science[C]. 2016:119-130.
[4]孫國新,汪小東.人工智能在報業的應用前景分析[J].新聞戰線,2017(12):19-21.
[5]方師師.算法機制背后的新聞價值觀——圍繞“Facebook偏見門”事件的研究[J].新聞記者,2016(9):39-50.
[6]姜紅,魯曼. 重塑“媒介”:行動者網絡中的新聞“算法”[J].新聞記者,2017(4):26-32.
[7]何哲.通向人工智能時代——兼論美國人工智能戰略方向及對中國人工智能戰略的借鑒[J].電子政務,2016(12):2-10.
[8]郝雨,李林霞.算法推送:信息私人定制的“個性化”圈套[J].新聞記者,2017(2):35-39.