方曦
北京時間2017年8月8日21點19分,四川阿壩州九寨溝縣發生里氏7.0級地震。21點37分15秒,一條全文585字的地震速報消息經由中國地震臺網官方微信率先在全球發布,內容涵蓋了速報參數、震中地形、熱力人口、周邊村鎮、歷史地震、震中天氣等八方面權威數據,同時配有五幅圖片。這條消息的作者,是中國地震臺網人工智能系統,寫作用時25秒。往前追溯,2017年1月17日,《南方都市報》寫稿機器人“小南”正式上崗,首篇300多字的春運報道生成用時不到1秒。
機器人也來寫稿了,媒體記者、編輯的飯碗還端得穩嗎?一時間,出現各種討論、擔憂。事實上,不止寫稿,人工智能在傳媒領域的實踐早已從最初的數據搜集,延展到內容生產、渠道分發等環節。今年3月的全國兩會上,人工智能首次被寫進《政府工作報告》,列為需要加快研發和轉化的五大技術領域之一。7月,國務院印發《新一代人工智能發展規劃》,明確了我國新一代人工智能發展的戰略目標:“到2020年,人工智能總體技術和應用與世界先進水平同步,人工智能產業成為新的重要經濟增長點;到2030年,人工智能理論、技術與應用總體達到世界領先水平,成為世界主要人工智能創新中心”。10月,習近平總書記在黨的十九大報告中提出,要加強國家創新體系建設,強化戰略科技力量,推動互聯網、大數據、人工智能和實體經濟深度融合。發展人工智能上升到國家戰略層面,這會給正處在融合發展關鍵期的傳統媒體帶來哪些契機?智媒時代,人工智能可能取代人力嗎?
人工智能試水傳媒業后,以人為主導的媒介形態逐漸發生變化。在生產端,各大巨頭加緊布局,爭先恐后地邁進自動化門檻;在分發端,智能客戶端遍地開花,人機互動越發個性化。線索搜集、處理,內容生成、分發,產品推廣、反饋……在上述流程的各個環節,或多或少都能感受到人與機器的應用連接。
機器人寫稿,被認為是人工智能在傳媒業的顛覆式創新。美聯社有“Wordsmith”、《華盛頓郵報》有“Heliograf”、新華社有“快筆小新”、騰訊有“Dreamwriter”、今日頭條有“張小明”……全球媒體紛紛推出自家的寫稿機器人。機器人是如何寫稿的,稿件質量怎么樣?我們來做個盤點。
1.格式化的財經、賽事消息
這是機器人寫稿目前最常應用的領域。以美聯社為例,2014年7月,美聯社與一家科技公司達成協議,使用對方的Wordsmith平臺自動編發企業財報。三個月后,這套人工智能系統通過算法學習,掌握了新聞寫作的基本規范,平均每個季度能生成4000篇左右財報。2015年,美聯社將Wordsmith的應用范圍擴大到體育板塊,并透露,下一步還要開發算法,爭取將文字消息自動轉換成廣播音頻。

在國內,擅長寫這類消息的機器人代表有新華社的“快筆小新”和今日頭條的“張小明”。“快筆小新”現供職于新華社經濟信息部、體育部以及《中國證券報》。機如其名,無論是一句話報盤,還是長篇大論的公司財報,人類記者花幾十分鐘甚至幾個小時才能寫就的稿子,“快筆小新”分分鐘就能生成若干篇。
今日頭條的“張小明”更加專注體育圈。里約奧運會開賽一周,“張小明”6天生成200多篇稿件,平均每天出稿三四十篇。有業內人士評價,高產還不是它的最大優點?!皬埿∶鳌鄙蠉彽母笠饬x在于,它能一場不落地關注奧運賽場上所有設定需要它關注的比賽。這些比賽有些是常人眼中的冷門項目,但從反饋來看,用戶關注度并不低。換句話說,“張小明”的出現,彌補了媒體人手有限的短板,觸發的長尾效應出乎意料地顯著。
2.大數據解讀稿
擅長撰寫這類稿件的機器人代表是微軟中國研發的“小冰”。近一兩年,“小冰”頻繁亮相,先后擔任過東方衛視早間新聞主播、中國教育電視臺選角導演、優酷自頻道人工智能主播等。如今,它的新身份是《錢江晚報》特約記者,在報社APP“浙江24小時”設有專欄。
“小冰”的數據處理、分析能力很強,加上有微軟必應搜索大數據支撐,它能輕松捕捉用戶興趣點。常態工作中,它會以“一個標題、一幅圖片、一段概要、兩種觀點”的形式,自動抓取熱點事件,羅列交鋒觀點,邀請網友互動點評。它還會不定期地推出數據解讀稿。比如今年春節后推出的作品《全國烹雞地圖來了,哪種“雞”征服了你的味蕾》,這是一篇基于大數據,盤點國人吃雞喜好的策劃報道。由編輯確定選題,工程師定制模板、研發算法,“小冰”自動分析生成。文章梳理了8道最受人們歡迎、以雞為食材的過節菜肴,又根據南北差異,繪制了一幅栩栩如生的全國“雞菜”地圖,選擇在春節剛過完上線,應景又生動。
和其他機器人一樣,“小冰”也會寫一些文體賽事類消息。所不同的是,它的預測能力驚人,成功預測過的賽事包括:格萊美獎、奧斯卡獎,還有多場NBA比賽。準確度之所以如此之高,源于“小冰”具備了將學習模型用于全網數據的分析能力,即依賴大數據。
要說和機器人聊天,估計大家最先想到的是蘋果Siri。其實,不止蘋果這類科技公司,很多新聞機構也在搶占聊天機器人的新風口。聊天機器人具備更強的關鍵詞識別能力,在人機互動的過程中,它們會將用戶使用過的關鍵詞搜集反饋到數據庫,經由勾勒、復刻用戶畫像,精準定位、定向推送,由此實現產品分發渠道的優化。
今年4月,Facebook在F8開發者大會上宣布,聊天機器人“Chatbot”上線。Facebook Messenger向開發者開放,它將助力媒體實現人機對話。很快,包括美國有線電視新聞網CNN、英國《衛報》在內的傳媒巨頭紛紛試水。
CNN的聊天機器人每天會向用戶定點推送頭條新聞。每條推送下方,都有三個選項:閱讀全文、獲知梗概、向CNN提問。只要提問,機器人就會自動捕捉問題關鍵詞,分析比對后,為用戶推送匹配的資訊。英國《衛報》的美食機器人“Sous-Chef”則有教人做菜的本領。但凡有想吃卻不會燒的菜,咨詢“Sous-Chef”,它就會根據食材、做法等關鍵詞,為用戶定制菜譜推送。
全天自采新聞多,有哪些更適合上社交平臺呈現?美國《紐約時報》虛擬編輯“Blossomblot”解決這個問題很拿手?!癇lossomblot”每天會過濾社交平臺上的海量文章,并根據大數據預判,篩選出大家最感興趣的內容,優先推薦。來自報社內部的統計顯示,經由“Blossomblot”篩選后自動推薦的文章,點擊量是普通文章的38倍。
英國機構Full Fact去年研發出一款新聞自動核查校對程序。它能從幾十家英國新聞網站上搜尋信息,一旦發現網絡謠言,就會澄清、粉碎它們。項目負責人自信,不久的將來,事實核查所經的各個環節都將實現智能化。
機器人出稿有多快?騰訊機器人“Dreamwriter”一天能寫超過2000篇財經科技類稿件、500篇體育類稿件;第一財經的“DT稿王”,一秒能寫28個字,一分鐘就是1680個字;美聯社機器人“Wordsmith”一個季度能出4000篇左右公司財報。如此高產高效,的確非人力所能及。
人工智能在傳媒領域的實踐有多火?以國內媒體為例,據不完全統計,僅今年全國兩會期間,從中央到地方,就有12家媒體推出了15款智能機器人。從終端形式來看,推出實體機器人的媒體有5家,推出虛擬機器人的有5家,兩者兼有的有2家。
如此蓬勃的發展勢頭,不由讓人疑惑:會有那么一天,人類記者、編輯被機器人取代嗎?事實上,類似的擔心在人工智能付諸實踐的若干領域都在不斷被討論。這些擔心并非空穴來風。高盛集團去年在一篇調查報告中提到:“當下,人工智能帶來的自動化及效率提升在各領域都縮減了約0.5%-1.5%的勞動工時?!边@意味著,今后,越是低附加值領域,人工智能取代人類的可能性就越大。只是,在傳媒領域,下這種擔心的結論為時尚早。
一個顯而易見的事實是:至少目前,機器人參與的所有媒體實踐都離不開人為干預,因為它所依賴的算法、模板、大數據,短期內都離不開人。
1.自動成稿需要人為干預
現階段,機器人成稿快是優點,但行文格式單一、可讀性差,也是回避不了的硬傷。對照出稿流程,按需定制的新聞模板決定了成稿框架;用戶的參與熱度左右了大數據體量;技術人員開發算法的水平,影響到出稿準確度。有鑒于此,機器人寫稿的應用范圍才會更多集中在需要數字說話的財報、賽事領域。其他需要深入采訪,或者強調個性化表達的調查報道、評論、訪談類體裁,短期內機器人還不能勝任。
2.深度學習依賴人為干預
人機互動,不僅僅是人與機器聊天,優化分發渠道、定制推送產品的過程,也是機器人充實大數據、深度學習的過程。通常,研究人員需要花幾年時間來確定目標對象的屬性、特征,搭建重點模型,再通過算法、代碼,幫助機器人理解模型。之后,在人機互動的過程中,機器會自動搜集、比對、標記接收到的數據,并根據優先級,做出針對性的吸納、學習。經過這個過程,機器的圖像識別能力和語音辨別能力會呈幾何級提升,并且理論上,它接觸到的數據越多,就越聰明。一個影響很廣的例子,就是谷歌公司的智能圍棋程序“AlphaGo”。它與人類棋手交鋒越多,就越熟悉人類的出棋套路,針對性地見招拆招。
了解其原理,不難發現,機器人深度學習,起碼有兩方面依賴人為干預。一是研發人員的前端準備,后端跟進、監控,這個過程需要程序人員不斷設計完善算法、模型;一是用戶反饋。反饋數據決定了數據庫的體量和質量,數據有效性越高,機器的智能化水平就越高。反之,則會導致機器人“黑化”,通俗的說法,就是機器人學壞了。
典型的例子是微軟聊天機器人“Tay”。初次亮相時,“Tay”表現得彬彬有禮。然而上線僅僅24小時,它在和人互動時就爆了粗口,甚至屢屢發出涉及種族主義的不當言論。在做出緊急下線“Tay”決定的同時,微軟方面也無奈地表示,“Tay”學習能力很強,它有將搜集到的信息內化的能力,但卻無法辨別信息好壞。由于使用者的不確定性,這種信息照單全收模式,直接導致了“Tay”的“黑化”。如此看來,機器人智能化水平的高低,不僅取決于研發技術,也與使用者的素質休戚相關。打個形象的比方,現階段,離開了人機互動,機器的初始智能就像一張白紙,在白紙上畫什么樣的畫,則取決于人為干預。
客觀地說,相比科技企業,媒體還不具備人工智能的開發實力。盡管爭先恐后的試水態度值得肯定,但細看之下,目前,除少部分媒體引入人工智能時,有從戰略到執行的系統方案,更多媒體還是在體系內的某個環節做著針對性的有限嘗試,并且開發依賴的大數據大多由科技公司提供。比如Facebook開發的Facebook Messenger chat平臺。目前在這個平臺上有11000多個聊天機器人,專長覆蓋了新聞、財務、娛樂、生活等門類,CNN、英國《衛報》的聊天機器人都是基于這個平臺。
盡管系統戰略、技術平臺尚不具備,但行業內盲目跟風,快速上馬人工智能項目的現象依然存在。一些媒體推出的所謂黑科技,短暫亮相后,很快銷聲匿跡。這種應景式的被動應承,自然不會涉及媒體核心采編業務。機器人取代記者、編輯,也就成了無稽之談。但這種行動過當,卻會帶來資源浪費。
我們正處在由技術革新推動的行業轉型期,智媒時代已然迫近。在可預見的未來,人工智能技術將對媒體生產、傳播的方方面面產生深遠影響。新技術更新迭代快馬加鞭,傳統媒體無法視若無睹,更不可能置身事外。順應發展,必須采取“升維”思路,變“傳統互聯網思維”為“人工智能思維”,站在戰略高度,將“Think Mobile”(移動思維)轉換為“Think AI”(智能思維),探索嘗試“內容+技術+市場”的全產業鏈運營。
媒體人應謹記,無論人工智能如何發展,機器,只能是輔助人力的高效工具;人,才是新聞生產和傳播的主體。
當前,行業內對發展人工智能存在兩種非理性狀態:一是一哄而上的跟風炒作,二是過分保守、觀望。必須承認,機器在數據處理、分析、核查等方面的效率確實比人高。理性看待它的發展,強化陣地意識,不盲從、不回避、不慌張,積極構建人機協作的互補共生體系,將是未來一段時期,媒體轉型升級的大勢所趨。
人工智能輔助數據處理。從生產端到分發端,穩扎穩打、合理安排人工智能輔助作業,將極大提升效率、節約成本、解放人力,讓更多編輯、記者有時間、有精力去創作富有溫度的作品。
人工智能輔助內容呈現。這幾年,VR(虛擬現實)、AR(增強現實)、H5技術日漸成為媒體新寵。幾乎每隔一段時間,行業內就會出現現象級的爆款產品。比如,人民日報客戶端H5產品《快看吶!這是我的軍裝照》、江蘇衛視跨年演唱會360°全景體驗式VR直播、騰訊與故宮合作推出的“Next Idea × 故宮”文創系列……新技術加持包裝的媒體產品,呈現方式靈活、用戶體驗新鮮,契合智媒時代多元化的受眾需求。
大數據是人工智能發展的基礎和前提。未來,誰擁有的數據量越大、質量越高,誰就越能占據高點,掌握發展主動權。當前,傳統媒體正處在向縱深融合發展的關鍵期,行業轉型升級勢在必行,對從業人員的要求,也從最早的熟練掌握采編業務,提升到兼具圖片、音頻、視頻處理能力,靈活對接全媒體平臺等。
媒體需要復合型人才,更需要復合型的人才隊伍。如果說全媒體記者和互聯網用戶為大數據采集提供了取樣支撐,那么“算法工程師”則是賦予機器深度學習能力的靈魂人物。他們運用數學和計算機知識,搭建模型、設計算法,訓練機器人采集、分析數據,深度學習,不斷提升業務水平。去年,今日頭條遠赴美國硅谷招兵買馬,開出百萬高薪招募資深算法構架師。在可預見的未來,這種對技術人才的重視和培養或將成為主流。盡早打造“全媒體記者+算法工程師”的人才高地,夯實發展人工智能的底氣,搶得先機。
以往,傳統媒體大多是單一的線性傳播,受眾的個性化選擇被忽視。智媒時代,以個人為基本單位的傳播能量被激活。發展平臺型媒體,意味著打通傳統媒體與互聯網的連接。在這個開放的平臺上,平臺自身就是一個信息傳播共同體。受眾既是媒體產品的用戶,也是人機交互的內容生產者和傳播者。人與人、人與機器,在一次次協同互動中完成用戶數據的積累、聚合。大數據體量、質量直接影響到算法的實現程度。平臺型媒體集納的人氣越多,就意味著用戶數據采樣越多,科學取用,再經深度算法學習,就能幫助人工智能系統快速迭代,升級進化,繼而進入人機互動體驗升級、用戶黏性升級、大數據升級、算法升級、人工智能升級的良性循環。