
摘 要 從人工智能的核心和基石入手,分析人工智能在新聞業的應用模式,挖掘其在未來更多的應用潛能。
關鍵詞 人工智能;大數據;機器學習;出版流程優化
中圖分類號 G2 文獻標識碼 A 文章編號 2096-0360(2018)22-0011-05
2016年3月15日,AlphaGo以4:1戰勝人類頂尖圍棋手李世石,“人工智能”在全世界引起關注[1]。
在提供未來更多可能性的同時,人工智能也帶來了“人類是否會被機器人取代”的恐慌。同年,專業從事智能語音技術研發的科大訊飛公司高級副總裁杜蘭在出席2016廣東互聯網大會時表示,“在未來5~10年內,人工智能將像水和電一樣無處不在,會進入每一個行業,深刻改變世界”[2]。
確如科大訊飛所預測,這兩年人工智能的觸手廣泛地進入人類生活的種種領域,語音識別、圖像識別、聊天機器人、無人駕駛汽車……人工智能在越來越廣泛的場景中得到應用。而在需要創造力和情感的新聞出版領域,人工智能能否發揮作用,為新聞出版業賦能?本文將從人工智能的核心與基石入手,分析人工智能在新聞業的應用模式,挖掘其更多的應用潛能。
1 人工智能的核心與基石
1.1 人工智能的核心是學習能力
“人工智能(Artificial intelligence)”簡稱“AI”,是計算機科學的一個分支,其定義目前并未統一,在《人工智能及其應用》一書中,蔡自興教授列舉了多種人工智能的定義,諸如“人工智能是計算模型研究智力行為”(Charniak & McDermott 1985)、“人工智能是研究和設計具有智能行為的計算機程序,以執行人或動物所具有的智能任務”(Dean,Allen,Aloimonos 2003)等[3]。
拋開學者從不同側重點闡釋的定義,我們可以從“人工智能”這一詞匯本身來揭示它最根本的內容:“智能”強調思維和學習能力,“人工”則表明機器的智能由人賦予,賦予的形式就是算法。所以從本質上來說,人工智能是一種算法程序,而算法運行需要附著在一定的硬件設備上。由程序+硬件設備構成的機器人在工業領域很早就已經得到應用,并逐步完成了對人工流水生產線的取代,但此時它們還不被視作人工智能。只有當機器設備能對人的思維過程進行模擬時——人類如何獲得知識、如何運用知識,機器才真正具備智能。戰勝人類頂尖圍棋手的AlphaGo,在全世界范圍內引起對人工智能的討論,正是因為其在短期內對大量棋譜的學習以及在實際對戰中巧妙地應用。所謂“智能”,正是機器通過自然語言處理、語義分析以及機器學習等過程獲得知識,并將其應用在實際中。可以說,是否具有學習能力,是機器是否具有智能的標志。學界普遍認同的關于“學習”的觀點來自人工智能大師西蒙,他認為學習是系統在不斷重復的工作中對本身能力的增強或者改進,使得系統在下一次執行同樣任務或類似任務時,會比現在做得更好或效率更高[3]。
2018年7月19日,來自Google AI的微信小程序“猜畫小歌”刷爆朋友圈,和傳統的“你畫我猜”相比,“猜畫小歌”的特色在于將“人作畫→設備呈現→人猜”轉變為“人作畫→機器猜”。機器猜圖的基礎來自Google AI對于大量UGC內容的學習。官方表示,“猜畫小歌由來自Google AI的神經網絡驅動,該網絡源自全世界最大的、囊括超過5 000萬個手繪素描的數據群。”[4]通過對素材數據群的學習,在大量的用戶生產內容中,AI總結不同用戶對同一詞匯的理解,進而形成對該詞語的概念,從而完成對人類思維的模擬。用戶數據在不斷生產,“猜畫小歌”通過對同一詞匯的反復認知形成并不斷更新自己的知識體系,這也是機器實現智能猜圖的關鍵。
1.2 大數據是人工智能得以實現并廣泛應用的基石
人工智能需要大量的數據來完成智能的建立,機器學習便是通過對數據的學習和訓練總結歸納出規律,進而形成知識。
海量的數據快速流轉,價值密度也低,人工獲取有效信息效率低,真正有價值的信息反而不一定能被發現。利用大數據技術,可以在類型多樣、體量巨大的數據中,快速抓取,獲得有價值的信息。而將大數據技術應用到人工智能,可以為人工智能建立結構化和系統化的數據庫。人工智能信息抓捕速度快,并且能夠高速邏輯生成有效數據,“大數據+人工智能”使得人工智能可以應用到更多的場景。例如在工業領域,將工廠信息、生產狀況、市場信息等建成工業大數據,人工智能通過對數據的分析可以發現當前生產領域的需求與生產力轉型升級的確切方向,進而幫助決策。
2 人工智能重塑新聞出版流程,為傳統新聞出版業賦能
人工智能技術應用到新聞出版行業,對新聞出版的各方面、各環節產生深刻影響,在未來將會重塑出版流程,推動新聞出版業轉型升級。
2.1 基于大數據的信息采集與分析實現選題優化與精準營銷
在互聯網時代,信息的獲取變得越來越容易,但同時信息冗雜,也為新聞出版業帶來了挑戰。傳統紙媒銷量越來越低,新媒體數量巨大,然而碎片化信息難成體系。人工智能在信息采集與分析中適時發揮出了優勢。
目前新聞出版業利用人工智能采集信息主要分為兩方面:選題信息——分析市場現有內容,發掘和優化選題;營銷信息——對用戶信息進行采集以形成用戶畫像,從而進行內容個性化推薦,實現精準營銷。
在傳統的選題策劃環節上,除了創意與靈感,媒體人大多都是將所能搜集到的市場圖書信息以及社會熱門事件等作為選題依據,圖書的策劃與出版都面臨較大風險,新聞報道的時效性也大打折扣。利用人工智能,媒體人可以通過對市場圖書、作者以及銷量、評價等數據的分析,了解市場新動向,發掘現有市場空白領域以及用戶的關注點和需求點,進行選題決策與優化。在熱點事件追蹤上,人工智能對熱詞傳播更為敏感,能快速進行反饋,幫助編輯策劃組稿。通過人工智能進行選題優化,可以有效降低資源的浪費情況,一方面減少同質化內容的生產,另一方面也能更精準地預測市場情況,減少預算的浪費[5]。
在營銷環節,人工智能可以對用戶數據進行采集與分析,形成用戶畫像,通過個性化推薦算法將相應內容精準推送到用戶端。一方面用戶可以脫離冗雜的碎片化信息的包圍,獲得對自己而言最有用的信息,另一方面,媒體方也可以完成自生產內容的推廣,使得內容有針對性地發揮出其最大的效用。
2.2 機器人寫作呈現了人工智能內容創作的可能性
人工智能的學習能力遠超人類,在語言學習與處理上,也迅速超越了人們的想象。在極富創造力的新聞出版業,人工智能早就打破大眾的認知偏見,實現了機器人寫作。
以國內為例,2015年9月,騰訊財經發布了機器人“Dream Writer”編寫的稿子《8月CPI漲2.0%創12個月新高》;2015年11月,新華社發布機器人記者“快筆小新”,從事財經、體育方面的報道撰寫;2016年里約奧運期間,由北京大學和今日頭條聯合研發的機器人記者“小明(Xiao Ming Bot)”發稿450多篇;2017年5月,微軟和湛廬文化推出機器人小冰創作的現代詩集《陽光失了玻璃窗》……
目前機器人寫作更多地還是應用在一些相對簡單的事實新聞報道中(以新聞體裁中的消息為代表)[5],或是需要呈現大量數據分析和可視化的內容(以財經新聞為代表)。機器天生的理性容易呈現更為客觀的報道,同時對數據的處理能力和速率也是人類所無法企及。短時間內高效率處理信息,并以簡明的文字呈現出來,機器人寫作在新聞寫作上更好地實現了時效性和客觀性的特征。在文學創作上,小冰的試水行為也為我們呈現了智能內容創作的更多可能性。
2.3 信息的高效處理,為新聞提供更多呈現形式
人工智能在語音識別與圖像識別上已經相當成熟,文字和音頻的轉化正確率基本都已經達到90%以上,語音輸入、文字與語音的轉化都成為可能,圖片識別技術也為內容的轉化提供了更多形式。
科大訊飛的“訊飛語記”是一款語音轉文字輸入軟件,將其應用到新聞出版領域,它可以在錄音的同時進行語音識別,將錄音速記轉化為文字,在采訪的同時生成文字稿件,能夠更高效地將內容呈現在讀者面前。訊飛語記還可上傳外部音頻進行識別,系統支持普通話、粵語及英語等10多種語言,準確率高達98%,新聞采訪的大量的音頻信息可以高效地轉化成文字形式,方便選取利用,大大降低了人工的工作負擔。除了語音識別,訊飛語記還支持圖片轉文字,不管是手寫體還是印刷體,通過圖像識別技術,圖片上的字都可以以文字形式呈現出來。
人工智能進行高效地信息處理,實現了文字、語音以及圖片信息之間的轉換,為新聞提供了更多的呈現形式:第一時間將采訪視頻呈現的同時,還可以迅速整合出采訪文字稿。文字、音頻和視頻、圖片等多種形式均可同時進行呈現。語音識別、圖像識別等技術使得傳統的編輯工作中耗時又費力的文字轉換工作由人工智能取代,媒體從業者工作重心能夠放在深度分析與思考上,為用戶呈現更深度更精彩的內容。
2.4 智能篩選,有效規避虛假與低俗信息傳播
互聯網在為我們提供海量信息的同時,也帶了問題:信息的發布主體不再受限,UGC內容越來越多。和PGC相比,UGC主體所承擔的信息傳播風險較小,于是大量的虛假信息在互聯網傳播,信息的真實性變得難以掌控。除此之外,各種低俗信息也在網絡環境的發酵中違法傳播。
要改善網絡虛假信息和低俗信息傳播狀況,除了利用法律法規加強個人和平臺的責任意識、提高公眾素養之外,還可以利用技術手段對已發布的信息進行篩選排查。
依靠人工智能技術,通過語義識別、圖像識別、關鍵詞設置等方式,信息平臺可自動對用戶上傳的信息進行審核,比如今日頭條在人工智能技術的識別下,能有效攔截低俗圖片,相較于純人工,攔截率提高了73.71%[6]。人工智能的自動篩選,能有效規避虛假和低俗信息的傳播。
3 人工智能在新聞出版業表現出的問題及對策
3.1 人工智能在新聞出版業表現出的問題
人工智能在新聞出版行業各領域應用的同時,重塑出版流程,為新聞出版提供了更多的可能性。然而在新技術與傳統行業的碰撞中,同樣也產生了各種問題。
3.1.1 個性訂閱與智能推薦造成新型信息孤島——信息繭房
“信息繭房”的是指人們的信息領域會習慣性地被自己的興趣所引導,從而將自己的生活桎梏于像蠶繭一般的“繭房”中的現象。
互聯網為我們提供了聯通一切的可能性,海量的信息可以輕松獲取,通過訂閱,我們可以關注自己最感興趣的信息,而同時,系統也會向我們推薦各種可能感興趣的內容。但是在這樣一個全開放的時代,不管是個人訂閱還是基于算法的個性化推薦,我們所接受的多是基于閱讀習慣和個人喜好的同質信息,看起來可獲得的信息越來越多,實際獲得的信息卻只是極小的一個范疇,互聯網讓信息孤島不再存在,但我們又仿佛進入了另一種信息孤島——“信息繭房”。我們接受的都是經過自己篩選的內容,對于異質化信息的接受度越來越低,局限在自己的小空間內,最終變得越來越狹隘[7]。
3.1.2 機器人寫作可實現范圍受限,大眾接受度低
機器人寫作目前應用并不十分廣泛,且主要應用在新聞報道上,以消息居多,通訊、特寫、評論等新聞類型人工智能無法進行,因為情感、創意等能力方面的不足,人工智能很難完成深度的報道。而淺層的報道,因計算機程序的特性和數據的相似性,又可能出現同質化的現象。
以小冰為代表的機器人文學創作,目前的適用性并不太高。“人類史上首部人工智能詩集”的噱頭雖然為《陽光失了玻璃房》帶來了一定的流量和購買力——從當當、京東的銷量與評論可見一斑,但豆瓣僅有77人參與評分,分數為5.8,這也意味著機器人所進行的文學創作目前并不被大眾認可。
3.1.3 人工智能獲取信息沒有標準邊界,道德倫理隨時面臨爭議
在社交網絡發達的大數據時代,用戶的信息極易獲取,人工智能在分析用戶習慣形成用戶畫像的過程中,因為人工智能對數據的使用沒有固定標準,容易喪失邊界,侵犯用戶個人隱私[8]。
3.2 人工智能發展對策
人工智能在出版業領域應用所出現的問題,主要要從法規制度完善和技術優化中尋求解決。在法規制度上,需要不斷完善對版權等問題的建設,明確信息邊界;在技術上,技術人員需要不斷進行技術的優化與提升。以科大訊飛為例,其語音識別技術仍在不斷改進,一方面對環境的容納度越來越高,另一方面識別的正確率也在不斷提升。針對“信息繭房”問題,除了從技術角度改善智能推薦機制之外,我們自身應該主動去接收更多領域的信息,形成自己的知識內核,而這一點也需要依賴政策對文化環境的建設引導,這將是一個長期的工程。
4 人工智能在新聞出版業的應用潛能
人工智能目前在新聞出版業的應用雖然存在一定問題,但在對問題的反思與總結中,在法規制度的建設與完善中,在人工智能技術的提升與優化中,未來也將呈現更多的應用潛能。
4.1 優化新聞出版流程,節省人力資源
雖然人工智能已經在新聞出版業的各領域得到應用,但在整個行業內并不算普及,依舊沒有完成新聞出版流程再造,在一些重復性高、創造性低的環節,還依賴大量的人力資源投入。從創作、編輯、校對到發行銷售,未來人工智能可以得到更廣泛的應用。
在內容創作環節,前文已經提到,基礎性的信息搜集和整合可以由人工智能完成,創作者可以節省前期的大量時間,將重心放在內容的深度挖掘上,既可以縮短創作周期,又能夠提高輸出的內容質量。市場整體的內容質量提高,對于大眾而言,所接觸到的信息更有價值,更能引發思考,好的文化環境對于大眾思維能力、對于全民文化素養的提高有百利而無一害。
在編譯校對環節,人工智能的語音文字轉換、機器翻譯、智能校對等功能目前已經擁有相當水平,未來在研發人員的努力下,其能力也會繼續得到提高,在提高準確性的同時,還可以進行智能改寫,使得文章更為流暢通順。編校環節的人力投入可以大幅度減省,轉而從事更有創造力的工作。
在銷售環節,傳統書店的書店員對圖書信息的掌握是有限的,而人工智能可以存儲大量圖書數據信息,同時可以對語義進行識別。用戶輸入相關內容——未來將不再局限于關鍵詞,人工智能對語義理解的進步必定能夠實現更模糊化信息的檢索——人工智能便可以迅速找到用戶所需要的圖書信息,協助用戶完成購買。
從創作到編校到發行,未來人工智能將會對出版流程進行重塑,完成新聞出版業的轉型升級。
4.2 推薦算法從迎合喜好變成培養習慣,打破信息繭房
現有的推薦算法都是基于用戶的閱讀習慣,推薦相同主題或者相似主旨的內容,也即所接受的信息大多都是同質化的,最終導致用戶所接觸的內容越來越狹隘。要改善這種信息繭房的現狀,媒體從業者不能一味根據迎合用戶的喜好,可以反過來利用算法培養用戶習慣。
以各種內容平臺為例,用戶在注冊時選擇了感興趣的方向以后,主頁所推薦的內容都是與興趣相關的文章,但如果推薦邏輯變成“兩篇根據用戶習慣推薦的同主題文章+一篇其他主題的文章”,在推薦內容里加入拓展用戶閱讀范疇的文章,用戶可能會習慣性點進去,此時內容質量就成為了留存用戶的關鍵。上文提到,人工智能時代,基礎性的信息收集與整合可以由人工智能來完成,媒體人可以將重心放在內容深度挖掘上,內容質量提高了,用戶可以留存下來,久而久之,閱讀習慣也將逐漸被培養起來。
當然,這種推薦算法的基礎還是用戶畫像,只是改變推薦邏輯,適當加入其他主題的內容。除了基于用戶的推薦算法,未來的新媒體平臺還可以同時運用基于內容生產者的推薦算法,開辟出專門的區域推薦優質內容。一方面激勵內容生產者之間的良性競爭,另一方面也可以使得優質內容獲得更多人的關注與閱讀。
對用戶而言,在兩種推薦邏輯的共同作用下,所獲得的信息既有個性化推薦的內容,以滿足自己的喜好和信息需求,又有共性化的推送內容,以拓展自己的閱讀面,獲得更多異質信息。挖掘人工智能在推薦算法上的改進空間,提升其應用價值,未來的新聞出版行業將從迎合市場逐步轉變為培養用戶習慣,在打破信息繭房的同時,提高全民的文化素養。
4.3 從個性化內容到個性化服務,人工智能助力用戶留存
近些年來,個性化在市場上越來越得到重視,在新聞出版領域,定制日歷、定制圖書封面或扉頁都已經在實際中得到應用,這也表明,用戶對于個性化的需求在逐步拓展到文化領域。人工智能時代,內容平臺紛紛利用算法工具為用戶提供個性化內容,而在未來,內容平臺可以將重心從個性化內容轉向個性化服務,以服務理念獲得用戶留存。
個性化的基礎是用戶的信息,隨著用戶畫像技術升級,未來人工智能能夠收集更多用戶數據,包括用戶的基本信息、習慣、愛好甚至是消費能力。在傳統的人工進行的個性化服務中,對于企業來說,一方面對于用戶信息的掌握相對有限,另一方面需要耗費大量的人力資源,增加了服務成本和管理難度,而利用人工智能技術,企業可以對用戶形成更清晰的畫像,有針對性地為用戶提供服務。
比如在知識付費產業中,由于個體的差異性,用戶需求的知識與消費能力也存在著差異。利用人工智能技術,將知識付費產品進行拆分與重組,以最大限度地滿足用戶對知識的需求,同時也能將知識付費產品的效用發揮到最大化。
除此之外,個性化服務也可在社群維護上發揮作用。為了留存用戶,內容產業現在很多都致力于做社群。社群人數眾多,管理員也需要耗費較多心力,并且很難對每一個用戶的問題提供解決方案,長此以往很容易影響用戶體驗。隨著聊天機器人技術研發,未來新聞出版業可以利用人工智能在社群維護中提供個性化服務。機器人能夠準確掌握每一位用戶的信息,同時可以更高效地解決用戶疑問,進而大大提升用戶的體驗感。對于用戶發布的不合適言論,智能技術也可隨時監測并及時予以處理,維護社群的和諧。
新聞出版業是極富智慧和創造性的行業,在人工智能技術日趨成熟、行業法規日趨完善的前提下,將人工智能技術合理地應用到業內各領域,可以協助完成新聞出版業流程再造,發揮出內容行業的最大價值。技術變革必定要經歷一個漫長的過程,在人工智能給出版行業帶來的顛覆性變革中,企業應該正視行業變化,從傳統的經營思維中跳脫出來,將技術與內容產業結合,最大限度地發揮內容行業的社會價值。
參考文獻
[1]羅園.人機大戰最終局 AlphaGO勝李世石完美收官[EB/OL].[2016-03-15].http://it.sohu.com/20160315/n440516324.shtml.
[2]艾媒網.科大訊飛出席2016廣東互聯網大會:“人工智能+”,未來已來[EB/OL].[2016-11-25].http://www.iimedia.cn/46469.html.
[3]蔡自興,劉麗玨,蔡競峰,等.人工智能及其應用[M].北京:清華大學出版社,2016(7):3,251.
[4]太平洋電腦網.谷歌“猜畫小歌”小程序被吐槽:這AI是個傻子[EB/OL].[2018-07-23].http://tech.ifeng.com/a/20180723/45076212_0.shtml.
[5]匡文波.人工智能時代出版業的變革之道[J].出版廣角,2018(1):6-8.
[6]鳳凰科技.人民日報:人工智能是虛假新聞的“克星”[EB/OL].[2017-03-23].http://tech.ifeng.com/a/20170323/44560059_0.shtml.
[7]彭蘭.更好的新聞業,還是更壞的新聞業?——人工智能時代傳媒業的新挑戰[J].中國出版,2017(24):3-8.
[8]王曉震.人工智能環境下新聞業的發展思考[J].今傳媒,2018(6):16-17.
作者簡介:吳方蘭,南京大學信息管理學院。