楊鴻瑞?萬巖
【摘 要】當前,我國出版業正向數字化、網絡化、智能化出版轉型,傳統出版與新興出版融合發展的新生態正在重構。文章從智能化引領角度出發,結合出版工作特點,分析人工智能與我國出版業融合的現狀,研究人工智能在創作編審、出版制作以及知識服務等方面的融合應用,指出出版融合新生態建設過程中的主要問題,并提出相應的對策。
【關? 鍵? 詞】智能化;出版;融合;新生態
【作者單位】楊鴻瑞,中央財經大學;萬巖,北京郵電大學。
【中圖分類號】G209 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2019.16.001
2019年3月16日出版的《求是》雜志,發表了習總書記題為《加快推動媒體融合發展構建全媒體傳播格局》的重要文章,文章強調要推動媒體融合向縱深發展,運用信息革命成果,加快構建融為一體、合而為一的全媒體傳播格局。2019年5月16日,國際人工智能與教育大會在北京召開,習總書記在致大會的賀信中指出,人工智能是引領新一輪科技革命和產業變革的重要驅動力。2015年4月,國家新聞出版廣電總局和中華人民共和國財政部聯合發布的《關于推動傳統出版和新興出版融合發展的指導意見》指出:堅持以先進技術為支撐、內容建設為根本,充分運用新技術創新出版方式、提高出版效能。有了頂層設計,出版業就能充分利用新興技術推動傳統出版轉型升級,重構出版融合新生態,為我國由出版大國向出版強國加速邁進注入強大動能。
一、人工智能與我國出版業融合現狀
現階段我國人工智能與出版業的融合,主要體現在出版教育、出版物生產等領域,已取得了較好的社會效益和經濟效益[1]。
一是在出版教育上,人工智能不僅打造了數字化教育模式,擴充了數字化教育資源,解決了傳統教育資源不足、教學時空受限和反饋不及時等問題,還可以提供陪伴式教學。例如,中國大地出版社于2018年初啟動了智能教育人工智能研發工作,同年6月在第二屆中國新聞出版智庫高峰論壇上發布了第一款科普人工智能“小悠”并進行路演。
二是在出版生產上,人工智能可以基于數據分析結果自動生成內容文本,實現新聞、網絡小說和輿情分析報告等出版產品的寫作,提高內容生產效率[2],如騰訊的Dream Writer、新華社的“快筆小新”和今日頭條的“張小明”等。
三是在知識服務方面,人工智能加速推進專業化知識服務平臺建設,有效聚集了專業領域數字內容資源,推動國家知識服務體系建設。從2015年開始,原國家新聞出版廣電總局就啟動了專業數字內容資源知識服務模式試點工作,確定部分新聞出版單位、大學和科研院所作為專業數字內容資源知識服務模式試點單位。
總體來看,人工智能在我國出版業的應用還處于探索和試點階段,出版過程中的選題策劃、內容創作、編輯加工、出版發行等環節主要還是以傳統方式為主。當前我國出版主要面臨以下問題:一是隨著出版資源的不斷堆積,從海量資源中人工選擇出版主題和內容越來越難;二是隨著互聯網時代的來臨,讀者對知識的時效性和出版周期的要求越來越高,傳統的人工創作模式無法適應新的要求;三是編校流程煩瑣,編校是保證出版質量的重要環節,傳統編校過程需要人工反復仔細閱讀勘誤。
二、以智能化引領出版融合新生態
人工智能與大數據、移動互聯、5G等技術的深度融合,不但改變了出版工作方式、工作內容和生產流程,還極大地推動移動閱讀、在線教育、知識服務、電子商務等新業態的發展,從而改變了出版生態。
1.人工智能引領未來采編模式
(1)文稿自動編寫
隨著自然語言處理技術的發展,計算機對文字的處理能力也達到了一個新的層次,文稿的自動生成就是其中之一。通過對重要法規、著作、標準、年報等進行語義分析和快速摘要,人工智能可以實現自動編寫和輔助編寫,從而提高文稿編寫效率。
目前文稿生成技術主要通過機器學習實現:一是通過生成對抗網絡中的生成器網絡與強化學習技術相結合,構建基礎文稿生成模型,設計“相似度得分”指標來衡量文稿生成的質量[3];二是利用循環神經網絡自動學習重要法規、著作、標準、年報等語義表示,并依據“評分函數”自動計算上下文的關聯性[4]。
國際上,美聯社已經實現了季度財報出版自動化。此前,美聯社新聞記者每季度只能人工創作約300篇財報稿件,數以千計的上市公司財報無法及時撰寫。引入Wordsmith自動化寫稿程序之后,美聯社的財報類新聞報道便實現了自動規模化生產,每季度生產的財報稿件數量在3700篇以上,約為原來的12倍[5]。
(2)智能翻譯
為了盡快搶占市場,出版企業對翻譯的時效性需求迫切,而智能翻譯為圖書多語言同步出版提供了可能。谷歌推出的AutoML Translate測試版,允許用戶利用自己的文字或語言數據在谷歌的神經網絡機器翻譯系統訓練定制化機器翻譯模型,實現了個性化的用戶需求;并且隨著訓練次數的增加,翻譯效果會逐步提高[6]。2017年,韓國政府辦公廳表示,基于神經網絡翻譯技術,可將韓國歷史上著名的朝鮮王朝機密記錄《承政院日記》中的中文翻譯成韓文。這一目標如果實現,將成為世界上首個利用人工智能技術實現中文古典文獻翻譯的實例[7]。
當前,智能翻譯正朝著人與人的溝通方向發展,目標是從“語調+聲音”里聽懂人的語言。智能翻譯技術的成熟,將為出版機構與讀者、客戶之間的溝通互動提供更好的支持平臺。
(3)評審助理
目前,出版業主要依靠人工進行編輯審核,不僅效率較低,而且容易漏審。運用人工智能技術,可以基于海量詞匯和機器學習構建自動糾錯系統,自動發現和識別稿件中存在的質量問題,從而提高編審效率。
計算機輔助評審已經在不少發達國家得到普遍應用。丹麥的論文及專利在線搜索平臺UNSILO在2018年法蘭克福書展上展示了一套自動檢查系統,該系統能與信息數據分析機構Clarivate Analytics旗下的同行評審平臺Scholar One一起,幫助編輯或作者實時評估新提交的作品內容[8]。UNSILO還具有自動尋找同行評審員的功能,通過人工智能技術分析新的手稿,與PubMed Central 學術數據庫中提供的超過2900萬篇文章作者進行比較,確定5位最合適的潛在同行評審員 。
一般來說,基于人工智能的文稿評審輔助系統應具備三種功能。一是啟發性。在文稿評審過程中,系統應能依據基本的規則事實進行推理,對文稿中的錯誤與疏漏進行判斷,決定是否通過。二是透明性。通過文稿評審的結果了解規則的內容和推理思路,從而與系統進行交互。三是靈活性。在文稿評審過程中,新的審核過程、審核結論等能擴充到現有的知識庫,進而不斷提高文稿評審效率。
(4)敏感信息智能化識別與排查
公開出版的文稿資料可能會涉及國家秘密、商業秘密、第三方權益和個人隱私等敏感信息,因此,加強敏感信息管理是新聞出版工作的重要任務。基于人工智能的敏感信息排查系統一般具有智能語義分析功能,以及根據監管需要進行實時詞庫更新和自定義規則等功能。
國內外已有較為成熟的敏感信息排查系統,如美國紐約Text IQ公司的產品使用深度學習技術將自然語言處理和圖模型結合起來,能提高識別文本數據中敏感信息的準確率[9];華為云旗下EI企業智能模塊提供的Moderation (Text)可以基于深度學習和內容審核模型,能自動識別文本中出現的涉政、涉黃、廣告、辱罵、灌水等內容,幫助新聞出版企業降低業務違規風險,凈化網絡環境,提升用戶體驗[10]。
2.人工智能引領未來出版新形態
(1)智能插圖和文稿多維展示
將內容豐富的圖書以圖文并茂的形式展示給讀者,也是滿足人們更高的文化消費需求。在文稿展示上,人工智能技術主要應用于兩個方面。
一是文檔信息可視化。利用人工智能技術可以從海量數據庫中快速找到相關數據,在短時間內生成可視化圖表。2016年,路透社宣布與語義技術公司Graphiq合作,將一些報告從新聞稿的形式轉化為圖像化數據。Graphiq公司擁有財經、體育、娛樂等領域的海量數據,可以利用人工智能技術抓取數據并生成與報道內容相匹配的可視化圖表,以增強報道的吸引力。
二是感官體驗直觀化。人工智能與VR技術的結合,使得傳播空間由三維擴展到四維,從而給受眾帶來更加直觀的感受,也使得文稿的可信度大大提升[11]。受眾可以利用VR/AR技術,在電腦、手機上真實還原新聞現場,取代單調地閱讀文稿的過程。
(2)智能排版
為了帶給讀者更好的閱讀體驗,出版物不僅要有良好的可讀性和較強的信息表達力,還要有美觀的版面。人工智能在這一領域有顯著的優勢。人工智能根據需要展示的內容,可以從已有數據中學習各個版塊的大小、形狀,進而推斷整體排版以及各個版塊的內容布局。智能排版大大減輕了人工排版的工作量,特別是對時效性要求較強的新聞出版單位而言,智能排版的作用更加突出。
目前,一些自動化圖文排版系統已經在市場出現,如WPS墨斗AI辦公系統可以通過軟件自動排版和美化版面,還可以生成整齊優雅的幻燈片,實現智能插入圖片、圖表等功能[12]。
3.智能化文字、語音及圖像處理助力數字多媒體產品制作
計算機文字、語音與圖像處理等是人工智能應用較為成熟的領域,目前已有大量商業化產品,其在數字出版中也將發揮越來越重要的作用。
(1) 計算機文字識別
在出版工作中,隨著數字出版的普及,大部分文稿都是以電子形式存在,但需要對各種手稿、古籍進行重新編纂出版時,計算機文字識別技術將發揮重要作用。2015年,富士通研究所利用人工智能技術,在世界范圍內首次開發出識別率達96.7%的手寫文字識別技術[13]。
(2) 計算機語音處理
計算機語音處理技術不僅可以將創作作品以文字、語音等形式展現,實現新聞采訪錄音向文字稿件快速轉化,還可以用于智能客服等領域。目前,計算機通過學習,已經能非常熟練地聽懂不同國家的語言甚至方言,在模仿人類發音方面幾乎能達到以假亂真的水平。
(3) 計算機圖形圖像處理
在新聞出版中,計算機可以利用人工智能技術對大量圖片、視頻進行分類及特征提取等處理,對圖片或視頻中的人物、物體、場景等進行識別,并協助采編人員進行后期加工。
人類認識了解世界的信息絕大多數來自視覺,目前人工智能技術的重要分支——計算機視覺在文字識別、圖像處理、生物識別等方面取得了較大進展。計算機視覺技術通過對三維世界中所感知的二維圖像進行處理,形成三維實體的特征,其終極目標是像人類一樣識別現實世界中的視覺信息。屆時,人工智能技術將引領出版業給廣大讀者帶來更加豐富多彩的產品和感受。
4.人工智能引領知識出版向知識服務轉變
知識服務是充分利用人工智能、大數據、移動互聯等現代信息技術,以用戶為目標驅動的服務。傳統的知識出版只關注是否向用戶提供他們所需的知識信息,而知識服務則關注和強調利用出版業獨特的知識和能力,對現成文獻進行加工形成新的具有獨特價值的信息產品,進而為用戶解決問題。因此,借助人工智能、大數據、移動互聯等新興技術手段,可以實現按需出版、高效傳播、精準服務以及提供多樣化的產品。
(1)按需定制
運用人工智能分析市場上已有的出版數據、讀者閱讀數據等,結合當下熱點和出版目標,不僅可挖掘和發現市場潛在需求,并形成初步方案給編輯構思選題做參考,還可以對出版題材和內容做精準選擇,構建出版單位的素材庫等儲備資源[13] 。同時,人工智能通過大數據挖掘和智能客服系統,可分析目標客戶的知識需求、消費需求和閱讀偏好,制定合理、差異化的出版品種,實現出版物或用戶需求的按需制作。
(2)高效傳播
滿足用戶閱讀喜好和差異、實現高效傳播,是出版業傳播知識的一個著力點。一是運用大數據、人工智能等先進技術手段,收集讀者閱讀時間、內容、時長、渠道、偏好和習慣等多種信息,以實現出版內容多渠道分發,達到高效的傳播效果;二是通過智能客服與用戶互動,了解用戶個性化需求,實現點對點傳播。
(3)精準服務
在知識服務模式下,出版業的廣告式營銷將變為服務式營銷。一是人工智能與移動互聯、區塊鏈等技術結合,能在知識服務消費、結算管理和出版供應鏈管理等方面發揮更安全、快捷的作用;二是人工智能技術與移動互聯和5G技術結合,使出版企業從廣告式營銷變為點對點精準營銷,既能讓出版企業深入了解用戶和用戶需求,也能讓用戶深入了解出版企業及其提供的知識服務內容。
5.人工智能造就復合型編輯
出版企業由知識出版向知識服務轉變的關鍵在于角色的轉變,其中編輯角色的轉變是核心。現代編輯要以用戶需求為中心,既懂內容創作又懂互聯網產品設計,具有內容生產能力、技術應用能力和客戶服務能力。
由于內容生產與傳播、服務緊密結合,出版融合不再是傳統高度分工下的單兵作戰,而是高度協同的團隊化運作。新型組織架構將打破傳統出版在內容、技術、市場等方面的壁壘,融合出版人才被賦予產品經理的角色,兼具內容生產力、技術應用力以及市場運營力,以產品視角對出版物的全生命周期負責[14]。
三、智能化在出版融合過程中存在的問題及應對策略
1.對新興科技帶來的行業變革認識不足
人工智能等新興科技的普及應用,給出版業的創作模式、傳播方式以及經營策略、管理流程等帶來巨大影響,出版業面對的客戶、市場、風險、供應鏈、監管環境等都將發生改變。出版業要想在競爭激烈的市場中立于不敗之地,必須適應新技術帶來的變革,積極調整組織架構,深化管理機制改革。
2.版權形態復雜涉及倫理和法律問題
人工智能已經可以創作詩歌、新聞等作品,但這些創作需要利用人類的大量作品數據進行學習,創作過程也可能會存在抄襲、模仿,以及涉及他人隱私、侵犯他人權益等問題。目前,人工智能創作作品的著作權歸屬在我國法律法規中仍處于空白狀態,寫作機器人雖是作者,但并非自然人,不享有著作權。
此外,許多優質作品出版后容易遭到網絡自媒體“拆書”“洗稿”,進行非法傳播,嚴重損害作者和出版機構利益。而出版單位缺乏有效的版權保護路徑和方法,維權成本極高。
3.缺乏復合型出版人才
為了適應人工智能等新興科技帶來的行業變化,出版企業必須擁有一大批既懂出版專業知識,又熟悉新興科技的復合型人才。出版業屬于知識密集型產業,要積極利用人工智能等新興科技,發揮其在選題策劃、創作編輯、知識服務、吸引讀者等方面的巨大作用。當前,國內不少出版企業存在出版融合團隊建設不專業、復合型人才儲備不足,甚至人才被其他行業挖走等問題。
4.應對策略
一是加強體制機制創新,建立出版技術創新聯盟。出版企業要聯合金融機構、科研院所等相關行業,建立以市場為導向、產學研相結合的技術創新體系,引導和支持創新要素向出版業聚集。人工智能等新興科技是極富挑戰性的學科,出版企業要往有利于掌握核心技術和自主知識產權、有利于形成產業技術創新鏈的方向重點突破。
二是完善制度體系。當前,人工智能技術落地和成熟尚需時日,牽涉的法律規范還有待完善。出版企業要注重知識產權的界定和梳理,合理合法使用新興科技,為新興科技的普及推廣提供制度保障。
三是積極發揮政府協調引導作用和企業的主觀能動性。政府要進一步加大對包括出版業在內的新興產業的政策扶持,支持出版業順利完成在新興科技條件下的戰略轉型,為我國出版企業走向世界奠定基礎。同時,出版企業不僅要順應包括人工智能技術在內的新興科技帶來的變革,積極轉變發展理念;還要重點培養既懂出版業務又懂新興科技的復合型人才,為出版業的數字化、智能化轉型提供強有力的智力保障。
四、結語
雖然人工智能具備一定的邏輯、演繹、推理、事務分析等理性抽象思維能力,在數據處理、復雜計算、辦事效率等方面具有巨大優勢,但是涉及情感、靈感、審美等方面的能力還遠遠無法與人類相比。
出版工作中,人工智能技術運用于外文翻譯或文學創作時,對復雜的語言處理往往會存在偏誤,難以處理文字背后的思想、情感等相關內容。因此,人工智能目前只是協助人類做一些簡單的工作,使人類可以抽出精力從事更復雜和高難度的工作。
出版業的發展對社會進步起著極其重要的作用,出版物凝結了人類的思想和智慧,出版的歷史就是人類文明的歷史。出版業的發展始終離不開先進技術的支撐,從古代的活字印刷到現代的數字出版,科技與出版的融合是出版人探索的永恒主題。近年來,包括人工智能技術在內的新興科技的迅猛發展,正深刻改變人們的生活和生產方式。出版業作為典型的知識密集型產業,人工智能技術也將對其發揮重要的作用。
|參考文獻|
[1]姜春輝. 人工智能技術與出版的融合探析[J]. 出版 廣角,2018(3):59-61.
[2]武菲菲. 人工智能技術與出版行業的融合應用[J].? 出版廣角,2018(1):26-28.
[3]孫博. 基于生成對抗網絡的文本自動生成方法研究[D]. 哈爾濱工業大學碩士學位論文,2018.
[4]梁健楠,孫茂松,矣曉沅,等. 基于神經網絡的集句詩自動生成[J]. 中文信息學報,2019(3):126-135.
[5]余旻佳. AI如何為媒體賦能——美聯社的人工智能創新探索帶來的啟示[J]. 傳媒評論,2018(11):54-56.
[6] 舜禹環球通. 谷歌發布AutoML,機器翻譯系統可以 定 制 了[EB/OL]. (2018-08-10)[2019-07-20] . http:// w
ww.sohu.com/a/246367268_488431.
[7]馬鈺薈. 國外檔案新聞集萃[J]. 中國檔案, 2017(4):70-73.
[8]Douglas Heaven.AI Peer Reviewers Unleashed to Ease Publishing Grind [J]. Nature,2018,563(7733):609-610.
[9] Text IQ.A Machine Learning Platform for Parsing Sensitive Corporate Data[EB/OL].(2019-06-12) [2019-07-20].https://www.textiq.com/.
[10]華為云. 內容審核-文本Moderation(Text)[EB/OL] . https://www.huaweicloud.com/product/textmoderation.html.
[11]欒軼玫. 人工智能在固態傳播中的媒體賦能——以2018年全國兩會報道為例[J]. 新聞與寫作,2018(4):36-39.
[12]馬榮. 人工智能加持 WPS全面升級文檔辦公體驗[EB/OL]. (2018-07-04)[2019-07-20]. http://news.zol.com. cn/692/6927653.html.
[13] 36大數據. 通過利用模仿人類大腦工作原理的人工智能技術,漢字手寫文字識別率達到96.7%[EB/OL].? (2015-10-20)[2019-07-20]. http://www.cbdio.com/BigData/2015-10/20/content_3994080.htm.
[14]田杰. 按需出版的發展路徑探析[J].科技與出版,2013(10):95-97.
[15]向安玲,沈陽. 基于大數據的出版流程變革[J]. 出版廣角,2014(14):54-57.