劉華東?馬維娜?張新新
【摘 要】群體智能理念指導下的出版流程再造,其最終目標是使出版企業擁有一套先進、完善的數字化、融合化、智能化的生產管理流程。可以說,智能化的出版流程,能夠將智能選題策劃、智能審校糾錯、智能排版印制和智能營銷推薦有機融合,以更加數字化、融合化、智能化的生產方式來推動新聞出版業的轉型升級,實現新聞出版業的提質增效,它將是出版企業出版流程發展的必然方向。
【關 鍵 詞】“出版+人工智能”;出版流程;群體智能
【作者單位】劉華東,易書科技(北京)有限公司;馬維娜,北京應用物理與計算數學研究所;張新新,地質出版社。
【中圖分類號】G230 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2018.01.003
國務院《新一代人工智能發展規劃》中提及未來人工智能的五大發展方向是大數據智能、跨媒體智能、自主智能、人機混合增強智能和群體智能。這五大發展方向均與新聞出版業有重要關聯,其中,大數據智能、跨媒體智能、人機混合增強智能和群體智能與新聞出版業關聯最為緊密。本文主要結合人工智能的原理,談一下出版流程再造的若干設想和已有的部分實踐。
實踐表明,群體智能在數字出版相關領域已經得到了部分運用,比如基于群體編輯的維基百科、基于群體開發的開源軟件、基于眾問眾答的知識共享、基于眾智眾籌的萬眾創新、基于眾包眾享的共享經濟等[1]。就新聞出版業而言,智能出版將會成為其未來發展趨勢,具體表現在以下兩方面。對外不斷提供智能化知識服務,優化完善數字產品和服務的供給;對內不斷提高新聞出版業生產管理流程的高效化、融合化和智能化水平。
新聞出版業的數字化轉型升級,主要包括三個方面:產品數字化轉型升級、流程數字化轉型升級和渠道數字化轉型升級。其中,流程數字化轉型升級的未來走向是智能出版流程再造,即以大數據、人工智能等技術為支撐,建立健全眾智眾創、協同創新的生產管理流程,提高數字內容生產、流程管控、發行傳播的智能化水平,研發、應用和推廣支持智能選題策劃、智能審校、智能排版、智能印刷、智能發行等環節的技術工具集,研發支持戰略研判、決策的智能化管理集成平臺,研發面向用戶提供智能化服務的集成平臺,進而實現全面提升新聞出版業協同化、融合化、智能化水平的目標。
一、問題:兩個流程的并行
長期以來,落后的生產方式、生產流程和管理方式,導致傳統出版流程存在一系列制約、限制甚至阻礙數字出版業務發展的問題。第一,現有的出版ERP系統,絕大部分只支持傳統出版流程,不支持數字出版流程。目前國內的出版ERP系統,大部分沒有數字產品生產、制作和發行的解決方案,僅個別ERP系統有關于數字產品銷售的相關流程。第二,傳統排版軟件大多屬于閉源軟件,開發者更多將軟件視作公司的商業秘密和自有財產,不同的排版軟件之間、排版軟件和數字化加工制作軟件之間,互相封閉、互不聯通,這導致傳統出版流程與數字出版流程之間的合作溝通不流暢、效率低,始終處于“腸梗阻”的狀態。第三,大部分出版社的數字出版流程是將紙質內容直接轉化為電子書,比如對排版文件進行數字化掃描、識別或對紙質圖書進行掃描和加工,這種生產流程最大的問題是重復建設和資源浪費。第四,傳統出版流程和數字出版流程“兩張皮”“各自為政”狀態長期存在,這不僅與新聞出版業數字化轉型升級的目標背道而馳,而且嚴重影響了出版企業傳統出版業務和新興出版業務的協同發展和良性互動。
二、未來:智能出版流程的重塑
人工智能對出版流程的最大啟迪在于,適時構建一套自動化、智能化、系統化的出版流程,以同時支撐傳統出版業務和數字出版業務,做到讓傳統圖書和數字產品的生產、制作、發行一體化、協同化和同步化。這是出版企業數字化轉型升級題中應有之義,也是傳統出版與新興出版融合發展的必然要求。
1.智能策劃與協同撰稿
出版企業要實現智能選題策劃,必須依賴大數據技術。大數據是實現人工智能的基石,也是第三次人工智能掀起熱潮的關鍵性因素。《新一代人工智能發展規劃》對大數據智能做了精準的描述,包括大數據基礎設施、智能理論、關鍵共性技術、智能服務平臺和各個細分領域的大數據系統等。
目前,大數據概念已滲透各個層面。從政策資金扶持的層面看,文化產業資金項目2014年支持9個項目,2015年支持17個項目;貴州出版集團正在實施“國家出版業大數據應用服務重大工程”;國家新聞出版廣電總局正在布局“新聞出版大數據應用重大工程”。從實踐操作的層面看,企業級智能選題策劃的實現,需要有一個具有超級數據規模的選題大數據系統作為支撐。隨著國家級新聞出版大數據的建立和健全,經濟、政治、哲學、法律、文藝、科技等各個細分領域選題數據庫將能夠逐步涵蓋海量級的選題;出版企業可借助選題數據庫,進行細分領域的選題查重、查缺補漏,降低組稿策劃時的盲目性,提高針對性,進而達到輔助選題策劃決策,提高選題策劃含金量的預期效果。同時,新聞出版業相關領域的研發人員基于群體智能的“眾智眾創眾籌”理念,優化運用智能蟻群算法、人工魚群算法、煙花爆炸算法等群體智能的算法,探索研發可以實現眾創撰稿、協同創作的工具系統,以達到通過眾智眾籌、集中專業領域智慧來提供個性化、定制化知識解決方案的目標。
2.智能審校系統
基于大數據智能、群體智能、自然語言處理等理論和技術,未來新聞出版業可研發一系列智能審校系統,以節約過程資源,提高流程效率,實現推動新聞出版業集約化、高質量發展的目標。
(1)自動糾錯系統
基于海量詞匯和機器學習構建自動糾錯系統,能夠自動發現和識別稿件中存在的問題,給讀者和用戶提供良好的閱讀體驗,同時提升圖書質量。優化和完善自動糾錯系統的關鍵在于精準識別專業細分領域的特定用語,避免將正確詞匯誤認為文字錯誤,這個技術的實現,必須依靠專業知識服務領域的大數據和海量詞匯的集聚。endprint
(2)敏感詞識別與排查系統
人工智能視角下的關鍵詞識別與排查系統,要具有精準發現、準確排除敏感詞的功能,以確保圖書的導向正確和質量過硬。敏感詞語數據庫需要及時更新,要能夠適應最新政策變化和時代發展需求,及時排除不合適的詞匯,屏蔽新聞報道禁用詞,這樣方可確保系統的準確性和實用性。
(3)協同編纂系統
協同編纂系統并不是一個新詞,只不過在人工智能的視角,被賦予了新內涵和新動能。未來的協同編纂系統,需要充分運用群體智能的理論和技術,進行兩個方面的變革。一方面,推進機器撰稿、協同編輯和眾智撰稿。比如協同編纂系統能夠支持百科、科普領域的機器撰稿,也能夠同時支持作者在線撰稿、編輯在線撰稿以及二者協同撰稿。另一方面,支持使用專業數字校對工具,進行數字化在線校對。比如協同編纂系統需具備內校、外校、作者校的協同校對功能,不過,這意味著現有校對模式的替換和校對方法的革新,意味著生產方式的變更和職業群體的更迭。
3.智能印制
智能印制發行系統的構建,其核心在于去庫存和去產能。長久以來,我國圖書出版業存在拍腦袋決定印制、同質化競爭、庫存積壓嚴重、倉儲成本過高等問題,這些問題在采用傳統的生產方式運營的過程中遲遲沒有得到解決。
從印刷環節來看,自動化是數字化的前提,數字化是智能化的前提。在drupa2016展會上,海德堡公司提出了“Simply Smart”的口號,翻譯成漢語就是“致簡·智能”,其對數字化時代印刷業的智能生產提出了前瞻性的理念——“未來,印刷就像自主駕駛汽車一樣簡單,一鍵完成所有客戶訂單的生產”,這無疑對印刷業具有劃時代的意義[2]。在中國制造2025規劃中,我國印刷產業未來轉型升級的方向是數字化、綠色化和智能化。其中,支撐智能化的重要環節包括耗材的綠色化、印前的數字化、設備的物聯網化以及印制過程的自動化。筆者認為,要實現智能印刷,我們的認知理念、工業基礎、核心技術和產業應用都還有很長一段路要走。
4.智能發行
智能發行的形態包括傳統圖書的智能發行和數字產品、服務的智能發行,其構成要素主要包括優化完善供給、降低退貨率、統計分析、個性化推薦和精準投遞推送等。從優化完善新聞出版產品供給的角度來看,能否優化圖書產品結構、提高圖書產品質量、多出精品力作,是當務之急。從需求側角度看,能否掌握讀者的數據信息,認知、了解并統計分析讀者的閱讀需求、偏好和消費能力等特征數據,進而實現精準用戶畫像,根據目標用戶的消費需求,來確定印制規模和發行數量,是迫切需要解決的痛點。以大數據視角審視傳統出版,最大的問題莫過于圖書實現了銷售,但無法實現對讀者的精準畫像,即“消費者是誰”“分布于哪些區域”“什么學歷”“什么年齡段”“知識域怎么構成”“閱讀的目的是什么”等,這些問題均無法回答。換言之,無法實現目標讀者的數據回傳,導致無法對目標讀者進行精準畫像,進而難以實現對目標讀者的精準推送。為此,出版企業要構建自身的客戶關系管理系統,包括對用戶數據的采集、統計、分析和畫像,以及對點贊、評論、留言等交互數據的統計分析。構架客戶關系管理系統的目的是獲取用戶數據,進行統計分析,進而實現精準畫像,最終實現紙質圖書、數字產品的精準推送和精準營銷。
值得關注的是,數字內容產業的智能發行展示了較強的市場潛力,并且已經在部分領域引起了資本界的關注。例如,內容智能發行商“魔窗”,它的用戶包括人民日報、滬江、東方航空等,其分發的內容主要是信息資訊,分發渠道主要是騰訊企鵝號等平臺,分發的支撐是基于用戶畫像的流量優化,實現工具是“魔窗”mLink。“魔窗”已于2017年5月獲得華耀資本的A1輪融資,8月完成得厚資本A2輪融資,兩輪融資合計數千萬元[3]。
5.流程協同與再造
群體智能理念指導下的出版流程再造,最終目標是使出版企業擁有一套先進、完善的數字化、融合化、智能化的生產管理流程,這種生產管理流程能夠同步支持紙質產品印制、數字圖書上線和知識庫的封裝上市,從而大大提高新聞出版業的生產效率,有效避免“先紙質書,后數字化”的大量重復勞動和滯后工作。
(1)一體化
一體化是指傳統出版流程與數字出版流程的一體化,該生產管理流程能夠支持傳統紙質圖書生產管理,也能夠支持數字圖書、條目數據、數據庫、知識庫、視聽庫等數字產品的生產管理。目前大部分企業的現狀是傳統出版流程相對成熟,而數字出版流程不清晰、不完善,甚至處于缺位狀態。
以智能化視角來審視流程一體化問題,未來的出版流程可能還會包括諸如AR出版物的生產、制作、加工和運營環節,包括VR出版類產品的生產、制作和銷售等環節,甚至還包括承載智能內容服務機器人的資源庫、交互性系統的支撐與對外運營等相關系統。
(2)協同化
2017年11月,國家新聞出版廣電總局發布了《數字出版業務流程與管理規范》的行業標準。該標準的創新性在于系統構建了包括“數字出版的產品策劃、資源組織、產品設計、內容審校、產品加工、產品發布、運營維護和售后服務”的業務全流程,同時對規劃管理、項目管理和團隊管理提出了與時俱進的建議和創新性設計構想。不足之處在于對數字出版流程與傳統出版流程的銜接、協同問題沒有做出回應。
流程的協同化,是指傳統出版流程和新興出版流程在人員和角色方面的協同,在內容制作、產品研發、技術應用和管理流程方面的協同。在內容制作和產品研發方面的協同,體現在以下幾方面。第一,知識元庫的建立和知識體系的研發,需要由傳統策劃編輯、數字編輯和作者隊伍進行協同化研制和修訂;第二,傳統策劃編輯需要全面了解所屬出版領域的知識體系,并能夠駕輕就熟地對每種圖書的章節進行知識標引,以便后期進行基于同源圖書的知識庫和專題等數字產品的研發;第三,內部校對、外部校對和作者校對所產生的定稿,要能夠協同用于傳統圖書產品印制和新興數字產品的研發;第四,傳統出版流程和新興出版流程在考核辦法、稿酬標準制定、利潤分配等方面要建立健全協同化、統一化的機制。
(3)同步化
流程的同步化,是流程的一體化和協同化共同作用的結果,是指通過出版流程,能夠同步化生產紙質圖書、電子圖書、數據庫、專題庫、視聽產品、AR出版物、VR出版物等,能夠實現傳統產品和數字產品的同步制作、同步生產和同步上線。
從發展時間和未來趨勢來看,傳統紙質圖書和新興數字產品的同步上線,不是此消彼長的關系,而是相互促進、相互推動、相得益彰的此漲彼漲的關系。未來的編輯將轉型為同時具備傳統出版業務能力和新興出版業務能力的現代型編輯,未來的出版是傳統出版與新興出版融合的出版,不再有傳統和數字之分。
(4)智能化
同時具備一體化、協同化和同步化的出版生產管理流程,就是智能化的出版流程。智能化的出版流程,能夠將智能選題策劃、智能審校糾錯、智能排版印制和智能營銷推薦進行有機融合,以更加數字化、融合化、智能化的生產方式來推動新聞出版業的轉型升級,實現新聞出版業的提質增效,它是出版企業出版流程發展的必然方向。
|參考文獻|
[1]李未,吳文峻. 群體智能:新一代人工智能的重要方向[EB/OL]. (2017-08-03)[2017-11-21]. http://stdaily.com/index/kejixinwen/2017-08/03/content_564559.shtml.
[2]來海德堡,看懂未來的智能印刷工廠[EB/OL].(2017-05-12)[2017-12-20]. http://www.keyin.cn/news/cpjs/201705/12-1104472.shtml.
[3]內容智能發行商魔窗獲數千萬元A輪系列融資[EB/OL].(2017-11-13)[2017-12-21]. http://biz.jrj.com.cn/2017/11/13163523375707.shtml.endprint