文_鄭 偉

今天在此分享北大方正對媒體融合中的大數(shù)據(jù)以及人工智能應(yīng)用的思考與實踐。
第一,從“數(shù)字化”到“新數(shù)智化”的轉(zhuǎn)型。“新”指“從新媒體出發(fā)重組生態(tài)”,一是以移動新媒體為核心,以移動新媒體為主陣地;二是新技術(shù)驅(qū)動,云計算、大數(shù)據(jù)、人工智能這些新興技術(shù)是媒體融合最重要的驅(qū)動力,起到支撐作用;三是媒體的定位和過去不一樣,要通過新產(chǎn)品、新服務(wù)來構(gòu)建、重組一個新生態(tài)。“數(shù)”指大數(shù)據(jù)重建連接。媒體提供適合于C端或B端用戶的產(chǎn)品,通過大數(shù)據(jù)把這些產(chǎn)品精準推送到用戶手中,這就是大數(shù)據(jù)建立的新連接。“智”指人工智能,重塑邊界。比如智能化采集生產(chǎn),過去以圖文為主,現(xiàn)在視頻等新產(chǎn)品都需要智能化的生產(chǎn)工具來快速完成,一場足球賽在結(jié)束后的短短幾秒鐘內(nèi)即可完成適合新媒體發(fā)布的內(nèi)容采集、生成。智能交互技術(shù)帶來新變化、新體驗、新媒介,包括圖象識別、人臉識別、智能語音等,萬物互聯(lián)使每個物體成為新媒介,人工智能技術(shù)重塑媒體邊界。“化”指流程化再造。技術(shù)的應(yīng)用必然會改變生產(chǎn)方式、生產(chǎn)流程,實現(xiàn)組織變革,打破傳統(tǒng)紙媒、網(wǎng)站、新媒體的邊界,通過流程優(yōu)化與再造,實現(xiàn)共融互通。從數(shù)字化到新數(shù)智化,以新媒體為核心,運用大數(shù)據(jù)、人工智能技術(shù)來實現(xiàn)流程以及生產(chǎn)方式的再造。
第二,與應(yīng)用場景緊密結(jié)合是用好大數(shù)據(jù)和人工智能技術(shù)的關(guān)鍵。業(yè)務(wù)訴求是什么?過去有什么樣的困難?生產(chǎn)效率可以在哪些地方得到提高?傳播如何更加精準有效?媒體需要把大數(shù)據(jù)和人工智能應(yīng)用在指揮策劃、新聞創(chuàng)作、音視頻生產(chǎn)、內(nèi)容審核、智能分發(fā)等各個環(huán)節(jié)。我們以兩個例子來看如何跟應(yīng)用場景緊密結(jié)合。新聞事件演化過程當中會出現(xiàn)新的分支和新的話題,海量數(shù)據(jù)使得整個事件的脈絡(luò)難以依賴人工梳理,而對一個事件的演化做分析是媒體做深度報道必不可少的環(huán)節(jié)。
仝卓事件,明星高考作假,帶來一系列反應(yīng)。下圖是人工智能自動生成的脈絡(luò),隱含幾個約束性條件,一是連貫性,整個事件提取的關(guān)鍵節(jié)點一定要關(guān)聯(lián),話題之間是相關(guān)的;二是結(jié)構(gòu)性,整個故事線覆蓋度較廣;三是覆蓋面,體現(xiàn)新聞的多樣性,來自于官方媒體、傳統(tǒng)媒體、社交媒體、自媒體。首先,采集海量的大數(shù)據(jù)是基礎(chǔ)條件,只有采集到豐富的數(shù)據(jù)才能對事件作出自動化抽取。其次,事件檢測,在海量內(nèi)容中檢測一個個話題,因為事件是發(fā)展變化的。第三,數(shù)據(jù)預處理,對每個檢測到的話題提取特征向量,把垃圾數(shù)據(jù)過濾掉,在時間軸里選擇代表事件發(fā)展的關(guān)鍵節(jié)點,根據(jù)發(fā)布量快速增長和變化來判斷時間節(jié)點是否為關(guān)鍵節(jié)點。還有子話題檢測,有的子話題有價值,有的子話題沒有價值,通過大數(shù)據(jù)技術(shù)和智能分析自動生成故事線和事件脈絡(luò)。

傳統(tǒng)媒體積累了大量圖文資料,如何用新方式表達?AI帶來全新的表達方式,比如孟晚舟事件,基于豐富的圖文資料,快速把文字和圖片自動生成更具表現(xiàn)力的短視頻。
第三,中臺戰(zhàn)略和中臺技術(shù)推動媒體技術(shù)架構(gòu)的演進。中臺是什么?中臺戰(zhàn)略的目標不是為了解決單點問題,而是提供可復用的“基礎(chǔ)服務(wù)和能力”的整合平臺,為上層業(yè)務(wù)賦能。中臺是新數(shù)智化的基礎(chǔ)理念,是新的系統(tǒng)架構(gòu)思路和系統(tǒng)建設(shè)模式。
長期持續(xù)的中臺能力建設(shè),可以快速構(gòu)建支撐新業(yè)務(wù)拓展的業(yè)務(wù)系統(tǒng)。過去我們做一個新業(yè)務(wù)要從系統(tǒng)架構(gòu)開始,從數(shù)據(jù)庫開始,從流程開始,未來的建設(shè)方式是從中臺去調(diào)取,利用數(shù)據(jù)中臺和AI中臺提供的基礎(chǔ)能力,快速搭建一個全新應(yīng)用。大數(shù)據(jù)和人工智能技術(shù)是基礎(chǔ)性的資源、服務(wù)和能力。中臺是大數(shù)據(jù)和AI能力的最佳構(gòu)建方式,也推動了媒體整體技術(shù)架構(gòu)的轉(zhuǎn)型和演進。通過中臺不僅為當前業(yè)務(wù)賦能,也為新業(yè)務(wù)的快速構(gòu)建打下基礎(chǔ)。數(shù)據(jù)中臺和AI中臺的架構(gòu)會帶來極大的開放性,各種AI組件、數(shù)據(jù)產(chǎn)品都可以整合在超融合中臺中,它是一個開放的平臺。未來的智慧媒體要通過數(shù)據(jù)中臺和AI提供架構(gòu)上的支撐。
(摘自鄭偉在2020中國[杭州]傳媒技術(shù)生態(tài)高峰論壇上的主題演講)