文_王卓爾
王卓爾
浙江日報報業集團辦公室
技術驅動媒體融合向縱深發展,已成為一種共識。而驅動技術發展的,正是數據。如何利用好數據,用數據驅動決策,不僅是媒體深度融合領域繞不開的命題,還是大型媒體集團向數字化轉型的關鍵所在。
數據的運用推動著思維方式的改變,人們越來越無法對單純用直覺下的定論感到信服,必須依據客觀數據。1981 年,美國一位學者借助計算機統計了《紅樓夢》中的詞頻,處理分析后得出結論,120 回全都出自一人之手。但這個說法很快遭到質疑,因為他從原著中只抽取了6萬字樣本進行研究,且變量也只有14個。復旦大學數學系畢業的陳大康為了駁斥這個結論,手動對《紅樓夢》全書的字、詞、句進行了全面的統計分析,73萬字的原著,他數了上百遍,獲得約2萬個數據,發現了一些專用詞如“端的”“越性”“索性”在各回中出現的情況,最終得出結論:前80 回為曹雪芹一人所寫,后40 回為另一人所寫,但包含了一部分曹雪芹殘本。
能和數據對抗的,還是數據。過去,數據驅動著學術研究;現在,以數據為中心進行決策和行動就更普遍了。比如,訂票網站根據搜索量分析,未來兩周是出行高峰,于是決定提高機票價格。但是,這僅僅是以數據為參考,并沒有真正做到數據驅動決策。數據驅動是指以海量數據為基礎構建模型,圍繞業務目標持續優化參數,自動做出決策的一種方法。目前,人工智能領域快速發展,聊天機器人等帶給人們太多驚喜。一個錯誤的認知是,技術驅動媒體融合就是引進專業的數據工程師,或是購買AI工具就可以了。其實,更為關鍵的步驟在于利用好自己擁有的數據,將其轉化為有意義、有見解的必要技能。谷歌、亞馬遜、Meta等科技巨頭與其他企業之間的巨大區別不在于他們數據科學家的腦力,或者他們技術的實際功能,而是他們不同凡響的數據驅動的文化。他們利用巨大的數據資產,并有出色的算法來解釋那些數據,然而他們的關鍵戰略優勢和最大資產卻是他們根據數據生存、呼吸和行動。[1]以數據驅動為主要決策導向,能讓企業著眼于具體目標,并借助技術工具更有效地解決問題。
在媒體行業內說到數據,往往會想起文章的“閱讀”“點贊”“評論”“轉發”這類指標,很長一段時間內,這些顯而易見的指標的好壞是決定一篇文章的傳播是否成功的唯一標準。雖然直觀,但這也給人們帶來了思維的固化。內容分發出去之后,閱讀量陡然上升并不能客觀說明傳播效果好,也許僅僅是因為有一個奪人眼球的標題而已。統計特定部分的跳出率更能說明問題,它可以幫助內容生產者對內容進行布局優化和修正,B 站的高能進度條就是如此。它在普通進度條上方設置了波峰標志,波峰越高的部分就是觀看人數越多、彈幕集中的部分。如果波形平緩,那就說明視頻平平無奇,缺少爆點。
此外,還需對表象數據進行穿透,挖掘出更多數據,適量囤積一些數據以備后續分析。比如,從自有平臺和分布式平臺等各種渠道收集大量類似訪問的時間、地址、入口、設備類型等方面的用戶訪問數據,再進行更復雜的深度分析。美國數字媒體公司BuzzFeed內部有一款數據分析工具Pound,能夠了解用戶如何在不同社交網絡內分享內容。假如網友將一篇文章分享給他的好友,好友轉發到推特,繼而又分享到其他社交平臺上,Pound可以把這些線索關聯起來,顯示不同分享人之間的聯系,并把這個線路圖描繪出來。甚至,Pound可以根據某篇內容的來源,預測它在該網絡如何傳播,進一步幫助BuzzFeed了解受眾。
然而,大數據大量、高速、多樣的特征決定了必須有一個強有力的大腦來支撐其運行,有一個足夠強大的數據倉庫來存儲數據。隨著數據體量和業務模塊的增加,數據處理能力將會經受不小的考驗。服務器能否經受高訪問量,數據庫是否能做到實時更新,多源異構數據是否能夠實現融合和匯聚,能否承載人工智能、區塊鏈等前沿技術的數據計算能力等方面,都在考驗著數據處理的技術能力。媒體企業也必然加大在技術硬件方面的投入,通過提升服務器硬件水平、部署分布式數據處理系統等方式來實現對數據的掌控力。
積累數據不僅僅是為了訓練模型,讓其更精準,更是為了從中提取有價值的信息,并利用好這些信息,進行更有效率的傳播,更精準地在用戶和信息之間構建橋梁。
不管是文章、視頻還是新媒體產品,最終到達的節點是用戶。用戶可以不去了解文章作者是誰、愛好是什么,但是作為內容生產者和傳播者,必須對其受眾有精確的洞察,這在很大程度上影響著內容制作的方向、特點、風格和運營模式。而隨著平臺型媒體的增多,PGC、UGC等內容生產方式層出不窮,用戶選擇可看的內容也不僅限于“千人一面”。通過對用戶年齡、階層、行為偏好進行數據分析,就可以向不同用戶推送不一樣的內容,形成“千人千面”的用戶體驗。
分析用戶數據還能實現精準營銷的目的。《紐約時報》專注于利用用戶數據幫助客戶實現廣告定位,起到產品建設的目的。2020年2月,《紐約時報》組建了一支由來自數據、產品、設計、技術和廣告領域的行家組成的新團隊,主要目標是通過用戶行為和喜好為廣告商設計產品,實現精準定位。[2]阿里巴巴的數據中臺通過One ID來連接用戶在阿里巴巴產品體系下的用戶數據,將用戶在阿里系產品中產生的數據通過One ID關聯起來,這樣就可以從衣食住行等各個方面來精確描繪用戶畫像和興趣,制定高轉化率的營銷方案。[3]
除了在單一平臺上發布內容,很多時候,還需要在不同渠道進行內容分發,來樹立品牌形象,進行流量引導。這需要根據不同平臺特性、不同目標用戶特性,對同一款內容進行二次加工。比如在抖音上發布的視頻多以豎屏為主,在小紅書上更多以圖片為主,在知乎上則要緊貼問題,不能照搬照抄。BuzzFeed開發了一個叫Hive的項目,它可以幫助編輯按平臺特性個性化制作同一款內容。舉例來說,一個包含7個步驟的燉雞菜譜網頁在Facebook 上變成了46 秒的視頻;在Instagram上變成15秒的短片,評論區附有烹飪要點;如果要分享到Snapchat,它還得轉成縱向模式。同一份菜譜,一瞬間就能變成數個不同的MP4文件。
在數據驅動思維的影響下,內容傳播效果的評價也將用數據來替代人工經驗,比如引入傳播力指數之類的指標進行檢驗。而要形成數據評價閉環,還需要對差異化的傳播結果進行對比測試,來指導新聞生產環節的改造、提升傳播效果和轉化率。數據驅動中比較典型的方法是A/B測試,它也被稱為對比測試和分桶測試,旨在用于對比測試(A)版本與變量(B)版本兩個版本的內容的效果,識別哪一個版本對于用戶更具吸引力。字節跳動在推出抖音之前做過很多產品小樣,起了很多名字,也設計了很多logo。它將不同名字和logo放在不同應用市場,在位置、預算等條件一致的前提下,測試了各自對用戶的吸引力程度、下載轉化率等指標,最終確定了“抖音”作為新產品的名字。
在A/B 測試的基礎上,也有諸如《華盛頓郵報》這樣的媒體引入了MAB(multi-armed bandit)測試,即“多臂老虎機”。它是一種動態隨機最優化的范疇,是特殊類型的動態隨機控制模型,用于處理如何最優地進行稀缺資源的分配。相比A/B 測試,它更加靈活,在測試運行過程中可以增加或者刪減變量,比如同時測試標題、圖片縮略圖、視頻、推薦文章、熱門文章等。當編輯添加一個變量到其MAB 模塊并對網頁進行發布時,MAB 測試的算法會自動注冊一個有關新變量與默認變量的新測試,同時發布到網站上,開始在測試頁上跟蹤與測試相關的用戶反饋,并根據實時反饋,選出最佳變量。這種最新的測試方法的優勢不僅在于變量的組合能夠最大限度地引起用戶的參與,并且能夠花費最小的成本探索出最佳的變量組合。[4]
雖然A/B 測試可以用較小的流量獲得優選結果,但是,它在國內媒體中的應用還處于初級階段。字節跳動旗下火山引擎做過的一項市場調研顯示,在企業的日常業務和管理中,A/B測試的普及率并不高,滲透率不足30%。一個比較實際的原因在于,部署A/B測試需要有很強的底層技術支撐,包括服務器的實時響應能力和處理速度等,來保證科學的流量分割、流量層直接的正交互斥,使得實驗不受干擾,中小企業不具備相應的技術條件。A/B 測試也并不是萬能的,它需要投入一定的試錯成本,很可能較好的測試結果并不是內容生產者希望出現的。當然,評價傳播效果不只有A/B 測試這樣一種方法,我們真正需要的是以用戶需求為導向,借助數據分析工具,更好地強化媒體與受眾的連接,提升內容傳播效果。
能夠超越技術的不是技術,是人;能夠成功讓技術引領媒體深度融合的也不是技術,是組織。新技術的運用,需要與之相適應的組織變革,其潛能才可以充分釋放出來。相對來說,組織變革更加復雜艱巨,因為涉及人與人生產關系的改變,而且要克服組織惰性。[5]在技術驅動媒體深度融合發展的背景下,技術人才并不只是待在幕后,而是走向編輯室,將技術融入更多內容生產之中。
例如,澎湃新聞《海拔四千米之上》H5產品就由技術人員發起創意。在預判會獲得大量精美影像材料的基礎上,前端工程師采用全景視頻的方式進行內容呈現并提供基礎框架,使用了普通拍攝、航拍、延時拍攝、360全景圖片、定點VR視頻、漫游VR視頻、互動熱點、交叉嵌合等方式,實現了多種技術和表現形式的大融合。產品最終獲得第二十九屆中國新聞獎融合創新類作品一等獎。
媒體競爭關鍵是人才競爭,媒體優勢核心是人才優勢。根據波士頓咨詢公司《數字經濟下就業與人才研究報告》,數字技術融入各行各業,善用數字技術成為諸多崗位的“必修課”,如傳統營銷轉型為數字化營銷,商業情報分析轉型為大數據分析。因此,掌握綜合化的不易被數字技術所取代的技能及素質將享有更廣泛的職業發展空間,而爭奪此類人才也勢必會成為“人才爭奪戰”的重中之重。無論是技術架構的搭建還是業務場景的深化,都需要數據分析師掌握分析工具、具備用數據分析問題的能力,并對業務有深入的理解和豐富的經驗,如此才能對媒體行業的數據指標有準確的判斷。
此外,媒體單位的組織方式也需要適應互聯網時代,變得更靈活、更多元、更扁平化。傳統媒體中逐級上報、決策滯后的模式將會是快速響應網絡的阻礙。如何建立數據與內容生產相適應的考核機制,也是傳統媒體需要突破的難題之一。