摘要:本文探討市級媒體數據中臺的項目背景、方法論、建設流程、應用實踐、創新性及落地成效,并分析數據中臺在媒體行業數智化轉型中的重要作用。通過數據資產管理、智能分析、發布展示和共享服務,數據中臺對推動媒體數智化轉型具有積極作用。
關鍵詞:數據中臺 數據倉庫 標簽 內容推薦 精準運營
在數字化轉型的大潮中,市級媒體作為地方信息傳播的重要載體,面臨內容生產、精準分發及用戶運營等多方面挑戰。隨著大數據、云計算等技術的快速發展,建設市級媒體數據中臺已成為提升媒體融合發展的關鍵舉措。本文探討如何通過數據中臺的建設,實現市級媒體資源的有效整合與高效利用,從而提升媒體服務的智能化、精準化水平。
一、建設背景
2020年4月15日,湖州市新聞傳媒中心推出官方移動新媒體客戶端“南太湖號”。在過去三年中,客戶端迅速發展,排名穩居全省前二。
然而,隨著平臺用戶數量的持續攀升,我們面臨一系列新的挑戰和問題。首先,我需要準確了解用戶需求,更加精準地觸達和運營用戶;其次,每天產生的大量數據——包括內容數據、用戶數據和服務數據——需要被有效地開發和利用;再次,隨著平臺功能的不斷豐富和日活的穩步提升,我們急切需要找到流量變現的有效途徑;最后是如何解決信息過剩問題,及時洞察社會熱點,為采編人員賦能。
二、建設方案
數據中臺旨在通過技術賦能與模式創新,全面提升媒體綜合競爭力,確保其在媒體融合發展的浪潮中保持領先地位,實現用戶價值、數據價值、商業價值與社會價值的和諧共生。
市級媒體數據中臺的建設主要分為數據資產化、智能化、場景化和服務化四個階段。各階段任務如下:
數據資產化,即通過數據采集、處理、存儲和治理,形成統一的數據標準和數據資源管理體系,將數據轉化為資產。數據智能化,即利用AI智能技術和人工相結合的方式,開展文字、圖片、音視頻的數據標引工作,實現內容資源的數據化,并挖掘數據之間的關聯,提升數據的潛在價值。數據場景化,即根據媒體機構的具體業務需求,將數據應用于新聞生產、運營、發布等多個場景,形成可持續的媒體數據與服務支撐平臺。數據服務化,即提供統一的數據服務功能,包括數據查詢、數據分析、數據可視化等,為前臺應用提供能力支撐。
項目前期,經過多輪細致比較和分析,最終確定一套基于阿里云“Dataworks+MaxCompute”的總體技術架構方案。這一方案利用阿里云在大數據處理和云計算領域的實踐積累,通過Dataworks提供的強大數據開發、數據集成和數據資產管理能力,以及MaxCompute提供的海量數據存儲和高速計算能力,湖州市新聞傳媒中心得以構建一個高效、穩定、可擴展的數據中臺。
數據資源整合及數倉建設分為三個階段。
1.建設用戶數據倉庫,形成用戶畫像子庫。我們將媒體用戶數據高效整合至數據中臺,借助“南太湖號”App用戶ID作為唯一標識“OneID”,有效串聯用戶的全部基礎數據和行為數據,打造一個精確、全面、統一且有效的用戶數據體系。在此基礎上,我們進一步對用戶數據深度清洗、建模與智能化打標,精心構建一套包含3個層級、10個維度的全方位用戶標簽體系。這一體系涵蓋用戶的人口屬性、平臺偏好、地理位置、閱讀習慣、消費行為、服務需求等多個方面,為用戶畫像的繪制提供有力支持。截至目前,我們已成功為230萬注冊用戶完成打標工作,每位用戶平均擁有203個標簽,為后續的數據分析和精準營銷奠定堅實基礎。
2.建設內容數據倉庫,形成新聞分析子庫。我們將大數據與大模型深度結合,運用文章分類、關鍵詞提取、情感傾向分析、圖片識別及視頻分析等AI能力,對內部生產及全網采集的內容數據精準打標。我們制定一套全面的內容標簽體系,涵蓋內容分類、關鍵信息,如人、事、地、物、組織、傳播熱度及正負面評價等多個維度。截至目前,我們已成功采集并整合500余個媒體賬號的數據,匯聚本地各類新聞內容高達1000萬條,每條內容平均被打上20個標簽,為新聞內容的深度分析和精準推送提供強有力的數據支撐。
3.建設專題庫,形成數據分析子庫。鑒于“南太湖號”客戶端應用廣泛且功能多樣的特點,我們在數據中臺構建多個專題庫,覆蓋本地政策、消費行為、綠色生活等若干細分領域,提供更加專業化、精準化、靈活化的數據支持。這些專題庫不僅深化數據新聞報道的內涵,還為智庫研究提供有力支撐,同時推動多個應用場景的建設,促進數據的高效共享與利用。目前,我們已成功發布一系列具有影響力的報告,如《春節消費報告》《招聘市場洞察》《電動車騎行安全調研報道》等。另外,我們推動多個應用場景的建設,如“共享停車”“食安有道”“工會服務”等。這些成果不僅展現數據價值,也為政府決策、企業運營和社會治理提供有益參考。
三、應用領域
經過兩年多的媒體中臺實踐,我們成功將數據接口、數據報告和數據模型等不同形式的數據產品從中臺層逐漸透出到應用層,為內外部發展賦能,成效明顯。主要運用場景如下:
1.賦能內容——智媒云采編系統
(1)內容生產。數據中臺內容倉庫與中心全媒體采編系統深度融合。通過全網數據采集,匯聚本地各類新聞內容,并通過中臺打標形成政策、民生、文化、科技、旅游、生活等26個熱點專題。借助趨勢分析和熱點預判,更加精準地指導采編工作。同時,中臺與本地氣象預警、120急救、119火警等系統實時連通,確保信息在最早時間發布,快速響應現場需求,提升媒體“及時響應”能力。
(2)精準分發。基于用戶標簽和內容標簽,我們自主研發黨媒推薦算法。根據用戶地理位置、所在部門、系列報道和興趣愛好等維度,實現內容側的精準分發。該推薦算法于2023年3月在“南太湖號”客戶端首頁上線,實現內容分發“千人千面”,滿足受眾個性化信息需求,提高新聞內容曝光轉化,提升用戶體驗。
(3)內容評價。我們將稿件閱讀數據、互動數據和全網轉載數據接入數據中臺,并以中臺MaxCompute云計算能力為支撐,定制開發傳播力計算模型,通過該模型對稿件的傳播效果量化評價,實現對稿件傳播效果的動態監測。目前傳播力指數已在傳播分析、稿費計算、考核排名等方面深入運用。
2.賦能運營——數據決策指揮系統
通過自主可控的數據采集分析工具,全面采集“南太湖號”端內外數據,包括App、H5、Web等,并通過數據中臺清洗、處理和計算,從而形成面向業務人員和管理人員可看、可分析、分決策的數據指標系統。隨著中心指標體系的建立和運用,逐步建立目標設定、指標拆解、過程監控、效果復盤、分析建議的數據運營閉環機制。中心運營人員理念逐步向數據化靠攏。內容運營、用戶運營、商戶運營、活動運營等方面,由原來的粗放式向 精細化轉變。
3.賦能經營——“湖廣通”智慧廣告系統
“湖廣通”智慧廣告系統的誕生,是對數據中臺用戶標簽體系的深度運用。通過該系統,廣告主在投放廣告時可根據廣告內容圈選特定的目標人群,包括用戶的常住地、性別、年齡、職業、消費偏好等標簽,使得廣告精準地向目標用戶投放,最終實現按點擊付費、按效果付費。這一轉變促進媒體廣告營收模式從傳統的廣告位獨占向個性化、精準化和效果導向轉變,不僅為廣告主帶來更好的體驗和更大的價值回報,也為中心提升廣告經營收益。
4.賦能社會治理——“綠色生活碼”應用
憑借數據中臺綠色低碳專題庫的數據基礎優勢,湖州市傳媒中心成為全市綠色數字生活領域公共數據授權運營單位,通過融合媒體用戶數據、社會數據和政府公共數據,建設“綠色生活碼”應用,解決全市市民用戶碳減排成果量化難、低碳生活踐行情況評價困難等問題,形成了全面、多維、豐富的市民個人碳畫像。該應用是媒體利用數據賦能、深化數據運用、參與社會治理的有益探索。
如今,數據資產的重要性日益凸顯。媒體數據作為一類重要的數據資產,具有較高的價值和潛力。媒體單位通過深入挖掘和分析自身數據資產,通過數據交易、合作共享等方式與其他行業數據互通和資源整合,從而提高采編改革和傳播效力,獲得社會效益與經濟效益雙豐收。
(作者馬翔系湖州市新聞傳媒中心科技研發部副主任;作者姚滿琳系湖州市新聞傳媒中心數據運營部主管;作者邱利中系湖州市新聞傳媒中心科技研發部導師;作者施穎涌系湖州市新聞傳媒中心數據運營部數據開發工程師)
責任編輯:苗權譽