(黑龍江新媒體集團 哈爾濱 150010)
根據The Media Briefing發布的《2017年傳媒生態報告》(The State of Media 2017),在30個國家的逾千名調查對象中,有67%的傳媒業高管對自己所有媒體持樂觀態度,縱觀傳媒的整體環境,有幾大特點值得關注,一是視頻成為媒體的投入重點。在中國,2017年網絡視頻用戶、移動網絡視頻用戶持續增長,移動互聯網成為觀眾觀看視聽內容的首選。截至2017年6月,中國網絡視頻用戶數量達5.65億,較2016年底增長3.7%,其中手機視頻用戶規模為5.25億,與2016年底相比增長5.1%[1]。二是互聯網廣告已經成為我國市場的主導,根據艾瑞咨詢的數據,2017年第一季度,我國網絡廣告季度市場規模為698.9億元,同比增長31.1%;第二季度為861.6億元,同比增長28.5%[2],即根據贊助商的需求量身打造并精準推送的廣告內容。三是互聯媒體已經成為主導,隨著大數據、人工智能、云計算等新技術的發展,興趣細分、個性推薦、內容分發已經成為眾多媒體的重要戰略方向,包括網易、今日頭條、搜狐、UC等都實現了基于算法的個性化、精準化的分發方式。
“大數據”在物理、生物、環境生態、自動控制等科學領域存在已久,但與新媒體的融合尚待挖掘,大數據技術,從本質上來說就是從類型各異、內容龐大的數據中快速獲得有價值信息的技術,而對于大數據所處理的兩種數據類型來說,非結構化數據規模是結構化數據的100倍以上,很顯然,非結構化數據對新媒體的大數據應用更具新價值,這些價值主要體現于幾個方面。一是語義價值,即非結構化的語義理解,通過最大似然估計計算出各個符號的頻率分布[3],從越來越多的語音、圖像、視頻等非結構化數據中挖掘出有價值信息的數據,實現人工智能的培養,最終的目標是人工智能能夠理解并模仿人類的語言。二是社交價值,當前的社會媒體形成了一個極為龐大而又錯綜復雜的社會網,“大數據推動了傳媒行業的縱向垂直整合,用戶數據和客戶群成為整個產業鏈中最為重要的因素”[4],而非結構化數據則是描繪了整個傳媒行業之內用戶輪廓、客戶群輪廓的重要工具。三是決策價值,大數據在媒體中的運作是尋找隱藏在數據中的模式、趨勢和相關性,包括“今日頭條”“網易新聞”等媒體客戶端都在利用非結構化數據來進行內容分發。因此,對于新媒體的決策者來說,非結構化數據正是根據各類趨勢進行決策,進而實現精準行文、精準投放及精準營銷。
今天的大數據除了統計功能外,還包括了云計算、深度學習等先進的技術,大數據技術讓我們越來越多地從數據中觀察到人類社會的復雜行為模式,不斷增加著我們的可用知識,使人們有了傳統手段所無法比擬的分析能力,這也從幾個維度為新媒體帶來了前所未有的機遇。首先,是自媒體應用的機遇,“自媒體和大數據在實際發展中都將受到‘相關性’的影響,這也促成了兩者直接的契合”[5]。微博、微信等自媒體平臺的廣泛應用實現了“人人都是信息的傳播者”,根據《2017年中國自媒體從業人員生存狀況調查報告》顯示,2017年全國自媒體人數量為260萬人,其中有38.8%的自媒體人月收入超過5000元。其次,是挖掘潛在渠道的機遇,隨著新媒體時代傳播渠道的多樣化,定制化渠道及個性化需求將成為新媒體運營者在細分市場的核心競爭力,包括了新舊媒體之間渠道的轉換及打通,這些都可以實現渠道的創新與受眾的觸達。第三,是大數據營銷的機遇,大數據營銷的核心是讓網絡廣告在合適的時間,通過合適的載體,以合適的方式,投放給合適的人。付安紅提出了相較于傳統營銷,新媒體營銷具有產品個性化定制、價格策略更加柔性化、增強企業與消費者的交互性、提高“顧客讓渡價值”、節約營銷成本、提高營銷效率等優點[6]。
大數據的發展為整個行業帶來了巨大的紅利,但同時也引發了一系列挑戰與難題。首先是算法瓶頸的挑戰,一方面算法使新媒體的推送更加精準,觸達率更高;另一方面,2017年9月人民日報連續三天發表評論文章,提出了以今日頭條為代表,單純依靠算法推薦的平臺存在價值觀缺失、制造信息繭房、競爭手段屢破底線三大問題,同時提出了“信息繭房”這一概念,主張算法主導下的內容分發模式會產生“自我封閉”的危險。其次是劣質內容挑戰,新媒體被理解為“在獨立的私人空間內,向特定或不特定的個人和群體傳達和分享相關信息的新型媒體”[7],因此很多自媒體缺少傳統媒體所承擔的一些義務與束縛,比如未經科學驗證的健康知識、夸大其詞的廣告、只為博眼球的標題黨、過于情緒化的觀點乃至毫無用處的信息,都時常出現在智能平臺首頁的推薦當中。這些問題,也許最終還是要從大數據技術本身入手解決,需要開發出更先進的技術和算法,采取“人機互補”的方式來加強新媒體的把關或管理。
數據化指一切內容都通過量化的方法轉為數據,而網絡則實現了數據的實時交換,人們可以從其中找出各個數據之間的關聯性,輔助自己的判斷以實現有效決策,對于媒體運營來說,最有價值的數據包括了用戶數據(讀者數據)、內容數據與營銷數據,大數據經過收集、分類、聚類后所提供的信息可以幫助新媒體運營者了解用戶需求、閱讀偏好及客戶細分,找出傳播的元素,分析讀者喜歡或反感某類或某篇內容的原因,預測趨勢及用戶行為,實現媒體運營者的精準決策。
用戶畫像也即用戶標簽化(User Labeling),它是現代媒體領域重要的研究方向之一,即通過用戶性別年齡、興趣愛好、閱讀習慣等的分析,實現個性化的推薦與精準的營銷。而用戶畫像正是以大數據為基礎的,當前所有的新媒體平臺幾乎都集成了用戶數字化蹤跡的記錄功能,而無論是范圍、效果還是效率都要遠遠高于傳統的調查問卷方式。該方式利用大數據建立SVM(Support Vector Ma?chine)向量權重模型,根據用戶的歷史數據建立起運營者自己的網絡資源庫。
對于數據的呈現,除了微信等平臺自帶的流量監測之外,國內很多公司已經探索出了多種集群化、圖標化的呈現模式,例如,“西瓜數據”提供全網優質公眾號查詢、監控及診斷等功能,可以幫助運營者迅速獲悉公眾號最新運營數據,實現公眾號運營及廣告投放效果的監控。可以查看地方公眾號排名并按22個垂直領域進行細分,可以查看閱讀增長趨勢圖,點贊數、公眾號年齡分布、性別分布、發文習慣等等。同時,大數據可以呈現網絡化的可視化分析結果,智能化實現包括用戶分析、圖文分析、競爭對手分析、活動/媒體合作分析等多維度的分析關系并以直觀的形式展現出來。
隨著人工智能與深度學習算法的不斷發展,寫稿機器人已經實現了第一時間自動生成稿件,瞬時輸出分析和研判的功能。早在2009年美國職業棒球大聯盟的季后賽上,一款名為StatsMondey的人工軟件就已經成為了新聞撰稿人,而且已經達到30秒內即可生成一篇新聞稿件的“極速效率”。在國內,騰訊開發的Dreamwriter自動化新聞寫作機器人實現了內容的編輯;里約奧運會期間,今日頭條研發的寫稿機器人張小明,16天撰寫了450多篇體育新聞,并以和直播同步的速度發布;第一財經的“DT稿王”,1900篇/天的產出速度,相當于同時100位資深證券編輯1個小時的產量。盡管在涉及思維、情感、立場、判斷、文化、藝術等方面,當前的人工智能仍然與人類存在著較大的差距,但可以預見的是,大數據和人工智能技術是機器人寫稿的技術基礎。尤其是隨著大數據技術的發展,機器人寫稿能力會越來越強。[8]
在大數據時代,任何行業都無法與數據完全“割裂”,在“冷冰冰”的數據背后存在的卻是人口統計信息、興趣、偏好各不相同的讀者、觀眾與網友,但如何用這些數據來產生“有態度”的內容,實現“有溫度”的營銷,創造“有深度”的產品,仍然需要人的努力。本文在研究大數據在新媒體傳播中的運用的過程中,不僅對新媒體傳播與大數據發展的現狀進行了分析,探討了其在社會中的應用,更提出了具體的策略,筆者也希望在該領域能夠有更多的實例研究,深入到大數據的算法及從社會科學的框架加以探討,同時,對新媒體領域大數據研究應緊跟其它領域的形勢,為新媒體運營者提供更多的技術手段與思路。