牛祿青
數據是國家基礎性戰略資源,是21世紀的“鉆石礦”。黨中央、國務院高度重視大數據在經濟社會發展中的作用,黨的十八屆五中全會提出“實施國家大數據戰略”,國務院印發《促進大數據發展行動綱要》,全面推進大數據發展,加快建設數據強國。
“十三五”時期是我國全面建成小康社會的決勝階段,是新舊動能接續轉換的關鍵時期,全球新一代信息產業處于加速變革期,大數據引領新一輪科技創新,對文化創新的驅動作用越來越強,成為文化創新的新動力,催生新型文化業態,孕育以數據科學為核心的人文科學革命。當前,國內文化市場需求處于爆發期,大數據產業面臨重要的發展機遇。
《大數據產業發展規劃(2016-2020年)》提出,推動文化創意等行業領域大數據應用,推進行業數據資源的采集、整合、共享和利用,充分釋放大數據在產業發展中的變革作用,加速傳統行業經營管理方式變革、服務模式和商業模式創新及產業價值鏈體系重構。
文化部文化產業司和中國人民大學聯合發布的《中國文化消費指數(2013)》報告指出,當前我國實際文化消費規模大約是1.038萬億元,占居民消費總支出的是6.6%,但實際調查顯示我國文化消費的潛在規模是4.7萬億元,應該占居民消費總支出的30%,大概存在著3.66萬億元的文化消費的缺口。萬億級的文化消費缺口,為文創產業提供了廣闊的想象空間,但要想滿足這一巨大的消費需求,離不開大數據技術的支撐和驅動。
正確理解文化大數據
文化大數據作為文化與科技融合發展的重要方式和產物,是國家大數據產業規劃的重要組成部分,是嶄新的文化生產力資源,有利于打造文化新業態和新經濟發展支撐點;有利于促進移動互聯網時代民眾科技文化素質的提升,培育創新人才;有利于促進中國經濟和傳統文化轉型升級,實現中華民族偉大復興的中國夢。
文化創意產業引入大數據技術有著得天獨厚的優勢:一是文創產業蘊含的數據具備較高消費價值。文創產業所涉及的產品大多和消費者直接相關,能直接為用戶所消費,有著明確的直接消費價值。二是文創產業本身就是創造數據和內容的行業,能夠不斷滋生新數據,而且數據體量龐大,僅次于政府信息數據。三是文創產業本身擁有極其雄厚的用戶資源,而基于龐大的用戶資源進行數據分析,將成為文創產業未來基于大數據技術轉型升級的關鍵性條件。
文化大數據可以分為需求側大數據和供給側大數據,前者被關注較多,例如客戶資源、市場信息、訂閱量、銷量、收視率、上座率、票房、流量、點擊率、點贊數等,都是針對文化消費的。而供給側大數據常被忽略,其實供給側大數據對文創產業的發展更為緊迫和重要。
供給側大數據主要來自三個方面:一是公共文化機構,包括圖書館、美術館、博物館、文化館、紀念館、檔案館等;二是高校科研機構,如傳媒大學、電影學院、美術學院、印刷學院、服裝學院、藝術研究所、考古研究所等;三是文化生產機構,包括報刊社、出版社、廣播電臺、電視臺、電影制片廠、唱片公司、文藝院團、網站、移動終端等。
2013年12月30日,習近平主席在主持政治局集體學習時強調,提高國家文化軟實力,要努力展示中華文化獨特魅力。要系統梳理傳統文化資源,讓收藏在禁宮里的文物、陳列在廣闊大地上的遺產、書寫在古籍里的文字都活起來。要綜合運用大眾傳播、群體傳播、人際傳播等多種方式展示中華文化魅力。
系統梳理傳統文化資源,這個過程將產生海量的數據,包括文獻數據、音頻數據、視頻數據、戲曲數據、文化遺產數據等。所以,供給側的文化大數據非常龐大,如果得以有效開發、利用和傳播,無異于“金山銀山”,經濟價值和社會價值不可估量。
不管是需求側大數據,還是供給側大數據,需要統籌兼顧,不能顧此失彼。而且兩者不是完全割裂的,而是相互聯系、相互促進的。后者是前者的基礎和本源,可以影響需求側的文化消費數據;前者是后者的依據和評價,可以影響供給側的文化產品的生產、傳播、消費方式及基本形態。
分類開發文化大數據
在文化供給和需求兩者的矛盾中,供給是矛盾的主要方面,也是文創產業的短板所在。如今文化消費市場煥發蓬勃活力,文化消費水平逐年攀升,但文化生產還停留在半工業化狀態,要把生產和消費緊密聯系,利用大數據等互聯網技術推動文創產品數字化,并及時跟蹤、收集、分析消費信息,為文化生產提供服務,加快文創產業轉型升級。
數字化技術改變了文創產品的生產、存儲、傳播、消費方式及基本形態,文創產品數字化成為不可阻擋的發展潮流。傳統文化消費的一些對象,如紙質報刊、紙質圖書、膠片電影、磁帶音樂等伴隨數字化技術的發展日漸式微甚至有可能逐步消失,而數字報刊、數字圖書、數字電視、網絡視頻、數字廣播、數字電影、數字圖書館、數字博物館等日益成為消費主流。數字化技術和新型介質的廣泛應用,推動文創產品科技含量大幅增加,生產效率明顯提高,生產方式不斷改進。同時,它也深刻改變了人們的文化體驗方式。數字化引發的虛擬浪潮,強化了人們“深度浸潤式”文化體驗,這在3D動畫電影、VR游戲消費中表現得淋漓盡致。
如何開發文化大數據?這里主要針對供給側而言。供給側的文化大數據要分類開放開發,大體可分為文化遺產類和文創產品類。從開發路徑上來看,首先要把文化遺產數字化,獲取元數據,其中包括三個程序:一是采集,二是加工,三是存儲。在此基礎上,通過市場化的方式開發這些元數據,將其碎片化,形成中華文化數據庫,再通過產業化的展示和交易,應用到文化創作生產中去。
文創產品類的數據開發過程與文化遺產類大同小異,主要是融資渠道不一樣。
文化遺產類的采集、加工和存儲,應該由財政預算渠道來解決;文創產品類的采集、加工和存儲以及市場化、產業化的展示和交易,所需經費主要通過企業本身或市場渠道來解決。
接下來舉一個文化大數據開發的案例。在北京舉辦的一場圖書博覽會上,中央文史研究館館員、中華書局編審程毅中拿起自己的手機,對著一個二維碼輕輕一掃,將《中華經典古籍庫》第四期推送上線。第四期數據的發布意味著,在這個古籍庫中,程毅中不僅能檢索到“中國古典文學基本叢書”、《先秦漢魏晉南北朝詩》這些他自己曾經參與策劃、編輯的中華書局版古籍,而且還能看到《冊府元龜》《宋代序跋全編》《郭店楚簡老子集釋》《全元文》《清詩紀事》等其他出版社整理本古籍的身影。
從最初的一家出版社、300種書、2億字,到如今的7家出版社、1200多種書、7.5億字,隨著聯合腳步的加快,古籍出版即將實現“大數據”。兩年多前,為了《中華經典古籍庫》項目,以中華書局員工為班底的古聯公司成立了。兼任古聯公司總經理的中華書局總編輯顧青,手上有一份目錄,上面的4000多種整理本古籍,分散在全國幾十家出版社。
現代意義的古籍整理,大概是從1920年前后開始的。粗略統計,近百年來總共出版了三萬種左右的古籍圖書。其中,有不少是影印本或重復出版的圖書,還有很多是普及類的選本、注本,再除去一些整理質量比較差的書,能跨進《中華經典古籍庫》門檻的整理本古籍,就是目錄上的4000多種。《中華經典古籍庫》至少要收入其中的3000種,建設的數據是5億字,把新中國成立以后主要的古籍整理圖書都囊括進來。
許多中小型古籍出版社雖然有一定的內容資源,但是總量不多,也缺乏數字出版的專門人才。如果單獨組建一個數字出版隊伍,投入很大,收效并不一定好。而且目前的古籍整理學術與出版隊伍相對分散,缺少統籌,也缺少系統性規劃;同時,古籍整理難度大,出版周期長,出版物市場小等因素,使目前處于產業化環境中的古籍出版單位,壓力加大,古籍整理出版物的品種上不去。古籍數字化需要在合作中共同發展。從弘揚中華優秀傳統文化大局出發,通過合作可以優勢互補,利益共贏。
鳳凰出版社、巴蜀書社、華東師范大學出版社、天津古籍出版社、齊魯書社、遼海出版社陸續加入進來。還有多家出版社準備加入,“這個古籍數據庫不是死的文物,而是不斷有新的內容進來,不斷生長”。
20世紀80年代以來,各類古籍數據庫層出不窮,但往往專業人士參與不足,文字錯訛、版本問題等一直為學界所詬病。雖然很多學者都在使用古籍數據庫,但主要將其作為檢索工具,在撰寫論文或著作時還要核對原書,而鮮少直接使用古籍數據庫中的文字。這樣不但不利于中華優秀傳統典籍的傳播,而且也是對歷史不負責任。
古籍數字化的根本在內容,傳播是手段。《中華經典古籍庫》是基于優秀古籍整理作品基礎上的數字化。盡管組織者也希望加快《中華經典古籍庫》的建設速度,豐富內容資源,但選取權威整理版本、獲得整理者授權、檢查文字內容這些環節絲毫不能馬虎,為讀者提供一個優質、可信、可直接征引的善本古籍庫,是他們一直所堅持的標準。
積極應用文化大數據
面對大數據時代的到來,文化企業應該以更敏銳的觸角、更開放的胸懷迎接市場挑戰,贏得數據先機,通過大數據技術,對特定人群的文化消費喜好進行分析挖掘,明確受眾群體的品味和需求,有效解決文創產品供需脫節的矛盾,廣告無效投放的困擾,創造出受歡迎的文創精品,提升文創產品的消費體驗,從而促進文創產業大發展大繁榮。
只拍觀眾想看的。過去,制作一部影視劇,主要靠導演、制片人的經驗;投資一個影視項目,投資機構很多時候是依賴人脈關系網;播出一部影視劇,則主要借力播出平臺的品牌效應。在這些環節中,觀眾作為客體只能被動地接受。如今,在大數據時代,觀眾想看什么,導演才拍什么,傳統的影視制作、播出模式正被顛覆。
在影視領域,大數據運用的成功案例當數美國Netflix制作的《紙牌屋》。該劇的制作方既不是電視臺,也不是傳統的電影公司,而是一家視頻播放網站。2012年,視頻網站Netflix開始準備推出自制劇。在決定拍什么、怎么拍時,Netflix拋開了傳統的制作方式,啟用大數據。通過在該網站上3000多萬用戶的收視選擇(如收藏、推薦、回放、暫停等)、400萬條評論、300萬次主題搜索,Netflix進行精準分析,將這些數據用于倒推前臺的影片生產。
通過對需求側大數據的分析、挖掘,Netflix發現,其用戶中有很多人仍在點播1990年BBC經典老片《紙牌屋》。這些觀眾中,又有許多人喜歡導演大衛·芬奇,大多愛看演員凱文·史派西出演的電影。Netflix大膽預測,一部影片如果同時滿足這幾個要素,就可能大賣。于是,《紙牌屋》出現了,并大獲成功。整部劇集13集一次性在Netflix網站發布,供訂閱者觀看,完全顛覆了傳統的每周一集的播出模式。這是由Netflix的看家法寶大數據得來的啟發。數據顯示,用戶喜好把一周一集的美劇屯著,等有空時一氣看完。《紙牌屋》大獲成功后,影視業興起了利用大數據技術的浪潮。
讓用戶參與創作。在大數據的支撐下,國內文化內容的創作生產正在漸漸改變僅憑內容生產者創意支撐的單向輸出狀態,通過IP粉絲大數據的分析與運用,IP可以在創作之初增強原作和粉絲之間的黏性與活動,融合大量粉絲創意,集眾智眾慧之力,為IP改編、跨界打造、宣發等提供具有前瞻性的指導作用,從而更好地提升IP的價值。
一本名為《余罪:我的刑偵筆記》的類型小說曾在圖書市場上引發熱議,首印十萬冊被征訂一空。《余罪》能夠在類型小說陷入低迷期時火爆逆襲,其魅力究竟何在?
《余罪》講述了菜鳥警察余罪意外從警校選拔中脫穎而出,和戰友們破獲各種犯罪,一步步成為享譽警界的刑偵高手的故事。《余罪》2013年開始在網上連載,一經推出便吸引了無數讀者熬夜追讀,甚至有身為職業警察的讀者一同參與到創作中來。
該書作者常書欣說:“粉絲里有很多警務人員,有一些因為看書成了朋友,他們會像審嫌疑人一樣審視文字,警銜設置錯誤了,他們會馬上指出來;偵破方案不對了,他們會在QQ上和我討論好久。最難對付的是,這些人猜情節,有的看一半就能猜出結局來,他們專業的欺負我一個業余的,于是就逼著我絞盡腦汁不斷來一個個峰回路轉。和粉絲的互動好處就在這兒,集體的智商肯定要比一個人強,他們的參與會提高這部小說的整體水平。”
大數據對設計行業也產生了變革性的影響。在大數據時代,越來越多的知名設計師、品牌和零售商開始利用社交網絡讓公眾參與到設計當中,而此前,這一行業只對時尚精英開放。
作為設計界國內領先的專注于創新產品設計的眾創平臺——洛客,打造了一種設計界的“CBD”模式。在這種模式中,CBD不再是傳統意義的“中央商務區”,而代表著超級想象力。其中,C(用戶)是敢玩的人格魅力體,B(企業)是敢造的超級供應鏈,D(設計師)是敢想的超級設計師。在CBD模式下,三者融合打造出一種創新體驗,這種體驗,從“不得已而為之”的顛覆,轉換成消費升級背景下的“新消費主義”,C+B+D促成了自上而下的洛客眾創生態。一大批由粉絲用戶參與創作的文創產品,如55°設計師保溫杯——Biger邦德杯、故宮貓、兒童全息互動魔盒、上上簽、一無二襯衫、喜馬拉雅H6小型降噪耳機等深受消費者喜愛。
精準投放廣告。文化企業可以利用數據采集、數據分析挖掘的核心技術,實現清晰的用戶畫像、消費者需求洞察,進而協助企業自身實現精準廣告投放,甚至還可以為企業提供具有高度可靠性的市場預測與決策支持等。
在歐美國家,網絡音樂下載需付費,在線收聽免費,但需忍受音樂之間插播的令人厭煩的廣告。在大數據時代,這一狀況將得到改善。一些在線音樂服務商通過收集用戶的數據,如音樂類型偏好,收聽音樂的場所、時間段等分析用戶的口味,從而推送讓用戶感興趣的廣告,提高用戶的體驗度。
Pandora電臺是美國最流行的提供在線音樂服務的軟件,擁有7200萬名活躍用戶。用戶只要輸入喜歡的歌曲或歌手,Pandora電臺就會為用戶建立一個私人電臺,不斷播放風格相近的音樂。收聽過程中,用戶還可以選擇“喜歡”、“不喜歡”或者“我聽膩了”,來對電臺進行調整,使其播放的音樂更符合自己的口味。
基于大數據研究,Pandora電臺推出“口味廣告”,力求為用戶插播“最適合”的廣告。電臺通過長期播放用戶喜歡的音樂,進一步發掘每個用戶喜歡的音樂類型,找到類似風格的廣告進行投放。
在藝術品市場,大數據還可以預測交易數量和市場變化。藝術品行業的大數據主要包括用戶、內容和渠道三方面,呈現形式如圖庫、音樂庫、影視庫、藝術品拍賣、多媒體藝術、展覽等。通過對用戶的搜索、瀏覽、點擊量可以精準追蹤和獲取相關信息,從而引發新的商機。比如將一些藝術家的信息選出,綜合出一個流派的指數,從中觀察交易數量的變化。這為藝術品研究報告的撰寫提供了準確的數據。據相關報道,以過去10年來的藝術品交易市場情況為對象,通過大數據分析,發現占市場交易最大份額的是現代派和印象派畫作,其中,現代派占比34%,印象派則為24%,二者搶占了全球藝術品市場的大半江山。
利用大數據延長文創產品的產業鏈。通過收集大量的潛在用戶的情感體驗大數據并進行分析,文創企業能提煉出主流消費群體的品位和審美變化,將其附著于產品之中。例如,藝術品開發企業可以與博物館、美術館合作,通過分析用戶瀏覽記錄(某類展館人流量、停留時間等)來確定較受歡迎的藝術作品和藝術形態,從而有針對性地進行開發。借助于大數據,文化企業還能根據產品的受歡迎程度決定開展二次產品開發,從而延長產品產業鏈和經營周期。
利用大數據縮短開發周期。過去,在產品開發的重要環節——收集用戶反饋中,文化企業往往不能及時獲取相關數據從而延誤產品的升級換代,不能給用戶帶來最新的消費體驗。現在,借助于互聯網尤其是移動互聯網的便利性,用戶只需輕輕一點便能給予反饋,或吐槽或點贊,企業在第一時間就能收集到與以往體量相比龐大得多的數據,及時對產品進行改進,使產品在市場更具迭代競爭力,更受用戶歡迎。