廖 迅
(中國國家圖書館 北京 100081)
我國的公共文化服務是指在政府主導下,以公共財政為支撐,以公共文化服務機構為骨干,向社會公眾提供公共文化設施、產品、服務,以實現公民的基本文化權利和滿足公民的基本文化需求。自2008年《自然》(Nature)推出《大數據》專刊探索大數據對當代科學的意義以來,大數據已在全球范圍內掀起了科學研究、政府治理、經濟建設、社會民生等領域的重大變革。大數據在公共文化服務領域的應用相對滯后,但也必將影響公共文化服務的形態和模式。
2015年8月,國務院印發《促進大數據發展行動綱要》(國發〔2015〕50號)。該綱要將發展“教育文化大數據”列入我國公共服務大數據工程之一,指出應“加強數字圖書館、檔案館、博物館、美術館和文化館等公益設施建設,構建文化傳播大數據綜合服務平臺,為社會提供文化服務”。因此,在當前語境下,國家政策層面的文化大數據特指我國公共文化大數據,即圖書館、檔案館、博物館、美術館、文化館、非遺館等公共文化服務機構活動產生的、涉及文化資源創建、傳播、服務、消費等方面的多源異構大規模數據,又稱公共文化服務大數據。本文即基于上述定義對公共文化大數據的研究現狀進行分析,并對未來研究動向加以研判。
從研究成果類型來看,現有公共文化大數據研究成果主要反映在學術論文方面,課題數量較少,而專著幾乎沒有。因此本文主要分析對象是以公共文化大數據為研究對象的學術論文。本文選取中國知網學術期刊全文數據庫(CNKI)作為文獻統計來源,以“主題”包含“公共文化大數據”為檢索條件進行精確檢索,檢索到相關文獻28篇。以“關鍵詞”包含“大數據”和“圖書館”并且“篇名”不包含“高校”“大學”“醫院”“高職”為檢索條件,以“關鍵詞”包含“文化館/美術館/博物館/檔案館/文化遺產”為檢索條件進行精確檢索,累計檢索到相關文獻589篇(檢索日期:2018年11月22日)。
經統計,國內公共文化大數據研究文獻主要集中于2012—2018年間。文獻數量總體呈現增長趨勢。2012年至2015年,公共文化大數據研究進入迅速發展期,研究成果逐年增多,頗為豐富。2015年以來,公共文化大數據研究規模較為穩定,但總體來說,與大數據綜合研究或其他專門領域如醫療大數據研究相比,文獻總量相對較少,公共文化大數據研究稍顯滯后。

表1 2012—2018年CNKI收錄“公共文化大數據”相關文獻數量(截止日期:2018-11-22)

圖1 2012—2018年CNKI收錄“公共文化大數據”相關文獻數量(截止日期:2018-11-22)
以圖書館領域大數據研究為例,從來源刊物級別看,發表在核心期刊上的論文只有78篇,占文獻總量(536篇)的14.60%;從被引頻次來看,共有335篇論文被引用,占文獻總量的62.50%,但有85篇論文僅被引用1次。論文總數不多、核心期刊論文較少、被引頻次普遍較低,這說明國內的相關研究進展緩慢,缺乏權威性研究成果。
筆者對上述619篇學術論文進行數據清理,即剔重、剔除無關文獻,兼顧論文質量與被引率進行篩選后,得到相關研究論文61篇。本研究以這些論文作為樣本,對其研究主題、研究特點、研究不足等方面分析如下。
國內研究者關注的公共文化大數據研究主題主要包括基本概念研究、功能研究、應用案例研究、發展困境研究、發展規劃研究、技術研究等六個方面。
1.2.1 公共文化大數據基本概念研究
公共文化大數據基本概念分析是指圍繞“公共文化大數據”這一概念的內涵、來源、分類、特征、邊界等展開的分析研究工作。大部分研究者都認同公共文化大數據是圖書館、博物館等公共文化服務機構進行服務所需要及產生的大規模數據。李廣建等梳理了公共文化大數據的四個層次,即核心數據(如資源數據、用戶人口統計學數據、用戶行為數據)、業務輔助數據(如主題表、解說詞)、管理數據(如工作人員數據、財務數據)、支撐數據(如政策法規),并指出文化大數據除了大數據的“4V”共性特點外,還具有數據分布不均衡、數據應用效果測評難等特點[1]68。嵇婷等則提供了區分公共文化大數據的更多維度,如按不同服務系統區分可分為圖書館大數據、博物館大數據、美術館大數據等,按信息類型區分可分為資源數據、用戶數據、運行服務數據和用戶行為數據,按來源可分為業務數據、網絡管理數據等[2]。而劉煒等強調了公共文化大數據內容和邊界變化的可能性,比如我國新聞出版及廣播電視領域的部分服務也具有公共性,企業或民間主導的部分文化服務也具有公共性。因而不宜對公共文化大數據進行經緯分明的條塊分割[3]。
1.2.2 公共文化大數據功能研究
公共文化大數據功能研究是當前研究重點之一。對公共文化大數據進行專業化的分析挖掘,并利用分析結果實現某一功能,如洞察大眾需求、開展精準服務、優化資源配置、拓寬服務渠道、提升服務效能、優化政務模式、完善決策體系等,最終都是為了更精確、更高效地提供更好的公共文化服務。現有文獻或從宏觀理論層面,或從微觀實踐層面,或從公共文化服務的整個體系,或從某一服務機構或平臺,對公共文化大數據的功能進行了多層次的探討。如汪征認為公共文化大數據在公共文化行業監管方面可以發揮巨大作用:主管機關可以通過大數據對公共文化場館進行績效評估,可以根據數據實現精準化采購與供給,可以利用實時大數據分析提高決策科學化水平[4]。
文化大數據功能研究熱點之一是利用大數據進行精準服務,形成需求導向機制。一方面,精準服務可以理解為為用戶量身提供個性化、智慧化服務,智能檢索、個性化推薦、智慧服務都是圖書館進行精準服務的形式。如張鵬指出公共圖書館應實現區域內讀者信息庫共建共享,通過分析大數據針對讀者需求進行精準定位、精準服務、精準管理、精準保障[5]。另一方面,精準服務也可理解為以市場意識為基礎,將精準營銷的理念引入公共文化服務中。如圖書館界和博物館界的研究者都探討了利用大數據來開發和推廣文創產品的策略[6]。實現精準服務的前提是用戶畫像分析,即對用戶人口屬性、行為特征、興趣特征、環境屬性進行分析。李廣建提出應研究公共文化服務用戶各項特征抽取的準則與技術,以及不同機構之間用戶畫像模型的共享和互嵌的方法[1]70。
1.2.3 公共文化大數據應用案例研究
研究現有的文化大數據應用案例,可以為下一步的實踐工作提供有效借鑒。當前國外公共文化服務機構已經在大數據應用方面進行了深入探索,數字圖書館、數字文化館和數字博物館都是利用大數據和互聯網提供智慧服務的案例,如德國數字圖書館以及大英博物館、盧浮宮的虛擬博物館服務。更多的應用實踐以數據為導向布局需求洞察、資源配置、服務供給等服務鏈各個環節,大數據同時被視作服務工具和管理依據。如美國丹佛公共圖書館通過大數據項目“服務遞送”(Service Delivery)綜合利用了圖書館數據、本地數據和國家統計數據(包括美國人口普查局統計數據、美國環境系統研究所人口預測數據、不動產交易數據、美國郵政快遞數據等),在資源采購、規劃制定、服務提供和人才培養等方面都實現了數據驅動決策[7]。
張春景等從國內外公共文化服務應用大數據的案例出發,總結了當前大數據應用的三大模式:數據驅動型、云平臺驅動型、整體驅動型[8]。2016年正式上線運營的“文化上海云”匯聚上海市各區文化館、圖書館、美術館、文化活動中心等機構的公共文化服務資源,包含活動預約、場館預訂、競賽互動、藝術鑒賞、藝術培訓等多項功能,解決了公共文化服務“活動知曉率低、活動參與率低、場館設施利用率低”的通病,也使資金投入更加有的放矢。這就是依靠平臺優勢發揮各機構綜合優勢的云平臺模式,是公共文化大數據融合服務的范例。此外,公共文化大數據還可和其他領域的公共大數據融合應用發揮合力,推動公共服務創新。如2011年法國啟動的“開放數據近端移動”項目,公眾可以通過移動終端獲取和使用文化活動、交通信息、旅游信息和環境質量等公共數據,便于實時制定出行計劃[7]12。
1.2.4 公共文化大數據發展困境研究
當前發展公共文化大數據在數據采集、存儲管理、開放共享、挖掘利用等方面都面臨著困難與挑戰。這些困難與挑戰主要源自三個層面。首先,文化大數據本身的特點帶來的挑戰:一則數據結構復雜[9]。文化大數據中有大量的半結構化或結構化數據,如全文本、空間、靜態圖像、動畫、視頻、音頻、音樂等,大部分數據都缺乏索引,這給數據的存儲與運算帶來了困難。二則價值密度較低[10]。文化大數據要經過處理和分析才能創造價值,其價值密度的高低與數據總量的大小成反比。鑒于文化大數據規模之龐大、更新速度之快,因而其價值密度較低。
其次,文化大數據的負面影響缺乏制度制約,從而引發了一定風險。一則存在數據盲點。數字鴻溝導致弱勢群體的聲音更為微弱,數據不均衡將加劇公共文化服務供給不均衡[11]82。二則存在信息安全風險。文化大數據開放后,個人隱私泄露和濫用的潛在風險加劇,國家的商業利益與公共安全也會面臨挑戰[12]。
最后,當前公共文化服務機構還沒有完全進入數據化建設和服務階段,限制了文化大數據發展。一是存在信息孤島現象[11]81。公共文化服務各領域信息共享基礎設施及技術滯后,缺乏統一的數據建設標準,缺乏數據開放共享意識,沒有形成跨部門數據互聯互通。二是專業大數據人才匱乏,公共文化服務人員的數據分析應用能力不足[13]。
1.2.5 公共文化大數據發展規劃研究
一方面,大數據的應用已經對公共文化服務產生了巨大的推動作用,公共文化大數據的價值和功能受到廣泛認可;另一方面,善用大數據的互聯網內容付費產業欣欣向榮,與傳統公共文化服務機構形成競爭關系。如果公共文化服務機構不重視大數據發展,其未來的發展空間將會受到擠壓。因此,促進文化大數據健康、有序、安全發展,利用公共文化大數據完善和創新公共文化服務,是當前面臨的重要課題。
針對文化大數據發展面臨的問題以及潛藏的風險和挑戰,劉煒、張春景、曹磊等多位研究者都提出了對策建議。第一,加強頂層設計,設立專門的發展領導小組,構建總體發展框架,完善相關標準和規范,從法律和政策層面保障數據安全和知識產權。第二,推進全面開放共享,拓寬大數據來源,打破行業和機構的條塊分割,構建文化大數據融合服務平臺,推進文化大數據傳播共享。第三,鼓勵社會力量參與共建,轉變政府主導公共文化服務的模式,引導社會力量進入公共文化領域,建立國際合作機制。第四,打造數據驅動的公共文化服務鏈,強化大數據思維,以大數據引領服務創新,公共文化服務供給向以用戶為中心轉變。第五,加快應用示范,開展創新政策試點,總結數據開放共享的“負面清單”,定期開展調研,編寫應用案例報告,借鑒先進經驗。
1.2.6 公共文化大數據技術研究
公共文化領域的海量數據只有在經過采集、標準化處理、存儲、分析挖掘等重要環節之后,才能實現數據向價值的轉變。大數據技術發展至關重要,它包括數據收集、數據存取、基礎架構、數據處理、統計分析、數據挖掘、模型預測、結果呈現。溫浩宇等針對數字圖書館在大數據背景下異構數據的集成問題,提出了基于NoSQL的中間件模型的數據集成方法,該方法便于存儲各種結構的數據,同時能很好地適應海量數據分布式存儲[14]。劉大維認為云計算技術已經成為圖書館等眾多機構進行數據管理的主流應用技術。云存儲和內網存儲并行是當前保障數據安全的兩種可用模式[15]。劉健從上海博物館的數據中心項目入手,介紹了數據挖掘技術的應用情況。上海博物館采用HDFS、MapReduce、Hive等中間件構建了完善的大數據系統,通過對定位系統、APP、環境傳感(物聯網)、互聯網的數據進行清洗、融合和轉換處理,形成了HDFS的數據集,以此為基礎實現對觀眾反饋、停留時間、關注內容、社交行為進行綜合分析[16]。要實現各領域文化大數據的開放共享、互聯互通,關鍵是建立一套技術標準規范體系和協議標準。當前文化大數據技術標準研究尚處于起步階段,吳素舫、柯平的研究填補了我國在該領域的研究空白。兩位研究者依據我國現有與標準化工作相關的法律法規、與文化大數據發展相關的政策、國外大數據標準規范以及我國公共文化行業發展規律,構建了多層次的文化大數據標準規范體系框架,包括基礎標準、技術標準、管理標準、應用與服務標準[17]。
1.3.1 研究特點
國內公共文化大數據研究呈現如下特點:
第一,研究對象從機構大數據向行業大數據轉變。早期的研究條塊分割明顯,研究對象都是圖書館大數據、博物館大數據、檔案館大數據等機構大數據。自2015年國務院明確提出文化大數據的概念以來,出現了以整個公共文化服務體系的大數據為研究對象的論文和課題,表明公共文化大數據共建共享、融合發展的理念受到重視。
第二,研究視角從聚焦技術到關注人本主義。公共文化服務領域早期的大數據研究,會較多地參考技術領域的研究成果,被引頻次較高的論文不少來自計算機技術期刊。隨著研究的深入,研究者認識到,技術至上可能加劇數字鴻溝、數據不平等、服務不均等,不能只讓技術來定義公共文化服務的游戲規則,人本主義才能引導大數據發展相對平等地實現公民基本文化權利和滿足公民基本文化需求。
第三,研究成果向實際應用轉化速度較快。基于現有研究對文化大數據可以優化政務模式、輔助績效管理的分析,2017年“成都市公共文化服務大數據績效管理平臺”上線,該績效管理平臺包含基礎設施、文化活動、政策保障、經費保障、人員保障等五大數據指標,并分為市級總覽及縣、鄉、村三級分別呈現,充分體現了大數據績效考核的客觀性、公正性和可視化、可量化特點。
第四,圖書館界是文化大數據研究的領軍力量。在公共文化服務體系內部,從時間來看,圖書館大數據的研究成果發布最早;從公共文化服務領域來看,圖書館領域的大數據研究最為豐富;從研究者所在機構來看,圖書館界的研究者最關心大數據發展。其中2012年發表的《大數據時代的圖書館服務淺析》(被引213次)、《大數據帶給圖書館的影響與挑戰》(被引279次)、《圖書館需要怎樣的“大數據”》(被引214次),是將大數據引入圖書館領域、公共文化服務領域的開創性文章。
1.3.2 研究不足
雖然當前公共文化大數據研究已有一批價值較高的成果,但還存在若干不足之處:
第一,現有成果集中于理論分析,缺乏實證研究和定量分析。多數研究成果在理論層面對文化大數據的功能或價值進行了闡述,但缺少案例和數據的支撐。少數幾篇論及應用案例的論文僅對案例做簡單介紹,缺乏基于真實數據的分析論述。
第二,現有成果同質化現象突出,研究水平參差不齊。部分研究者對大數據的含義、特征、帶來的機遇與挑戰等基礎理論基本沿襲前人觀點,文字和觀點都較為雷同,重復研究不利于文化大數據研究的創新發展。
第三,介紹國外經驗時缺乏國內適應性探討。現有文獻在介紹國外先進實踐經驗時,沒有對國內政策環境、發展現狀等進行系統的調研分析,因此缺乏國外樣本移植國內的適應性問題探討,發展建議缺乏可操作性。
第四,若干關鍵領域的研究進展緩慢。從核心期刊論文較少、被引頻次普遍較低的情況看,國內的相關研究進展緩慢,權威性研究成果匱乏。在文化大數據標準化建設、文化大數據版權保護、文化大數據處理流程與方法、文化大數據人才培養制度等方面缺少系統、深入的研究和實操性強的成果。
現有研究存在欠缺主要有三個方面原因:首先,相較于醫療衛生、食品安全、智慧交通等具有大數據基礎的領域,公共文化大數據的發展和應用工作尚處于起步階段,學術研究缺乏深厚的現實基礎;其次,公共文化大數據研究難度較大、頭緒較多、問題較復雜;再次,我國公共文化機構研究力量較為分散,尚未形成具有創新精神的研究團隊。
為從整體上把握國外研究狀況,筆者以Web of Science數據庫、ProQuest綜合學術期刊庫為基礎進行檢索。由于歐美等國的公共文化產品供給模式與中國的政府主導模式不同,如美國、德國等國采用市場主導模式,政府依賴各類文化團體來管理和提供文化服務,而英國、澳大利亞等采用“一臂之距”模式,政府借助民間文化團體來管理和提供文化服務,再加上中英文表達方式的差異,因此歐美等國沒有“公共文化服務(Public Cultural Services)”的概念,更沒有“公共文化大數據(Big Data of Public Culture)”的概念。因此筆者將“big data” + “cultural sector/ items/ goods/services”“big data” + “library/ museum/ cultural heritage/archive/ gallery”作為關鍵詞在Web of Science數據庫進行篇名檢索,文獻類型為會議論文、期刊論文,檢索結果共計114篇;同時,在ProQuest綜合學術期刊庫中檢索“摘要”包含上述關鍵詞的文獻,檢索結果為240篇(檢索日期:2018年11月22日)。
本研究對上述檢索結果進行篩選,選定研究論文34篇,同時結合近年國外發布的相關重要報告作為研究樣本,以求窺見國外文化大數據研究概貌。
主要歐美國家的公共文化供給模式不同于中國的政府主導模式,更倚重市場的作用,公共文化服務和文化市場、文化產業之間并沒有涇渭分明的區分,不存在我國所謂的公共文化服務體系。因此歐美等國的研究者要么以整個文化行業的大數據發展與應用為研究對象,要么以圖書館、博物館、美術館等機構為邊界進行大數據發展與應用研究,而沒有我國所謂的公共文化大數據研究。研究主題主要包括發展理論研究、技術研究、安全保障研究、應用案例研究。
2.2.1 文化大數據發展理論研究
(1)主要功能。Kostas Arvanitis等學者分析了文化機構利用大數據實現的三大功能:第一,文化機構借助現代技術收集、分析和利用大數據,以加深對現有用戶和潛在用戶的了解,實現精準營銷和精準募捐;第二,文化機構的決策者和資助者利用大數據分析結果評估投入產出率,作為循證決策的證據;第三,文化機構采用個性化的分析策略,重點關注在線用戶的行為、偏好、使用的文化資源,培養機構內的大數據文化,即利用大數據分析結果來進行產品評估、自我評價、循證決策等重要活動的理念和機制[18]。
(2)發展前景。2014年,安永國際咨詢團隊提出了關于發展和利用文化大數據的幾個基本事實:第一,共享文化大數據不會消耗其價值,反而會增加其價值,因為文化大數據可以幫助創新產品和服務,吸引新用戶;第二,開放和利用文化大數據不會威脅個人隱私,因為分析一定數量的匿名數據比單獨的個人數據更容易產生價值;第三,不同文化機構的數據開放共享共融是創造價值的關鍵;第四,文化領域是大數據開放共享障礙較小而大有作為的領域;第五,文化大數據獲得良性發展必須滿足幾個先決條件:設定明確的目標、引進人才和技術、讓所有參與者從數據開放中獲益、提升對開放數據的信心[19]。
(3)發展困境。歐美等國公共文化領域的大數據發展遠不如文化企業,主要原因在于三方面:第一,多數文化服務機構擁有的數據量規模較小,離大數據規模還有差距;第二,多數文化機構缺乏擅長分析數據的專家,也缺乏利用大數據的整體策略規劃;第三,非政府主導的公共文化供給模式中,公共財政對公共文化服務的支持力度有限,缺乏必要的資金[18]。
(4)發展階段。英國專家Anthony Lilley和Paul Moore教授提出了文化機構大數據發展的三個階段:數據1.0階段,只收集核心運營數據(如門票銷售數據),以最簡單的方式應用于市場和營銷,幾乎沒有大數據驅動的業務決策。數據2.0階段,文化機構注重收集在線數據(如網站訪問量),但沒有將其和1.0階段收集的數據進行整合,在日常運營中極少依賴大數據決策。數據3.0階段,文化機構以客戶為中心對所有數據進行整合。基于大數據的影響力評估模式取代傳統的活動和產量評估模式,數據驅動決策成為業務管理的核心手段。目前多數公共文化機構的大數據發展還處于前兩個階段,但3.0階段是未來發展趨勢[20]。
2.2.2 文化大數據技術研究
國外學者對大數據的發展技術討論相對全面,同樣適用于公共文化領域,研究熱點主要包括云計算分析技術、Map Reduce & Hadoop分析技術、可視化分析技術,在此不贅述。近年來,傳統的數據分析技術研究更加細化,演變為粒度更小的語義分析和帶有時代色彩的大數據分析。Robert Stein和Bruce Wyman介紹了幾個能夠生成可操作數據用于決策的工具,可以輕松復制到不同的博物館應用程序中。如Chart.io可以設計來自不同數據源的圖表和圖形,生成每周和每月報告,支持對每個報告的自定義SQL查詢,并提供項目數據實時接口。Tableau是可視化和商業智能桌面應用程序,可以離線和在線處理與展示大型數據集,具有開箱即用的報告功能。達拉斯藝術博物館用Tableau連接各種不同的數據源,以探索數據中可能存在的模式和關系。一些開源Python項目和模塊可以進行更復雜和定制化的數據分析:IPython Notebook是IPython的瀏覽器外殼,允許就地編寫腳本并對數據進行內聯可視化;Pandas是一個支持數據分析,統計和數據建模的Python模塊;NumPy是用于科學計算的標準Python模塊,特別適用于數學陣列操作和統計;Matplotlib是一個用于Python的二維繪圖庫,可以生成出版品質的圖像,并可以通過Web瀏覽器在IPython Notebook中顯示[21]。
2.2.3 文化大數據安全保障研究
數據在自由流動中才能創造最大的價值,但數據收集和數據使用都有數據安全風險。Waqar Ahmed等指出大數據挖掘應用中可能對個人隱私造成的侵害以及如何尋找價值開發和隱私保護的平衡點一直是圖書館大數據研究的熱點[22]。Affonso等調查發現,在用戶沒有察覺的情況下被采集的個人數據比用戶自行提供的要多得多,大多數國家的數字圖書館都沒有提供隱私指導,因而建議圖書館通過透明的隱私政策告知用戶這一隱患[23]。Doyle認為“隱私已死”,即使聚合數據和匿名數據也會泄露個人隱私,通過大數據分析對個人行為和生活方式進行預測終究會損害個人的利益。當前被認為最有效的隱私保護手段,即個人信息的模糊化處理和數據資產化都注定會失敗[24]。Inoue通過圖書館的案例說明了日本等國對隱私的理解,并探討了如何立法保護公共文化機構中用戶的個人隱私[25]。普林斯頓大學的阿爾文德希望可以對大數據服務的營銷手段實施逆向管控,完成服務機構的隱私侵犯與歧視行為的“普查”工作。數據審核與跟蹤技術也是保護數據安全的重要方法[26]。
2.2.4 文化大數據應用案例研究
歐美國家的文化大數據應用處于領先地位。在美國、英國、德國、法國等國,涌現了各種形式的文化大數據應用案例。
(1)文化資源數據開放共享。紐約大都會藝術博物館2017年實施“開放獲取”計劃,推出“大都會集合”的應用程序編程接口,任何第三方都能夠將該集合可持續地整合到其網站中,以確保用戶可以獲取最新的圖像和數據信息。該開放獲取項目使“大都會集合”中所有的“知識共享零”(CC0)數據和超過20.5萬CC0對象中的40.6萬張圖像可供人們無限使用[27]。
(2)文化大數據融合服務平臺。公共文化信息資源的聚合和整合、構建文化大數據融合服務平臺是解決公共文化資源分散、資源利用率低和信息孤島問題的重要解決方式。谷歌藝術計劃(Google Art Project)是谷歌與歐洲各地的博物館進行合作、創建在線博物館平臺的案例。參與此計劃的博物館超過150家,其中包括泰特美術館、烏菲齊畫廊博物館、梵高博物館等歐洲最負盛名的博物館。谷歌利用街景技術拍攝博物館內部實景,并且以超高解析像拍攝館內歷史名畫,用戶可以在參與此計劃的博物館中訪問所有在線館藏資源[28]。
(3)社交媒體數據拓寬文化大數據。Andrei L.Badin認為,文化服務機構可通過在Facebook,YouTube,Instagram,Twitter等社交媒體開設賬號,收集用戶偏好數據,吸引全球消費者。如英國倫敦的泰特現代藝術館利用社交媒體和博客創建了一個數字社區,通過這個社區與潛在用戶頻繁互動,一方面吸引了更多用戶訪問和使用其資源,另一方面更了解用戶需求和偏好,從而設計出更加貼近大眾需求的展覽形式。此外,還吸引了公眾捐助其修復館藏和維持運營[29]。
(4)文化大數據助力精準服務和市場營銷。法國阿維尼翁文化論壇在2013年發布的研究報告《大數據大文化——數據不斷增長的力量及其對文化經濟的展望》認為大數據應用改變了文化產業的運營模式。旅游和智慧城市是綜合利用公共大數據提供文化服務最合適的兩個領域。前者如迪士尼樂園為游客準備的“魔法手環”,可以收集游客在園區產生的所有數據,以滿足游客個性化的需求體驗,并使園區的服務更符合游客的消費習慣和偏好;后者如卡耐基大學發起的“民生計劃”(Livehoods Project),通過研究某城市居民在社交網絡上的活動來分析這個城市的社會活躍程度和社會結構。其中,結合文化活動密度、文化場館的客流數據與城市公共健康數據,可用于預防文化場館的疾病傳播等[30]。
和國內公共文化大數據研究相比,歐美國家的相關研究呈現以下特點:
第一,研究團隊多元化。國內研究者主要來自公共文化服務機構、高校、科研機構。在歐美國家,除了上述研究力量之外,在資金、技術、人才方面都頗具實力的商業咨詢機構也發揮了重要作用。如位列四大會計師事務所的安永和普華永道的咨詢團隊分別對文化大數據進行了深入研究,形成了初具規模的研究成果。
第二,研究成果多元化。總體來說,國內研究成果雖然在水平上有所差別,但在重要問題上的聲音比較一致。國外研究者在研究同一問題時會產生截然不同的結論。如在信息安全問題上,安永團隊認為,開放和利用文化大數據不會威脅個人隱私,因為分析一定數量的匿名數據比單獨的個人數據更容易產生價值;而Doyle認為聚合數據和匿名數據也會泄露個人隱私,大數據時代“隱私已死”。
第三,注重案例實證研究。歐美等國歷來有實證研究的傳統。以證據為依托、有數據、可以驗證和重復驗證是其研究成果的重要特征。如在論證“對用戶數量、結構特征、興趣愛好、消費習慣等數據進行收集,可以為精準營銷提供依據”時,研究者會展現具體機構收集數據、分析數據的流程與方法,并提供完整的運營數據作為論據,而不是依靠理論來證明事先設定的命題,陷入無限自我論證的過程。
第四,文化(創意)產業大數據研究是熱點。在歐美國家,雖然圖書館、博物館、美術館的大數據發展較為緩慢,但大數據應用已經對文化(創意)產業產生了巨大的推動作用,改變了文化(創意)產業的運營模式和文化消費形態,文化經濟越來越倚重以數據為導向的決策,這些應用實踐和創新經驗為研究工作提供了豐富的現實樣本,是當下的研究熱點,也值得我國研究者和從業者關注學習。
基于對國內外現有研究主題的梳理和分析,以及當前公共文化大數據發展和應用現狀,我國公共文化服務機構應當跨界合作、協同攻關,從以下五個方面加強并拓展公共文化大數據研究。
文化大數據的開放共享需求是其最為重要的特征。研究文化大數據整合體系構建方法;研究標注、關聯、匹配文化大數據的技術規范和標準;研究文化大數據權限分級制度;研究文化大數據云存儲和云服務模式;研究完善公共文化大數據資源的運營機制;制定文化大數據開放獲取政策;探索離岸文化大數據服務模式。
大數據技術是推動文化大數據實施的基礎,我國應加大對文化大數據重點領域關鍵技術自主研發的扶持力度,研究文化大數據核心技術構成,鼓勵文化大數據核心關鍵技術研發,推進文化大數據科學和工程的核心方法及技術研究。調研文化大數據理論基礎研究現狀、目前存在的困難,提供實驗環境,保證實驗設備的配置,推動先進文化大數據技術應用的政策研究。
我國政府應大力推進相關法規制度建設,以保障文化大數據的穩定流轉和正常使用,明確在文化大數據發展中的角色和作用。研究文化大數據生產制度,規范文化大數據的生產流程和安全要求;探索文化大數據創新生產模式,完善文化大數據安全保障政策,制定文化大數據安全等級劃分標準;研究文化大數據長期保存的保障機制,建設文化大數據備份方案;研究文化大數據的版權溯源機制。
文化大數據的建設需要專門研究機構與技術人才的支撐:研究文化大數據人才體系的構建,建立文化大數據人才儲備庫;研究如何建立中外大數據領域人才合作長效機制,引進大數據高端人才。
融合是新時代大數據發展的最大特征和價值所在。文化大數據和其他公共大數據融合發展,必能創造更大的價值。研究融合發展政務、醫療、文化、旅游、交通各公共領域的大數據的技術手段和保障機制,使得數據融合更為全面,信息服務更加智慧。
(來稿時間:2019年1月)