張弛
[摘 要] 構建因應工業4.0的精準出版,既需要大數據技術支持,也需要大數據哲學視域。精準出版所表現的“量身定做”和“私人定制”是基于數字人類學和文化組學的“量子人性”概念,大數據“一切皆可量化”的價值功能通過數據挖掘與量化分析進行用戶畫像,使精準出版進入“圖書基因組計劃”的文化基因量化分析層面。精準出版對讀者用戶群中“可能讀者”或“潛在讀者”的關注和開發是基于大數據“第四范式”的“一切皆可預測”的價值功能,依據大數據分析為讀者推薦產品,使出版能為讀者用戶提供更加貼身的個性化服務。精準出版所依據的全媒體閱讀方式是基于語義分析意義上的“超文本”原理,全媒體的移動化、社交化、互動式、網絡化的趨勢給精準出版創造了個性化、定制化的機遇。
[關鍵詞]精準出版 大數據 大數據哲學
[中圖分類號] G237[文獻標識碼] A[文章編號] 1009-5853 (2019) 03-0091-06
[Abstract] In response to industry 4.0, lean publishing demands big data technology support as well as big data philosophy field of vision. The private ordering of the lean publishing is based on digital anthropology and culture comics. Every thing can be measured in big data, which can create lean publishing personas by data mining and quantitative analysis. Thus, the lean publishing is at the level of quantitative analyse of Book Genome Projects culture comics.The lean publishing can recommend products to potential readers according to personas based on big data analysis,which can guide the ordering. The readers can get more comfortable personalized service. The Omani media reading realizes that the lean publishing does semantic analysis by hyper-text. Hence,the lean publishing expects the trend to the mobilization,socialization,interaction and networking.
[Key words] Lean publishing Big data Big data philosophy
目前,對于中國出版業來說,因應工業4.0和大數據潮流盡快構建基于大數據的滿足用戶個性化需求的精準出版服務新業態已是大勢所趨。所謂精準出版是粗放出版的對稱,是指針對不同讀者對象量身定制精確營銷的出版模式。作為出版業發展的新業態和新模式,基于大數據的精準出版既是一種技術應用,也是一種思想方法和哲學方法。只有充分理解精準出版的哲學思想方法,才能高屋建瓴地加快推進精準出版新業態建設。精準出版的大數據哲學向度主要有以下幾個方面:在主體論意義上“量化人性”的“數字人類學”和“文化組學”;在科學認識論意義上“一切皆可預測”的“第四范式”;在語義分析意義上“一切可連接”的“超文本”和非結構性數據分析。
1 基于“數字人類學”和“文化組學”的精準出版
英國當代數學家及人類學家托馬斯·克倫普(Thomas Crump)在《數字人類學》一書中指出:“數字的本質是人,數據挖掘就是在分析人類族群自身”;處于一定時間、地點條件下的人類族群活動是一個動態系統,“所有特定的聚居人群的經濟、社會和政治都是一些動態系統”。而數字人類學就是關于“這種系統是如何運作的假設”。從這個意義上說,“人人都是建模者(modeller)”[1]。按照托馬斯·克倫普的觀點,數字本質上是人的行為和客觀世界運動的記錄,是人類行為和客觀世界的數字符號化或者定量化。只是在小數據時代,人類行為數字化只限于處理具有嚴格邏輯性的結構化數據,難以量化處理雜亂無章瞬息萬變的人的情感和心理行為數據,而大數據改變了人類掌控數據的能力,大數據MapReduce和Hadoop等非關系數據分析技術,使人們分析處理海量的雜亂無章的非結構性數據的能力發生了質的飛躍。大數據“一切皆可量化”的功能和價值使“量化人性”成為現實。被稱為大數據預測專家的埃里克·西格爾(Eric Seagal )因此提出了“量子人性”概念[2]。他認為,在大數據時代,人們對人性的認識已經由傳統定性分析的經驗層面進入到精準量化分析的量子層面。
基于“數字人類學”的精準出版不僅是一種業態模式,更是一個洞悉分析人性的邏輯過程。離開人來討論精準出版,其結論肯定缺乏精準性。精準出版是一個全程出版概念,既包括出版選題策劃環節的“量身定做”和“私人訂制”,也包括出版印制環節的“按需印刷”,還包括銷售環節的“精準營銷”和“精準服務”。云南出版集團曾開展為期一年的“精準出版年”活動,提出 “十個精準”:定位精準、導向精準、策劃精準、作者精準、讀者精準、編輯精準、校稿精準、印刷精準、發行精準、效益精準”[3]。在這十個精準中,最重要的是讀者精準,其他的精準都是圍繞讀者精準展開的,而讀者精準是基于大數據的用戶畫像。“用戶畫像是用戶數據的標簽化,是真實用戶的虛擬代表,是建立在一系列數據之上的目標用戶模型”[4]。用戶畫像要求洞悉讀者行為軌跡和讀者心智,通過數據挖掘實現讀者數據標簽化。由此可見,實現精準出版必須對讀者進行用戶畫像,讀者用戶畫像必須運用大數據進行數據挖掘,數據挖掘的背后一定要還原為人,這就是“數字人類學”之于精準出版的哲學意義所在。
“數字人類學”強調“數據挖掘就是在分析人類族群自身”,而“文化組學”(cultureomics)可以說是“分析人類族群自身”的具體體現。
“文化組學” [5]從產生開始就與圖書出版存在著天然聯系,其創始人艾略茲·利波曼·埃頓(Erez Liebeman Aiden)在2007年3月訪問谷歌研究部主任彼特·諾維格(Peter Norvig)時,其初始目的是能進入谷歌圖書系統以獲得一些數據,而谷歌圖書正雄心勃勃地試圖掃描人類出版的每一本書的每一頁。通過與谷歌合作,對1000多萬種圖書進行數據挖掘,埃頓發現幾個世紀以來,文字或單詞在出版物上的增長和減少,反映了人類文化的演變。2010年,埃頓與其助手米歇爾聯合設計出“n-grams”軟件,并由谷歌推出。這種研究方法用類似基因組分析的方法研究圖書數據庫,他們將這種方法稱為“文化組學”。“通過對世界各類書籍的數據挖掘,艾略茲·利波曼·埃頓正嘗試實現絕大多數的人文研究的自動化”[6]。可見,“文化組學”是將文字或單詞等關鍵詞作為文化基因,利用大數據挖掘整理出隨時間推移文化如何發生改變的量化指標。例如,通過數據挖掘發現,在19世紀,技術進步平均需要66年才能被主流文化所接受容納,而在1880年至1920年間,這一過程只需要27年。
“文化組學”通過數據挖掘和量化分析來揭示人類心理行為和文化發展趨勢,這是在原有的純邏輯模式下難以實現的。一直以來,閱讀作為一種文化體驗,個人讀書時的心境狀態和思考過程具有很強的個體性,這種私密性是外人無從體會的。在全媒體時代,出版商和作者不僅可以通過信息互動掌握出版物的銷售額,而且可以一窺讀者的閱讀強度。交互創作出版公司交互創作出版公司的聯合創始人麗莎·盧瑟福(Lisa Rutherford)堅信“書籍應該可以是互動的”這一觀念。她和亞馬遜“Kindle互動型內容開發者計劃”合作,在交互創作出版公司出版的網絡版電子書中允許讀者自己設計人物角色和情節線索,經數據分析,讓作家調整故事以迎合大眾口味”。 “文化組學”在圖書出版中的具體運用案例是蘋果公司收購書燈(Booklamp)的“圖書基因組計劃”(Book Genome Project)[7]。該計劃根據不同讀者閱讀興趣和購書記錄的大數據分析,對每個讀者進行“智能分組”,對每個讀者進行基于“圖書基因組計劃”的“量身定做”和“私人定制”。“圖書基因組計劃”根據不同人群的文化屬性進行用戶畫像和智能分組,具有鮮明的“文化組學”基因。
“文化組學”和“圖書基因組計劃”都聚焦人的文化屬性,把洞悉人性放在中心位置,正如圖靈獎獲得者理查德·衛斯里·漢明(Richard Wesley Hamming)所說,計算的目的不在于數據,而在于洞察人和事物。同樣,“出版的目的也不在于‘出版,因為更為廣闊的利益回饋是通過出版衍生更多的關系和交流”[8]。互聯網巨頭之一的騰訊一直把洞悉人性作為關注焦點,從關注廣告,到關注人與人脈,關注人群背后的數據與需求,并通過騰訊強大的用戶平臺、關系鏈及營銷工具,為生產提供高效的社會化營銷解決方案。圍繞人脈這一核心要素,在大數據時代,騰訊社會化營銷平臺提供打通的用戶產品、數據庫的營銷工具;而騰訊MIND 3.0則通過對用戶行為數據的洞察、分析和挖掘,深描每一個用戶族群,通過差異化標簽在品牌和受眾之間建立社會化的營銷關聯[9]。對于出版業來說,“通過精確的數據分析、方便快捷的個性化服務,去鎖定用戶、增強忠誠感,對于學術出版、專業出版,尤其賦予意義”[10]。因此,精準出版不是傳統的經驗式的抽樣調查分析,而是建立在“數字人類學”和“文化組學”基礎上的量化分析和人性洞悉。
2 基于“第四范式”的精準出版
“范式”一詞最早出現在科學哲學家托馬斯·庫恩(Thomas Kuhn)的《科學革命的結構》一書中,哲學意義上的范式通常是指關于科學研究的一系列基本觀念和實踐規范。這些基本觀念和規范包括3方面內容:“(1)共同的基本理論、觀點和方法;(2)共同的信念;(3)某種自然觀(包括形而上學假定)。”[11]由此可見,范式涉及哲學本體論、認識論和方法論問題。作為本體論的范式回答研究對象的本質為何以及其真實性何在的問題;作為認識論的范式回答認識者與被認識者的相互關系問題;作為方法論的范式回答認識者如何獲得知識及研究方法的理論體系問題。庫恩認為:“常規科學即解難題(puzzle)”[12];研究范式對科學家共同體起規范的作用,規范他們共同的思想觀念和研究方法,科學共同體的任務是在范式的規范下開展研究,進而推動科學發展。
“第四范式”是已故圖靈獎得主吉姆·格雷提出的,2007年1月他在《科學方法的一次革命》中提出:“用于這種數據密集型科學的技術和方法是如此迥然不同,所以,從計算科學中把數據密集型科學區分出來作為一個新的、科學探索的第四種范式頗有價值。”[13]吉姆·格雷之所以將大數據密集型范式作為獨立的第四范式與實驗型第一范式、理論型第二范式、計算型第三范式區別開來,是因為以前三種范式的共同特點是研究需要模型和假設,而第四范式處理PB級以上大數據的能力使人們能做到沒有模型和假設也可以分析處理數據。中國工程院倪光南院士指出,科學研究的實踐型范式、理論型范式、計算型范式都是在已知規律的情況下發現新的規律,而大數據“則是在未知規律的情況下,運用計算機能力從大數據中發現規律并發揮規律的作用”[14]。能夠基于“未知”來探求“未知”進而發現規律,這是大數據第四范式的方法論革命,其意義在于從“未知”中發現問題和規律,進而精準預測。而公認的大數據的核心價值就是精準預測。埃里克·西格爾指出:“有若干因素將會推動預測技術的不斷發展:爆炸式的數據增長、功能更加強大的計算機、更加廣泛深入的理解以及科學的發展。組織與個人之間越來越多的交互行為將受到預測的驅動。”[15]
基于大數據的精準預測導致兩個重要的認識論轉變:第一,從小數據時代的經驗式預測到大數據時代的精準性預測轉變。在小數據時代,因為缺乏海量的、全面的、準確的數據作為支撐。人們對事物發展趨勢的認識往往是以經驗為基礎的,日常表現為“大概”性的猜測。胡適曾將這種習慣“大概”的中國人稱為“差不多先生”[16]。顯然,“大概”“差不多”是與小數據時代相聯系的。在大數據時代,海量、實時、準確的數據收集及其挖掘技術轉變了人類認識事物的路徑,即涂子沛在他的著作《大數據》提到的“將計算機運用于數據,而不是數據用于計算”。大數據挖掘中“Hadoop處理數據是以數據為中心,而不是傳統的以程序為中心”[17]。因此,“大數據的洪流也在改變著人們對數據及其作用的認識”。“數據不再僅僅是科學研究的結果,而且變成科學研究的活的基礎和工具”[18]。大數據的實時性、整體性、高效性、相關性成為精準預測的主要科學基礎。第二,社會科學認識方式從“非科學”到“科學”的轉變。在小數據時代,量化人性和定量人的行為是困難的,而大數據時代賦予“定量人性”以現實可行性。“無尺度網絡”概念的提出者艾伯特·拉斯洛·巴拉巴西(Albert-LászlóBarabási)指出,“人類行為93%是可以預測的”,“人類大部分行為都受制于規律、模型以及原理法則,而且它們的可重現性和可預測性與自然科學不相上下”[19]。巴拉巴西由此提出人類社會發展呈現冪律式周期爆發運動。雅虎的首席科學家沃茨(Watts)更進一步指出,由于大數據出現,社會科學將脫下“準科學”的外衣,真正走進科學的殿堂[20]。從哲學意義上講,大數據第四范式從“未知”發現“未知”的認知方式改變了傳統哲學關于“可能與現實”的關系,大數據的核心價值在于發現潛在價值和防范潛在風險,大數據 “一切皆可預測”的功能和價值大大提高了人類行為的前瞻性和防范風險的能力。
從精準出版的意義上講,“一切皆可預測”和“可能與現實”關系的改變要求我們改變關注點,即從關注“現實讀者用戶”轉變為同時要關注“可能讀者用戶”或“潛在讀者用戶”,過去我們通常強調“讀者是上帝”,但關注的只是存在著現實買賣關系的“讀者”,而不關注對“潛在讀者用戶”的挖掘。主要原因是缺乏對讀者用戶數據的挖掘。在出版領域,將可能的“潛在用戶”挖掘、發展成“現實用戶”的常見措施是基于智能分組的出版物推薦系統,讀者用戶只要在淘寶、京東、拼多多、當當和亞馬遜有過購買出版物或者瀏覽過出版物的記錄,都會同時伴隨出現相關出版物的推薦。運用這種推薦系統的成功案例是2013年推出新版《紙牌屋》的奈飛公司(Netflix),它改變了過去單純依靠算法來優化推薦系統的傳統模式,而是通過模擬人的大腦活動建構更接近人的個性化需要的智能化出版物推薦系統。埃里克·西格爾指出:“Netflix是預測分析應用的先行者,它租借出去的70%的影碟都通過預測分析在網絡得到推薦。推薦對于零售業來說越來越重要。這不僅僅是商家單方面的銷售指數,如果能精準地為客戶推薦產品,那也是為消費者提供的貼身化和個性化服務。”[21]滿足讀者用戶個性化需要的精準出版本質上也是智能出版,而智能出版是大數據時代的必然產物。從人類精神生產和智能活動的進步來看,數據是信息的基礎,信息是知識的基礎,知識是智能的基礎。人類的智力活動,就是將數據轉化為信息,將信息轉化為知識,將知識轉化為智能的邏輯過程。
3 基于“超文本”的精準出版
“超文本”一詞最早由美國學者特德·納爾遜(Ted Nelsom)在1965年提出,雖然在他之前,范尼瓦·布什(Vannevar Bush)在1930年代就提出了存儲擴充器(memory extender,Memex)的想法,他設想了文本的一種非線性結構,但第一次正式使用“超文本”一詞的是特德·納爾遜。“超文本”既是一種超鏈接的,將不同空間和不同格式的信息數據組織起來的網狀文本,更是一種用戶界面范式。網狀非線性是其結構特點,多通道并行傳輸是其傳播特點。
從哲學意義上研究“超文本”的主要是羅蘭·巴特(Roland Barthes)和德里達(Derrida)等解構主義語言學家,他們從語義分析角度出發,指出語言表達過程中言語所表達的意義既不是線性的,也不是單一的,其原因在于語言中能指與所指之間的對應關系會受到“第三者”的干擾,或者由于語境變化而產生意義分裂,能指會滑向另一層所指,所指也會滑向另一層能指。語言的意義由此會從原來的線性單一結構演變成非線性的、復雜的、無邊的網狀結構。羅蘭·巴特在《S/Z》一書中指出:當讀者閱讀文本時,意識中“理性的邏輯方式與象征的邏輯扭作一團。這象征的邏輯不是演繹的,而是聯合的:它與另外的觀念、另外的意象、另外的意指作用具體之文聯合起來我們被告知唯一的文本不存在”[22]。羅蘭·巴將對文本閱讀的設計只是“理想文本”。但其“理想文本”概念一直被視為超文本的理論基礎。而真正意義上“超文本”是直到計算機和網絡普及,特別是大數據、云計算、新一代人工智能蓬勃發展起來以后才得以實現的。在泛互聯和大數據條件下,讀者的閱讀已經由以往單一的文本閱讀擴展為文字、圖片、音頻、視頻等多媒體甚至全媒體交互式閱讀,閱讀介質也由以往的平面媒介擴展為立體媒介閱讀,以至于“媒介不再是訊息,它是訊息本身”[23]。
從哲學方法論意義上說,基于大數據的“超文本”改變了科學主義的決定論觀點。科學主義認為只有自然界是決定論的,只有自然現象是遵循必然規律并可以預測的;而人類社會是非決定論的,是雜亂無章,無規律可循的。顯然,這種決定論觀點是與小數據時代相聯系的。在小數據時代,人們的社會活動錯綜復雜,人的社會活動數據變動不居,千頭萬緒;特別是個人情感數據、人群社會交往數據等,大都是非結構性數據,既難以收集,更難以分析整理。正如中國工程院院士李國杰所說:“人們日常生活中所產生和獲取的數據85%以上是非結構化和半結構化數據,傳統的關系數據庫無法勝任這些數據的處理,因為關系數據庫系統的出發點是追求高度的數據一致性和容錯性。”[24]在大數據條件下,以Hadoop和MapRduce為代表的非關系數據分析技術,使人類獲得了處理非結構性數據的強大能力。通過社交網絡服務(SNS)獲取人們的網聊記錄,通過在線支付獲得人們的消費記錄,通過LBS獲得地理位置信息,通過視頻監控、電子郵件獲取人們的言談舉止數據。這些“超文本”數據大大擴展了對人的認知范圍和認知深度。出版作為符號信息的社會化工作,“隨著符號的精細化、準確化、形象化,同時也伴隨著人類精神的自我認知與發展,人類精神活動得以在其中直觀展開”[25]。
從精準出版的意義上講,“超文本”對傳統出版有兩個重要改變:一是“超文本”的網絡全媒體結構改變了人們傳統的、單一的、線性閱讀方式,交互式、體驗式閱讀大大提高了人的閱讀參與性和閱讀興趣。由于全媒體閱讀的發展,中國三大電信運營商都投入巨資進入圖書閱讀市場,中國移動推出“和閱讀”,中國電信推出“天翼閱讀”,中國聯通則推出“沃·讀者”。還有一些網絡文學運營商不斷拓展閱讀體驗新空間,如塔讀文學推出“富媒體互動閱讀計劃”,其網上運營的“閱space”客戶端,圍繞互動閱讀提供圖文并茂、音頻視頻交互、頁面多樣套用的閱讀內容。時代出版傳媒推出“時光流影TimeFace”閱讀社交化計劃,“QQ閱讀”把閱讀和社交結合起來,其精彩內容可以在朋友圈鏈接、傳遞、分享。這種閱讀方式移動化、社交化、互動式、網絡化的趨勢是“超文本”帶給出版精準化、個性化、定制化的機遇。二是“超文本”的網絡無邊、即時特性改變了傳統單一的學習方式,在線學習大大提高了人們學習的便捷性和選擇性。中央電視臺曾以“慕課來了”作過專題報道,“慕課”作為一種基于互聯網和大數據的教學模式,其“線上+線下”的資源整合模式比傳統單一線下教學更有優勢。“慕課”的迅猛發展使得課程教材出版也出現了“紙質版教材+光電網絡教材”的價值構造。美國高等教育在線學習公司Sipx副總裁海瑟·魯蘭·斯特圖斯(Heather Rez Stratus)指出,“ 慕課對于出版產業拓展出版空間具有重要價值。‘慕課需要內容,學術出版商應該抓住這一機會為‘慕課提供內容,從而拓展新的市場”[26]。從體量上說,慕課是面向億萬人的超大課堂;從個人需求來說,慕課又是私人定制、按需組合的精準課堂。可以說,“慕課”既拓展了傳統的課堂學習方式,也拓展了傳統的線下出版方式。
當然,“超文本”不僅僅只是改變了傳統的出版格式和格局,更重要的是改變了出版傳播的理念和思考方式。事實上,基于羅蘭·巴特的“理想文本”理念和計算機網絡技術的發展,全球出版業在幾十年前就已經開始從紙媒體時代向多媒體時代的轉型。中國很多出版機構不僅擁有紙質出版物的出版權,還擁有電子音像和網絡出版物的出版權,在出版傳統紙質圖書基礎上,不少出版機構還推出電子版、手機版、網絡版以及應用程序(App)等多種媒體出版物。但是,幾十年過去后,多媒體出版的效果并不盡如人意。分析其原因主要有兩個。
第一,只轉變媒體方式而沒有轉變出版理念。很多出版機構還是沿用老式的出版理念來運營新媒體,像搬家一樣將老的、紙質的內容拷貝到新媒體上,而并不在意這些內容的簡單搬家式移植是否符合讀者用戶的個性化需要,這種用老思維嫁接新技術的做法本質上是沒有理解新媒體的價值和意義。其實,新媒體之新,不僅僅表現在技術上和形式上將文字、圖表、音頻、視頻等多種格式的文本集于一身,更重要的是它從傳播學意義上消解了傳播者和接受者主客二分的二元身份,使傳播者能變成接受者,使接受者能變成傳播者。同時,新媒體特別是網絡媒體的應用還改變了傳統傳播的時空特性。而在線閱讀、移動閱讀打破了以往傳播時間和傳播空間的局限性,使閱讀成為可以實時、實地進行的個性化選擇。顯然,新媒體突破了傳統媒體的主客二分和時空局限性,具有個性化、互動性、精準性、及時性、移動性、開放性、海量性、低成本等特點,而其中精準傳播和互動傳播是新媒體最本質的特征。美國《在線》(OnLine)雜志在對新媒體進行定義時指出:“新媒體是所有人對所有人的傳播。從這個意義上說,傳播受眾不再是單純的、被動的信息接受者,受眾同時也是轉播主體。”美國學者J·A·巴倫(J.A.Barron)在20世紀60年代提出的受眾參與理論在互聯網、移動互聯時代日益變成日常傳播實踐。正因為如此,新聞傳播學界有人提出以“用戶”概念替代“受眾”概念[27]。
第二,缺乏大數據思維,不注重讀者用戶的數據收集、數據挖掘和數據利用,只是把新媒體當做簡單的傳播工具。目前,很多紙媒出版的App都不注意分析用戶行為數據,很少有運用“用戶網絡行為畫像”的成功運作案例。用戶畫像是一種能將定性與定量方法很好地結合在一起的載體,定性的方法通過對用戶的生活情境、使用場景、用戶心智進行分析,對用戶的性質和特征做出抽象與概括;定量的方法可以對特征做精細的統計分析與計算,獲得對于用戶較為精準的認識,便于在數值排序的基礎上實現核心用戶的發掘與突出[28]。但遺憾的是,出版行業目前在運用“用戶畫像”實現精準出版方面還沒有真正起步。最突出的表現是,移動用戶的閱讀高峰一般出現在晚上十點至凌晨一點這一時間段,這一時間段很多出版媒體的App反而不再更新內容,因為體制原因,這一高峰段傳統媒體員工都下班了。媒體既然面對的是讀者和用戶,就要知己知彼,讀懂用戶的消費需求。為了精準了解用戶行為,美國創業公司海馬(Hiptype)推出一套專門的電子閱讀分析工具,既能統計讀者的試讀次數和購買次數,還能統計讀者的年齡、職業、性別、收入、居住地址及閱讀愛好,并通過對數據分析繪制“讀者圖譜”。當今的社會化閱讀,早已將大眾傳播的內容移植到人際交往平臺上,社交平臺產生的大量“超文本”非結構性數據,一般都是通過音頻、視頻、網絡日志、圖片、聊天記錄等非邏輯形式表現出來的。過去由于缺乏大數據技術,這些非結構性數據大都被當做“數據垃圾”和“數據廢氣”舍棄。在大數據時代,處理“黑暗數據”和“數據廢氣”已不是太大的技術難題,出版行業要真正建立基于讀者用戶個性化需要的精準出版新業態,亟需進行出版理念和思維方式的革命。
注 釋
[1] [美]托馬斯·克倫普.數字人類學[M].北京:中央編譯出版社,2007:110-111
[2] [15] [21][美]埃里克·西格爾(Eric Siegel)著;周昕譯.大數據預測[M].北京:中信出版社,2014:259,235,149
[3] 孫海悅.云南出版集團開展“精準出版年”活動[N].中國新聞出版廣電報,2016-03-29
[4] 曾鴻,吳蘇倪.基于微博的大數據用戶畫像與精準營銷[J]現代經濟信息,2016(16):306-308
[5] [美]艾略茲,利波曼,埃頓.數字化圖書的定量文化分析[J].科學,2011(1):176-182
[6]楊鑫倢.終有一天,大數據會“顛覆”出版業[N].IT時報,2013-08-16
[7]愛德華·諾沃特卡.極具創意的圖書基因組計劃[EB/OL].[2018-06-11].http://www.bookdao.com/article/27706/.htm
[8] 白志如.國內眾籌出版項目的內容分析與發展建議[J].出版科學,2014(5):74
[9] 麻震敏.大數據時代:營銷智慧的進化論[J].成功營銷,2012(7):82-83
[10]蔡 翔.傳統出版融合發展 :進程、規律、模式與路徑[J].出版科學,2019(2):10
[11] 鄧仲華,李志芳.科學研究范式的演化:大數據時代的科學研究第四范式[J].情報資料工作,2013(4):19-23
[12]T.S.庫恩著;李寶恒,紀樹立譯.科學革命的結構[M].上海:上海科學出版社,1980:29
[13]Tony Hey Stewart Tansley Kristin Tolle著;潘教峰,張曉林譯.第四范式:數據密集型科學發現[M].北京:科學出版社,2012:11
[14]黃曉艷,單曉釗.關于大數據:訪中國工程院院士倪光南[J].高科技與產業化,2013(5):40-45
[16]涂子沛.大數據[M].桂林:廣西師范大學出版社,2013:329
[17]陳明.數據密集型科研第四范式[J].計算機教育,2013(9):103-106
[18]梁娜,曾燕.推進數據密集科學發現提升科技創新能力:新模式、新方法、新挑戰:《第四范式:數據密集型科學發現》譯著出版[J].中國科學院院刊,2013(1):115-121
[19][美]艾伯特·拉斯洛·巴拉巴西著;馬慧譯.爆發:大數據時代預見未來的新思維[M].北京:中國人民大學出版社出版,2012:Ⅲ
[20]D.J.Watts.“A twenty-first century science”[J].Nature,2007,volune445:489
[22][法]羅蘭·巴特著;屠友祥譯. S/Z[M].上海:人民出版社,2000:136
[23][美]尼葛洛龐帝著;胡泳,范海燕譯.數字化生存[M].海口:海南出版社,1996:68
[24]李國杰.大數據研究的科學價值[J].中國計算機學會通訊,2012(9):10
[25]侯亞丁.媒介產業的價值生態[J].出版科學,2015(1):53
[26]孫牧. 大數據推動學術出版革新[N]. 中國出版傳媒商報,2013-10-08
[27]曹疆.從內容為王到用戶至上[N],中國產經新聞報,2013-04-14
[28]牛溫佳,劉吉強,石川,等.用戶網絡行為畫像:大數據中的用戶網絡行為畫像分析與內容推薦應用[M].北京:電子工業出版社,2016:3
(收稿日期: 2019-04-04)