陳超,吳亞東,付朝帥,童興,李攀,褚琦凱,王雪楠
1. 四川輕化工大學計算機科學與工程學院,四川 自貢 643000;2. 四川省大數據可視化分析技術工程實驗室,四川 宜賓 644000;3. 四川輕化工大學自動化與信息工程學院,四川 自貢 643000
中國白酒文化因其悠久的歷史、豐富的內涵,在世界文化之林中獨領風騷。其與詩詞歌賦、文學典籍、書法繪畫、散文戲曲以及影視音樂等藝術形式相輔相成[1],對中國歷史文化、文學藝術、繪畫藝術、宗教文化、民風民俗、科學技術、社會心理、軍事研究等各個領域產生了巨大的影響,已經滲透到社會生活的各個方面。然而,中國白酒文化數據具有數據源廣泛、多元化、復雜度高等特點,將可視化技術應用到中國白酒文化中,對于傳播和弘揚中國白酒文化的豐富內涵、增強文化自信、促進國際文化交流具有重要作用。利用可視化技術的直觀、易于理解、分析和交互等特性,可有效地支撐和推動中國白酒文化的表達、研究和傳播。采用先進的數據可視化技術提高中國白酒文化的影響力、服務中國白酒文化建設成為一項重要課題。
自20世紀60年代以來,在計算機媒介的支撐下,人文知識的獲取、分析、集成和展示方式都在發生重大變化。海量的圖書、報紙、期刊、照片、繪本、樂曲、視頻等資料被數字化,并上傳到互聯網供大眾獲取和使用,隨之出現了許多優秀的歷史信息化項目,例如中國歷代人物傳記數據庫(CBDB)提取、整理了與近百萬名歷史人物相關的時空事件和關系信息。面對這種日益強化的數字化現狀,2016年IEEE VIS會議將數字人文和可視化兩個領域的專家聚在一起進行研討,打破了傳統文理學科與技術之間的壁壘,為可視化技術在數字人文領域的應用開辟了新的思路。數字人文為中國白酒文化可視化研究提供了強有力的數據支撐,數字人文和可視化技術的交叉融合為中國白酒文化可視化的發展奠定了重要的基礎。
面向公眾的中國白酒文化可視化應用主要采用可視化技術將與白酒文化相關的詩詞歌賦、古籍文本、古跡文物及戲曲書畫等晦澀枯燥的數據以直觀生動的方式呈現出來,并借助交互技術吸引公眾主動探索白酒文化,從而實現白酒文化的傳播與傳承。比如,酒具酒器可視化能幫助受眾了解古今煮酒器、盛酒器、飲酒器、貯酒器的具體類型,制作材質從陶器、青銅器、漆器到瓷器的歷史變遷過程,以及酒具酒器作為重要禮器所承載的禮儀文化。酒詩、酒詞可視化能幫助受眾了解中國白酒對詩詞文化創作的影響,從詠誦古人詩詞作品到探知古人“酒中賦詩、詩中有酒”的詩酒生活,進而感知古人創作詩詞的情感。酒禮、酒俗可視化從民風民俗的角度展現歷朝歷代不同地區民族的農事節令、婚喪嫁娶、慶功祭奠、奉迎賓客等民俗活動中白酒的中心地位。酒令可視化從娛樂的角度全方位地展現勸酒行為的文明化和藝術化,打破公眾對劃拳行令的單一認知,舉凡世間事物、人物、花木、蟲禽、曲牌、詩文、中藥以及種種風俗、節令,無不入令。
面向領域專家的中國白酒文化可視化應用借助可視化技術對專業領域知識進行分析,輔助決策。比如,可視分析技術可以幫助中國白酒文化研究專家系統地梳理中國白酒文化的研究現狀、研究主題變遷、研究熱點和研究方向,并在此基礎上,分析、預測未來的發展趨勢等。白酒文化可視化可以幫助領域專家分析中國白酒文化發展的歷史脈絡,建立白酒文化發展的知識譜系。中外白酒文化對比分析能幫助行業專家分析中西方的白酒文化差異,提升中國白酒的國際影響力。
中國白酒文化可視化流程可以分為4個層次:白酒文化數據采集層、白酒文化數據處理和分析層、白酒文化數據資源匯聚層、白酒文化可視化應用與交互層,如圖1所示。

圖1 中國白酒文化數據可視化流程
(1)白酒文化數據采集層
白酒文化數據具有碎片化、信息覆蓋范圍廣等特點,因此,白酒文化數據主要從詩詞歌賦、古籍文獻、戲曲書畫和古跡文物等信息源獲取。獲取的數據大多是多媒體數據,少有結構化數據,其中文本數據是最主要的數據類型,此外還有音頻、圖片、視頻等文件數據。
(2)白酒文化數據處理和分析層
由于采集到的數據碎片化嚴重,需要先經過數據清洗等預處理,再進入信息分析提取階段。基于自然語言處理算法(如長短期記憶(long short-term memory,LSTM)網絡和卷積神經網絡(convolutional neural network,CNN)等)實現文本信息分類和文本信息自動化提取[2-3],最終提取出關鍵信息,如時間、地點、人物、事件等。涉及古籍文本數據的,還需要借助古籍文本語料庫進行文本挖掘[4-5]。
(3)白酒文化數據資源匯聚層
根據數據類型的不同,數據資源匯聚層可實現多種數據存儲方式。結構化數據以文件的形式存儲,如JSON、CSV、XML等,也可以以表結構的形式存儲在結構化數據庫中,如MySQL、Oracle等;非結構化數據可存儲在非結構化數據庫中,如MongoDB等,若信息量巨大,還需要采用大數據分布式存儲技術,如Hadoop分布式文件系統(Hadoop distributed file system,HDFS)等。
(4)白酒文化可視化應用與交互層
通過可視化技術將白酒文化數據映射到圖像空間,比如,采用文本數據可視化、多維數據可視化、時空數據可視化以及網絡數據可視化等相關技術,為用戶提供直觀、可交互的圖形化界面。
文化數據可視化技術很早就有應用,如Charles Minard將拿破侖1812年侵俄戰爭的行軍圖用流式地圖的形式繪制出來,該圖涵蓋了地點、行軍路線、人數、重大事件、溫度等多個維度的信息[6]。2010年,北得克薩斯大學和斯坦福大學聯合開發了由美國國家基金資助的數字人文可視化項目Mapping Texts[7],針對北得克薩斯大學圖書館數字化的約232 500頁歷史報紙進行文本挖掘,將其與地理空間分析結合起來進行可視化呈現。
中國的文化數據可視化應用尚在起步階段,直接將可視化技術應用到中國白酒文化領域的研究更加稀少。隨著近年來可視化技術在國內的推廣普及,在一些文化領域有不少可視化研究成果涌現。
中國白酒文化與詩詞歌賦、文學典籍、書法繪畫和散文戲曲等文學作品密切融合。中國詩酒文化之濫觴的《詩經》中共提到“酒”62次(39篇),體現了人際心靈溝通和審美等多個精神層面的融合[8]。《水滸傳》中出現飲酒場面647次,《三國演義》中出現飲酒場面319次,《西游記》中出現飲酒場面103次,《紅樓夢》中出現飲酒場面152次[9]。“酒”在《白居易全集》中共出現840次,《杜甫全集》中出現204次,《李白全集》中出現250次,《韓愈全集》中出現138次,《柳宗元全集》中出現65次,《蘇東坡全集》中出現1 151次。《唐詩三百首》中涉及酒的詩有46首;《宋詞三百首》中與酒相關的詞有126篇;《全元散曲》中近三分之二的篇章涉及“酒”,其中“酒”出現了1 121次,“醉”出現了936次,“飲”出現了211次,“杯”出現了259次,“樽”出現了192次[10]。此外,酒與書法、繪畫、戲曲等文學作品更是相輔相成。
隨著大量文學作品的完全數字化以及人工智能處理技術的發展,大批學者開始采用先進的可視分析技術對文學作品進行全新解析。2014年,張建立等人[11]在解析古詩詞文本空間信息的基礎上,基于地理信息系統(geographic information system,GIS)進行了空間可視化分析。2015年,閻思瑤等人[12]首次嘗試將自然語言處理、計算數學和計算機動畫等相關研究成果結合,用來解決古典詩詞的動畫自動生成問題。2016年,李欣哲[13]運用可視化技術將《詩經》中抽象的情感內容轉換為可感知的形式,探索了在數字媒介環境下傳播優秀傳統文化經典的新途徑。2017年,李舒迪[14]以可視化的形式展現了《紅樓夢》詩詞活動中的時序分布、人物關系、地理路線、詩詞活動組織形式,該研究是文本可視化技術在中國古典文學上應用的新嘗試。2018年,胡華華[15]通過可視化技術對宋詞風格和詞人流派演變歷程進行了呈現,有助于人們從宏觀層面對宋詞風格流派演變進行認知和理解。2019年,張瑋等人[16]提出了一套基于文本關聯與時空可視分析的方法,通過對宋詞文本的音律情感可視化與文本意象進行關聯分析,讓文學研究者可以從多個維度了解宋詞文本的特性。2019年,吳瀟等人[17]利用文本挖掘技術對近400首描寫關中(現陜西省中部)風貌的唐代詩詞進行篩選梳理,對人文景觀情感特征、景觀空間分布特征和空間語義網絡特征展開多維信息可視分析。2020年,侯文軍等人[18]設計并完成了包含京劇劇本列表、京劇劇本概覽圖、京劇劇本指紋圖和京劇劇本情節圖4個可視化模塊在內的京劇劇本可視化系統,幫助對京劇了解程度不同的人更好地了解京劇劇本,有益于京劇文化的傳播。
顯而易見,文學作品分析與可視化在數字化后經歷了3個階段的探索:簡單的統計分析階段(如詞頻統計)、可視化階段(信息提取后直接可視化呈現,如空間信息可視化、文本信息可視化)、可視分析階段(文本挖掘后進行可視分析,如情感分析可視化、關聯信息可視分析等)。
中國文明進化史與白酒文化的發展密不可分,在河南省賈湖遺址發現的9 000年以前的釀酒痕跡是最好的證據[19]。國內與白酒文化相關的考古遺存非常豐富,這些遺跡和遺物種類多樣,從不同角度反映了當時人們的釀酒、飲酒等生活細節,為后人研究釀酒技術、酒禮、酒俗、經濟、藝術等提供了寶貴資料。
目前與白酒文化相關的考古遺址及歷史文物可視化研究還未起步,但是在考古領域,可視化技術并未缺席。覃京燕[20]提出了運用信息思維方法指導數字化文化遺產項目的整體策劃,基于信息可視化模型和信息可視化設計原則,進行數字化文化遺產中信息管理、信息呈現和信息傳播的設計。Jang M H[21]采用三維可視化技術為韓國延三河流域的歷史文化遺產繪制了情感地圖。Han J G等人[22]利用增強現實技術對文化遺產地、建筑文化遺產和歷史遺跡修復數字內容的開發進行了研究,建立了戶外文化遺址三維模型可視化系統。Gupta N等人[23]提出的適合考古數據的地理可視化以及地理可視化分析工具能很好地解決考古現象的復雜性和多樣性。Gómez J M N等人[24]使用全景球面攝影和地面激光掃描技術,建立了卡塞雷斯省歷史和文化遺產的交互式三維可視化系統。Wang B S等人[25]采用虛擬現實技術建立了二維地圖和三維城市模型,以及可視化敘事平臺,以提升公眾的文化遺產保護意識。張加萬團隊借助圖像分析、機器學習與攝影測量學等技術,建立了一套“本體監測-關聯分析-實驗室研究-反向控制”的預防性保護風險管理預控系統,實現了敦煌壁畫病害的可視分析。
考古遺址及歷史文物領域的可視化研究主要集中在采用三維建模還原考古遺址和文物、運用虛擬現實技術和增強現實技術實現交互性方面。對文物情感可視分析以及基于圖像分析技術的文物病害的可視分析等新興領域的研究有待進一步深入。
歷史變遷與歷史人物之間是相互依存的關系,人類在歷史長河中不斷地書寫著歷史。從微觀視角審視歷史,能看到一個個歷史人物的人生歷程,其中不少歷史人物飲酒后留下了文學佳作或傳奇故事,他們本身也成為白酒文化的一部分;從宏觀視角審視歷史,可以看得到文化中心、城鎮中心的變遷以及文化流派的演變過程。
在宏觀的歷史變遷可視分析方面,國內外學者進行了初步探索[16,26-32]。Schich M等人[26]使用大規模可視化技術追溯了歐洲和北美2 000多年來的文化敘事,描繪了歷史名人的遷徙模式及文化中心的歷史趨勢。Cho I等人[27]開發的VAiRoma系統對羅馬歷史中的重大事件、時間、地點等信息進行了可視分析。胡華華[15]采用散點圖從宋詞詞人的分期迭代和詞人所屬的流派分類兩個角度呈現宋詞詞人流派的歷史演變進程,呈現詞人流派群體隨著歷史推進而出現盛衰漲落的變化軌跡。
國內學者更加關注微觀視角的歷史人物可視分析。吳旻家等人[28]從地理空間分析的角度對李白的漫游軌跡以及詩歌中的地理空間進行了研究,從而分析李白的行為空間與詩歌空間。劉菊等人[29]建立了古琴名人時空信息采集系統,動態展示古琴名人的二維軌跡與三維軌跡,并結合古琴知識圖譜,實現古琴名人相關信息的智能化查詢。鄒亞國等人[30]提出了首都距、家鄉距、遷徙指數、前臺指數、軌跡透視圖等人生軌跡分析指標,并結合核密度、標準差橢圓等空間分析方法,對歷史名人的人生軌跡進行探索性分析。張瑋等人[16]參照基于詞典的情感分析算法,設計了詞人人生起伏視圖,并與詞作數量相關聯,分析了詞人一生的跌宕起伏。王妮滿等人[31]基于WebGIS進行了地圖敘事性的可視化嘗試,探索了歷史人物軌跡數據由文本格式到地圖空間可視化的方法,對歷史名人的行為軌跡、社交關系進行空間化和可視化。黃娟等人[32]基于異構名人文化數據,構建了名人文化數字化框架,著重解決名人文化數據的組織與可視化問題。
在歷史變遷可視分析方面,國外學者大多聚焦在龐大、多維度的歷史數據宏觀分析,國內學者更多側重研究小數據集的、單一領域的數據分析。歷史人物可視分析是國內學者較關注的領域,目前多數研究成果集中在基于時空可視化技術的人物行跡可視化方面,但是也有不少深入的探索分析,如人物軌跡與作品風格的關系[28]、人物社交網絡的關系[32]、人物人生起伏與作品數量的關系[16]等。
目前可視化技術在中國白酒文化領域的研究尚在起步階段,研究成果主要集中在知識圖譜可視化領域。陳于后[33]對四川酒文化研究的現狀、研究主題的變遷、研究熱點、研究方向和研究趨勢等方面進行了探討,并采用可視化方法構建了知識圖譜。蔣玉石等人[34]繪制了白酒企業經濟研究學者、研究機構和研究主題的知識圖譜,使用數據可視化的方法還原了近15年來中國白酒企業經濟研究的發展歷程。與白酒文化密切相關的文化數據可視化技術研究較為全面,從技術角度可以劃分為四大類:文本數據可視化、網絡數據可視化、時空數據可視化、多維數據可視化。
文本數據可視化綜合了文本分析、數據挖掘、數據可視化、計算機圖形學、人機交互、認知科學等學科的理論和方法,將文本中復雜的或者難以通過文字表達的內容和規律以視覺符號的形式表達出來,同時向人們提供與視覺信息進行快速交互的功能,使人們能夠利用視覺感知的并行化處理能力,快速獲取文本信息中蘊含的主題、結構或情感態度等方面的關鍵信息[35]。
(1)基于詞頻的文本可視化
詞頻是一種進行情報檢索和文本挖掘的常用加權技術,用于評估一個詞在一個文件或者一個語料庫中的一個領域文件集中的重復程度。統計文本中的詞頻能直觀地體現其重要性,從而展現文本特征。目前基于詞頻的文本可視化技術主要集中在詞云及其變種等方面。參考文獻[32]采用經典詞云圖展示了民國時期關鍵名人的熱度,如圖2(a)所示;參考文獻[36]采用聚類詞云圖展現了世界五百強企業,通過企業所在國家進行聚類,體現五百強企業的分布情況,如圖2(b)所示;參考文獻[16]通過改進的區域詞云視圖,展現了詞人在不同時期的作品詞頻,如圖2(c)所示;參考文獻[37]通過氣泡圖展現某一朝代姓氏的占比排行情況,氣泡越大表示該姓氏的占比越大,如圖2(d)所示。
(2)基于詞義的文本可視化
基于詞頻的可視化無法表現文檔關鍵詞語義之間的聯系,基于語義的文本可視化主要關注文本的內在語法結構和語義關系。目前經典的基于詞義的文本可視化技術主要有語義網(phrase net)[38]、語義樹(word tree)[39]和DocuBurst[40]等。Van Ham F等人[38]分析 了簡·奧斯汀的小說《傲慢與偏見》中“X and Y”結構,并構造了語義網。Wattenberg M等人[39]為馬丁·路德·金的歷史性演講“I have a dream”構建了語義樹。Collins C等人[40]的研究中采用DocuBurst的形式來顯示文本內容的結構,并通過徑向布局體現了詞的語義等級。
(3)多信息文本數據可視化
文本數據視化在文化領域的應用不僅是對關鍵詞及其語義關系的信息提取,更重要的是對文本中包含的情感、意圖等不同維度的信息的處理。許多文本數據可視化方法[13,16,18]通過對文本中多維信息的處理來形成聯合數據可視化。目前多信息文本數據可視化的呈現方式主要有桑基圖、多圖關聯以及信息疊加等多種形式。如參考文獻[13]通過關鍵詞提取、情感識別的文本分析結果,直觀反映《詩經》的主題、情感分布情況,如圖3(a)所示。參考文獻[16]用顏色代表情緒,用折線代表字音節的語調值,展示宋詞的情感音律,構造情感音律視圖,再通過關系圖將情感音律視圖與語言運用視圖關聯起來,如圖3(b)所示。參考文獻[18]采用京劇劇本指紋圖對京劇劇本的文本結構進行輔助標識,通過方形像素塊的顏色代表的句長及白線代表的方差值標識出念白、唱詞等,以便快速定位到文本片段,如圖3(c)所示。

圖2 詞云圖

圖3 多信息文本數據可視化
通過抽取出與白酒文化相關的詩詞文本,筆者將文本數據可視化方法應用于白酒文化可視化,通過統計不同作者的酒詩、酒詞中的詞頻,使用隨機詞云圖實現白酒詩詞文本可視化,如圖4(a)所示;并通過機器學習的分類算法對詩、詞體裁進行分類,以桑基圖呈現詩詞作者、派別及體裁之間的聯系,如圖4(b)所示。

圖4 白酒文化之詩詞文本數據可視化
網絡數據可視化指在有限空間中對具有海量節點和邊的大規模網絡進行可視化。網絡數據關系是文化可視化中常見的數據類型,如事物之間的關聯、人物之間的社交網絡等,常用樹形圖、圓形樹圖、力導向圖和關系圖等方式呈現。網絡數據可視化中的每個節點代表一個對象,節點間的連線代表對象之間的關聯關系。如參考文獻[13]通過樹形圖由內而外的層次關聯屬性,形象、高效地表示出《詩經》的章節、小節、題目、內容等層次化數據的關系,如圖5(a)所示。參考文獻[41]通過樹形圖展現中華烹飪文化知識庫中文本的分布情況和關鍵主題之間的關系,如烹飪知識包含推薦菜譜和食材簡介,飲食文化包含文化故事和美食攻略。參考文獻[14,31-32,42-44]使用力導向圖和關系圖等分析了歷史名人的人際關系網,如圖5(b)所示。

圖5 網絡數據可視化
筆者將網絡數據可視化方法應用于白酒文化可視化,采用力導向圖分析不同作者所作作品的題材分類。力導向圖中第一層節點代表詩或詞,第二層節點代表作者,第三層節點代表題材類型,各節點的大小代表作品數量,可直觀地呈現每位作者的題材偏好,如圖6所示。
(1)地理空間數據可視化
地理空間數據可視化是指運用地圖學、計算機圖形學和圖像處理技術,將地學信息輸入、處理、査詢、分析以及預測的數據及結果采用圖形符號、圖形、圖像,并結合圖表、文字、表格、視頻、音頻等可視化形式顯示,進行交互處理的理論、方法和技術。目前地理空間數據可視化從維度上可以分為二維和三維地理空間維度,從形式上可以分為基于點、基于點線結合、基于區域的地理空間形式。參考文獻[11,28-31]采用不同的核密度分析方法,基于地理信息系統標注了歷 史人物低、中、高軌跡點核密度,實現了對名人活動軌跡的核密度分析及可視化。
參考文獻[16]先采用基于區域的地理空間可視化技術渲染出宋朝時期歷史疆域范圍,再采用基于點的地理空間數據可視化技術展示了宋朝詞人的地理空間分布情況。參考文獻[5,14-15,31,37]采用基于點線結合的地理空間數據可視化技術,實現了歷史人物活動軌跡的可視化。參考文獻[37]采用基于區域的地理空間數據可視化技術及圖層疊加技術,清晰地展示了唐朝、宋朝、元朝、明朝和清朝等不同歷史時期中國疆域的變遷過程。參考文獻[13]的國風情感地圖采用基于區域的地理空間數據可視化技術,詮釋了《詩經》國風篇中不同風格的民間詩歌類別所涉及的疆域范圍,并在此基礎上用區域邊界的顏色表示喜怒哀樂等不同的詩歌情感。
(2)時間序列數據可視化

圖6 白酒文化之詩詞題材分類力導向圖
時間序列數據可視化是針對具有時間屬性的數據集進行的呈現形式,當前主流的呈現形式有 河流圖、散點圖、時間軸等多種樣式。參考文獻[13]的時間情感河流圖采用主題河流圖技術,以君主時期為橫軸時間坐標,呈現《詩經》整個創作周期的情感變化趨勢,如圖7(a)所示。參考文獻[14]中的創作詩詞時序圖采用散點時序圖形式,展現《紅樓夢》詩詞活動中林黛玉等人創作詩詞的先后順序,如圖7(b)所示。
(3)時空立方體可視化

圖7 時間序列可視化
時空立方體可視化是指將地理空間信息和時間序列信息融合在一起,構造的三維立體可視化效果,其可以幫助用戶理解復雜空間信息的時間變化規律,主流的時空展現形式有組圖對比型、二維平面疊加時間軸型以及三維時空立方體等。參考文獻[30]中的人生軌跡點時空格局 圖采用平鋪成組的西漢、唐、北宋、元、明、清6個朝代的二維地圖,分別呈現該朝代歷史名人聚集區域,通過對比方法,直觀呈現了各朝代歷史名人聚集區域的變遷過程,這種可視化方法能展現離散的時間節點上的空間數據。參考文獻[29,45]構建了三維的時空立方體,縱軸為時間序列,橫軸所在平面為地理空間維度,分別刻畫了古琴名人的三維時空運動軌跡和紅軍四渡赤水的時空立方體。
參考文獻[16]將詞人按照地點和時間劃分成幾個人生階段,通過地圖視圖中地點經緯度和時間序列視圖中事件的時間之間的關聯,以二維形式呈現詞人在不同人生階段停留的地區。參考文獻[27]同樣采用二維地理空間視圖疊加時間軸的方式,呈現了羅馬歷史中戰爭時期熱度中心的遷移過程。
筆者將時空數據可視化方法應用于白酒文化可視化,基于歷史名人軌跡數據庫,建立了白酒詩詞作者的人生軌跡時空可視化,在二維地圖上采用點線結合的方式描繪作者的人生軌跡,輔以時間圖例顯示作者不同年齡段的線段顏色,在浮框中以時間軸的方式顯示作者不同時間段的生平介紹,地圖與浮框以聯動方式實現交互,如圖8所示。

圖8 白酒文化之詩人生平軌跡可視化
多維數據可視化指的是同時將具有多個維度屬性的數據變量進行可視化展現,多維數據可視化的呈現形式多樣,根據數據的維度不同,設計方案各不相同,典型的代表有地理空間信息疊加其他信息、時間序列信息關聯多種維度信息,呈現形式有單圖可交互式(一個圖集成多個維度信息,通過交互聚焦某一維度數據)、多維空間立體式(如地理空間疊加情感、時間等),更多的用法是多視圖聯動式(通過不同視圖呈現不同維度的信息,但視圖之間存在關聯)。參考文獻[27]中設計的圓形主題視圖從時間、熱度排行、占比等維度呈現主題的變化過程。參考文獻[46]設計的語義時空立方體采用多視圖聯動的形式同時展示時間序列、地理空間分布和語義變化趨勢。
參考文獻[17]采用三維立體方式,在二維地理信息基礎上疊加縱軸方向的情感分類,呈現了關中地區正面、中性、負面人文景觀情感空間分布,如圖9(a)所示。參考文獻[47]通過基于時間序列的散點圖的設計,分析了史詩《英雄格薩爾》中熱點人物出場的頻率及章節分布情況,其中橫軸代表史詩的章節,縱軸代表人物信息,散點的大小代表人物出場的頻率,將橫軸與縱軸結合起來還能體現同一章節中人物之間的關聯信息,如圖9(b)所示。參考文獻[15]將散點圖和主題河流圖結合起來,散點代表該時期的代表性詞人,主題河流圖中的橫軸是年代,同時標注了重要歷史事件,縱軸代表文學風格流派。多維信息疊加既能呈現某個時間區域內在宋詞詞壇文學風格流派的影響力強弱的對比變化,又能將宋詞風格流派的演變與詞人作者相關聯,體現詞人對流派的影響,如圖9(c)所示。
筆者將多維數據可視化方法應用于白酒文化可視化,基于以酒具酒器為主題的數據庫(包括酒具酒器的類型、用途、材質、朝代以及古籍文獻出處等多個維度的數據),采用桑基圖關聯酒具、酒器的類型與用途、材質和朝代,并采用桑基圖與動畫聯動的交互方式,動態書寫該類酒具酒器的古籍文獻出處,如圖10(a)所示。同時,基于酒具酒器的文物數據和交互數據,采用樹狀圖動態呈現酒類器具名稱與類型之間的關系,如圖10(b)所示。
中國白酒文化大數據具有數據源廣泛、多元化、數據離散型大、數據邊界模糊性強、復雜度高等特點,當前的可視化方法主要集中在數據縮放技術、多視圖聯動技術以及查詢和過濾技術等支持可視化推理與人機交互的重要技術[48]。比如,在時間序列視圖中,數據縮放技術能關注歷史長河中某一朝代甚至某一年代的細節信息;在多維數據可視化視圖中,通常用多視圖聯動技術關聯不同視圖中不同維度的數據,通過交互能夠幫助用戶感知同一條件下不同維度的信息之間的關系和規律;對于中國白酒文化的海量數據,可以通過查詢和過濾技術幫助用戶快速聚焦感興趣的信息。
這些具有交互能力的可視化方法可以幫助用戶關注細節信息和少量維度的關聯信息,但是不利于從宏觀層面將多元、離散的數據進行關聯,進行數據分析和挖掘,更無法解決邊界模糊性和復雜性問題。同時,從文化傳播的需求出發,中國白酒文化的可視化效果需要兼具藝術觀賞性,因此從中國白酒文化數據屬性出發,研究滿足需求的可視分析方法將成為該領域的研究熱點。
可交互的白酒文化可視化應用研發是提高新生代對白酒文化興趣的關鍵。可視分析采用的交互技術應是貼近用戶認知心理的、支持直接操做的、自然的交互技術[49],因此基于觸摸屏、寫字筆甚至手勢感應的自然交互技術也應該被合理地運用到中國白酒文化可視化的應用研究中。

圖9 多維數據可視化

圖10 白酒文化之酒具酒器多維數據可視化
增強現實和虛擬現實都具備較強的交互性,可作為白酒文化可視化的交互手段使用,比如通過增強現實技術構造全仿真的三維酒文化博物館,體驗者足不出戶即可隨意參觀;通過虛擬現實技術虛擬仿真少數民族酒文化場景,融合少數民族服裝、節日、祝酒歌、舞蹈等多維元素,給體驗者沉浸式的文化感受。
中國白酒文化大數據具有多樣性、碎片化等特點,這給數據的預處理和挖掘分析帶來了很大困難。有效地實現文本分類,提升自動化信息提取的準確性,都是近年來學者研究的熱點[2,3,50-51]。文本情感分析、人物關系推理等深入挖掘分析的算法有待進一步探索。此外,古籍文本的文本分析難度遠高于白話文文本分析,構建全面的語料庫并不斷優化分析算法也將成為學者面臨的重大課題。大規模、多維度的歷史數據宏觀分析仍是國內研究的未來熱點,云計算與大數據技術的高速發展為該領域的研究提供了技術支撐。
當前主流的可視化技術的研究主要集中在數字文本數據可視化層面,中國白酒文化數據的多媒體屬性意味著可視化技術需要展示的不僅僅是數字文本數據,還包含更多元的信息,如考古發掘的酒具酒器以圖片方式傳播、民風民俗中存在的祝酒歌以音頻為載體、與白酒文化相關的戲曲以視頻為載體、白酒香型以嗅覺形式感知等。因此,研究多媒體信息的可視化技術也將成為中國白酒文化可視化主要的研究方向之一。
本文從中國白酒文化可視化應用研究的視角出發,分析了中國白酒文化可視化的應用場景,闡述了中國白酒文化可視化的流程,并從文學作品分析與可視化、考古遺址及歷史文物可視化、歷史變遷及歷史人物可視分析3個維度入手,分析了中國白酒文化數據的特點,探討了中國白酒文化可視化應用研究的現有成果與未來方向。通過對相關文獻的可視化技術進行進一步的分類整理,總結了文本數據可視化、網絡數據可視化、時空數據可視化和多維數據可視化4個技術類別分別在文化可視化領域的應用情況,并給出了中國白酒文化可視化未來的研究熱點。當前中國白酒文化可視化的研究尚在起步階段,相信不斷改進的數據分析技術能實現對中國白酒文化更深、更廣的挖掘和分析;通過多媒體可視化技術的研究,能實現多種感知信息的可視化,提升用戶的全方位學習和體驗;采用先進的人機交互技術,能讓公眾對中國白酒文化有更深入的體驗。