楊麗君



摘要:當前對于數據有效的處理和分析研究逐漸受到重視,而數據可視化又是數據分析中一項最重要的方法。對此,基于圖形語法的優勢提出一種新的數據可視化方法設計,通過對數據的轉換及圖形標記、圖形可視化編碼以及標度及坐標系變換,實現對數據可視化的轉換。通過對比實驗驗證,該方法與傳統數據分析方法相比具有更高的交互率,可以為數據分析提供更加快速的可視化幫助。
關鍵詞:圖形語法;數據;可視化;交互性
中圖分類號:TP311.5 文獻標識碼:A
文章編號:1009-3044(2020)13-0277-02
數據可視化是一種借助于人類眼睛的快速視覺感知以及人類大腦的智能認知能力的技術,利用數據可視化技術可以有效地傳遞、交流清晰的數據。目前已經存在的數據挖掘方法和數據統計分析,對于海量、復雜的數據進行處理往往是對數據的簡化,只會造成數據的傳遞出現偏差。而數據可視化則是對數據中所有的結構及細節進行還原,提高數據處理的精度。圖形語法是可以讓用戶通過結構簡單的語法搭建出眾多不同類型的數據可視化圖像或表格,并且在圖形語法當中還包含了眾多用于統計和分析的工具,支持坐標系的構建,讓使用者可以自主的構建需要的圖像或表格。
1基于圖形語法的數據可視化方法設計
本文設計的基于圖形語法的數據可視化方法是以數據到圖形空間的映射為基礎,利用圖形語法完成有數據轉換為圖形的過程,從下至上,由最基礎的數據元素生成更高級的元素嘲。基于圖形語法的數據可視化方法的具體思路為:首先利用圖形語法對數據轉換為圖形的形式,再對圖形進行標記,最后對圖形進行可視化的編碼實現數據可視化,根據不同用戶的需要還可對其進行相應的標度和坐標系變換處理。下文將對上述基于圖形語法的數據可視化方法的過程進行詳細的說明。
1.1基于圖形語法的數據轉換及圖形標記
從圖形語法的角度出發,一個統計的圖形就可以看作是由數據到幾何圖形轉變、映射得來的。通過圖形語法將數據的統計進行轉換,最終根據實際需求繪制在特定坐標系當中,通過多個不同的數據組合成不同的子集圖形,最終構成完成的數據可視化圖形。數據可視化圖形當中最核心的部分是可視化的數據部分,其次是通過數據在變化過程中產生的相應圖形屬性的映射。對于數據的轉換,首先要將海量的數據信息輸入到同一個數據框架當中,在數據框架中包含了數據的屙l生以及相應的數值,圖1為數據框架的集合結構組成。
數據框架當中的每一條數據都包好了其自身的屬性以及數值,將數據轉換為數據框架的形式,其中每一行都可以表示為一條記錄內容,在圖形語法當中數據框架中的每一列都代表一個變量,想要表示多維度的數據可以通過多列疊加的方式處理。數據框架本身是一個通過數據列存儲的數據格式,因此對數據的轉換操作更加方便。數據向數據框架轉換關系具體可表示為:在計算機當中輸入相應的數據屬性及數值,通過轉換后只需輸入相應的數據屬性即可得到相應的數據屬性數值。在數據框架當中還包含大量的數據操作,方便使用在根據具體需要對數據進行轉換,轉換操作包括:映射、過濾、排列、集合、分組等,從而完成對數據到圖形的轉換。
在對數據進行可視化轉換過程中,還需要對轉換后的圖形進行標記,通過圖形的標記可以直接決定最終生成的圖形或圖表的類型。基于圖形語法的規范性圖像轉換沒有特定的圖形或圖表要求。因此,在對圖形進行標記時只需要利用更加細小的粒度實現對圖像的標記,通過不同圖形標記的組合得到多種不同類型的數據表達含義。將圖形和圖表看作是圖形標記集合的標記對象,在圖形語法當中沒有對特定的圖形進行定義,因此本文為圖形標記與傳統圖表之間的關系進行如表1所示的定義。
在實際操作過程中,本文基于圖形語法的數據可視化方法的圖形標記定義只需要用到表1中的前六種圖形標記類型即可完成對絕大多數數據的可視化處理。
1.2圖形可視化編碼
完成對數據額轉換及圖形標記后,還需要通過對圖形進行可視化編碼,從而實現對數據的可視化映射圖形的建立。由于人們在對可視化的感知是通過人的視覺完成的,因此,本文在對數據可視化方法進行設計時,首先基于人類視覺感官的編碼原則對數據進行可視化元素映射。通過圖形可視化編碼可以是海量數據信息更易被用戶理解,數據本身的含義也更加生動、直觀的表現。本文提出的可視化數據圖像編碼是由圖形和視覺屬性共同構成的通道,利用圖形語法實現由數據維度到數據可視化元素的映射,可以隔年直觀且有效的表現出數據本身的性質及信息。再通過控制圖形語法的視覺通道使數據的維度能夠在圖形的視覺屬性上得到映射,可以更加準確地反映出數據屬性中的定量信息,通過兩種不同作用的通道實現對海量數據信息的完整可視化表達。
利用圖形語法實現對不同數據類型的圖表的表達可通過不同的圖形標記實現,由于圖形在繪制的過程中會產生不同的形狀,因此通道中與圖形相對應的數據屬性映射方法不同時,最終生成的圖形形狀也不同。
圖形標記點可以直接用三角形、圓形或矩形表示;圖形標記線可以用折線、曲線以及虛線表示;圖形標記多邊形可可以用實心的多邊形,也可以用只有邊框輪廓的空心多邊形表示。通過構建對應關系,形成了具有特定意義的圖形標記,通過形狀的選擇決定了各個視覺通道當中的圖形屬相的映射,通過圖形形狀確定應該選擇圖形標記。
本文基于圖形語法的數據可視化方法的圖形可視化編碼實際上是利用表現能力更強的視覺通道實現對數據中重要屬性及數值的可視化編碼。視覺通道中的性質類型決定著不同數據所應用的不同通道,根據數據實際包含的含義選擇適當的視覺通道可以對海量數據信息更加完整的表達,從而實現對海量數據信息的可視化。
1.3標度及坐標系變換
完成對圖形的可視化編碼后,基于圖形語法的數據可視化方法基本完成,但還可根據企業當中對數據信息的實際需要對圖形進行標度和坐標系轉換。標度是指從定義領域向數值領域映射的函數處理方法。利用相應的方法構建輸入的數據數值向可視化數據轉變的映射函數,從而方便用戶根據具體內容對數據進行可視化展現。標度作為由數據領域向圖形領域過渡的橋梁,主要負責對初始數據信息到區間[0,1]的轉化作用,由初始數據向區間內繼續轉化的過程稱之為歸一化操作。在轉化的過程中,標度的類型是隨著數據的類型不斷改變的,對于數據的分類大致可分為兩種,一種是離散型的數據,一種是連續型的數據,其中離散型數據又可分為有規律的和無規律的兩種。
在本文設計的數據可視化方法當中的坐標系與傳統意義上的坐標系不同,在圖形語法中坐標系主要用于描述數據信息是如何通過映射方式轉化為圖形的,在本文方法中用到的坐標系為極坐標、地圖投影以及笛卡爾坐標三種。其中地圖投影坐標系需要用戶將數據中帶有地理坐標的數據以本文上述方式轉變為二維空間中的坐標。在三種坐標系當中都包含對圖像的平移、旋轉和鏡像的操作,用戶可進行自由的操作實現對數據全方位的可視化,提高了數據的多樣性和靈活性。
2實驗論證分析
為了詳述本文提出的基于圖形語法的數據可視化方法,下面將通過對比實驗的形式,完成本文數據可視化方法與傳統數據分析方法交互性驗證的實驗。
2.1實驗準備
首先建立兩個初始狀態完全相同的分析模型,其中一個添加本文設計的數據可視化方法,并將其設置為實驗組;另一個添加傳統數據分析方法,并將其設置為對照組。分別在兩個分析模型中添加相同的數據信息,并模擬用戶對數據的使用以及數據的展示效果。通過兩個分析模型的不斷迭代輸出最終的實驗結果。
2.2實驗結果及分析
分別將兩個分析模型的實驗結果進行記錄,并通過結果計算出兩種數據展示方法與用戶之間的交互率,并繪制成如圖2所示的實驗結果對比曲線。
通過進行60次的迭代后,從圖2中可以明顯看出,實驗組的交互率整體呈現出上升的趨勢,而對照組在完成20次迭代后交互率呈現出了明顯的下降趨勢。因此,通過對比實驗的形式進一步證明了,本文提出的基于圖形語法的數據可視化方法具有更高的交互性,可以更加完整地向用戶展示數據中包含的所有信息,將其應用到企業的實際運行當中,更有利于企業的發展。
3結束語
本文針對目前數據信息對企業發展的重要性,提出了一種基于圖形語法的數據可視化方法,通過對比實驗進一步驗證該方法具有更高的交互性。隨著圖形語法本身的不斷發展,在未來還可以用于解決更多的數據問題,在后續的研究中,還將針對圖形語法實現對數據動態可交互的可視化圖形生成方面進行更加深入的研究。