文/徐海波 李朝陽
數據可視化是一種技術,在視覺傳達過程中能夠直觀、生動、有效的將信息傳遞給人們,引起人們的心理反應,幫助讀者理解。數據可視化的終極意義是催生觀點的生成、推動決策。大數據時代,數據生成速度快,積累的數據體量龐大,如何從數據礦藏中提煉輔助決策的數據,通過人機交互,幫助管理者在非結構化任務中作出決策是一個重要課題。隨著數據驅動的決策分析越來越受到政府機構、企事業單位的高度關注,使用數據視覺化技術的決策支持系統建設不斷開展。

圖1:離港航班24小時流量時序圖
決策支持系統(Decision Support System,簡稱DSS)是以計算機技術、仿真技術和信息技術為手段,針對半結構化的決策問題,支持決策活動的具有智能作用的人機系統。
該系統能夠為決策者提供所需的數據、信息和背景資料,幫助明確決策目標和進行問題的識別,通過人機交互功能進行分析、比較和判斷,為正確的決策提供必要的支持。它通過與決策者的一系列人機對話過程,為決策者提供各種可靠方案,檢驗決策者的要求和設想,從而達到支持決策的目的。
該系統所支持的主要對象是半結構化和非結構化的決策(即不能完全用數學公式、數學模型來求解)。決策支持系統只是支持用戶,而不是代替用戶判斷。它的一部分分析可由計算機自動進行,但需要用戶的節點判斷和參與,主要特征為:

圖2:按國內、國際分類的航班流量時序圖
(1)主要針對用戶經常面臨的非結構化或半結構化、說明不夠充分的問題;
(2)把模型或分析技術與傳統的數據存取及檢索技術結合起來;
(3)人機交互方式使用,為用戶提出有效的數據查詢并在管理系統的支持下,評估用戶的查詢條件和查詢結果,指導用戶更佳查詢;
(4)強調對環境及用戶決策方法改變的敏捷性;
(5)決策支持系統為用戶或管理人員制定決策提供支持。
使用各種統計分析和控制分析模型,進行多層面和更復雜的分析和計算,發現趨勢(旅客流量增長趨勢、年度旅客吞吐量預測、地方經濟對旅客出行方式的影響等);通過查詢獲取重要內容詳細信息;確定事項優先級和內部管理規則,支持組織內部各管理層決策。為用戶和管理人員有效的幫助。
每個業務系統將包括相應業務(旅客流量、地方經濟、投資、政策法規、收入等)的輔助決策系統,并在分業務的支持下輔助決策支持系統。
數據可視化(DataVisualization)技術是利用計算機圖形學和圖像處理技術,將數據轉換成圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術。
用戶(stakeholder)既是數據的生產者,也是數據的使用者,然而用戶獲取和存儲的原始數據總是雜亂無章的。總之,并不是所有人都可以理解一份復雜的數據報告,但人人都會看圖。要想數據達到生動有趣、讓人一目了然的效果,就需要借助數據可視化。數據可視化是和數據分析、數據挖掘等方法的有效補充。
數據圖表開發者根據用戶需求,對多維數據進行切片,旋轉,通過人機交互,最終呈現給用戶簡介、直觀的圖形或圖像,展現數據力量,幫助用戶發現未知信息,促動用戶觀點的生成、助力管理者決策的產生。本﹒施奈德曼(BEN SHNEIDERMAN)說“先總覽,再縮放并篩選,然后按需尋找細節”。數據可視化可以恢復數據集的真實結構,乃至極大的增強數據的全局結構和數據的具體細節,通過獲得數據與數據之間的關系、發現數據對整體結果影響的模式,使管理者獲得對整體結果的洞察。
數據可視化的目的是最大化數據價值,其本質意義就是幫助用戶(stakeholder)理解數據和推動用戶決策。可把數據理解為一個支點,數據可視化技術即是杠桿,兩者結合,可以撬動用戶決策,助力企業價值增長。數據可視化是充分展現數據力量的重要工具。以下介紹幾種可視化的應用示例。
圖1的設計采用散點圖(scatter plots)綜合熱力圖(heat map)的展現形式,橫坐標為時間,縱坐標為離港人數,每個數據元素代表一個航班,顯示隨著時間的推移生成的航班數量及旅客人數。圖1可以判斷出(1)8時至10時為該日上午的航班出港高峰,下午17時至18時為該日下午的航班出港高峰時段,下午13時至14時為該日白天出港航班較少的時段;(2)航班載客人數在150人至200人之間聚集;(3)凌晨2時至6時,機場離港航班以貨運為主;(4)能夠快速定位到貨機、大型客機、小型客機的起飛時段。圖2在圖1的基礎上,用顏色增加了航班屬于國內航班還是國際航班的維度。圖3的設計采用樹形圖(treemap),顯示當日各航司的航班數量,且航司之間橫向比較,更為直觀。從數據可視化的技術分類角度來講,圖1、圖2為基于幾何的可視化技術,圖3為基于層次的可視化技術。

圖3:當日各航司航班數量的比較

圖4:2018年前十大機場旅客吞吐量、貨郵吞吐量、起降架次展現
從圖4可以看出,旅客吞吐量排名最高的為北京首都機場,貨郵吞吐量排名最高的為上海浦東機場,杭州機場貨郵吞吐量排名優于旅客吞吐量排名且取得了貨運較優的成績。圖4使用了氣泡圖的方式,氣泡圖與散點圖類似,繪制時將一個變量放在橫軸,另一個變量放在縱軸,而第三個變量則用氣泡的大小來表示以,允許以二維方式繪制包含三個變量的圖表。圖4展現了旅客吞吐量、貨郵吞吐量、起降架次三個維度,展示效果優于條形圖和直方圖。
本文研究了數據可視化在決策支持系統中的重要性和應用。從筆者業務環境分析了數據可視化的設計實現方式。數據可視化促進了管理人員對信息的認知,讓復雜的半結構化、非結構化數據更易于理解, 從而影響決策,為企業、為社會、為個人生活帶來實際價值。