王育紅,馮 鋒,左雨芳,孫 冉
(江蘇師范大學 地理測繪與城鄉規劃學院,江蘇 徐州 221116)
近年來,空間數據快速獲取與更新手段不斷豐富、大容量存儲技術日益成熟、高性能計算設備逐漸普及,各類空間數據及其關聯數據正以前所未有的速度急劇增長和持續積累,時空數據規模越來越龐大。這些新的發展成就,為充分考慮空間數據的時間特征,深入開展時空數據組織管理[1]、挖掘分析[2]、可視化[3]等方面的理論研究與應用實踐,有效促進知識決策服務型動態GIS的設計與實現,奠定提供了堅實基礎與良好契機。
1987年,美國國家基金會圖形圖像專題討論組提出并闡述“科學計算可視化”(Visuali-zation in Scientific Computing,ViSC)概念,一般將其看作可視化科學與技術被系統研究的開端。該概念后來被簡化為“科學可視化”,甚至是“可視化”[4]。可視化的本意是“使之可見”,其根本目標是把由實驗或數值計算獲得的大量數據轉變成人的視覺可以感知的計算機圖形圖像,以幫助人們直接理解現象、發現規律和傳播知識。隨著研究的深入,目前可視化已建立形成了由科學可視化、數據可視化、信息可視化、知識可視化、可視化分析等分支組成的復雜技術體系。這些技術及應用之間又存在著區別、交叉和聯系[5-6]。
作為可視化研究與應用的一個重要組成分支,GIS時空數據可視化的基本形式是地圖。盡管地圖制圖相對于可視化是一門非常古老的學科,但將可視化理論與技術融入地圖制圖和GIS卻可為其注入新的動力,帶來根本性變革,該工作始于20世紀90年代初[7-8]。時空數據可視化技術的核心是為使用者提供直觀的、可交互的空間信息可視化環境,它已遠遠超出了傳統的符號化及視覺變量表示法的水平,而進入可交互地圖條件下的探索視覺效果和提高視覺功能的階段。經過近三十年的不懈努力,時空數據可視化在理論模型、技術方法、開發類庫、軟件平臺等方面積累了許多有益成果,目前已呈現出并行化、多樣化、多維動態化的總體研究與應用趨勢[8-12]。
為克服傳統靜態GIS的不足,避免從底層編碼實現相應技術的困難,結合當前發展趨勢,本文選擇2020年10月發布的最新國產高性能GIS桌面軟件——GeoScene Pro 2.0(簡稱GeoScene),以曾廣為關注的湖北省新冠疫情數據為例,在設計建立時空數據庫的基礎上,詳細討論空間二維、三維環境下的動態可視化方法及相關技術細節,以期為同類可視化問題提供高效、實用的解決方案與技術參考。
簡單地講,時空數據就是具有時間元素并隨時間變化而變化的空間數據。時空數據涉及各式各樣的數據,不僅具有明顯的空間分布和屬性語義特征,而且具有數據量龐大、非線性以及時變等特點。根據變化的內容,可將時空數據分為3大類:僅空間變化的時空數據、僅屬性變化的時空數據以及空間屬性同時變化的時空數據。
無論哪種類型的時空數據,GeoSence都以要素類(空間關系表)的形式加以組織管理,通過不同類型的字段來分別記錄實體現象的空間、屬性和時間數據。其中,時間/時戳數據有“單字段”和“雙字段”兩種記錄方式。“單字段”僅用來表示現象實體發生變化或者被觀測采集的時間,一般適用于變化或觀測周期相對固定的情況,如每隔3 h、1 d等;“雙字段”則分別用來表示現象實體發生變化或者被觀測采集的“開始”和“結束”時間,一般適用于現象實體持續存在時間或觀測周期不統一的情況。
文中所采用的湖北省新冠疫情時空數據屬于僅屬性變化的時空數據,分別使用面狀和點狀兩個要素類加以管理。除了描述行政區空間特征的幾何形式不同之外,這兩個要素類并無其他不同。二者都以“單字段”方式記錄湖北省17個省轄市區,從2020-01-23—2020-03-23,每天的新增病例、新增出院、新增死亡數據。表1給出了面狀要素類組織管理新冠疫情時空數據的基本結構與形式。

表1 新冠疫情時空數據基本結構和形式
上述時空數據的生成主要依據兩種來源的原始數據。一是來源于湖北省衛健委在疫情期間每日發布的新冠疫情數據;二是從中科院資源環境科學與數據中心獲得的中國地市行政邊界數據。圖1給出了對這些數據進行處理派生形成所需時空數據以及后續可視化的基本過程,本節主要討論處理生成環節。

圖1 湖北新冠疫情時空數據處理生成與可視化基本過程
1)每日新冠疫情數據的處理生成。在湖北省衛健委官網,按時間先后依次打開每日發布的新冠疫情情況網頁,從中解析提取17個省轄市區的新增病例、新增出院、新增死亡的數據。為提高輸入匯總的效率,將所得數據按如表2所示形式記錄在Excel工作表中。在所需數據匯總結束后,使用Excel軟件對所得工作表的“武漢市”“黃石市”等17個數據列進行逆透視,然后再對包含3個疫情數據的數據列進行拆分,然后按表1所示內容重新命名所得工作表的相應字段,最后將該工作表導入到基于GeoDatabase[13]的疫情時空數據庫中。

表2 基于列的新冠疫情數據非結構化匯總表
2)行政區劃空間數據的處理生成。從所獲得的中國地市行政區劃空間數據Shape文件中,選擇提取湖北省轄的17個面狀行政區要素,并核對修改每個要素的名稱、代碼等數據,使其與表1、表2相應內容保持一致。為滿足后期時空立方體可視化的要求,使用GeoScene自帶的“投影”工具,將該數據集所采用的CGS2000經緯度地理坐標轉換為高斯投影平面坐標。最后,使用GeoScene自帶的“要素轉點”工具,以面狀行政區要素類為輸入,生成包含17個面狀要素對應中心點的要素類。
3)新冠疫情時空數據的處理生成。首先,使用GeoScene自帶的“添加連接”工具,通過共同的“政區名稱”字段,向“省轄行政區點要素”連接追加“新冠疫情屬性表”中的不同行政區隨時間變化的疫情數據;然后,將這一需要動態連接擴展的臨時性數據,導入到疫情時空數據庫,生成永久性“新冠疫情點狀時空數據”,以提高后期可視化的處理效率。接著,再按照類似過程生成“新冠疫情面狀時空數據”。
目前,GeoScene支持在多個視圖窗口環境中,以不同形式同時展示呈現時空數據所包含的全部或部分信息。例如,在某一時段內或某一時刻點上的某些要素的空間或屬性信息,等等。這些可視化可概括為地圖、場景、屬性表和統計圖4種主要形式。其中,地圖和場景分別以二維平面圖形和三維立體圖形的形式來展示要素的空間位置形狀及相應屬性信息;屬性表和統計圖則以二維表格文字和幾何圖形的形式來展示要素的屬性信息。
地圖是GeoScene最便捷的可視化方式,只需將包含時空或空間數據的要素類拖拽到地圖窗口,系統便會自動創建相應圖層對其加以展示。1幅地圖通常包含多個圖層。圖層是空間數據內容的圖形化展示與呈現,它通過符號和標注來表達數據的特征和差異,同一內容的空間數據可以表示為不同形式的圖層,正所謂“內容與形式相分離”。在加載創建圖層后,一般需要調整設置圖層符號和標注的類型、大小、顏色、參考字段等屬性,以使其表達更明確、更豐富、更美觀。
針對數據記錄多、數值差別大的湖北省新冠疫情時空數據,可采用GeoScene提供的分級色彩、分級符號、比例符號、點密度、統計圖表等方式來符號化相應圖層(見圖2),從而派生形成不同類型的疫情地圖與可視化效果。為避免因行政區空間位置形狀未變化造成的信息遮擋和冗余混亂,這些地圖僅選擇使用了2020-02-10的面狀疫情空間數據。

圖2 新冠疫情時空數據地圖可視化示例
場景也被稱為3D地圖。場景中既可以包含2D平面要素圖層,也可以包含具有高程(度)信息的真3D立體要素圖層。在默認情況下,文中所用疫情時空數據在場景中最初顯示為2D圖層,可通過3D符號化、按屬性拉伸、生成時空立方體三種方式將其轉化為3D圖層。圖3分別給出了點狀疫情數據采用上述方式在場景中的三維可視化表達效果。

圖3 新冠疫情時空數據場景可視化示例
其中,前兩幅圖只選擇使用了2020-02-10的點狀疫情數據;后一幅圖所用數據則是使用“通過以定義位置創建時空立方體”工具,在再次連接行政區中心點與全部疫情點狀時空數據的基礎上,以5 d為間隔聚合統計生成的新增病例真三維時空立方體數據。該數據以netCDF[14-15]格式存儲,需要使用專門的處理工具將其轉換為3D要素圖層,才可以將其顯示在場景中。
屬性表是最接近時空數據原始邏輯組織結構的一種可視化形式。它以平面二維表的形式逐行展示時空數據所包含的要素記錄及相關屬性。如果需要,可以關閉隱藏屬性表相關屬性字段的顯示,也可以按圖層中所設置的時間起止范圍、屬性取值范圍、地圖窗口范圍等條件來過濾顯示僅在相應范圍內的要素記錄。
統計圖又稱統計圖表,是利用點、線、面、體等幾何圖形,表示數據間對比、結構、依存、分布等不同關系及其變動情況的各種工具的統稱。針對表格型數據,目前GeoScene共提供了條形圖、散點圖、散點圖矩陣、直方圖、箱形圖、QQ(分位數)圖、折線圖、剖面圖、數據時鐘、日歷熱點圖等10種類型的圖形可視化表達形式。其中,數據時鐘、日歷熱點圖則主要用來表達一般時態表格數據或矢量時空表格數據在整個或其中某一時段內的發生情況和變化趨勢。圖4分別給出了利用數據時鐘、日歷熱點圖對湖北省每日新增新冠病例匯總統計的可視化表達效果圖。

圖4 新冠疫情時空數據統計圖表可視化示例
與靜態可視化相比,動態可視化不僅可以豐富數據的表達維度,而且可以分析挖掘事物現象的時空格局、演化規律,甚至模擬預測其變化過程與發展趨勢。動態可視化的實質是從復雜的輸入數據中生成連續的動態圖像。目前,空間數據動態可視化一般采用動態地圖來實現,其表達對象和目標可概況為兩種基本情景:一是通過“意動”符號增強靜態空間數據可視化的動態視覺效果與感受;二是基于“時戳”信息從時空數據集中動態提取并展示不同時刻或時段內的數據記錄,以刻畫模擬地理要素空間或屬性特征隨時間推移發生運動變化的過程[16]。
作為新一代GIS軟件平臺,GeoScene動態可視化能力大幅改善和提升,可通過時間滑塊、動畫視頻兩種方式,在地圖、場景、表格、統計圖表4種不同的視圖窗口中動態展示瀏覽、追蹤回放時空數據。
時間滑塊是GeoScene軟件系統的一個功能組件,可用來從時空數據集中動態提取、展示播放指定時段的數據記錄。如果要使用時間滑塊,必須先在地圖或場景中設置啟用引用空間數據集的對應圖層的時間屬性,并指定時間值的存儲方式及具體字段。當圖層啟用時間之后,時間滑塊會自動出現在包含該時態圖層的地圖或場景窗口中,系統主界面也會增加“時間”功能選項卡。
在“時間”功能選項卡中,可進一步設置時態圖層動態可視化的“開始結束”時間、跨度(時間窗大小)、播放速度等參數,以幫助用戶獲得最佳的可視化效果。在利用時間滑塊進行動態回放過程中,如果打開了時態圖層的屬性表或基于該圖層創建的統計圖表,則屬性表或統計圖表的顯示內容將隨著地圖或場景顯示內容的變化而變化。基于時間滑塊實現動態可視化的基本原理如圖5所示。

圖5 基于時間滑塊的動態可視化基本實現原理
作為重要的多媒體技術和表現形式,動畫和視頻具有很深的淵源。由于二者都是利用視覺延遲原理,沿時間軸依次更換顯示連續漸變的靜態圖像或圖形,從而產生動態視覺感受的媒體形式,因此,經常被認為是同一個東西。但嚴格區分起來,二者還是有區別的。動畫是一門綜合藝術,其每幀圖像/圖形都是由人工設計或計算機產生的;而視頻是一種信號處理技術,其每幀圖像主要是通過實時攝取自然景象或者活動對象獲得的。簡單地講,動畫是一種表現形式,視頻是一種播放方式。
在GeoScene軟件系統中,動畫是指創建連續圖像集合并快速回放這些圖像以創建動態圖像的過程。連續圖像集合中的每個圖像被稱為關鍵幀。關鍵幀只能用來記錄地圖或場景窗口中相關圖層的顯示內容和狀態。用戶可通過手動逐項插入方式為動畫創建關鍵幀,也可以根據特定的工作流使用導入方法自動創建大量關鍵幀,如根據瀏覽書簽、時間滑塊步長等。
動畫不僅能按時間動態展示時空數據,而且能以不同的視點、比例、范圍等參數動態切換展示一般靜態空間數據。與時間滑塊相比,通過動畫對時空數據進行動態可視化具有信息內容豐富、方便共享等優勢。在設計動畫時,可根據需要在相應關鍵幀上添加放置文本、段落、圖像、圖形、版權、水印等信息;在設計創建完動畫之后,可以將其導出轉換為不同格式的視頻文件,以方便沒有GeoScene軟件系統的用戶瀏覽查看相應地圖或場景。
作為利用視覺通道幫助用戶發現數據特征、理解數據內涵、洞察數據規律的一種重要技術手段和高效人機界面,數據可視化一直是多個學科領域共同關注研究的熱點。文中在簡要梳理數據可視化概念和歷程的基礎上,從時空數據可視化發展趨勢及全球關注的新冠疫情出發,詳細分析討論了最新國產GIS桌面軟件平臺——GeoScene系統環境下的時空數據庫組織管理、多維可視化形式以及動態可視化實施策略等內容。該研究進一步驗證了GeoScene在時空數據高效組織處理、二三維融合動態可視化等方面的卓越性能,可為解決同類可視化應用問題提供了實用的技術參考和靈活的方法選擇。針對目前疫情時空數據人工手動解譯獲取效率低、更新慢的不足,下一步將研究利用網絡爬蟲、中文分詞等技術加以解決。