段旭升 王智慧



【摘 要】大數(shù)據(jù)、可視化、智能分析……這些信息時代的新技術(shù)沖擊著我們的認知,在領(lǐng)略飛奔的技術(shù)的同時感覺既熟悉又茫然。本文以制作北京市新冠肺炎疫情交互型可視化數(shù)據(jù)報告為例,嘗試從技術(shù)實現(xiàn)和教學(xué)策略角度闡述信息技術(shù)教學(xué)中對數(shù)據(jù)分析內(nèi)容的探究。
【關(guān)鍵詞】數(shù)據(jù)分析;可視化;大數(shù)據(jù);Power Bi
【中圖分類號】434 【文獻標識碼】B
【論文編號】1671-7384(2020)011-076-04
2017版普通高中信息技術(shù)課程標準中強調(diào):“構(gòu)建具有時代特征的學(xué)習(xí)內(nèi)容,將知識構(gòu)建、技能培養(yǎng)與思維發(fā)展融入運用數(shù)字化工具解決問題和完成任務(wù)的過程中。”而數(shù)據(jù)作為信息時代的基石以及一切數(shù)字化工具的根本資源,越來越受到大家的重視。讓學(xué)生了解和體會數(shù)據(jù)分析和可視化表達更是必修模塊中的重要環(huán)節(jié)。
日常生活中的“數(shù)據(jù)”和“枯燥”一詞形影不離,大數(shù)據(jù)更是遠看光鮮亮麗,近看無從下手。如何打破僵化局面,帶給學(xué)生易于實現(xiàn)且富有視覺沖擊的數(shù)據(jù)分析課程,是我們每位信息技術(shù)教師關(guān)心的問題。但是,無論是Excel視覺圖表,還是Python詞云展示,似乎都略顯單薄,無法引領(lǐng)學(xué)生一窺大數(shù)據(jù)的風(fēng)采。本文將從技術(shù)實現(xiàn)過程和教學(xué)策略角度闡述數(shù)據(jù)分析課程的探索與嘗試。
工具選擇和數(shù)據(jù)來源
工欲善其事,必先利其器。選用適合的數(shù)字化工具進行協(xié)作學(xué)習(xí)和解決問題正是在培養(yǎng)學(xué)生“數(shù)字化學(xué)習(xí)與創(chuàng)新”核心素養(yǎng)。一款上手簡單、易用,并且面向?qū)W生未來發(fā)展的軟件尤為重要。微軟的Power Bi便是不錯的選擇,其與Office家族息息相關(guān)。早在2013年,Office365就已嵌入Bi商業(yè)智能解決方案,而今Power Bi早已成長為強大的商業(yè)智能分析和數(shù)據(jù)可視化工具,其官方中國社區(qū)的可視化大賽更是進行得如火如荼。該軟件另一個巨大好處是低成本,Power Bi Desktop版本是完全免費的,并且具有許多與付費版本相同的功能。
在數(shù)據(jù)來源這一問題上,學(xué)生身邊熟悉的數(shù)據(jù),或者社會熱點數(shù)據(jù)最為適合。如網(wǎng)絡(luò)購物數(shù)據(jù)、家庭消費數(shù)據(jù)、學(xué)習(xí)成績數(shù)據(jù)等。在此,正值北京地區(qū)40天打贏抗“疫”戰(zhàn),以“北京速度”展現(xiàn)中國力量之時,筆者選擇引入此次新冠肺炎疫情數(shù)據(jù)帶領(lǐng)學(xué)生制作交互型可視化數(shù)據(jù)報告。目的是使學(xué)生保持新鮮感,提升參與度。確定了數(shù)據(jù)選型,接下來需要找到科學(xué)而又權(quán)威的數(shù)據(jù)來源,在基礎(chǔ)層面杜絕錯誤的發(fā)生。通過數(shù)據(jù)搜索,筆者找到了“北京政務(wù)數(shù)據(jù)資源網(wǎng)”(https://data.beijing.gov.cn),在新冠肺炎疫情信息專欄下載了歷史數(shù)據(jù)(圖1)。
數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理工作主要是在Excel環(huán)境下對下載的數(shù)據(jù)進行整理,刪除或添加數(shù)據(jù)條目。
(1)刪除序號。網(wǎng)絡(luò)上很多數(shù)據(jù)帶有序號索引,而數(shù)據(jù)分析并不涉及序號數(shù)據(jù),所以需要事先刪除該條目。
(2)修改數(shù)據(jù)格式。有時我們下載的數(shù)據(jù)雖然表面上看是數(shù)字,但卻是文本格式,需要在Excel中指定為數(shù)值型。只有設(shè)置成數(shù)值格式,才能在Power Bi中自動識別并快速度量。
教學(xué)實踐過程中,數(shù)據(jù)預(yù)處理環(huán)節(jié)可以忽略掉繁雜的處理過程,只展示和練習(xí)需要注意的重要環(huán)節(jié)即可。圖2為處理后的“北京市6月10日至7月6日新冠肺炎新增數(shù)據(jù)統(tǒng)計表”的一部分。
PowerBi的安裝與注冊
首先,前往powerbi.microsoft.com下載桌面版軟件,同時該站點還提供了移動端App下載。其次,在注冊賬戶過程中值得一提的是,Power Bi需要用企業(yè)郵箱注冊,一般的郵箱無法注冊成功。學(xué)生可以使用釘釘郵箱或者在網(wǎng)絡(luò)上搜索“臨時郵箱”進行快速注冊。
制作交互型可視化數(shù)據(jù)模型
在制作之前,教師應(yīng)引導(dǎo)學(xué)生觀察數(shù)據(jù)各個字段,思考討論從哪些角度將這些枯燥的數(shù)據(jù)展示成圖形、要用數(shù)據(jù)表達哪些觀點、要用什么樣的圖形展示最為貼切,最終形成代表性意見。例如,從時間角度上用折線圖來展示新增確診病例數(shù)變化過程,用來表達此次北京市防控疫情的迅速果斷;從地理空間角度上用柱形圖來展示各行政區(qū)的確診病例數(shù)對比,用來說明病毒擴散的弱化過程……前期確定數(shù)據(jù)分析的方向尤為重要,尤其是學(xué)生初次接觸Power Bi,應(yīng)以詳盡的分析思路引領(lǐng)學(xué)生,盡量避開技術(shù)問題,轉(zhuǎn)而關(guān)注數(shù)據(jù)的內(nèi)在價值,為后面的工作做到有的放矢做好準備。同時,選用適當(dāng)?shù)姆椒ㄌ崛 ⒎治龊徒忉寯?shù)據(jù)正是“計算思維”的核心素養(yǎng)。
在Power Bi中點擊“獲取數(shù)據(jù)”(圖3),可見該軟件支持眾多導(dǎo)入方式。在此選擇Excel格式,并連接到準備好的疫情數(shù)據(jù)表格。這種連接方式,只要表格中的數(shù)據(jù)發(fā)生變化,Power Bi中即可對視覺對象進行刷新,就像Excel中數(shù)據(jù)發(fā)生變化,以此生成的圖表也會自動變化一樣。
數(shù)據(jù)加載成功之后,工作窗口右側(cè)的“字段”界面即可看到每列數(shù)據(jù)的標題。接下來我們要制作一個簡單的折線圖,用來從時間維度反映新冠肺炎新增確診病例數(shù)的變化過程。在可視化選項卡界面中選擇“折線圖”,將“日期”字段拖動到可視化選項卡的“軸”;將“新增病例數(shù)”字段拖動到“值”,點擊下拉按鈕設(shè)置度量方式為“求和”(圖4)。簡單的拖動就做完了“新增確診病例數(shù)”折線圖,此外還可以在“可視化”選項卡的“格式”選項,對圖表的標題、數(shù)據(jù)標簽、外觀等進行詳細設(shè)置。
繼續(xù)新建一個堆積柱形圖,用來從地理空間維度反映新冠肺炎新增確診病例的數(shù)量對比。拖動“行政區(qū)”到“軸”,拖動“新增病例數(shù)”到“值”,度量方式依然為“求和”。
兩個基礎(chǔ)維度的數(shù)據(jù)分析圖構(gòu)建完畢。接下來,以這兩個分析圖為依托,繼續(xù)引領(lǐng)學(xué)生將關(guān)注問題進行深化細化,如從時間上看疫情暴發(fā)的前期以哪些行政區(qū)為代表,從空間上看我們所在的大興區(qū)新增確診病例集中在哪個時間段等。此時引入“切片器”的概念:更細化的篩選數(shù)據(jù)。在“可視化”選項卡中點擊“切片器”,拖動“日期”到“字段”完成構(gòu)建。滑動滑塊可以對整個時間線進行切片分析,清晰看出疫情爆發(fā)的前五天(2020年6月10日至6月14日)各行政區(qū)的累計確診數(shù)(圖5)。同樣點擊下方柱形圖中“大興區(qū)”,也可以看出各時間段的變化趨勢。讓學(xué)生在分析問題的同時體會數(shù)據(jù)分析的交互性。
為了進一步增強數(shù)據(jù)的可視化,吸引學(xué)生興趣,我們繼續(xù)添加“地圖”元素,使數(shù)據(jù)分析界面更友好、更易識別。點擊“地圖”圖標,將“行政區(qū)”拖動到“位置”,“新增病例數(shù)”拖動到“大小”,并指定度量方式為“求和”。
此時,地圖中出現(xiàn)大小不一的氣泡,氣泡越大代表病例數(shù)越多,并且與切片器、柱形圖、折線圖相互聯(lián)動,具有很強的交互性。如點擊“豐臺區(qū)”氣泡標記,左側(cè)折線圖即切換到豐臺區(qū)新增確診病例變化數(shù)據(jù),下方柱形圖也跟隨互動,高亮顯示豐臺區(qū)累計確診病例數(shù)量。再結(jié)合“切片器”可清晰快速地得出很多結(jié)論。例如,疫情后期6月26日至7月6日僅有兩個行政區(qū)有新增確診病例;豐臺區(qū)此階段累計新增43人確診;豐臺區(qū)26日至30日疫情形勢出現(xiàn)積極變化,新增確診病例降幅明顯。
挖掘數(shù)據(jù)價值
通過正確而規(guī)范的數(shù)據(jù)、適合的數(shù)字化工具、適當(dāng)?shù)姆治龇椒ǎ覀儤?gòu)建了交互型可視化的數(shù)據(jù)分析模型。接下來,需要引導(dǎo)學(xué)生挖掘數(shù)據(jù)中隱藏的信息,體會這些有價值的信息對形成正確決策的作用和意義,認識數(shù)據(jù)管理與分析技術(shù)對人類社會生活的重要影響。而這正是提升“信息意識”核心素養(yǎng)的關(guān)鍵一步。
此時,可以讓學(xué)生根據(jù)上面已經(jīng)做好的數(shù)據(jù)分析模型,針對此階段北京市的疫情撰寫簡單的分析報告,發(fā)表各自觀點。其目的除了使學(xué)生認識到數(shù)據(jù)的重要性,還可以讓學(xué)生逆向體會數(shù)據(jù)分析的構(gòu)建思路,做到先拆解數(shù)據(jù)模型厘清脈絡(luò),再組合思路,思考對現(xiàn)行分析方法的優(yōu)化和改進。最后提出新的數(shù)據(jù)分析任務(wù),給學(xué)生布置選題,既可以自由選題獨立獲取數(shù)據(jù),也可以由教師提供諸如學(xué)校圖書館借閱數(shù)據(jù)、學(xué)生視力數(shù)據(jù)、體質(zhì)健康測試數(shù)據(jù)供學(xué)生選擇。重點讓學(xué)生自己確立分析思路、制作數(shù)據(jù)模型、撰寫并展示分析報告,親身體會數(shù)據(jù)分析的整個項目過程。
以上是我們對信息技術(shù)教學(xué)中數(shù)據(jù)分析內(nèi)容的技術(shù)實現(xiàn)和學(xué)習(xí)策略探究。如今,多樣的數(shù)據(jù)分析技術(shù)已經(jīng)廣泛應(yīng)用于人們的日常生活和學(xué)習(xí)中,越來越成為解決實際問題的重要方式。同時,我們在體會大數(shù)據(jù)、可視化、智能分析帶來巨大便利的同時,也應(yīng)深切思考如何帶領(lǐng)學(xué)生掠過光鮮飛奔的技術(shù)列車,轉(zhuǎn)而關(guān)注如鐵軌一般行穩(wěn)致遠的根本素養(yǎng)。
作者單位:北京市大興區(qū)第一中學(xué)? ?北京市大興區(qū)教師進修學(xué)校