宋佳音 卜彩麗 河南師范大學
在信息化時代的今天,大數據不僅用于數據分析,還應用在教育領域中的精準教學。隨著“核心素養”時代的到來,“以德為先,全面發展,因材施教,綜合評價”的教育理念逐步深入人心。大數據并不在“大”,而在于“有用”。價值含量、挖掘成本比數量更為重要。利用大數據,對教育領域內的信息進行挖掘,通過對這些數據的針對性挖掘與分析,構建起學生生涯發展規劃平臺,著眼于學生的主體性作用,能充分發揮學生的主動性,更有效地幫助學生進行升學規劃,提高考生升學優質率。因此,筆者以“網絡購物平臺客戶行為數據分析”為項目主題,以項目學習活動為途徑,開展自主、協作、探究學習,讓學生了解數據采集、分析和可視化表達的基本方法,理解隨著社會數據量和個人數據量的增大,選用恰當的軟件工具或平臺處理數據、發現信息,已逐步成為人們解決問題的一種重要方式。筆者還通過對數據和大數據進行采集、存儲、處理,以及從中發掘有價值的信息等過程,讓學生全面了解數據與計算的重要意義,從而提升學生的信息素養。
情境:目前我國網購商品規模不斷擴大,由此產生大量的網購商品數據。這些數據存在一些規律,通過對這些數據的采集、分析,就可以找到數據之間的內在聯系。在商業活動中,這些數據可以為商業決策提供數據支持,由此產生更大的經濟效益,所以網絡購物平臺的商品銷售數據是一個巨大的商業寶藏。
項目主題:網絡購物平臺客戶行為數據分析。
目標分析:通過“網絡購物平臺客戶行為數據分析”項目,組織學生進行自主、協作、探究學習,讓學生認識大數據及其特征,理解數據對日常生活的影響,了解數據采集的基本方法及其對數據保護的意義,能夠在雜亂無章的數據中,運用數字化的工具和技術分析數據,并學會選用恰當的工具實現數據的可視化表達,以便更好地理解數據。學習過程將知識建構、技能培養與思維發展融入運用數字化工具解決問題和完成任務的過程中,促進本章對應課標的學科核心素養水平的達成,完成項目學習目標。
項目目標:通過項目的完成,認識大數據及其特征,認識大數據對人們日常生活的影響,了解數據采集、分析和可視化表達的基本方法;學會選用恰當的軟件工具或平臺處理數據,完成分析報告;理解對數據進行保護的意義,從而實現項目學習的目標。
工具和方法:利用思維導圖工具和“頭腦風暴”的方法組建團隊、明確任務;采用Python語言和數據分析方法等實施探究。
通過查找資料、學習和交流,了解大數據的概念,理解大數據的特征,明晰傳統數據與大數據的區別,知道大數據對日常生活的影響。
任務一:什么是大數據?大數據的特征有哪些?傳統數據與大數據有何區別?數據可視化的定義是什么?數據可視化的特征有哪些?
給學生5分鐘的時間完成任務一,通過查閱教材和小組內交流明確大數據、大數據的特征、傳統數據和大數據的區別、數據可視化的定義和數據可視化的優勢。每個問題選擇一個小組進行提問,根據提問的結果進行適當的解釋和補充說明:①大數據的概念及其特征;②數據可視化及基本特征。
任務二:數據可視化的目標和作用有哪些?數據可視化呈現的類型有哪些?你能從網上找出一些數據可視化圖片或視頻嗎?說一說它們屬于哪一種類型?
給學生3分鐘的時間完成任務二,通過查閱教材、互聯網搜索、小組內交流等形式讓學生理解數據可視化的類型,并能從互聯網上找到數據可視化的圖片并進行分類。教師提問2~3組,并根據回答情況進行補充說明。
(1)數據可視化的目標和作用。數據可視化與傳統計算機圖形學、計算機視覺等學科方向既有相通之處,也有較大的不同。數據可視化主要是通過計算機圖形圖像等技術展現數據的基本特征和隱含規律,輔助人們認識和理解數據,進而支持從數據中獲得需要的信息和知識。數據可視化的作用主要包括數據表達、數據操作和數據分析三個方面,這三個方面即以可視化技術支持計算機輔助數據認識的三個基本階段。
(2)數據可視化呈現的類型。大數據可視化可以讓人們快速抓住要點信息,讓關鍵的數據點從人們的眼睛快速通往心靈深處。從常用和實用的維度來看,大數據可視化的呈現類型主要分為探索和解釋兩種不同的類型。探索類型幫助人們發現數據背后的價值,而解釋類型則把數據簡單明了地解釋給人們。處理數據類型不同,可視化呈現的主要方式也不一樣,具體如圖1所示。

圖1
(3)數據可視化流程。數據可視化是對數據的綜合運用,包括數據采集、數據處理、可視化模式和可視化應用四個步驟。
通過查找資料、學習和交流,了解數據采集的基本方法和常用工具。根據選定的項目主題,確定項目的數據需求,列出數據采集清單和內容大綱。
教師提供采集上網行為管理系統數據基本操作指引微課。引導學生了解數據采集的基本方法和常用工具;以項目范例為例,引導學生對項目問題進行抽象與建模,確定項目需要利用爬蟲程序從淘寶網—實惠熱賣—零食類別中采集一份包括商品名稱、店鋪名稱、商品價格、商品銷量的數據(taobao.xls),需要利用爬蟲程序從淘寶網—實惠熱賣—零食類別中采集一份包括商品價格、商品銷量、商品評論的數據(sale_sample.csv),需要從店鋪后臺或手工采集一份店鋪銷售訂單數據(orders.xls,包括每個訂單賣出商品的名稱),為本項目的數據采集具體實施做好準備。
學生通過學習和交流,借助學習資源,了解系統日志采集法及其它數據采集法,并對小組項目問題進行抽象與建模,小組結合本組選題,分析和確定本組項目的數據內容需求、數據來源、采集方法和工具以及數據保存形式。
數據采集的基本方法包括日志采集法、網絡數據采集法和其他數據采集方法。
通過學習、交流、探究和實踐,結合本小組選題,了解Python第三方庫的安裝及使用,了解搭建本地服務器,體驗爬蟲程序,使用爬蟲程序采集網絡數據。
教師提供項目范例中的Python程序代碼,提供有關第三方庫模塊安裝與使用、Xampp搭建本地服務器、爬蟲程序采集網絡數據的基本操作指引(或微課)。指導學生安裝Python第三方庫、運行正弦函數程序,了解第三方庫的使用方法;指導學生安裝、運行Xampp,啟動本地Web服務;指導學生安裝chrome瀏覽器,體驗采集本地Web服務器數據,使用爬蟲程序從淘寶網—實惠熱賣—零食類別中采集一份包括商品標題、店鋪名稱、商品價格、商品銷量的數據,保存文件為taobao.xls,為本項目的數據分析做好準備。
學生通過學習、交流、探究和實踐,借助學習資源,體驗安裝第三方庫、利用第三方庫繪制正弦函數,體驗搭建本地Web服務器,運行爬蟲程序采集本地服務器數據,修改爬蟲程序代碼采集網絡數據。程序和繪制結果如圖2、圖3所示。

圖2

圖3
通過查找資料、學習和交流,了解數據存儲的方式、數據保護的方法和意義。
教師提供數據的存儲和保護基本操作微課,引導學生了解數據存儲的方式、數據保護的方法和意義。
學生通過學習、交流、探究和實踐,借助學習資源,結合本組選題,創建數據庫,利用程序發現和處理缺失值、處理異常數據、繪制直方圖,觀察數據的分布特征。
介紹本課使用的在線詞云圖繪制的網站“易詞云”(https://www.yciyun.com/)的功能,詳細展示詞云圖制作的步驟(選擇模板、導入數據、選擇字體、調整背景、生成詞云等),學生動手操作。
講解Python語言生成詞云圖的方法和具體步驟,并對代碼部分進行詳細分析。通過Python詞云圖代碼,演示Python編程的編輯和運行過程,讓學生上機操作,利用Python語言生成詞云圖。
本文通過項目式學習讓學生了解了數據的處理和可視化表達,利用書本上的例子,逐一進行探究。由于對Python編程不熟練,教學中出現了一些問題,如過程不是很連貫、項目的實施不是很充分、最后對項目缺乏有效的評價等。學生對Python編程學習還是有難度的,僅僅利用上課時間來學習是不夠的,在以后的教學中,教師應該進一步深化對項目式學習的理解和探究,多積累項目式學習的實踐經驗。