林晴嵐 鄭達藝 陳柳娟
(福建教育學院數學教育研究所,福建 福州 350025)
數據分析是大數據時代的特色,其核心是通過對數據的分析探索事物發展,深入了解事物的發展特性和規律,促進人們提升科學合理處理問題和解決問題能力.《普通高中數學課程標準(2017 年版2020 年修訂)》課程內容與時俱進,將傳統數學基礎知識和時代特色的數學應用相結合,優化了原有高中數學課程內容,結合時代發展新趨勢提出了把“數據分析”作為高中數學核心素養.同時,科學設置課程相關內容,把培養學生數據分析素養的目標要求融入課程目標要求中,以“主線—主題—單元—核心內容”四層次設置課程內容的相關系列,并根據學生選擇高中畢業和參加高考兩種不同目標設置培養要求,分別設計課程內容.
《普通高中數學課程標準(2017 年版2020 年修訂)》中概率與統計主線的課程優化后重組統計單元核心內容有:基本概念(總體、樣本);“數據分析”全過程(即學習收集數據、能描述與刻畫數據、會科學地提取信息、利用信息說明問題,領會統計思想與方法);掌握成對數據相關性、回歸分析、獨立性檢測這幾個解決統計基本問題的手段.[1]課程內容以主線—主題—單元—核心內容設置為必修學習內容和選擇性必修學習內容,分別對應學生高中畢業和參加數學高考兩種不同學業質量水平培養要求.
必修課程學習要求是應達到高中數學學業質量水平一的標準,學習內容是:在具體的實例中,了解事件的總體、樣本、樣本量的概念,知道獲得數據的基本途徑有哪些,認識收集數據所具有的隨機性,領會抽樣的樣本必須要與總體同性質分布,知道根據實際問題特點合理選擇抽樣方法如簡單隨機抽樣、分層隨機抽樣等,明確抽樣的意義在于用樣本的平均數、中位數、眾數來估計總體的集中趨勢,以及用樣本的標準差、方差、極差估計總體的離散程度、取值規律,體會統計思維與數學確定性思維的差異;[2]了解百分位數的統計含義,學習用統計圖表對收集的數據進行可視化描述,感受統計圖表的合理使用的重要意義.這部分內容是數學學業水平合格性考試命題的重要依據.
選擇性必修學習要求是要達到數學學業質量水平二的標準,學習內容是:相關的統計軟件;以具體實例借助有效樣本分析,了解樣本相關系數的統計含義,領悟樣本相關系數與標準化數據向量夾角的關系,學會利用成對數據統計相關性解決簡單實際問題;在了解一元線性回歸模型的含義和最小二乘法原理的基礎上,領會模型參數的統計意義,學習用一元線性回歸模型參數的最小二乘估計方法研究變量之間的隨機關系,能結合實際問題對總體進行預測;在理解2×2 列聯表的統計意義與其獨立性檢驗特征的基礎上,學習應用2×2 列聯表來解決獨立性檢驗的簡單實際問題的方法,體會歸納推理與演繹推理的差異.這部分內容是數學高考命題的重要依據.
一是增加了百分位數,百分位數作為數據分析中的常見量,在對數據采集、整理、統計、分析等過程中百分位數應用突顯現出它的重要性.大數據時代發展的需要學生掌握并能正確用好這一個常見量.二是減少了原有課程內容的系統抽樣、統計案例.意在明確“數據分析”主要是借助計算機與數據這兩個重要技術和資源載體對隨機數據進行分析處理,提高學生對技術和資源的掌握與使用要求.
基礎教育數學課程中概率與統計主線學習內容整體設置是以提升學生的分辨能力為主要目的.正確認識統計問題是可采用不同的方法收集數據,不同的數據蘊含的信息是有所區別的,理解根據現實問題用數學模型對不同方法收集的數據進行分析,會得到不同的推斷結果,推斷結果的準則是“好與壞”.領悟統計思維既有嚴謹性和準確性,又有數學特有的藝術特色.
首先,明確統計的研究對象是數據,數據作為信息的載體,數據包含數字型數據和非數字型數據,統計的研究核心是數據分析,數據的有效、科學和較為精確的獲取是數據分析的前提,統計最基本的思想是用樣本推斷總體.為此,要掌握數據收集的科學方式和技術手段,以確保數據的精確和可信,學習統計估計的推斷方法,培養學生會用統計的眼光觀察世界.其次,明確統計單元教學的重點是圍繞三個基本問題開展:第一是認識研究對象的總體與樣本,明確總體就是統計要研究的對象,了解總體的分布狀況,以及樣本與總體的關系,會用簡單隨機抽樣、分層隨機抽樣等方式抽取樣本,正確認識樣本的隨機性特性,明確樣本作為揭示總體規律的手段,把握樣本抽取的原則是樣本分布必須符合總體的分布規律;第二是以具體實例開展數據分析全過程活動,即通過收集有效數據→對數據描述、刻畫→提取信息→利用信息分析→解決實際問題→歸納總結統計思想和方法,從活動過程中感受“數據”是數據分析的基礎,而整理收集的數據是有效進行數據分析的基礎,基于現實生活的情景出發,利用統計知識和方法,構建統計模型,獲得結論形成知識,達到解決問題的目的,體會數據分析就是一個透過數據探索客觀事物本質和規律的過程;第三是掌握用成對數據相關性、回歸分析、獨立性檢測這些統計的基本方法,精確研究的隨機現象的特性和內在規律,從中獲得更精準地服務于科學發現、技術創新和管理決策.
必修部分內容教學是圍繞著總體與樣本核心概念展開的,總體是統計研究的對象,樣本是貫揭示總體規律的手段.這部分教學要幫助學生達到數學學業質量水平一的要求,教學思路:一是引導學生學會對生活中的具體問題開展研究.知道獲取有效數據的基本途徑,掌握有效收集數據的方法,會合理使用樣本數據蘊含的信息,了解數據的隨機性.二是掌握繪制統計圖表的方法,能結合獲取的數據和實際情況合理使用統計圖表,體會用圖表可視化表達數據具有的獨特性.三是掌握用樣本數據提取需要的數字特征方法,理解用樣本估計總體的統計規律.整體思路是通過對真實問題的研究,讓學生經歷數據處理全過程,學會有效進行數據收集和整理,掌握用刻畫數據統計特征的方法,體會“數據”既有隨機的一面,又有對決策性確定的一面,更好地認識數據影響人們在實際生活中對事物進行科學決策的必要性和可能性.
教學案例:某市政府為了實現綠色發展,提出對居民用電采用階梯電價收費的建議,應該如何合理確定階梯電價中的電量臨界值?
提出問題1:如何科學掌握該市全部居民住戶全年每月用電總體情況?
建議:可以選擇全市所有住戶全年每月的每戶用電量進行研究,也可以通過選取該市有代表性區域住戶全年每月用電量進行研究.明確統計的總體是要研究全市所有住戶全年每月的每戶用電量,抽取樣本應具有與總體相同規律,利用從樣本獲得的規律來估計總體的規律,達到解決相應的實際問題目的.
提出問題2:如何獲取有效居民住戶用電量的樣本數據?該樣本數據應具有怎樣的特點?
建議:可以選擇該市一個有代表性的居民生活區為樣本,以該小區居民住戶某月用電量為樣本.還可以借助技術軟件,科學有效收集該市有代表性小區的居民住戶某月用電量數據,如以6 月用電中高峰期的每戶居民用電量數據為樣本.通過對收集樣本數據分析,尋找樣本數據中蘊含的信息.需要注意的是,由于樣本存在的隨機性,這樣的估計可能會存在一定的誤差,但這樣的誤差一般不會影響我們對總體分布情況的大致了解.
提出問題3:如何合理確定階梯電價中的電量臨界值?
建議:科學合理的取樣設計才能使樣本數據達到相對精確度和可信度.可以選擇電價第一階梯電價的受眾面占75%,第二階梯電價的受眾面占20%,第三階梯電價的受眾面占5%.以此,估計該市全部居民住戶全年每月用電量總體分布情況,為政府確定合理階梯電價決策選擇提供有力支持.
該例借助生活中的具體問題研究,讓學生學會面對的統計問題,可以通過主動收集與被動收集等不同方式獲得數據,能針對不同的問題特征有效的抽樣方法獲取所需樣本數據,會在隨機抽樣獲得觀測數據的基礎上,選擇或者創建更合理的方法對數據進行整理,能充分利用有效的數據信息通過數據分析,找出數據中蘊含的信息,選擇適當的表達描述數據方式,并用這些數據分析結果進行解決實際問題.學生通過此問題研究,經歷較為系統的“數據分析”全過程,掌握數據分析的基本操作要領,體會統計思維與確定性的數學思維的差異、歸納推斷與演繹證明的差異,[1]提升科學有效運用所學知識、方法解決實際問題的能力.
選擇性必修部分教學是在學生學習了統計必修課程內容后,在達到數學學業質量水平一標準要求的基礎上,進一步提高解決統計相關問題的深度、廣度、精確度和可信度,從而達到數學學業質量水平二的檢測標準要求.課程內容整體設置成圍繞統計的幾個基本問題(成對數據的統計相關性、一元線性回歸模型、獨立性檢驗)自然地將有效收集數據、利用數據提取信息、構建數學模型,進行數據分析整體過程有機融合展開研究.教學思路:一是通過對子女的身高與父親身高之間的關系、糧食畝產量與施肥量之間的關系等一系列具體案例,讓學生感受到在現實中大量存在相關關系和研究變量之間相關關系的必要性,把握用成對樣本數據呈現的統計相關性研究兩個數值變量的相關性的原則,深化學生對變量之間相關關系概念的理解,體會現實世界里這些不確定性關系也是常見的一種關系,理解樣本相關系數的統計含義,掌握用條形圖、直方圖、散點圖對數據統計描述和刻畫的常規手段;[3]二是基于在觀察子女的身高與父親身高得到的成對樣本數據刻畫的散點圖基礎上,理解一元線性回歸模型的變量關系特征,掌握利用一元線性回歸模型與最小二乘法的原理相結合解釋和對事物的發展變化進行有效預測的方法,體會統計模型關注的是統計規律,正確理解隨機誤差,以及統計模型與函數模型差異,[3]能使用統計軟件實現回歸分析;三是通過問題,如新藥對治療某疾病是否明顯有效、不同學校某學科教學質量是否有明顯差別等具體問題,引導學生利用2×2 列聯表和應用獨立性檢驗解決現實具體問題,體會統計思想,掌握檢驗兩個隨機變量的獨立性的方法,理解統計思維與確定性思維之間的差異,培養學生聯系實際的意識和數據處理能力,提高學生綜合手段解決實際問題的能力.
以概率與統計主線的視角,把握好統計單元的教學,從更高的觀點理解統計單元所包含的知識、概念本質,通過實際案例教學研究分析活動,不斷積累實踐經驗,把握數學知識技能與數學核心素養之間的關聯,養成在課堂教學過程中把知識技能的評價與核心素養達成狀況的評價有機融合自覺行動,增強信息技術與數學課程深度融合自覺行動,提升數學教育研究能力.
概率與統計主線是培育學生基于數據的統計眼光、分析意識、洞察能力、活動經驗、交流能力、思維品質,綜合體現了數學核心素養之一“數據分析”的育人價值.學生通過統計主題課程內容的學習和參與數據分析的實踐活動,一是對“數據”產生了興趣.有了主動獲取數據的意識,會用有效的、科學的和較為精確的技術手段采集數據、整理數據,正確認識到數據分析的基礎是“數據”,且“數據”作為信息的載體有著豐富的呈現形式.二是有能力讓數據說話.認識到正確的“分析”是基于有效收集數據、整理數據,會用統計模型對數據進行有效推斷,能通過數據思維去洞察事物的本質,尋求問題的解決的途徑,會用統計的思維去分析客觀世界的變化和發展,形成通過數據探索客觀事物本質和認識事物內在規律性的思維品質.三是積累基于數據分析的全過程活動經驗.從活動中領悟到“數據分析”作為刻畫隨機現象統計規律性的語言,為許多學科探索其變化和發展的規律性提供了觀念、方法和工具,認識數據分析是認知客觀世界的基本思想和數學方法,以及隨著科學技術的不斷發展創新出了新的數據分析技術,領會了用數據分析的思想和方法建立發現事物特征和規律的歸納思維策略,提升適應時代社會發展所必備的可持續發展的學習、觀察、思考、研究能力和眼光.