

摘" 要:對于加權平均數,要理解其在大數據背景下的統計意義;要通過問題引導,結合典型案例,在數據分析過程中形成概念、辨析概念、應用概念,發展數據觀念.
關鍵詞:加權平均數;統計理解;概念形成
上海市徐匯中學朱元苑老師(以下統稱“執教教師”)執教的“加權平均數”一課,是初中統計概率教學中的一節比較典型的課例. 在本節課中,執教教師關注加權平均數概念的形成過程,通過設計問題與情境,從孕育“權”,感知“權”到明晰“權”,層層遞進,引導學生形成概念;結合解決實際生活情境中的典型問題,通過學生的討論交流,推動他們理解“加權平均數”的意義和作用,從而發展學生的數據分析觀念. 這節課給筆者留下了深刻印象,也引發筆者對統計概率內容教學的思考.
一、對“加權平均數”的內容理解
統計是一種對社會現象中數量資料的搜集、整理、分析和解釋,并據此作出推斷、預測的調查研究活動;統計學是一門收集、分析、表述和解釋數據的科學. 在統計中,我們常用平均數、中位數、眾數刻畫一組數據的集中趨勢,用極差、方差、標準差刻畫一組數據的離散程度,用四分位數、百分位數刻畫一組數據的位置特征. 這些“數字特征數”,可能在這組數據中,也可能是這組數據生成的“新”數據,它們反映了這組數據的集中趨勢、離散程度、位置信息等.
在平均數、中位數、眾數等描述數據的集中趨勢的統計量中,用平均數作為一組數據的代表,比較可靠和穩定,但平均數計算時比較煩瑣,并且容易受到極端數據的影響. 用中位數作為一組數據的代表,不受極端數據的影響,并且求法簡便,中位數還是一種特殊的百分位數,是一個反映數據集中趨勢的位置的代表值. 眾數利用了出現次數最多的數據的信息,但并未告訴我們它比其他數據多的程度,能傳遞數據的信息較少,對極端數據也不敏感.
平均數包括算術平均數、幾何平均數、調和平均數、加權平均數、平方平均數、指數平均數等. 我們通常意義所說的平均數,一般是指算術平均數,也就是一組數據的和除以這組數據的個數所得的商,即 [An=a1+a2+…+ann.] 平均數直觀、簡明,它與這組數據中的每一個數據都有關系,對這組數據所包含的信息的反映最為充分,可以反映一組數據取值的平均水平,也可以用于不同組數據的比較,是刻畫數據集中趨勢最常用的統計量.
加權平均數通常是指加權算術平均數,是根據分組數據計算的平均數,也稱加權均值. 目前,各個版本的初中數學教材中,對于加權平均數,特別是權或權數的定義,并不完全相同,有的教材將權或權數定義為一組數據中各個不同數據出現的頻數,有的教材中將權定義為一組數據中各個不同數據的頻數占總數據個數的比例.
在《中國大百科全書》(第二版)中,是這樣定義加權平均數的:
設原始數據被分成k組,各組數據的組中值分別用[M1,M2,…,Mk]表示,各組變量值出現的頻數分別用[f1,f2,…,fk]表示,則總體均值的計算公式為:
[μ=M1f1+M2f2+…+Mkfkf1+f2+…+fk=i=1kMifiN].
其中,[N=f1+f2+…+fk],即總體數據的個數.
實際上,權可以有不同的表現形式,可以是頻次,可以是比例,也可以是百分比或不同數據頻次的比,其中各個不同數據占總數據的比例可以看成是這些數據的標準化權數.
我們現在處于大數據時代,海量數據的傳輸和存儲都需要非常大的成本,在進行數據分析時,如何減少數據的傳輸和存儲是人們關心的問題. 在統計中,經常遇到要分布式計算平均數的問題. 例如,假設知道兩家網站的用戶日人均上網時間分別為[a]小時和[b]小時,基于這些信息不可能知道所有用戶的日人均上網時間. 如果還知道這兩家網站平均每天上網人數分別為[m]和[n,] 那么就可以用[a]和[b]的加權平均數[ma+nbm+n]得到兩家網站用戶的日人均上網時間. 在數據量大時,這樣的計算,在形式上是加權平均,在程式上是分別計算,是分布式計算的最簡單形式,是大數據計算的熱門算法,可以大大節省數據的傳輸和存儲成本,這也體現了加權平均數的統計意義.
二、結合典型案例,重視概念形成過程,發展數據觀念
統計教學的核心是發展學生的數據觀念. 對于數據觀念,《義務教育數學課程標準(2022年版)》中指出:“數據觀念主要是指對數據的意義和隨機性有比較清晰的認識. 知道數據蘊含著信息,需要根據問題的背景和所要研究的問題確定數據收集、整理和分析的方法;知道可以用定量的方法描述隨機現象的變化趨勢及隨機事件發生的可能性大小. 形成數據觀念有助于理解和表達生活中隨機現象發生的規律,感知大數據時代數據分析的重要性,養成重證據、講道理的科學態度.”數據觀念不是簡單的讓學生會畫一些統計圖表,會計算一些數字特征就能養成的,要結合典型的統計案例,讓學生經歷數據的收集、整理、描述、分析的過程,在解決統計問題的過程中理解概念,逐步形成數據觀念.
本節“加權平均數”一課,是一節統計的概念課. 執教教師的整體教學設計清晰,圍繞加權平均數的概念,設計了概念形成、概念辨析、概念應用、交流小結等階段.
在“概念形成”階段,圍繞“求平均身高問題”,讓學生經歷了如下過程.
孕育權:提出求全班學生平均身高的問題,復習算術平均數的改變,引發學生的已有認知與實際情況的沖突,為后續的思考與探究打下基礎.
感知權:將學生人數從無到有,感受男生、女生人數對平均身高的影響;再將學生人數從有到變,從全班學生平均身高,到全年級學生平均身高,再到全校學生平均身高,讓學生感知權的存在,以及影響權的要素.
明晰權:回顧前面求學生平均身高的問題,從數學角度觀察學生人數之比對平均數的影響力,感受權的意義. 在此基礎上,從特殊到一般,歸納加權平均數的特征,給出加權平均數的概念.
概念形成后,圍繞“青少年視力保護”問題進行概念辨析. 問題1是學生初步運用加權平均數,同時通過估值活動檢測學生對概念的理解,是否明晰數據的“權”是體現這個數據對平均數影響力大小的量;問題2的數據以百分數的形式呈現,引導學生體會數據的不同形式,通過學生之間對錯誤列式的辨析,理解錯誤緣由,加深對概念的理解.
在“概念應用”部分,通過“計算射擊環數”的問題3,在多個數據的情況下,引導學生體會每一個“數據”和“權”對平均數結果的影響,初步建立理性的數據觀;問題4是“招聘網絡維護員”問題,通過學生的交流討論,激發學生思考量化數據“重要程度”的方法,體會權的不同形式,感受實際問題中可以通過給數據“賦權”,體現每個數據對平均數的影響力,體驗加權平均數的意義和作用,初步建立統計觀念.
上述“概念形成”“概念辨析”“概念應用”的設計,從感性到理性,從特殊到一般,環環相扣,步步深入,體現了概念教學的基本過程. 每一個階段都圍繞典型案例展開,讓學生在解決問題的過程中,不僅掌握加權平均數的計算方法,體會權的不同形式,更重要的是體會了加權平均數的統計意義,培養了學生的數據分析觀念.
三、重視問題引導,加強過程探究,積累數學活動經驗
問題是數學的心臟. 數學核心素養是在學生與情境、問題的有效互動中發展的. 在教學中,教師應結合教學任務及其蘊含的數學核心素養,以問題引導學習,通過設計切合學生實際的情境和問題,引導學生用數學的眼光去觀察、想象、發現問題;使用恰當的數學語言、模型描述問題;用數學的思想、方法解決問題. 在學習知識、解決問題的全過程中,理解數學內容的本質,促進數學核心素養的發展.
例如,在加權平均數的“概念形成”階段,執教教師提出了以下系列問題.
缺少人數的問題:已知某班級男生的平均身高為170 cm,女生的平均身高為160 cm. 能否計算出全班學生的平均身高?
添加人數的問題:在不計算的前提下,你能大致估計全班學生的平均身高嗎?平均身高的計算結果是否符合估計值?它和人數的多少有關嗎?
同比例擴大人數的問題:三種情況下平均數相同,你有什么發現?影響因素在平均數列式中如何體現?你能清晰說明平均身高為什么都是166 cm嗎?
加權平均數的形式化定義:從上面解決問題的過程獲得啟發,一般情況下如何定義加權平均數?
上述過程,通過控制“人數”這個變量,教師提出層層遞進的問題串,從孕育權,到感知權,到明晰權,進而得到加權平均數的概念. 這一過程充分體現了“問題性”. 教師在引導學生解決典型的統計案例的過程中,通過對學生提出恰當的、對學生數學思維有適度啟發的問題,引導學生的思考和探索活動,使他們經歷觀察、猜想、推理、交流、反思等理性思維的基本過程,體會數學研究方法,積累數學活動經驗,提升了發現問題和提出問題的能力.
四、本節課可以進一步提升的地方
本節課中,執教教師重視教學任務設計,在分析學生的學習起點的基礎上,基于目標導向學習終點的要求將目標分解為學習進階,通過學生的認知線索創設恰當的情境,設計問題串引導學生開展實質性數學思考,設計系列化的活動引導學生開展獨立思考、自主探究、合作交流,讓學生經歷數學知識的產生、發展、應用的過程,從而使課堂教學能夠切實指向學生,促進學生的思維發展,發展學生的數據觀念. 但本節課也還有可以進一步提升的地方.
一是可以讓學生進一步理解加權平均數的統計意義,特別是在大數據時代背景下加權平均所體現的分布式算法的統計意義. 在本節課中,涉及了多個實際案例,包括“求平均身高問題”“青少年視力保護”“計算射擊環數”“招聘網絡維護員”等,但是計算總體數據的加權平均數的案例居多,涉及大數據計算的就是“青少年視力保護”這個案例. 另外,在解決“青少年視力保護”這個案例的過程中,教師的重點在于對加權平均數概念的辨析,在于明晰權的大小是影響數據的平均數的大小的量,辨析數據和權的不同形式. 實際上,還可以結合這個案例,向學生點明在大數據背景下,計算加權平均和分布式計算的聯系,從而讓學生更好地體會這種算法在大數據時代的作用;也可以提供其他案例,用樣本的加權平均估計總體的加權平均,體現樣本估計總體的思想,讓學生對于加權平均數,不僅會算,即達到算法理解;還要理解其概念,即達到概念理解;更重要的是理解其統計意義,即達到統計理解.
二是進一步加強開放性,在開放的問題解決中讓學生應用概念. 例如,在本節課“概念應用”階段,在解決“招聘網絡維護員”的問題時,執教教師開始只給出了三位候選人創新能力、計算機能力、溝通能力的測試成績,讓學生討論應該招聘誰的問題. 學生經過討論,提出了不同的選擇方案. 這時教師再給出四種不同的“賦權”方式,讓學生通過計算加權平均數,選擇候選人. 實際上,在教師給出四種“賦權”方式之前,學生已經通過討論,有了不同的想法,這時教師可以更開放一些,可以讓學生按照自己的想法賦權,通過計算加權平均數得出不同的選擇. 這樣處理,可以更好地激發學生思考量化數據“重要程度”的方法,感受實際問題中可以通過給數據“賦權”,體現每個數據對平均數的影響,體會賦權需要多方面的考量,才能體現合理性和公正性等,從而進一步建立理性的數據觀,用數據解釋問題,彰顯學習加權平均數的價值.
參考文獻:
[1]中國大百科全書數據庫[DB/OL]. https://h.bkzx.cn/item/234391.
[2]中國大百科全書數據庫[DB/OL]. https://h.bkzx.cn/item/210758.
[3]P R HALMOS. 數學的心臟[J]. 彌靜,譯. 數學通報,1982(4):27-30.