王 鳴,薛 艷
(南京信息工程大學 環境科學與工程學院 江蘇省大氣環境與裝備技術協同創新中心 江蘇省大氣環境監測與污染控制高技術研究重點實驗室,江蘇 南京 210044)
環境科學是一門新興的研究和解決環境問題的綜合應用型學科,涉及內容廣泛[1]。對環境問題的分析離不開實驗研究和定量分析,因此系統學習數據分析與實驗設計相關的理論知識和方法體系能夠培養環境科學專業學生的量化思維和實踐能力。我校為環境科學專業本科生開設了“數據分析與實驗設計”課程,但以往的教學效果顯示,學生對課程內容掌握情況不理想,未達到課程教學目標。未能全面考慮環境科學專業的特點及學生的實際需求,未能將理論與實踐緊密聯系是導致這一問題的重要原因[2]。為此,結合環境科學專業特點,在“數據分析與實驗設計”課程教學內容、教學方法和考核方式等方面進行改革探討,旨在加大案例式教學和實踐性教學力度,激發學生學習熱情和興趣,提升學生理論聯系實踐、解決實際問題的能力。
“數據分析與實驗設計”課程設計的初衷是,培養學生應用數理統計相關知識開展環境科學實驗研究和進行數據分析的能力。以往授課教師為數學專業教師,教學內容與傳統數理統計課程接近,側重理論知識和數理方法。學生普遍反映課程內容抽象難懂、理論性強、掌握難度大,而且理論與實踐沒能有機結合,學生不知如何聯系環境科學實際,從而失去學習興趣,具體體現在如下方面:
(1)數學理論所占比例過高。概念抽象,數學公式及推導過程復雜,非數學專業學生理解和掌握難度大。
(2)方法應用和軟件技能培訓薄弱。文字性理論闡述過多,統計方法適用條件、優缺點比較等側重應用的介紹較少,缺少對統計軟件的講授。
(3)教學與實踐結合不緊密。教學過程中未能將理論知識和方法與環境科學專業的實際需求有機融合,導致課程結束后,學生不知如何用所學知識解決實際問題。
上述問題說明,以往的教學未達到“實驗設計與數據分析”課程預期教學效果,與開設該課程的初衷“強調應用,弱化數學理論”不符。為了提高環境科學專業學生學習數理統計的積極性,培養學生利用相關理論知識分析、解決環境問題的能力,對課程教學進行改革勢在必行。
針對數理統計教學中普遍存在的“重理論,輕方法”“重闡述,輕軟件”和“重傳授,輕實踐”等問題[3-4],結合環境科學專業特點,提出了以“應用+實踐”為導向,理論教學與實踐教學并重的教學模式[5]。總體思路是,由環境專業教師替代數學專業教師進行授課,在講授數理統計相關理論和方法的過程中,用具體環境問題作為案例,并結合環境科研項目進行實踐教學。
在教學內容上,弱化數學理論和公式推導,課時占比由約70%降至30%~40%;強調應用,注重方法應用條件和優缺點比較講授,并在教學過程引入大量案例和練習,課時占比為30%~40%;增加利用Excel、SPSS、Igor Pro 等軟件進行數據分析和實驗設計的技能性培訓和練習,課時占比約為10%~20%;另外,增加基于環境領域科研項目的實踐教學,課時占比為10%~20%。
在教學方法上,一方面在課堂教學過程中加強課內互動,以環境科學領域具體案例為切入點,引導學生選用正確方法解決實際問題,引入軟件操作練習,指導學生用軟件實現參數估計、大小比較、相關性等數理統計分析;另一方面,結合科研項目,開展任務驅動的實踐教學,以小組為單位完成具體的實驗設計和數據分析任務,并以PPT 匯報和論文形式進行呈現。
在考核方式上,改變以往以書面考試為主方式,將書面考試分數在總成績中的占比由100%降為60%,增加對課堂案例討論和科研項目實踐練習的考核,在總成績中的占比分別為10%和30%。
通過實踐教學,使學生加深對課程重要知識點的理解和掌握,培養數理統計思維,正確應用數理統計方法分析環境數據,開發專業潛能,提升創新意識和解決實際問題的能力。通過具體的案例分析,使學生將數理統計理論和方法融會貫通,強化對采樣方法、數據預處理、概率分布、假設檢驗、相關分析等核心內容的理解和應用,并掌握利用軟件實現統計分析的具體方法和操作步驟。
在“數據分析與實驗設計”理論課程基礎上,以國家自然科學基金項目“長三角地區大氣羰基化合物化學轉化和來源量化研究”為案例,設計了如下實踐教學內容。
3.2.1 采樣方案設計
大氣羰基化合物采樣方案的設計,主要考查學生對于如何獲取代表性樣本和抽樣方案等知識的理解和掌握。獲得有代表性的數據,是基于有限樣本資料推斷總體特征統計分析的基礎。在樣本量確定的情況下,抽樣方法是影響樣本代表性的重要因素。常用的抽樣方法包括系統抽樣、隨機抽樣、系統-隨機抽樣和多層次抽樣[6]。在本案例中,大氣羰基化合物采用2,4-二硝基苯肼(DNPH)衍生化法進行采集,采用高壓液相色譜(HPLC)技術進行實驗室分析[7-8],由于采樣和分析成本較高,綜合考慮將總樣本量控制在400 以內。由于A 城市的功能區劃中包含城區(住宅和商業為主)、工業區和清潔背景區,為了確保樣本的空間代表性,采用多層次抽樣方法,設置城區、工業區和清潔背景區3 個采樣站點,每個站點的觀測結果構成一個子系統。考慮到大氣羰基化合物濃度的時間變化特征,為保證樣本的時間代表性,在每個站點采用系統-隨機抽樣方法進行樣本采集。首先按照系統抽樣的思路,劃分春、夏、秋、冬4 個季節,然后在每個季節中隨機選取5 天(隨機抽樣)進行樣本采集。在采樣當天,按照系統抽樣思路,每間隔4 h 采一個樣。
通過采樣方案設計這一實踐訓練,一方面能夠使學生對抽樣方法有更加直觀的認識,加深對多層次抽樣、系統抽樣和隨機抽樣的原理、步驟、適用范圍和方法及其差異的理解和掌握;另一方面通過抽樣方法的靈活運用,培養學生的創新性思維,為學生獨立開展環境科學實驗打下基礎。
3.2.2 概率分布擬合分析
引入具有繪圖功能的統計軟件,并設計可視化的直觀教學案例,能夠提升教學的趣味性和實用性[9]。數據分布能夠反映總體的綜合特征,而數據分布特征是影響統計方法選擇的重要因素。在本案例中,利用Igor Pro 軟件中的Histogram 函數進行頻數分布特征分析[10]。以工業區站點甲醛濃度為例,其頻數分布如圖1 中灰色陰影所示。進一步利用正態分布和對數正態分布這兩種理論分布模型,對其進行概率分布擬合分析。從擬合結果來看,對數正態分布能夠更好地反映大氣羰基化合物的濃度分布特征。

圖1 工業區站點甲醛濃度頻數分布圖
這項實踐內容可以使學生加深對總體分布特征、正態分布、對數正態分布等知識點的理解和掌握,并且能夠自主利用軟件實現概率分布擬合分析,有利于調動學生的積極性,使學生直觀感受到數據分析的現實性和實用性。
3.2.3 異常值檢驗
通過概率分布擬合分析,發現工業區站點甲醛濃度頻數分布接近對數正態分布,因此將數據先進行正態變換,變換公式為X’=ln(X)。式中,X 為大氣羰基化合物原始觀測濃度,X’為取自然對數之后的濃度。然后進行假設檢驗,顯著性水平α 確定為0.05。統計假設的原假設H0為可疑值但不是異常值,對立假設H1為可疑值且為異常值。首先將最極端的數值(即最大值和最小值)作為可疑值開始檢驗。利用Excel 軟件中NORM.DIST 函數計算出最大值、最小值的相伴概率p[11],分別為0.011 和0.046,小于0.05,因此拒絕原假設,即在0.05 顯著性水平下,最大值和最小值為異常值;進一步檢驗次大值和次小值,其相伴概率分別為0.032 和0.107,次大值相伴概率仍小于0.05,認為其為異常值,而次小值相伴概率大于0.05,接受原假設,認為其不是異常值;繼續檢驗第三大值,其相伴概率為0.068,大于0.05,認為其不是異常值。
異常值檢驗不僅能讓學生練習數據預處理、異常值檢驗和相伴概率計算的具體步驟,而且能加深對假設檢驗的一般步驟、統計假設、顯著性水平等知識點的掌握、理解和應用。
3.2.4 總體大小比較
為了使學生理解并掌握總體大小比較方法及其選擇依據,設計了如下練習題目:判斷城區和工業區站點羰基化合物濃度是否存在明顯差異。
考慮到羰基化合物濃度符合對數正態分布,能夠進行正態變換,因此在進行總體大小比較方法選擇時,優先選擇檢驗功效更高的參數檢驗方法,即t 檢驗。另外,使在兩個站點的相同時刻采集的樣本構成一一對應的個體,采用成對數據t 檢驗進行大小比較。統計假設的原假設H0為城區站點和工業區站點甲醛濃度不存在明顯差異,對立假設H1為兩站點甲醛濃度存在明顯差異。顯著性水平確定為0.05。利用Igor Pro 軟件中Analysis—Statistics—Two Sample Test 來實現對成對數據的t 檢驗[10]。檢驗結果顯示,檢驗統計量t所對應的相伴概率為0.008,小于0.05,因此拒絕原假設,即認為在0.05 的顯著性水平下,兩站點甲醛濃度存在顯著差異。
3.2.5 相關分析
分析以往教學中相關分析的統計假設和方法選擇考試出錯率較高的問題,設計了如下練習內容:為初步判斷大氣羰基化合物的來源,探討工業區站點甲醛和乙醛濃度是否具有共變關系[7-8]。
羰基化合物濃度數據可以進行對數正態變換,故選用參數檢驗方法(Pearson 相關系數法)進行相關分析,以充分利用數據信息,提高檢驗功效。統計假設中H0為甲醛和乙醛濃度不相關,H1為二者顯著相關。利用SPSS 軟件實現Pearson 相關分析,具體步驟為“分析—相關—雙變量—Pearson 相關系數”[12]。檢驗結果顯示,Pearson 相關系數r 為0.941,在0.01 水平上顯著相關,因此作出甲醛和乙醛濃度具有顯著共變關系這一判斷。
在這一實踐教學案例中,設計了針對課程6 大類理論知識,共20 個重要知識點的練習,覆蓋課程教學大綱中約70%的內容,詳見表1。另外,在實踐教學中,指導學生使用了3 個常用的數據分析軟件,掌握了9 項重要的軟件使用技能。

表1 實踐教學案例中涉及的主要知識點及技能練習
學生在這一實踐過程中,通過對實際環境數據進行統計分析,加深了對數理統計理論、方法的掌握,提高了應用能力,并對環境數據分析有了更加直觀的認識,大大提升了學習興趣。
針對環境科學專業特點和學生需求,探討了“數據分析與實驗設計”課程的教學模式改革,提出以實用性為核心,理論與實踐并重的教學模式。在新的教學模式中,弱化理論推導,加強案例討論,增加軟件使用等技能練習,并結合環境科研項目設計了實踐教學方案。這不僅使學生提高了分析解決問題的能力,而且挖掘了專業潛能,增強了創新意識和綜合素質。