華北理工大學外國語學院 秦學鋒 吳 艷 呂 黛
?
語塊對英語寫作影響的效應量研究
華北理工大學外國語學院 秦學鋒 吳 艷 呂 黛
摘 要:基于假設檢驗的統計分析只能回答研究效應是否存在。效應量是評價研究效果真實大小和意義的統計指標。本文在8個語塊對英語寫作影響的研究結果基礎上,通過計算效應量,分析、解釋每個研究的效應量大小和實際意義。效應量在外語研究中的使用有利于科學評價研究的真實效果。
關鍵詞:效應量 實際意義 語塊 英語寫作
近年來,語塊在提高英語學習者寫作中的作用引起了國內外語教師和研究者的重視。一些學者圍繞語塊對英語寫作的影響開展了實證研究,結果顯示使用語塊能夠促進語言表達的流利性、準確性和得體性,從而有效提高學習者的外語寫作水平。然而,這些研究結果主要依據了假設檢驗的統計學顯著性結果。由于假設檢驗的顯著性結果受樣本大小的影響較大,其結果達到統計學意義上的顯著性(statistical significance),并不能代表實際效果的顯著性(practical significance)。對此,國內外學者提出,在運用假設檢驗的基礎上,單個實證研究必須計算、報道研究結果的效應量(effect sizes,es),為評估研究效果的真實效應大小提供科學依據。
通過分析國內語塊對英語寫作影響的實證研究文獻發現,國內學者的研究結果中尚沒有對效應量的計算和報道。因此,本文將以國內語塊對英語寫作影響的實證研究為例,在所報道的數據基礎上進一步計算,呈現研究結果的效應量,以期引起國內外語教學研究領域對效應量的重視,從而為運用元分析方法綜合評價語塊對英語寫作影響的實際效果提供數據支持。
假設檢驗只能幫助回答“研究效果是否存在”這一問題,并不能回答“研究效果有多大”。研究者認為,當統計結果的概率小于設定的顯著性水平(如α=.05),即達到統計學意義上的顯著性時,得出拒絕原假設而接受被擇假設的結論,從而認為研究效果具有顯著性。然而,這一結論僅表示研究效果存在,并不能回答研究效果有多大,是否在教育學、心理學或特定研究領域中具有實際意義不得而知。換句話說,假設檢驗結果達到統計學意義并不代表研究結果具有實際意義。相反,假設檢驗結果沒有統計學意義,也并不代表不具有實際意義。兩者的真實含義通常容易被混淆。
受樣本大小的影響較大,假設檢驗結果中存在兩種現象:一是在研究樣本較大的情況下,即使微小的差別或關系也能呈現出統計學上的顯著性,但其實際意義可能并不大;二是如果研究樣本太小,即使存在較大的差別或關系也無法呈現出統計學上的顯著性,而現實中研究結果的實際意義卻不容忽視。
為給客觀評估研究效果的真實大小和意義提供依據,克服樣本大小對研究效果的影響,統計學家提出了效應量(effect sizes,es)這一概念,用來估計研究效果的真實大小或強度。效應量最大特點是不受樣本大小影響,是以標準差為單位的統計指數(即標準分Z-score),可用來比較不同測量單位結果間的大小。社會學、教育學和心理學等領域,根據研究設計的不同,常用的效應量有兩類:一類是評價差異大小的簇效應量,主要指標準化均值差;另一類是評價相關強度大小的簇效應量,主要為相關系數。
針對效應量大小的評判標準,研究者以行為科學研究為基礎,提出衡量效應量的參考標準:對于d簇效應量,0.2為小效應、0.5為中效應、0.8為大效應;對于r簇效應量,0.10小效應、0.30為中效應、0.50為大效應。還有學者提出評價二語研究領域中效應量大小的參考標準,對于組間設計中的d簇效應量,0.40為小效應量、0.70為中效應量、1.00為大效應量;對于組內設計中的d簇效應量,0.60為小效應量、1.00為中效應量、1.40為大效應量;對于r簇效應量,0.25為小效應量、0.40為中效應量、0.60為大效應量。可以看出,前者的標準低于后者提出的標準。
盡管上述兩個參考標準因為研究領域的不同在大小等級劃分上存在差異,但d簇效應量是以標準差為單位的標準分,不同研究中的效應量都可參照正態分布表對研究結果進行解釋。對照正態分布表可以確定正態曲線下低于某一標準分的面積或累積百分比。
例如,一次組間實驗的效應量為0.2,即實驗組均值高于對照組均值0.2個標準差,差正態分布表可知對照組中58%的樣本低于實驗組的平均分。而兩個變量的相關系數r本身就可以作為效應量,r的平方值(表示為R2,稱為決定系數)可以解釋為兩個變量間的共同變異量。又如,一項研究中兩個變量間的相關系數r,即效應量,為0.3,其平方值R2=0.09,表示兩個變量間的共同變異量為9%,或者說一個變量解釋了另一個變量9%的變異。需要指出的是,研究者不要把參考標準作為教條,應該根據具體研究領域和研究問題對效應量的大小做出解釋,否則會得出錯誤結論。
1. 研究問題。本次研究僅在已有文獻的基礎上計算單個研究的效應量(es),旨在計算和呈現現有文獻中單個研究的效應量的大小。
2. 研究數據。本次研究從外語類中文核心期刊中選取已公開發表的8篇研究語塊對英語寫作影響的實證研究論文。研究均采用組間實驗設計,統計方法為獨立樣本T檢驗。為計算每個研究的效應量,從每篇論文中提取的數據包括實驗組和對照組的樣本量ne、nc,平均分me、mc,標準差se、sc和顯著性值p(見下表)。

語塊對英語寫作影響研究的統計數據匯總表

注:1. 陳東嵐(2015);2. 伍萍(2014);3. 郭月琴、吳秀娟(2013); 4. 樓捷(2011);5. 徐軍、黃永華(2011); 6.肖武云(2011);7. 蓋淑華(2010);8. 鄧鸝鳴、王香云(2007)。為便于計算,作者將部分數據四舍五入后保留小數點后兩位數。
3. 研究工具。本次研究使用了由Wilson設計的在線效應量計算工具(Standardized Mean Difference),用于計算每個研究的效應量d,即標準化均值差方(standardized-mean-difference)。使用者只需在線輸入實驗組和對照組的樣本量、平均值和標準差即可計算出效應量。
本次研究的目的僅在以現有文獻為例,在所提供數據的基礎上計算每個研究的效應量。上表呈現了本次選取的8個語塊對英語寫作影響的實證研究的數據。所有研究的假設檢驗均達到了統計學意義上的顯著性水平,由此證明了語塊使用在提高英語寫作水平上有效性。但研究結果僅回答了研究效果的存在,并沒有回答研究效果的大小。從表中呈現的效應量可知,語塊使用對英語寫作均產生了積極作用,但每個研究的實際意義并不相同,存在很大差別。根據Cohen(1988)的參考標準,郭月琴、吳秀娟(2013)的研究效應量(d=0.44)和徐軍、黃永華(2011)的研究效應量(d=0.54),接近中等效應量;其他6個研究的效應量均為大效應量。根據Plonsky和Oswald(2014)的評價二語研究領域中組間設計效應量大小的參考標準,郭月琴、吳秀娟(2013)的研究效應量(d=0.44)和徐軍、黃永華(2011)的研究效應量(d=0.54)則趨向于小效應量,陳東嵐(2015)的效應量介于中效應量和大效應量之間,其他5個研究的效應量為大效應量。盡管兩個參考標準有所不同,但都反映了語塊使用對提高學生英語寫作水平除具有統計學顯著意義外,還具有不同程度的實際意義。
為更直觀解釋和理解效應量在實際教學中的作用和意義,通過對照正態分布表,每個研究的效應量可以從兩方面解釋:一是對照組學生低于實驗組均值的百分比,二是實驗組均值在對照組中的排名(見上表)。
例如,陳東嵐(2015)研究中語塊使用對提高英語寫作水平的效應量為0.81,表示在對照組中79%的學生(39人)的成績低于實驗組均值(10.78),這一均值在對照組50名學生的成績中排在第11位。鄧鸝鳴、王香云(2007)研究中語塊使用對提高英語寫作水平的效應量為2.97,表示對照組100%的學生(34人)的成績低于實驗組均值(6.86),這一均值高于對照組中所有34名學生的成績,排在第1位。通過這兩種解釋,普通讀者可以更直觀地看出語塊使用對提高英語寫作水平的實際意義和作用。
導致各個研究效應量不同的原因與研究設計中的多個因素有關系:
一是研究樣本特征不同,如有的研究樣本來自重點大學,有的來自非重點大學;有的研究樣本為一年級學生,有的為二年級學生;有的為英語專業學生,有的為非英語專業學生等。二是研究時長不同。如有的研究持續一個學期,而有的研究持續兩個學期。三是研究工具不同。實驗后期進行測試時,各個研究在寫作的內容和難易度等方面的要求不一致,寫作時間可能也不同。四是語塊教學內容不同。主要表現為實驗中學生所學語塊的來源不同,如教材不同等。五是語塊教學方式不同,如有的研究中實驗班和對照班為同一教師,有的為不同教師;有的采用討論式教學,有的采用自主學習方法。這些因素對研究效果產生的影響,可以在元分方法中作為調節變量,探索導致研究間系統變異的來源和大小,從而更全面、科學地認識和評價語塊對英語寫作影響的真實效應和實際意義。
基于概率的統計假設檢驗只能回答研究效應是否存在,效應量的使用可以克服樣本大小對假設檢驗結果的影響,是評價研究效果真實大小的統計指標。由于效應量是以標準差為單位的標準分,可以用來比較針對同一研究問題不同研究設計研究間的真實效應。本文以8個研究為例,介紹并呈現語塊對英語寫作影響的效應量大小和實際意義,以期引起國內外語研究者對效應量的重視,從而提高研究水平和研究質量,為以后運用元分析方法整合同一研究問題的所有單個研究綜合評價研究效應、探討研究設計中的調節變量對研究效應的影響等提供科學依據。
注釋:
[1]Wilson的在線效應量網址為:http://cebcp.org/practicalmeta-analysis-effect-size-calculator/.
參考文獻:
[1]Borenstein, M., Hedges, L. V., Higgins, J. P. T., & Rothstein, H. R.Introduction to Meta-Analysis [M]. Hoboken, NJ: Wiley,2009
[2]Coe.R.It’s the effect size.stupid: What effect size is and why it is important,2002.accessed from www.leeds.ac.uk/educol/ documents/00002182.htm
[3]Cohen. J.Statistical power analysis for the behavioral sciences (2nd ed).Hillsdale. NJ: Erlbaum,1988
[4]Cumming.G.The new statistics: Why and how.Psychological Science, 2014
Cumming.G.Understanding the New Statistics: Effect Sizes. Confidence Intervals. and Meta-Analysis[J].New York: Routledge,2012
[5]Ellis.P.D.The Essential Guide to Effect Sizes: Statistical Power. Meta-analysis. and the Interpretation of Research Results[M]. Cambridge: Cambridge University Press,2010
[6]Kirk.R.E.Practical significance: a concept whose time has come[J]. Educational and Psychological Measurement,1996
[7]Lipsey, M.W&Wilson.D.B.Practical meta—analysis[M]. Thousand Oaks: SAGE,2001
Plonsky, L., & Oswald, F. L. How big is “Big”? Interpreting effect sizes in L2 research[J]. Language Learning, 2012
[8]鮑 貴,席 雁.統計顯著性檢驗:問題與思考[J].南京工程學院學報(社會科學版),2010
[9]陳東嵐.語言意識驅動下的語塊教學法在大學英語寫作教學中的運用[J].外語學刊,2015
[10]鄧鸝鳴,王香云.背誦式語言輸入對中國學生二語寫作能力發展的有效性研究[J].外語教學,2007
[11]蓋淑華.最近發展區域中的詞塊習得實證研究— 基于支架式教學的實證研究[J].外語與外語教學,2010
[12]郭曉英, 毛紅梅.語塊教學對英語寫作能力影響的實驗研究[J].山東外語教學, 2010
[13]郭月琴, 吳秀娟.CLIL 模式在大學英語寫作中的應用探究[J].外國語文, 2013
[14]樓 捷.論網絡語料庫輔助對英語寫作語塊運用能力的影響[J].外語與外語教學,2011
[15]權朝魯.效果量的意義及測定方法[J].心理學探新,2003
[16]肖武云.基于語塊的以寫促說的教學模式實證研究[J].外語界,2011
[17]徐 軍,黃永華.詞塊在師范學生英語作文中的應用[J].山東外語教學,2011
[18]鄭昊敏,溫忠麟,吳 艷.心理學常用效應量的選用與分析[J].心理科學進展,2011
文章編號:ISSN2095-6711/Z01-2016-01-0193