☆ 趙興龍 李 蕾 張 璇
(中央電化教育館,北京 100031)
很多語文教師都遇到這樣一個問題:學生的作文除了給寫寫評語之外,怎么樣更科學地去測量呢?這樣的問題很普遍,也非常重要。隨著教師專業化發展的不斷深入推進,一名好的語文教師不能僅僅會教書,更重要的是能將自己的教學實踐與研究結合起來,形成指導語文教學實踐的普遍規律。本文介紹的重復測量方法就是教語文教師如何科學地測量學生作文從而形成研究結論。
重復測量研究用來分析一段時間或某幾個時間點個體的增長趨勢或個體之間的差異[1],主要采用重復測量的多元方差分析對數值進行統計并對結果進行解釋說明。所謂打寫是指小學生在計算機或某種手持設備的支持下使用鍵盤進行輸入的一種寫作方式。以往類似的文本分析研究,大都采用均值說明學生打寫規律的變化趨勢。這種表示過于粗枝大葉[2],同時也不合適描述個體特征的發展,在實際的操作中顯得過于松弛。在寒暑假后,學生的打寫狀態一般都會由于疏于訓練而變得不穩定;在每個學期的開校前兩周、期中考試周、期末考試周這三個時間段內,學生的打寫水平也有可能受到各種各樣因素的干擾而呈現出意料不到的波動,這些影響因素如果只用平均數去表示就有失嚴謹了。在語料收集中避開上述特殊時間段并選取學生打寫能力相對平穩的時間點進行測量可以使研究結果更加可信和有效。通過求出多次測量之間的差值并計算出差值的多元方差以及通過正交轉換之后的趨勢分析,有利于在相對較長時間的動態發展中對學生打寫規律進行準確和連續刻畫。重復測量方法在學生打寫文本分析中的應用應特別注意以下幾個方面。
班級案例語料是重復測量研究中常用的語料形式。這種形式的語料可以將一個班級作為個案,選擇學生較為熟悉且大家集體參與的活動進行主題打寫產生語料,有效避免因為生活經歷以及地區的差異而帶來的研究誤差。選擇這種形式的語料有兩個考慮:一是在不打亂正常教學秩序的前提下,很難通過班級對比實驗設計來產生語料,有效的實驗和可信的統計之間確實存在著難以兩頭兼顧的困難[3];二是對于打寫測試,學生生活圈子非常有限,他們看待事物的態度以及觀點表述和成人有著明顯的區別,知道的就能寫出來,不知道就是不知道。對于一些寫作主題由于地方差異,很難達到統一。比如“雪”這個主題,北方的學生寫起來津津有味,而南方有的學生從小到大根本沒有見到過雪,根本不知道雪意味著什么,只是從電視或書本上了解過。
在研究中為什么不采用抽樣的辦法來收集語料而偏偏選擇班級案例法呢?這是因為對于學生寫作文本這樣的語料對象而言,抽樣和班級案例法有著本質的區別。抽樣是部分代表總體,通過研究局部推斷總體狀況[4][5]。但是對于個體的打寫測量能否使用抽樣的方法生成語料呢?綜合以往的研究,打寫話題中字詞的識別、對話題意義的理解、打字的速度、打寫話題的熟悉度、打寫測試的時間、打寫過程中指導與提示以及工作記憶等這些內部因素會影響學生的打寫,教師的教學風格、教師和學生之間的親密程度、學校對寫作的重視程度、學校之間的差異、地區之間的差異、家庭氛圍和文化素養之間的差異、父母的文化水平等這些外部因素同樣對學生的打寫有著影響。試想,如果將這樣紛繁復雜因素影響下的學生打寫采取抽樣的方式進行研究,最后得出的只能是一般化的“學術”結論,而對學生個體實際的能力培養起不到應有的作用,一般化的結果對教師而言很可能成為束縛他們自己的統計緊箍咒[6]。而對于班級案例研究而言,在自然狀態下對特定的同一個班級進行長期追蹤,收集不同時間點的語料進行深入細致分析。由于這個班級在追蹤過程中始終是同一個教師、同樣版本的教材、相同的教學模式,受到的外界變量干擾較少,所以,對于研究學生的打寫有著得天獨厚的優勢。
什么樣的測試方法生成的語料才能真實反映學生的打寫水平呢?一般而言,打寫測試方法可以分為一次測試和重復測試。所謂一次測試是指對全部被試進行一次測試后計算組間差異或前后測差異;所謂多次測試是指通過對全部被試進行一段時間或長時間的跟蹤后進行同一內容或不同內容的多次測試,以保證測試的準確性。學生打寫的內在差異具有動態變化的屬性,單憑一次測試可能很難反映他們打寫的特點,也不足以說明學生寫出這樣或那樣內容的真實意圖以及實際的寫作潛能,多次測試甚至是長時間的追蹤測試對于學生打寫測量是必要的。
同一個班級的學生在不同時間點打寫同一個話題的重復測試的語料生成方式,既能夠準確地測量學生在不同時間點中語言運用能力發展的動態狀況,而且能夠排除一些其他因素(如不同話題之間的干擾、教學水平因素、教師自身因素)的影響,對打寫的可信度起到很好的支持作用。打寫測試時間的安排應避開寒暑假、節假日以及期中期末考試三個時間段。打寫測試以第一次打寫內容為基礎,后續打寫都在第一次測試的基礎上進行續寫或修改。有的學生因為和其他學生有點小摩擦,不再愿意寫第一次寫作中出現的學生,這樣也是允許的。
打寫話題一般可以分為多話題測試和單一話題測試。多話題測試不可控因素過多,實施起來較為困難;采用同一個話題對被試進行多次測試的方式,與認知神經科學中領域特異化知識系統的研究成果更加貼近。為了盡量達到話題熟悉度的要求,在選擇話題的過程中需要遵循四大原則:第一,話題具有延續性而不能是瞬時性的。所選話題應該是和學生的生活實際緊密相連并且能夠讓兒童經常參與的活動或事件,而且能夠考慮不同區域的學生都能進行打寫的共性特點;第二,話題具有豐富性而不能是單一的。所選話題的內容既要具有階段性的穩定性,又要具有細節內容的變化,不管如何,這些豐富的變化是讓學生能夠切身體會到、感觸到的;第三,話題具有集體性而不能是個體的活動。選取集體性的活動或事件作為話題就會避免一部分學生因沒有話題而生搬硬套的情況;第四,話題須具有真情實感,將學生本身對生活的情感融入進去,用語言表達心聲,表達自己對周圍事物的認識和看法,這一條是四個原則之中最為關鍵也是最為核心的一條。
由于年齡、要求以及打寫的特殊性,學生打寫的文本和一般交互性會話文本的處理方式有很大的不同之處,具體處理方式如下。
第一,詞的定義。詞的定義以2008年國家語言文字工作委員會發布的《現代漢語常用詞表》(草案)為依據。該草案共收錄使用頻率較高的漢語普通話常用詞56008個,主要以單音節詞(3181個)和雙音節詞(40351個)為主,也收錄了一些熟語和表達概念名稱的其他固定短語[7]。在實際的文本電子詞庫中有詞匯56064個,比標準多出了56個,這56個詞組皆為詞表一些詞的同音詞,如詞表中是年輕,在電子詞庫中“年輕”和“年青”則是兩個詞,他們的頻率號相同,都是697。值得特別注意的是,學生在打寫的初期經常出現詞語誤打錯誤、音節替代現象以及亂打三類現象。
對于亂打這一類現象,處理時直接將胡亂打寫的字符剔除就行。對于詞語誤(錯)打和音節替代的現象:詞語誤(錯)打時,誤(錯)打的詞語在詞語統計中不計算;利用音節替代的詞語,在統計中也不計算;如果音節書寫錯誤,就按照錯誤的詞語進行剔除。
第二,分詞處理使用中科院計算所漢語詞法分析系統ICTCLAS,這個系統的中文分詞、詞性標注以及未登錄詞識別三大功能恰好能夠解決學生打寫中出現的詞項頻率、實詞和虛詞以及不經常使用的一些新詞的分詞問題。
第三,人名和事物名稱、地名在文本預處理中視為非禁用詞,計入詞匯數量統計。
第四,別詞、多余的詞項、錯用詞、文不對題的部分都不計入詞匯數量統計。
第五,句子處理:語文新課標規定,二年級結束后才要求使用逗號和句號。所以,對于剛入學的兒童而言,打寫中利用逗號和句號區分出句子是非常困難的。對于文本中的句子,采用人工增加逗號和句號后再進行切分的辦法來處理兒童打寫文本中的句子。
第六,命題的計算:句子的判別主要依靠人工方式進行,一般判別以句號為準則,但是對于一些感嘆句表達判斷和雙重否同表達判斷的句子,也被歸屬為命題。
第七,完成全部多輪打寫測試的文本才是有效文本,才能進行計算。
第一,總體特征:每輪打寫的總體特征,這些特征包括人數、最小值、最大值、平均值和標準差,這些總體特征包括毛詞匯量、凈詞匯量、IR分布度等。
第二,差值特征:后一次打寫測試的總體數量減去第一次打寫測試的總體數量,這些特征包括人數、最小值、最大值、平均值和標準差。
第三,多元方差分析:檢驗多次打寫測試的總體特征、差值特征之間的均值差異是否顯著,需要表述清楚F值和P值。
第四,單因變量檢驗分析:進一步觀測單因變量檢驗結果,檢驗多次測試的均值是否存在著顯著的差異性。
第五,趨勢分析:經過矩陣轉換,找出不同測量次數的正交多項式線性、二次和三次系數,計算出三個正交轉換后的變量Lin、Qua和Cub。分別以正交轉換之后的三個新構成變量為因變量進行多元方差分析,檢驗總體多元方差是否與差異變量Wilks’Lambda整體多元方差統計結果一致并說明單因變量分析的線性和二次、三次增長趨勢是否顯著。
實際上,對于語文教師而言,掌握重復測量方法是非常容易的,關鍵在于教師能不能堅持規范的測量方法,能不能將學生長期打寫的數據保存下來。我們期望在學生打寫研究中能夠出現更多更為實用的研究方法,這對研究學生打寫規律以及知識建構規律都是有幫助的。
[1]劉紅云.追蹤數據分析方法及其應用[M].北京:教育科學出版社,2005:1.
[2][3][6]徐曉東.從組間比較到個體內比較的回歸:重構教育技術學研究方法論[J].電化教育研究,2009,(1):46-53.
[4]李克東.教育技術學研究方法[M].北京:北京師范大學出版社,2006:91.
[5]裴娣娜.教育研究方法導論[M].合肥:安徽教育出版社,2001:116.
[7]現代漢語常用詞表課題組.現代漢語常用詞表[M].北京:商務印書館,2008:666.