【摘要】本研究對義務(wù)教育階段統(tǒng)編語文教材中的現(xiàn)代漢語詞匯的分布情況統(tǒng)計分析后發(fā)現(xiàn):低頻詞數(shù)量占比偏大。詞總量及詞種量的分布呈現(xiàn)小學(xué)階段增長平穩(wěn)、初中階段波動較大的特點,符合課程標(biāo)準(zhǔn)對閱讀量的變化要求。新增詞種量的冊際分布規(guī)律性較弱,反映出科學(xué)控制教材新增詞種的冊際分布是教材編寫的一大難題。通過對統(tǒng)計分析結(jié)果進行更深入的討論發(fā)現(xiàn),義務(wù)教育語文教材的詞匯編排應(yīng)協(xié)調(diào)好語言屬性和教學(xué)屬性的矛盾,可以通過發(fā)揮《義務(wù)教育常用詞表(草案)》的指導(dǎo)作用,重視詞頻效應(yīng)規(guī)律,遵循兒童認(rèn)知發(fā)展規(guī)律等方面來改進。
【關(guān)鍵詞】義務(wù)教育語文教材;現(xiàn)代漢語詞匯;詞匯編排
母語教育需要語言學(xué)的支撐,母語教育的進步狀況一定程度上依賴于語言學(xué)的支撐力度。[1]對語文教材中的文本從語言學(xué)視角進行分析,并為語文教育研究提供支持,正是這種支撐的體現(xiàn)。蘇新春指出:“對教材語言進行專業(yè)化研究,將為教育體制、教材編寫、教學(xué)內(nèi)容以及教學(xué)手段等各個方面的改進提供科學(xué)的依據(jù)。”[2]在語文教材的專門統(tǒng)計研究方面,王文新(1931),艾偉(1949),婁警予、馬世一(1980)等,李焱、孟繁杰(2016),羅樹林(2017),蘇新春(2017)等學(xué)者都開展過相關(guān)研究。筆者在前人研究的基礎(chǔ)上,前期已對統(tǒng)編義務(wù)教育語文教材(以下簡稱“統(tǒng)編語文教材”)中除古詩文之外的現(xiàn)代文文本(包括課文之外的現(xiàn)代文文本)的詞匯量進行過統(tǒng)計,得出詞總量(不考慮詞語重復(fù)的總數(shù)量)為434328個,詞種量(考慮詞語重復(fù),對重復(fù)詞語只計1次的數(shù)量)為27163個,并將統(tǒng)編語文教材中的詞種量與《義務(wù)教育常用詞表(草案)》(以下簡稱“草案”)進行了比較,指出統(tǒng)編語文教材詞匯量方面的現(xiàn)狀,對義務(wù)教育語文教材的詞匯編排及中小學(xué)語文課程詞匯教學(xué)提出一些建議。[3]本文是在此基礎(chǔ)上開展的進一步研究。
一、統(tǒng)編語文教材中現(xiàn)代漢語詞匯詞頻分析
對詞頻的分析涉及“頻次”“累積頻次”“頻率”“累積頻率”“頻級”等。頻次是指被調(diào)查對象(如某個詞語)在調(diào)查語料(如教材)中出現(xiàn)的次數(shù),是最基礎(chǔ)的詞頻分析數(shù)據(jù)。累積頻次是指某調(diào)查語料范圍內(nèi)所有詞條頻次數(shù)的累加,該數(shù)據(jù)即文本的詞總量。頻率指某一被調(diào)查對象的頻次與調(diào)查語料范圍內(nèi)所有被調(diào)查對象累積頻次的比值,該數(shù)據(jù)以百分比的形式反映某詞出現(xiàn)的概率。累積頻率是將每個詞語的頻率依次累加而得到的序列數(shù)據(jù),通過它可以直觀地看到被統(tǒng)計文本某覆蓋范圍所用到的詞種數(shù)。頻級是將頻次數(shù)相同的詞語確定為同一級,頻級數(shù)可以反映出被調(diào)查文本同頻次詞語數(shù)量情況。表1是統(tǒng)編語文教材現(xiàn)代漢語詞匯詞頻情況略表,表2是按頻次區(qū)間統(tǒng)計的情況:
從表1、表2可以看出:統(tǒng)編語文教材中現(xiàn)代漢語詞匯的平均頻次為16次(434328/27163,四舍五入)。頻次為5及以下的詞種數(shù)占比高達73.74%,每個頻次對應(yīng)的詞種量都超過1000個,頻次為1的詞更是高達10961個,占比高達40.35%。覆蓋教材90%的文本只用了6300余個詞。這些數(shù)據(jù)共同反映出統(tǒng)編語文教材中現(xiàn)代漢語詞匯低頻詞數(shù)量占比較大。
我們還從義務(wù)教育階段統(tǒng)編語文教材附錄詞表(一般被認(rèn)為是需要重點學(xué)習(xí)的詞語)中隨機抽選了30個樣本詞語來進行詞頻及分布細(xì)節(jié)考察,詳見表3。
由表3可知:
(1)從頻次數(shù)看,只有7個詞的總頻數(shù)≥6次,而總頻數(shù)只出現(xiàn)過一兩次的詞有11個。
(2)首現(xiàn)冊次越低的詞,其總頻數(shù)往往越高;首現(xiàn)冊次越高的詞,其總頻數(shù)往往越低。表3第一學(xué)段首現(xiàn)的詞有“逐漸、故意、傷心、笨、兇狠、坐井觀天”6個。只有“坐井觀天”的總頻數(shù)為2次,其他的都≥4次,“逐漸、故意、傷心”更是在10次以上。九年級首現(xiàn)的詞有“闊綽、貿(mào)然、隱匿、箴言”4個,除“闊綽”的總頻數(shù)是2次外,其他3個詞的總頻數(shù)都只有1次。我們認(rèn)為,這種現(xiàn)象雖符合語言的自然使用規(guī)律,但難以滿足教學(xué)需求。低年級首現(xiàn)的詞大都是漢語詞匯系統(tǒng)中的高頻詞,毫無疑問,這些詞隨著年級的遞升,再接觸到的概率是非常高的。而高年級才首現(xiàn)的詞往往是漢語詞匯系統(tǒng)中相對低頻的詞。如果不通過增加閱讀量、加大閱讀文本的難度或是人為地增加它們的復(fù)現(xiàn)次數(shù),再接觸到它們的概率是非常低的。
(3)越是口語色彩濃厚的詞,其總頻數(shù)往往越大;越是書面色彩濃厚的詞,其總頻數(shù)往往越小。表3中總頻數(shù)在5次及以上的詞多數(shù)是口語中的常用詞,而4次及以下的多為書面語詞,如頻次數(shù)只有1次的“貿(mào)然、目空一切、圈定、頹然、隱匿、箴言”等詞,書面色彩都很濃厚。我們認(rèn)為,這雖符合語言的自然使用規(guī)律,卻難以滿足教學(xué)需求。義務(wù)教育階段的學(xué)生,尚處于詞匯學(xué)習(xí)從低階向高階發(fā)展的階段。他們所接觸的書面文本中往往充斥著大量口語中常用的詞匯,這符合語言的自然使用規(guī)律。然而,語文教育的重點在于書面語的學(xué)習(xí),書面語詞頻過低不利于學(xué)生對它們的習(xí)得,也不利于學(xué)生認(rèn)知域的擴展和加深。

二、統(tǒng)編語文教材中現(xiàn)代漢語詞匯分布梯度分析
教材中詞匯的分布梯度能反映教材編寫的漸進性和層次性。可以從多個維度考察教材詞匯分布的梯度。如詞匯量的遞增情況、詞族成員的擴展情況等。
1.詞總量與詞種量的變化高度正相關(guān),小學(xué)階段增長平穩(wěn),初中階段波動較大
詞總量的梯度情況反映的是閱讀量的梯度,詞種量的梯度情況反映的是去重后的凈詞語數(shù)的梯度,圖1是統(tǒng)編語文教材詞總量和詞種量的各冊分布情況。
從圖1可以看出:
統(tǒng)編語文教材詞總量的變化與詞種量的變化曲線走勢相近,一至四年級,兩項數(shù)據(jù)都呈明顯的逐冊遞增趨勢,五、六年級有明顯的下降或增幅變小,七年級則急速上升,說明初中階段對閱讀量的要求比小學(xué)階段有了跳躍式的提高。八、九年級則明顯下降。我們認(rèn)為,這種變化節(jié)奏總體而言是比較科學(xué)的。

第一,這種變化節(jié)奏與課程標(biāo)準(zhǔn)對閱讀量的變化要求基本一致。
課程標(biāo)準(zhǔn)對第一學(xué)段的閱讀量要求是“課外閱讀總量不少于5萬字”[4],第二學(xué)段的要求是“課外閱讀總量不少于40萬字”[5],第三、第四學(xué)段的要求分別是“不少于100萬字”[6“]不少于260萬字”[7]。整個小學(xué)階段的課外閱讀量要求是不少于145萬字,這是小學(xué)六年的閱讀量,但也只是中學(xué)三年所要求閱讀量的56%而已。可見,課程標(biāo)準(zhǔn)對閱讀量的要求是小學(xué)階段漸增、中學(xué)階段激增。統(tǒng)編語文教材詞量的分布梯度符合課程標(biāo)準(zhǔn)要求的閱讀量指導(dǎo)精神。
第二,這種變化節(jié)奏與教材文白混編、文白交替學(xué)習(xí)的特點相適應(yīng)。

統(tǒng)編語文教材現(xiàn)代漢語詞匯總量緩增或下降之處,正是文言內(nèi)容學(xué)習(xí)任務(wù)較重之處。如五年級增速放緩,是因為五年級教材中出現(xiàn)了大量古詩文。特別是五年級下冊,四大名著節(jié)選的內(nèi)容占了教材不小的容量。八、九年級比七年級詞總量變少了,因為這兩個年級的古詩文篇幅更多也更長了。
2.新增詞種量的冊次變化規(guī)律性弱
新增詞種量是指被統(tǒng)計的高年段語料范圍內(nèi)的詞種數(shù)與之前低年段范圍內(nèi)的所有詞種數(shù)之差。如果n、n1、n2……nx構(gòu)成語料的階段變化,則:
n1的新增詞種量為:(n+n1)的詞種數(shù)-n的詞種數(shù)
n2的新增詞種量為:(n+n1+n2)的詞種數(shù)-(n+n1)的詞種數(shù)
nx的新增詞種量為:(n+n1+n2……+nx)的詞種數(shù)-(n+n1+n2……+nx-1)的詞種數(shù)
也就是說,18冊統(tǒng)編語文教材構(gòu)成一個連續(xù)體,某冊的新增詞種量是在該冊之前所有冊次詞種數(shù)之和基礎(chǔ)上的凈增詞種數(shù)量。
統(tǒng)編語文教材的新增詞種量冊次變化情況如圖2:

從圖2可以看出:各冊新增詞種量時上時下,前面11冊波動幅度較小,后面7冊波動幅度較大,變化規(guī)律不如詞總量、詞種量隨冊次變化的規(guī)律強。相比控制詞總量和詞種量,控制新增詞種量的科學(xué)變化難度要更大,因為詞總量或詞種量的增減與文本量之間的關(guān)系,只要注意在控制文本量的增減時略微注意文本的閱讀難度情況,就能實現(xiàn)二者較強的正相關(guān)性。如果要比較科學(xué)地控制新增詞種量隨文本量的變化情況,則要基于更精確的統(tǒng)計和更大量的文本篩選。可見,科學(xué)控制教材新增詞種量變化是值得研究的課題。
3.詞族成員的擴展情況——以“美丑”義類詞族為例
考察教材中某類詞族成員的擴展情況,不僅可以從微觀層面看出教材的詞種及新增詞種變化情況,還可以看出教材對學(xué)生的語義認(rèn)知促進情況。下面以“美丑”義類詞族為例進行考察。
根據(jù)蘇新春主編的《現(xiàn)代漢語分類詞典》,統(tǒng)編語文教材中一共有125個“美丑”義類的詞,它們在教材中共出現(xiàn)348次,具體分布情況見表4。
我們先把表4中的數(shù)據(jù)制成直觀數(shù)據(jù)圖(見圖3)。上端的曲線是“美丑”義類詞在教材各冊中分布的詞種數(shù),下端的曲線是“美丑”義類詞在教材各冊中分布的新增詞種數(shù),帶公式的兩條直線分別是對兩條曲線的線性擬合,R2值越接近1說明擬合效果越好,X軸對Y軸的解釋力也就越強,因此R2值又被稱為決定系數(shù)值。

由圖3可見,統(tǒng)編語文教材中的“美丑”義類詞的新增詞種量的冊分布情況決定系數(shù)值只有0.095,說明“美丑”義類詞新增詞種量的變化情況跟教材的冊次進階情況關(guān)系不大。但是“美丑”義類詞的詞種數(shù)的冊次分布情況決定系數(shù)值達到0.7229,說明“美丑”義類詞詞種量的變化情況跟教材的冊次進階情況關(guān)系較大。這進一步驗證了前文所說統(tǒng)編語文教材詞種量及新增詞種量的總體變化情況。
三、關(guān)于統(tǒng)編語文教材的詞匯編排分析
總體而言,語文教材的詞匯編排應(yīng)協(xié)調(diào)好語言屬性和教學(xué)屬性之間的矛盾。
就語言屬性而言,一方面,語文教材與其他漢語書籍或文獻匯編一樣,是漢語言文字文本的集合,從這個意義上說,語文教材是個漢語語料庫;另一方面,語文教材又不同于其他漢語書籍或文獻匯編,它包含課文系統(tǒng)、助讀系統(tǒng)、作業(yè)系統(tǒng)、知識系統(tǒng)等,是供國人學(xué)習(xí)國家通用語言文字運用的精致文本集。就教學(xué)屬性而言,語文教材同其他任何教材一樣,其本質(zhì)屬性就是教學(xué)性。“用于教學(xué)、可教可學(xué)、利教利學(xué)的教學(xué)屬性,是包括第二語言教材在內(nèi)的各種教材的本質(zhì)屬性。”[8]“語文教材是語文教學(xué)的憑借,是學(xué)生學(xué)習(xí)語文、提高語文能力、提升語文素養(yǎng)的重要依據(jù)。”[9]因此,語文教材還得滿足科學(xué)的教學(xué)要求。
然而,從詞匯統(tǒng)計結(jié)果看,統(tǒng)編語文教材的語言屬性和教學(xué)屬性之間的矛盾比較突出:在有限的文本厚度下,大量的詞低頻甚至孤頻,這本是語言自然使用時的大概率事件,但對于包括語文在內(nèi)的語言類教材而言,卻可能面臨不利于教學(xué)的問題。同樣的,書面語詞匯量不足、新增詞種量缺乏科學(xué)規(guī)劃、首現(xiàn)早的詞頻數(shù)往往大于首現(xiàn)晚的詞頻數(shù),口語詞頻數(shù)往往大于書面語詞頻數(shù)等現(xiàn)象也都反映了語言屬性和教學(xué)屬性的矛盾。
其實,早就有學(xué)者指出過這種矛盾,張志公曾說:“一個‘扛’字,幼兒園在講,小學(xué)在講,甚至初中還在講。”[10]艾偉(1949)、蘇新春(2017)等對同一時期不同版本語文教材的詞匯進行統(tǒng)計時發(fā)現(xiàn),其中的差異較大。這說明語文教材語言屬性和教學(xué)屬性的矛盾是積存已久的普遍性問題,但并未引起足夠的重視。
那么,如何協(xié)調(diào)這種矛盾呢?就統(tǒng)編語文教材的詞匯編排而言,我們認(rèn)為,可以通過以下途徑來優(yōu)化教材教學(xué)的適切性。
1.發(fā)揮草案的指導(dǎo)作用

草案首次發(fā)布了義務(wù)教育階段最常用的詞語,標(biāo)志著我國義務(wù)教育階段的漢語詞匯教學(xué)有了可以量化的標(biāo)準(zhǔn)。不僅如此,詞表還對應(yīng)四個學(xué)段,為詞語分了四個等級,除能按音序檢索外,還建立了義類表“,以類顯義”,“就近關(guān)聯(lián)”,呈現(xiàn)了一個立體網(wǎng)狀的語義世界,以方便詞匯的教學(xué)與拓展。盡管草案可能存在不足,但它是教育部語言文字信息管理司組編,且作為國家“語言生活皮書”來發(fā)布的,具有一定的權(quán)威指導(dǎo)性。“詞表的理念和具體成果要應(yīng)用到語文教育的試點中去。”[11]義務(wù)教育語文教材中的詞匯應(yīng)盡可能將草案中的詞語覆蓋全。此外,可以充分應(yīng)用草案的詞條分級成果,更科學(xué)地控制語文教材的新增詞匯變化。
2.重視詞頻效應(yīng)規(guī)律對詞匯習(xí)得的作用
所謂詞頻效應(yīng)規(guī)律,指的是學(xué)習(xí)者對于詞語的習(xí)得需要該詞在可理解的上下文中多次出現(xiàn)。盡管學(xué)習(xí)者的差異、學(xué)習(xí)情境的差異、文本難度的差異等諸多變量都可能影響到學(xué)生對某詞語接觸的頻次,進而對詞語的學(xué)習(xí)效果產(chǎn)生不同影響;盡管學(xué)界對詞頻效應(yīng)的理想數(shù)量(一般認(rèn)為是6次)仍存在爭議,但詞匯學(xué)習(xí)存在詞頻效應(yīng),這是已經(jīng)被教育實驗證明了的事實。統(tǒng)編語文教材中的詞40%多是只出現(xiàn)了1次的孤頻詞,60%多是只出現(xiàn)了3次及以下的詞。雖然使所有詞語都高頻出現(xiàn)是不現(xiàn)實的,但突出需要重點學(xué)習(xí)的部分詞語是可以通過形式多樣的學(xué)習(xí)活動的設(shè)計來實現(xiàn)的。
3.遵循人類詞匯習(xí)得發(fā)展規(guī)律
人類詞匯習(xí)得的基本模式是從基本層向外擴散。所謂基本層是指與實體最具相似性的知覺層面,如“動物—哺乳動物—狗—哈士奇”這一組詞中,“狗”就是基本層。心理學(xué)家指出,“成人的自然傾向是用基本層面來談?wù)撌澜纾@一傾向在理論上和實體之間的知覺相似性有關(guān)。”[12]就某個詞的學(xué)習(xí)來說,一般而言,人們也總是先學(xué)會它的基本語義,然后再擴展到其他語義。人們學(xué)習(xí)及運用詞語的過程就是不斷擴大或深化認(rèn)知域的過程。
從基本層向外擴散的語義認(rèn)知模式啟示我們,語文教材的詞匯應(yīng)按照圈層擴展來編排。具體指的是:就某個詞而言,從常用基本義用法擴展到其他義用法。如“鐵”,從表示金屬義的“鋼鐵”到表示比喻義的“鐵肩”;就某個義類而言,從義類的概稱詞擴展到具體詞。如從“大”擴展到“碩大”;就教材詞匯體系整體而言,從基本詞匯擴展到一般詞匯,從具體詞擴展到抽象詞。
張志公曾說:“學(xué)習(xí)語言,最重要的是學(xué)習(xí)詞匯。一個人如果知道的詞很有限,或者知道不少的詞可是不知道怎么用,他的語言能力一定不高……‘詞不達意’,也往往是詞不夠用的結(jié)果。”[13]然而,關(guān)于語文教材詞匯的科學(xué)編排、語文課程的詞匯教學(xué)等是尚未引起高度重視的課題。這不僅需要更多的學(xué)者提供更豐富的詞匯統(tǒng)計數(shù)據(jù)支撐,還需要更多學(xué)者從語言學(xué)及語言教學(xué)等理論高度加以研究。
參考文獻
[1]李宇明.母語教育的語言學(xué)支撐體系問題[J].陜西師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2020(2).
[2]蘇新春,杜晶晶,關(guān)俊紅,等.教材語言的性質(zhì)、特點及研究意義[J].語言文字應(yīng)用,2007(4).
[3]邵克金.義務(wù)教育統(tǒng)編語文教科書收詞分析——基于與《義務(wù)教育常用詞表(草案)》的比較[J].現(xiàn)代語文,2022(12).
[4][5][6][7]中華人民共和國教育部.義務(wù)教育語文課程標(biāo)準(zhǔn)(2022年版)[S].北京:北京師范大學(xué)出版社,2022:8,10,12,15.
[8]李泉.對外漢語教材通論[M].北京:商務(wù)印書館,2012:4.
[9]徐林祥.中學(xué)語文課程標(biāo)準(zhǔn)與教材研究[M].北京:高等教育出版社,2016:99.
[10][13]張志公.張志公語文教育論集[M].北京:人民教育出版社,1994:210,316~317.
[11]銀晴.《義務(wù)教育常用詞表(草案)》出版座談會大家談[J].江西科技師范大學(xué)學(xué)報,2019(3).
[12]烏莎·戈斯瓦米.兒童心理學(xué)[M].吳帆,譯.南京:譯林出版社,2019:49~50.
【本文系2023年度江西省基礎(chǔ)教育研究課題“小學(xué)語文字詞教學(xué)‘蛛網(wǎng)模型’實踐研究”(課題編號:SZUGSYW2023-1150)研究成果】