張李斌 張 麗 馮廷勇
(1 西南大學心理學部,重慶 400715) (2 中央財經大學社會與心理學院,北京 100081)
發展性計算障礙(developmental dyscalculia,DD, 以下稱計算障礙),是一種特殊的數學學習障礙。具體表現為發展性計算障礙兒童擁有正常水平的智力、穩定的情緒,同時具備適當的學習動機和良好的教育條件,但是他們在學習算術時仍然表現出困難,不能以正常的方式習得基本的算術(Mammarella, Hill, Devine, Caviola, & Sz?cs, 2015;白學軍, 臧傳麗, 2006)。雖然中國的學生在數學能力上相對較強,但調查研究發現我國仍有5%-6%的學生患有發展性計算障礙,與英國、美國、以色列、德國、瑞士等國調查的3%-6%的發生率基本一致(Shalev, 2004; 張樹東, 董奇, 2007; 張懷英, 2009; 王芳, 路浩, 楊紅, 趙暉, 2012; Di Filippo& Zoccolotti, 2018)。
以往有很多學者對發展性計算障礙的成因進行了探究,主要有“領域一般性”和“領域特異性”兩種觀點。其中近似數量系統假設是領域特異性的代表性理論之一。近似數量系統(approximate number system, ANS)是指個體在不需要依賴于計算和數量符號的情況下,對一組數量進行近似表征的系統(李紅霞, 司繼偉, 陳澤建, 張堂正, 2015)。Dehaene 最早提出了該假設,他認為近似數量系統具有近似性和不精確性,并且不精確性隨著數量的增加而增加(Dehaene, 1992)。近似數量系統遵循韋伯定律(Weber's Law; Barth et al., 2006),其中韋伯分數越接近于0,表示近似表征越精確,近似數量系統的敏銳度越高。嬰幼兒、兒童、成年人以及非人類的動物都具有近似數量表征能力(Kibbe & Feigenson, 2015)。概括來講,近似數量系統的準確性通常使用數的敏感性(number acuity)或數感(number sense)能力來反映,使用非符號數量比較任務來測量(Bartelet, Vaessen, Blomert, &Ansari, 2014; Halberda, Mazzocco, & Feigenson, 2008;De Smedt, No?l, Gilmore, & Ansari, 2013)。非符號數量比較任務給被試呈現兩個點陣列,每個點陣列中有一定數目的圓點,在不允許被試數數的前提下,讓被試判斷哪側的數目較多,通過正確率、反應時或韋伯分數來衡量近似數量系統表征的精確性,即近似數量系統的敏銳度或數感能力。
基于近似數量系統假設,有研究者認為數感缺陷可能是發展性計算障礙產生的一個原因(Bugden & Ansari, 2016; Dehaene & Cohen, 1997;Piazza et al., 2010; Wilson & Dehaene, 2007; 張麗, 蔣慧, 趙立, 2018)。例如,Dehaene 和Cohen(1997)認為發展性計算障礙患者存在數感缺陷,即不能快速理解、估計以及操縱非言語數字數量。Piazza 等(2010)發現發展性計算障礙兒童的數感嚴重損傷,10 歲計算障礙兒童的數感相當于正常兒童5 歲的水平。Geary(2013)研究發現近似數量系統發育遲滯,即數感能力較差的兒童,存在數學學習困難。Bugden 和Ansari(2016)對計算障礙兒童和正常兒童的數感能力進行比較,結果顯示計算障礙兒童的韋伯分數要顯著大于正常組兒童,表明計算障礙兒童存在數感缺陷。在2017 年一篇元分析的文獻中,Schwenk 等(Schwenk et al.,2017)系統分析了過去關于計算障礙兒童數感能力的研究,發現計算障礙兒童的數感能力是顯著低于正常兒童的。然而,也有一些研究發現計算障礙組被試和正常組被試之間在數感能力上并無差異(De Smedt & Gilmore, 2011; Szücs, Devine, Soltesz,Nobes, & Gabriel, 2013; Rousselle & No?l, 2007)。例如,Rousselle 和No?l(2007)使用阿拉伯數字和非符號數量比較任務對比了計算障礙兒童和正常組兒童之間的差異,結果發現計算障礙兒童在阿拉伯數字比較任務上存在缺陷,而在非符號數量任務上沒有缺陷。De Smedt 和Gilmore(2011)考察了一年級兒童的數量加工和估算能力,結果發現計算障礙組兒童在涉及符號信息提取的任務表現上與正常組兒童存在顯著差異,表現出了加工缺陷,但是在非符號數量加工任務上與正常組兒童并沒有顯著差異。Szücs 等(2013)亦沒有發現障礙兒童和普通兒童在非符號比較任務上的成績存在差異。
對已有研究進行深入剖析發現,不同研究之所以產生不同的研究結果可能有兩個原因。首先,計算障礙兒童的篩選程序不統一。De Smedt和Gilmore(2011)的研究中,被試的篩選只選擇了數學成績的后25%一個標準,兒童的智力水平和閱讀成績都沒有進行控制。其次,任務難度不同。Rousselle 和No?l(2007)的研究中的任務難度范圍也只包括1:2 和2:3。Szücs 等(2013)研究中的難度范圍也只有1:2,2:3 和3:5,這對計算障礙兒童和正常兒童來說可能難度偏低,因而無法區分出其間差異。因此,與Szücs 等(2013)篩選計算障礙兒童的程序類似,本研究采用了嚴格的標準,即計算障礙兒童的數學成績排名在后25%,其智力水平和閱讀成績正常,而且統計分析中將智力水平作為協變量進行了控制。此外,本研究通過增大任務難度來考查以往研究結果的不一致是否和任務難度有關。以澄清計算障礙兒童是否存在數感缺陷這一問題。
如果計算障礙兒童存在數感缺陷,那么數感缺陷是否特定于計算障礙?閱讀障礙是和計算障礙類似的一種發展性學習障礙。以往關于閱讀障礙與計算障礙是否存在共病性存在爭議。早期的主要觀點是兩種障礙存在特異性的缺陷(Landerl,Fussenegger, Moll, & Willurger, 2009; Rubinsten &Henik, 2006),即語音意識缺陷是閱讀障礙的主要成因,而數感缺陷是計算障礙的主要成因。例如,Landerl 等(2009)的研究發現計算障礙組只存在數感缺陷,而不存在語音意識缺陷,閱讀障礙組只存在語音意識缺陷而不存在數感缺陷,閱讀和計算雙障礙組同時存在語音意識缺陷和數感缺陷。Tr?ff,Desoete 和Passolunghi(2017)的研究表明閱讀障礙兒童在阿拉伯數字比較任務上的反應時長于正常組兒童,然而非符號數量比較任務(數感能力)上與正常組兒童并無差異。
然而,近年來越來越多的研究表明閱讀障礙和計算障礙可能有一些共同的缺陷(De Smedt &Boets, 2010;Jordan, Wylie, & Mulhern, 2010; Peters,Bulthé, Daniels, Op de Beeck, & De Smedt, 2018;van der Stam, 2014)。De Smedt 和Boets(2010)的研究發現有語音意識困難的閱讀障礙兒童,其代數事實的提取存在困難。van der Stam(2014)的研究發現計算閱讀雙障礙組的語音意識不存在缺陷,但數字線表征存在缺陷。Peters 等(2018)使用核磁技術發現閱讀障礙,計算障礙和雙障礙組被試在完成代數減法任務時的大腦激活模式非常相似。Willcutt 等(2013)的研究則表明兩種障礙既存在特異性的認知損傷,亦存在一般性的認知損傷,比如工作記憶,加工速度和言語理解。因此,與Landerl 等(2009)和Tr?ff 等(2017)的研究類似,本研究亦擬探討與正常兒童相比,閱讀障礙以及雙障礙兒童的數感能力是否較差。若回答是否定的,則說明數感缺陷是特異于計算障礙的;若回答是肯定的,則說明數感能力是閱讀和計算障礙共同存在的一種缺陷。與Landerl 等人的研究相比,為了更全面考查兒童的數感能力,本研究不僅分析了反應時數據,亦分析了正確率和韋伯分數。
綜上,為了回答計算障礙兒童是否存在數感缺陷以及數感缺陷是否特定于計算障礙兩個問題,本研究以計算障礙、閱讀障礙、雙障礙以及正常兒童為被試,以非符號數量比較任務,來考察計算障礙是否存在數感缺陷以及數感缺陷是否特異于計算障礙。
選取重慶市內以及周邊八所小學二三年級的學生參加被試篩選測驗。第一步,對1696 名學生施測了《中國兒童青少年數學學業成就測驗》(內部一致性系數0.81)和《中國兒童青少年語文學業成就測驗》(內部一致性系數為0.85)(董奇, 林崇德, 2011),按照年級將測驗成績轉化為標準Z 分數,以整體樣本量的25%(Swanson &Beebe-Frankenberger, 2004)為臨界點,選取數學成績位于年級后25%,語文成績在年級前75%的學生,篩選出296 人確定為潛在計算障礙被試;在閱讀障礙兒童篩選中,選取數學成績位于年級前75%,語文成績在年級后25%的學生,初步確定潛在閱讀障礙組318 人;在雙障礙兒童篩選中,選取數學成績位于年級后25%,語文成績也在年級后25%的學生,確定潛在雙障礙組210 人。第二步,對第一步篩選出的被試施測瑞文智力測驗(張厚粲, 王曉平, 1989),選取智力得分高于90 分的學生,從而排除智力因素導致的學習障礙。同時請班主任對選取出來的學生進行客觀評估,排除因其他原因(家庭環境、學習動機等)導致成績較低的學生,最終確定計算障礙兒童72 名,閱讀障礙兒童76 名,雙障礙兒童69 名。本研究中計算障礙兒童檢出率(5.31%)和以往研究基本一致(王芳等, 2012; 張樹東, 董奇, 2007)。從數學成績和語文成績都位于年級前75%的學生中,隨機選取人數、年齡、智力相匹配的兒童作為正常組被試,并且同樣通過班主任的評估,該組被試最終86 人。
被試分為計算障礙組(7 2 名, 平均年齡9.13 歲, 男生40 名, 占55.56%)、閱讀障礙組(76 名, 平均年齡9.20 歲, 男生51 人, 占67.11%)、雙障礙組(69 名, 平均年齡9.15 歲, 男生54 人, 占78.26%)和正常組(86 名, 平均年齡9.07 歲, 男生46 名, 占53.49%),共計303 名被試。
實驗為4(組別: 數學障礙組, 閱讀障礙組, 雙障礙組, 正常組)×6(刺激比例: 1:2; 2:3; 3:4; 5:6;6:7; 7:8)的混合設計,其中組別是組間變量,刺激比例為組內變量。
非符號比較任務:該實驗任務采用E-prime l.0進行編制呈現,見圖1。實驗材料為不同大小的黑色圓點,點數范圍為5 到16。為了保證數量大小不在感數范圍內,排除感數的影響,選擇點數大于4。不同數量的點陣列分別呈現在同一屏幕上的兩個相同大小的方框中,要求被試根據感覺而不能數數來判斷哪個方框中的點數較多,并且盡可能快的按下相應的鍵,“F”鍵表示左側方框內的點陣數量大,“J”鍵表示右側方框內的點陣數量大。實驗材料會一直呈現,直到被試做出相關的按鍵反應以后點陣列才會消失。其中兩個方框中的點數比例有以下六種:1:2;2:3;3:4;5:6;6:7;7:8。每種比例下有12 個試次,所以正式實驗共兩個block 每個block 有36 個試次,中間進行短時間的休息。正式實驗開始前有10 個試次的練習以及結果反饋。實驗任務中一半試次點陣兩側點的總面積相等,一半試次點陣兩側點的平均面積相等,從而保證了無關因素對實驗任務的影響(Dietrich, Huber, & Nuerk, 2015),且點數較多的方框左右出現的次數在實驗中也進行了平衡。
采用正確率、反應時和韋伯分數作為測量指標,被試的韋伯分數基于心理物理學模型來進行計算評估。該模型認為以數感任務正確率擬合的模型符合高斯正態分布,數感任務中點陣點數n1和n2符合高斯正態分布,其平均表征為高斯隨機變量x1和x2,標準差為韋伯分數乘以平均數。點陣中大點數與小點數之差為n2-n1,標準差為。被試數感任務判斷的正確率為1-,即高斯曲線下大于0 的總面積(Halberda et al., 2008)。通過Levenberg-Marquardt 算法求出模型的自由參數w,即為該被試的韋伯分數。韋伯分數越大,表明被試的近似數量敏感性越低,即數感能力越差。
韋氏智力測驗積木和詞匯分測驗(張厚粲,2009):這些任務分別用來測量被試的空間能力以及言語能力。韋氏智力測驗中的積木測驗是給被試一定數目的積木,讓被試在規定的時間內擺出指定的圖形,同時根據被試的不同年齡,開始的題目難度也是不一樣的;而詞匯測驗則是給被試口頭呈現一個詞匯,被試要做的就是解釋該詞匯的意思,開始題目的選擇根據被試年齡大小來確定。主試根據被試的作答情況來進行記錄以及分數的統計。
因為數感能力受到智力因素的影響,以下所有數據處理結果都以瑞文標準推理測驗得分以及韋氏智力測驗中積木和詞匯分測驗得分的總智力作為協變量進行分析。本研究我們先對303 名被試的正確率進行4(被試分組)×6(點數比例)重復測量方差分析,各被試類型描述性統計結果見表1。

表 1 不同點數比例下非符號任務正確率的描述性統計量(M±SD)
結果顯示,被試類型主效應顯著,F(3, 298)=7.15,p<0.001,η2=0.067。LSD 事后比較分析發現正常組兒童的正確率(0.83±0.01)顯著大于計算障礙組(0.78±0.01)、閱讀障礙組(0.78±0.01)以及雙障礙組(0.76±0.01)兒童的正確率,而在三組障礙兒童被試之間兩兩均沒有顯著差異。這說明計算障礙、閱讀障礙以及雙障礙兒童和正常兒童的確存在數感缺陷。點數比例主效應顯著,F(5,1490)=8.60,p<0.001,η2=0.028。LSD 事后比較分析發現,除了比例5:6,6:7,7:8 兩兩之間差異不顯著外,其他任意兩個比例之間差異均達到顯著水平,大比例點數正確率(1:2 正確率為0.93±0.01;2:3 正確率為0.86±0.01;3:4 正確率為0.79±0.01)要顯著大于小比例點數(5:6 正確率為0.70±0.01;6:7 正確率為0.72±0.01;7:8 正確率為0.71±0.01)的正確率。點數比例與被試類型的交互作用不顯著,F(15, 1490)=0.63,p=0.848,η2=0.006。
結果顯示被試類型主效應不顯著,F(3, 298)=1.97,p=0.118,η2=0.019,說明在反應時上正常組(1114±31)ms 兒童與計算障礙(1152±33)ms、閱讀障礙(1086±32)ms、雙障礙組(1017±36)ms兒童無顯著差異。點數比例主效應不顯著,F(5,1490)=1.35,p=0.241,η2=0.005。點數比例與被試類型的交互作用不顯著,F(15, 1490)=1.38,p=0.148,η2=0.014。見表2。

表 2 不同點數比例下非符號任務反應時的描述性統計量(M±SD)
首先,我們計算了每個被試的韋伯分數,并且刪除不能擬合模型的被試以及韋伯分數超出3 個標準差的被試,最終保留計算障礙組61 人,閱讀障礙組72 人,雙障礙組50 人,正常組74 人。其次,以智力為協變量,采用協方差分析,檢驗了計算障礙組、閱讀障礙、雙障礙和正常組兒童之間在非符號數量比較任務上的差異。結果顯示存在顯著的組間差異,F(3, 253)=3.92,p=0.009,η2=0.045。對韋伯分數進行事后LSD 多重比較,結果顯示,計算障礙組(0.24±0.120)、閱讀障礙組(0.23±0.111)和雙障礙組(0.27±0.128)被試韋伯分數顯著大于正常組(0.19±0.075)被試,但計算障礙組、閱讀障礙組和雙障礙組被試之間的韋伯分數兩兩并沒有顯著差異。這說明計算障礙被試、閱讀障礙被試和雙障礙被試存在數感缺陷,其近似數量系統敏感性較低。見表3。
表 3 非符號數量比較任務韋伯分數的差異比較

表 3 非符號數量比較任務韋伯分數的差異比較
測量指標 (計n算=障6 1礙) (閱n讀=障7 2礙) (雙n=障5礙0) (正n=常7組4) F p韋伯分數w 0.24±0.12 0.23±0.11 0.27±0.13 0.19±0.08 3.92 0.009
本研究采用非符號數量比較任務檢驗計算障礙兒童是否存在數感缺陷以及探討其是否特定于計算障礙兒童。研究發現計算障礙兒童和正常組兒童在非符號數量比較任務上存在顯著差異。閱讀障礙兒童、雙障礙組兒童與正常組兒童在非符號數量比較任務上也存在顯著差異。這些結果說明計算障礙兒童的確存在數感缺陷,但是數感缺陷并不特定于計算障礙兒童。
計算障礙兒童與正常兒童相比在正確率和韋伯分數上均存在顯著差異,說明計算障礙兒童存在數感缺陷,這一結果與以往多數研究結論相一致(Bugden & Ansari, 2016; Mazzocco et al., 2011;Piazza et al., 2010)。支持了近似數量系統假設,即發展性計算障礙兒童的數量估計系統存在缺陷。近似數量系統負責操作和區分近似數量大小(Dehaene, 2007),被認為是精確符號(數詞和阿拉伯數字)表征系統的先驅,而精確符號表征系統負責解決基本的算術問題和更高階的數學問題(Piazza, 2010),因此,近似數量系統缺陷能夠導致符號表征不精確和數學技能較差,從而出現計算障礙。以往影像學研究發現近似數量系統加工與腦內頂內溝區域有關,頂內溝是負責數量表征和數量加工的關鍵腦區(Ansari & Dhital, 2006;Cantlon et al., 2009; Holloway & Ansari, 2010;Kaufmann et al., 2008)。而計算障礙兒童在執行非符號數量比較任務時,其右側頂內溝激活要顯著弱于正常兒童,導致計算障礙兒童無法像正常兒童那樣調用頂葉數量加工資源對小數量距離做出反應(Price, Holloway, R?s?nen, Vesterinen, & Ansari,2007)。此外,近年來大量針對數感訓練的研究發現數感訓練能夠提高兒童數學能力(Hyde, Khanum, &Spelke, 2014; Wilson, Dehaene, Dubois, & Fayol,2009)。這些研究均間接支持計算障礙兒童可能存在數感缺陷。
與以往沒有發現計算障礙兒童數感缺陷的研究相比(Szücs et al., 2013; Rousselle & No?l, 2007),本研究中計算障礙兒童在難度較高(5:6, 6:7 和7:8)和較低的比例(1:2 和2:3)上成績均差于正常兒童。這說明任務難度不同并不是計算障礙兒童數感能力研究結果不一致的原因。那么更可能的原因便是被試的樣本選擇偏差,比如樣本所屬區域不同,其變異程度可能不同。本研究選擇的是重慶市相對偏僻的一個區縣,或許正常兒童和障礙兒童的差異比較大。而Szücs 等(2013)的樣本變異程度較低,這導致正常兒童和障礙兒童在數感方面差異并不是很大。
閱讀障礙兒童和雙障礙兒童的數感能力均顯著低于正常兒童的數感能力,這一結果說明數感缺陷不是特定于計算障礙兒童的。這樣的結果有兩種可能的原因。其一,數感能力本身可能是一種初級的、基本的能力。研究發現不同物種非符號數量表征的神經編碼存在相似性(Nieder,Freedman, & Miller, 2002; Sawamura, Shima, & Tanji,2002)。人類和動物的大腦頂葉神經不斷進化,最終形成了對非符號數量進行表征的具體的近似數量感知系統。隨著數字符號的引入和計數的運用,頂葉系統進行了意義深遠的改變,先前表征近似數量的神經機制被部分“回收”用于支持精確數字的表征,所以數感隨著環境在不斷進化,具有環境的基本屬性(Piazza & Izard, 2009)。因而,數量估計是一種初級視覺特征的加工,數感像顏色、方向和大小等物理特征的視覺加工一樣,也同樣具有前注意加工的特點(Burr & Ross,2008)。它不受物體的大小、顏色、位置等因素的影響,而是受到諸如連通性或者內外關系等拓撲不變量的影響(He, Zhou, Zhou, He, & Chen, 2015)。同時,數感能力是一種基本能力,也是基于閱讀障礙兒童和雙障礙兒童也存在數感缺陷推論得出的。其二,數感能力可能受一般認知能力影響非常大,比如視空間能力、抑制控制能力。測量數感能力一般采用非符號任務,而該任務中視覺加工的物理特征和數量大小特征糾纏在一起,兒童難以排除物理特征而只進行數量的加工(Soltész,Szücs, & Szücs, 2010),因而該任務可能需要被試較強的視空間能力。也有研究者提出數感能力測驗是基于抑制控制能力(Gilmore et al., 2013)。進一步的研究需要對這兩種可能性進行檢驗。
本研究發現閱讀障礙兒童也存在數感缺陷,正如上面我們提及的,數感任務的加工需要視空間能力的參與,而研究發現漢語閱讀障礙兒童存在視空間能力缺陷。已有研究發現閱讀障礙兒童在語音編碼和正字法加工上均存在缺陷,漢字作為一種圖形文字,對正字法加工有著更高的要求,加工過程需要視覺空間能力的參與,而研究發現漢語閱讀障礙兒童存在視空間能力缺陷。因此,閱讀障礙兒童存在數感缺陷也就有據可循。相比較于正常兒童,閱讀障礙兒童存在數感缺陷這一結果與Tr?ff 等人(2017)的研究結果是不一致的,這可能和選取的樣本有關。本研究中閱讀障礙兒童的數感能力(Mw=0.234,SDw=0.111)和Tr?ff 等人的研究中閱讀障礙兒童的數感能力(Mw=0.230,SDw=0.060)并無較大差異,t=-0.1605,p=0.873。然而,本研究中正常兒童的數感能力(Mw=0.190,SDw=0.075)卻顯著高于Tr?ff 等人的研究中正常兒童的數感能力(Mw=0.250,SDw=0.140),t=2.915,p<0.01。除此之外,西方以字母為特征語音文字更多需要語言編碼,而漢字作為圖形文字,字形復雜,結構密集,在識別漢字過程中更多需要知覺辨認和正字法加工,更需要精細的視覺空間分析能力,這可能也是造成中西方關于閱讀障礙兒童是否存在數感缺陷研究結果矛盾的一個原因。與Landerl 等(2009)的研究一致,本研究的反應時數據也沒有探測到閱讀障礙組的數感能力與正常組兒童存在差異。然而,根據以往研究結果(Inglis & Gilmore, 2014),正確率,反應時和韋伯分數三種測量指標中正確率指標最可靠,其次是韋伯分數。因此本研究的結果是可靠的。這也啟發我們將來的研究應全面報告不同指標的結果,這樣便于積累文獻,并能與其他研究比較(Dietrich et al., 2015)。但必須說明的是,在障礙組和正常組之間,反應時指標沒有明顯差異,也可能和本研究中實驗材料的呈現時間沒有限制有關,這也是本研究的不足之處,需要在今后的研究中改進。
前文已經提及,盡管中國兒童的數學能力相較于西方兒童普遍較好,但是,中國兒童仍然存在較高的計算障礙發病率。探究計算障礙的影響因素,對于找到有效的干預方法尤其重要。本研究的結果啟發我們,既然數感缺陷并非特定于計算障礙,那么不管針對計算障礙,閱讀障礙還是雙障礙兒童,均可以制定相應的數感能力訓練課程以改善其狀況。
(1)數感缺陷是計算障礙的一個原因;(2)閱讀障礙兒童和雙障礙兒童也存在數感缺陷,數感缺陷并非特異于計算障礙。