[摘要]文章從外語教學中的自主學習(autonomous learning)研究文獻中提取關鍵詞,經過數據處理后形成共詞(co-words)網絡。通過共詞網絡社群圖(sociogram)的繪制、密度(density)分析、中心性(centrality)分析、核心一邊緣(core/periphery)分析等常用社會網絡分析(socialnetwork analysis,簡稱SNA)技術,揭示我國外語教學中自主學習的研究現狀與未來發展趨勢。
[關鍵詞]社會網絡分析;自主學習;共詞
[中圖分類號]G420[文獻標識碼]A[論文編號]1009-8097(2012)01-0064-06
一、概述
自主學習又稱為自我指導學習(self-directed learning)或學習者自主(1earner autonomy,簡稱為LA),是一種以人本主義心理學和認知心理學為基礎的現代學習理念,也是目前應用語言學研究的一個重要課題,1981年,Henri Holec首次在外語教學中引入學習者自主的概念。這一概念指的是學習者在學習過程中能夠對學習有關的各個方面進行決策,也就是學習者能對自己的學習負責。這種決策活動包括“確定學習目標”、“決定學習內容和進度”、“選擇學習方法和技巧”、“監控學習過程”以及“評估學習效果”。雖然Holec對學習者自主學習的決策能力過于樂觀,而且自主學習與學習成績之間的關系也要比原先設想的復雜得多,但培養學習者自主性,以學習者為中心的教學理念,已成為近年來外語教學界許多教育工作者和研究人員的共識,自主學習也成為所有學校教育和其他正規教育的目的。從上個世紀90年代末自主學習的概念引入我國外語教學界以來,國內不少學者進行了深入研究,取得了一定的成果。本文試圖從社會網絡分析的角度出發,揭示我國外語教學中自主學習發展的現狀與特點以及未來的發展方向。
二、研究方法
關鍵詞是科研論文的文獻檢索標識,是反映論文主題概念的詞或詞組,也是表達文獻主題概念的自然語言詞匯。我們將某些關鍵詞出現在同一篇文獻的現象稱之為共詞(co-words)現象。共詞現象假設,當兩個能夠表達某一學科領域研究主題或研究方向的專業術語,例如關鍵詞,在同一篇文獻中出現,就說明這兩個詞之間具有一定的內在關系(relation)。這兩個詞共同出現的次數越多,表明它們之間的距離越近,關系越密切。將這種關系量化,對于規劃學科布局,調整學科方向,促進學科發展具有重要的參考價值。而社會網絡分析法就是量化這種關系的有效方法。
社會網絡分析法是在人類學、心理學、社會學、經驗研究、數學以及統計學領域中發展起來的社會學量化研究,這種社會學量化研究關注的是社會行動者(social actor)以及社會行動者之間關系的集合。適合社會網絡分析的數據類型不是屬性數據(attribute data),而是關系數據(relationaldata),是關于接觸、聯絡、關聯、群體依附和聚會方面的數據。這類數據將一個社會行動者與另一個社會行動者聯系在一起,而關系則被認為是表達了社會行動者之間的關聯。近年來,社會網絡分析法在知識管理與數據挖掘領域得到廣泛的應用,共詞分析是其應用的一個重要領域。從社會網絡分析的角度看,共詞能夠形成一個虛擬的關鍵詞網絡,每個關鍵詞都是這個虛擬網絡中的點(node)。關鍵詞是否同時出現或者同時出現的頻次決定了點在網絡中的不同地位以及承擔的不同角色。在一定的時間范圍內,那些共同出現頻次較多的關鍵詞也就擁有較多關系,其反映的內容也就是該主題的研究熱點。因此,關鍵詞網絡分析對于了解一個研究主題的成熟度、知識結構、研究規模等狀況具有非常重要的意義。
綜合以上分析,本文遵循以下幾個步驟進行研究:
第一,文獻檢索。沿著“中國期刊網(CNKI)——中國期刊全文數據庫——外語類核心期刊”這條路徑進行檢索。確定“自主學習”和“學習者自主”為檢索詞,檢索項“關鍵詞”,檢索范圍“外國語言文學”,時間范圍“1978~2010年”。將檢索得到的文獻做去重與合并處理,最終留下文獻130篇。并對這130篇文獻以及相關的信息進行分類匯總與數據描述。
第二,數據提取。為避免關鍵詞命名不規范等問題,本文采取如下處理方式:合并基本同義的關鍵詞,例如將“學習者自主”和“學習者自主性”合并為“學習者自主”,將“自主學習”和“自主性學習”合并為“自主學習”,將“自主學習中心”、“自主語言學習中心”和“語言自主學習中心”合并為“自主學習中心”,將“網絡化教學”、“基于網絡的教學”和“網絡支撐的教學”合并為“網絡教學”等等;刪除無益于研究、不存在領域專指度的詞匯,例如“對策”、“影響”、“研究”等等。
第三,數據預處理。使用Donohue高頻詞與低頻詞界分公式計算高頻詞閥值:
其中II是詞頻為1的個數,T為高頻詞與低頻詞界限值。根據Donohue公式,得出高頻詞與低頻詞的界限值,并根據此界限值去掉非高頻詞,以此來簡化結果,突出重點。根據組合數計算公式:
對關鍵詞進行兩兩配對(其中n為網絡規模,k為關鍵詞分組規模,在本文中k=2),形成共詞矩陣并進行二值化(dichotomize)處理后,轉換為二值矩陣,為接下來的社會網絡分析做準備。
第四,社會網絡分析:繪制共詞網絡社群圖、網絡密度分析、中心性分析、核心-邊緣結構分析。
使用Excel 2003進行數據收集與數據預處理,使用UCINET 6.0進行社會網絡分析。
四、結果與分析
1.描述統計
130篇文章覆蓋10份外語類核心期刊,其中最早刊登有關自主學習主題的雜志是《外語界》。截至2010年,刊登有關自主學習文章最多的雜志也是《外語界》,共有57篇文章。從1999年起,有關自主學習的文章逐漸增多,2005年是刊登有關自主學習文章最多的年份,隨后的2007年和2008年有所下降,之后2009年和2010年又持續上升(表1)。



130篇文獻中有246個關鍵詞(合并處理后),大多數文獻包含2-5個關鍵詞不等,根據公式②得到616組原始關鍵詞對。根據公式①計算得到高頻詞與低頻詞閥值T=4.77。因此去掉頻次小于5的關鍵詞,最后得到32個高頻關鍵詞,形成共詞矩陣,并轉化為二值矩陣。這32個高頻關鍵詞按照頻次由高到低依次排列為:大學英語教學、自主學習、元認知、學習者自主、網絡環境、自我評估、建構主義、自主學習中心、學習策略、問卷調查、網絡教學、實證研究、教學改革、訪談、人本主義、教學模式、課堂教學、反饋、同輩評估、聽力自主學習、自我監控、網絡自主學習、自我效能感、適應性、研究性學習、學習動機、自主學習能力、雙中心教學模式、以學生為中心的教學模式、協作學習、合作學習、語料庫等。這些截止到2010年的高頻關鍵詞初步確定了國內外
語教學中自主學習的研究重點。
2.社群圖
使用UCINET 6.0繪制社群圖(圖1)。社群圖直觀地反映了共詞網絡的整體特征。圖中32個關鍵詞用圓點標記,圓點之間的雙箭頭直線表示兩點之間存在關系,即在同一篇文獻中共現。圓點越大,其點度中心度(point centralny)就越大(有關點度中心度的概念請參閱下文中心性分析)。圖中“大學英語教學”、“自主學習”、,“學習者自主”、“自主學習中心”、“元認知”等一些點較大,周圍關系豐富,處于網絡的中心位置。而另外一些處于網絡邊緣的點,例如“語料庫”、“適應性”等,擁有的關系相對較少,在社群圖中顯得比較孤立。社群圖直觀地反映了在自主學習研究中,哪些領域是研究重點,發展比較成熟,哪些領域還處于不成熟狀態。
3.網絡密度
為獲得社群圖整體狀況的定量描述,需做網絡密度測量。密度是指網絡中各個點之間關系的緊密程度,是社會網絡分析常用的測度之一,該測度的取值范圍為[0,1],數值越大,密度越大。UCINET 6.0計算網絡密度為0.1976,這意味著在規模為32個點的關系網絡中,理論上最多存在496個關系(根據公式②),但實際上只存在大約98個關系。顯然,在32個關鍵詞中,關系大多都是“稀疏連接”的,密度較低,自主學習研究的深度還不夠。
4.中心性
中心性指行動者在網絡中處于一個怎樣的地位,擁有怎樣的權利(power)。行動者越處于網絡的中心位置,其影響力越大。就共詞網絡而言,關鍵詞越處在網絡的中心位置,所代表的內容就越能成為該研究領域的重點。中心性分析包括特征向量(eigenvector)、點度中心度、中間中心度(betweenness centrality)與接近中心度(closeness centrality)四個主要測度。
特征根向量是刻畫行動者中心性以及網絡中心勢的一種標準化測度,能在網絡整體結構的意義上,找到網絡核心的成員。表2第5列反映的就是各關鍵詞的相對特征根向量(表2關鍵詞按點度中心度的數值由高到低排序)。該值越大,在網絡中就越處于核心的位置。共詞網絡的特征根向量中心度的平均值為0.154,標準差為0.088。圖2-A反映的是特征根向量中心度的分布,越靠近圓圈中心的位置,其特征根就越大,也就越處于核心的位置。“大學英語教學”等7個關鍵詞(菱形點)的特征根較大,處于網絡的核心位置。



在一個社會網絡中,如果一個行動者與很多其他行動者之間存在直接聯系,那么該行動者就居于中心地位,在該網絡中擁有較大的權力。在這種思路的指導下,網絡中一個點的點度中心度,就可以用網絡中與該點有直接聯系的點的數量來衡量。“大學英語教學”、“自主學習”、“元認知”、“學習者自主”、“網絡環境”、“自我評估”、“建構主義”等關鍵詞的度數高于其他各點。這些關鍵詞所代表的研究領域在共詞網絡中處于中心地位,擁有較大的權利,在網絡中的交流過程也比較活躍,與其他點保持較多的關系(圖2-B,菱形點為活躍關鍵詞)。
如果一個點處于許多其他點對(poim pair)的測地線上,或者說如果一個點處于許多其他兩點之間的路徑上,我們就說該點具有較高的中間中心度,起到了橋梁的作用。一個點的中間中心度高,說明網絡中其他點對它的依賴強,這個點處于網絡中心位置;一個點的中間中心度低,說明網絡中其他點對它的依賴弱,這個點處于網絡的邊緣位置。“大學英語教學”和“自主學習”的中間中心度數值仍遠大于其他關鍵詞。正是由于這兩個關鍵詞的橋梁作用,共詞網絡才相互連接,沒有離散。此外,表2中有14個關鍵詞的中間中心度為0,占共詞網絡的43.74%,這個比例很高。說明網絡中的信息流動依賴于“大學英語教學”和“自主學習”等少數幾個關鍵詞,其他不少關鍵詞處于網絡的邊緣。或者說,這些關鍵詞在共詞網絡中的存在嚴重依賴其他關鍵詞。關于這一點,從圖2-C中可以得到清晰地印證。
接近中心度是指一個點是否通過比較短的路徑與其他點相連。路徑較短說明該點在傳遞信息上較少依賴其他的點;路徑較長說明該點多半需要通過其他點來傳遞信息。因此,接近中心性數值越小的點在網絡中越處于核心地位。從表2的數據結果中可以看出,“大學英語教學”、“自主學習”、“元認知”、“學習者自主”、“自主學習中心”等關鍵詞的接近中心度值較小,這些關鍵詞能以最短的路徑到達其他點,在網絡中處于比較核心的位置。而正如上文所述,“反饋”、“同輩評估”和“訪談”等關鍵詞的“接近中心度”較大,它們需要依靠網絡中其他的點來傳遞信息(圖2-D)。
從共詞網絡的整體中心性來看,網絡中的點相異程度低,相似性高,信息流動相對集中,自主學習的研究重點都分布在幾個中心度較高的關鍵詞上。
5.核心-邊緣分析
核心-邊緣模型是現實社會網絡的一種簡明關系視圖,也是量化核心度(coreness)的一個基礎。核心度是對關鍵詞在共詞網絡中處于什么位置(核心、半邊緣、邊緣)的一個量化認識,或者說核心度用一種簡明的關系圖式來表示不同關鍵詞在網絡中的不同位置。核心,邊緣理想模型是將關鍵詞分為兩組,其中核心組成員之間關系緊密,而邊緣組成員之間沒有關系,但邊緣組成員都與核心組成員存在關系。不過在現實網絡中,成員之間并不一定存在如此嚴格的量化關系。例如邊緣組內部成員之間會或多或少地存在聯系。



共詞網絡核心度計算結果顯示實際數據與理想模型之間的相關系數為0.825,屬強相關,說明數據分組與理想模型之間關系比較緊密。各關鍵詞的核心度數值如表2所示。對核心度向量進行數據重排,得到圖3的核心,邊緣矩陣。圖3中的紅線將矩陣由左至右劃分為核心、半邊緣和邊緣三個部分。
核心度數值>0.15的關鍵詞為核心關鍵詞,核心度數值≤0.15且≥0.05的關鍵詞為半邊緣關鍵詞,核心度數值<0.05的關鍵詞為邊緣關鍵。根據此標準對表2中的數據進行歸類,得到詳細的核心,邊緣分類(表3)與核心。邊緣結構圖(圖4)。與圖3類似,圖4中的兩個紅色圓圈將關鍵詞由內到位劃分為核心、半邊緣和邊緣三個部分。
五、總結
綜上所述,我國外語教學中自主學習的研究有如下特點:
第一,“大學英語教學”既處于共詞網絡的核心地位,也是聯系其他關鍵詞的重要橋梁。因此,我國外語界對于自主學習的研究主要以大學英語教學為背景,自主學習理念得到了廣大高校英語工作者的認可。但這也反映出一個問題,即自主學習的研究基本上局限于大學英語教學,很少涉及小學、初中和高中。
第二,網絡中的信息流動過分依賴于“大學英語教學”和“自主學習”兩個點。當然,共詞網絡中還有其他一些點,例如“學習者自主”、“元認知”、“學習策略”、“網絡環境”、“自主學習中心”、“建構主義”等等,這些點代表的研究領域也是自主學習目前研究的重點。
第三,對于某些研究主題,例如“語料庫”、“自我監控”、“同輩評估”、“協作學習”、“合作學習”、“研究性學習”、“學習動機”等等在自主學習中的研究還處于不成熟狀態。
第四,“問卷調查”、“反饋”、“訪談”等研究手段仍處于共詞網絡的邊緣,研究方法的局限性在一定程度上制約了自主學習研究的發展。
第五,從整體來看,我國對于自主學習的研究相似程度較高,信息流動相對集中,缺乏新意;而且各關鍵詞所代表的主題之間缺乏橫向聯系,研究的深度明顯不足。
根據我國自主學習研究的特點,本文提出如下建議:第一,研究可擴大應用范圍,嘗試進行不同層次的自主學習研究,例如在中、小學外語教學中開展自主學習研究;第二,加強自主學習研究領域之間的橫向聯系,加強邊緣與半邊緣研究領域的研究,避免研究局限于少數幾個千篇一律的主題;第三,在自主學習研究中應更多地引入實證研究,采用“問卷調查”、“反饋”、“訪談”等手段收集數據,用事實說話。
綜上所述,本文在社會網絡分析定量方法的基礎上,對我國外語教學中自主學習的研究現狀以及將來的發展方向做了分析。期望本文的研究結果能為我國下一階段自主學習研究的規劃與布局提供參考。
作者簡介:唐進,成寧學院副教授,碩士研究生。研究方向:數據挖掘。
收稿日期:2011年11月25日
編輯:李原