丁永剛,金夢甜,桑秋俠 ,張 馨
(湖北大學教育學院,湖北武漢430062)
國內教育技術學核心網站測定實證研究*——基于網絡信息計量學指標
丁永剛,金夢甜,桑秋俠 ,張馨
(湖北大學教育學院,湖北武漢430062)
為了從數量眾多的教育技術網站中挖掘出核心網站,文章以國內7大類共307個教育技術學網站為研究樣本,依據“頁面總數”、“總入鏈數”、“網絡影響因子”等網絡信息計量學指標,利用布拉德福定律和網絡影響因子法對國內教育技術核心網站進行測定,并對不同方法測定所得結果進行分析、討論,研究結果表明這種評價方法是科學、有效和可靠的。
核心網站評價;計量學指標;教育技術學;布拉德福定律
網絡信息計量學(Webometrics)是采用數學、統計學等各種定量方法,對網上信息的組織、存貯、分布、傳遞、相互引證和開發利用等進行定量描述和統計分析,以揭示網絡信息數量特征和內在規律的一門新興學科[8]。隨著網絡信息計量學研究的不斷深入,網絡信息計量學方法已經廣泛運用于國內圖書情報學網站[1]、中國大學網站[2]-[4]、中國社會科學院網站[5]、中外企業網站[6]、團購網站[7]等學術性網站和電子商務網站的評價與信息有效性分析中。
隨著教育技術學科的興起和不斷發展,與教育技術學科相關的網站不斷涌現。其中一些網站發布的教育技術專業信息不僅量大,而且穩定,專業人士訪問率高,這些網站在一定程度上反映了教育技術學方向的研究水平和發展動態,具有較高的學術及應用價值,是教育技術核心網站。同時我們也意識到,由于各級(省、市、區)教育技術網站建設水平參差不齊,一些內容缺乏針對性,管理及維護不夠完善的教育技術相關網站也大量存在。對此,我們提出這樣一個問題,即如何才能從數量巨大、類型眾多、結構各異的教育技術網站中挖掘出教育技術的核心網站。目前,對教育技術網站的評價大多采用定性分析的方法,除陳向東將鏈接分析法和流量分析法用于教育網站評價外[8][9],應用網絡信息計量學對教育技術學網站進行定量評價的相關研究尚不多見[10]。然而,以往的定性研究方法易受評價專家個人知識、經驗和好惡的影響而使得評價結果具有較大主觀隨意性。而定量評價方法的指標數據是由軟件或者其他非人工直接干預的方式產生,排除了人為主觀因素的影響,因而評價的指標數據較為客觀[11]。
文章依據上述思想,提出了一種基于網絡信息計量學指標的教育技術學(Educatioal Technology,ET)核心網站評價方法。本研究的主要目的在于利用布拉德福定律和網絡影響因子法,從眾多教育技術網站中甄別出核心網站,并對這兩種方法測得的結果進行綜合分析及評價。同時,通過此實證研究,驗證網絡信息資源定量評價指標的有效性,為定量評價教育技術核心網站提供新的思路和方法。
1.選擇研究樣本
從理論上講,所有包含與教育技術學專業相關信息的網站均可視為教育技術學網站。但對于研究的可行性與可靠性來說,這樣的定義過于寬泛。因此,我們首先借鑒文獻[12]的研究方法,利用中國知識基礎設施(National knowledge infrastructure,CNKI)學術期刊全文數據庫,對我國教育類核心期刊 《中國電化教育》2009~2013年五年全年刊載的1897篇論文進行檢索,并對這1897篇論文的關鍵詞進行頻度分析,發現出現頻度較高的主題詞有:“信息技術”、“教學資源”、“教育信息化”、“網絡教育”、“遠程教育”、“網絡課程”、“教育技術”、“電化教育”等。這些主題詞在一定程度上體現了我國目前教育技術專業研究的重點問題和發展方向,綜合比較后,筆者們確定以上8個關鍵詞為教育技術學專業的特征詞。在本研究中只要包含上述主題詞中任意一個的網頁均被認定為教育技術學“相關網頁”,但這些相關網頁所屬的網站不一定是教育技術網站,因為存在著這樣一些網站,它的某個網頁可能只是對含有教育技術學專業相關特征詞的新聞進行報道、或只是對特征詞進行解釋(如百度百科,維基百科等網站)。因此需要對這些網站進行過濾,并刪除只包含少部分教育技術信息的網站。最終,我們得到的研究樣本共307個,分類后如表1所示。
進一步驗證,我們發現樣本中有的網站只包含部分信息技術內容;有的網站沒有明顯的特征將其歸屬到相應的類型中。將諸如此類的樣本刪除后,將其劃分為國家級教育資源網(庫)、省級教育資源網(庫)、教育技術期刊網、信息技術網站、專題學習網站、遠程教育網站和高等院校的網絡教育學院七大類,得到最終研究樣本共307個教育技術網站,如表1所示。

表1 最終研究樣本
2.獲取樣本數據
本研究要用到樣本網站的計量指標包括:網站總入鏈數、網站網頁總數和網站出鏈數。本研究依據參考文獻[13],在對幾大著名的搜索引擎進行覆蓋范圍、檢索準確度和檢索速度等性能綜合比較后,發現百度(https:// www.baidu.com/)的各項性能均優于其它搜索引擎。因此筆者們采用百度搜索引擎的相關指標檢索式來獲取數據。為了把搜索引擎穩定性的影響降到最低,筆者們集中在2015年6月10日完成研究數據的收集工作。
1.布拉德福定律方法
布拉德福定律是傳統計量科學的基本定律之一,主要用來描述科技論文在期刊中的分布規律,后來逐步發展成為傳統計量科學的基本規律之一[14]。近年來許多研究成果表明,網絡信息在許多情況下也具有與傳統信息類似的變化特點和分布規律,張洋[1]等在對我國圖書情報學核心網站測定的實證研究中也證實布拉德福定律在網絡環境下同樣具有適用性。因此我們依據布拉德福定律的基本原理,借鑒相關研究成果,采用 “總入鏈數”為評價指標,利用布拉德福定律方法來測定教育技術樣本網站中的核心網站。
(1)排序
首先,將307個樣本網站的“總入鏈數”按照遞減順序進行等級排序,如表2所示。

表2 教育技術網站“總入鏈數”排序表
(2)檢驗
利用布拉德福定律方法的圖像分析法檢驗樣本網站的“總入鏈數”是否符合布拉德福分布。仿照布拉德福的做法,以“樣本網站累計數n的自然對數lnn”為橫軸,以“總入鏈數的累計數R(n)”為縱軸,以表2中的數據(Lnni,R(ni))為坐標值作散點圖,得到布拉德福曲線如圖1所示。將圖1中的曲線與標準的布拉德福分散曲線作比較,可以發現兩者十分相似,曲線的下彎部分 (核心區)、直線部分以及彎曲下垂部分(格魯斯下垂)都清晰可見。因此,可以初步認為該數據確實符合布拉德福分布。

圖1 “總入鏈數累計數”的布拉德福曲線圖
(3)分區
由表2中的數據可知,網站總數量N=307,這307個網站的總入鏈數A=R(307)=9154780,分別取分區數m為3和6來計算布拉德福常數am(m=3,6)。
當m=3時,按照區域分析法,令每個區的網站總入鏈數的累積量相等,其平均值為A/m=3051593,按照這一平均值計算各區域中的網站累計數Nj(j=1,2,3),得到區域劃分的結果如表3所示。

表3 區域劃分的結果(m=3)
當m=6時,同理,得到區域劃分的結果如表4所示。

表4 區域劃分的結果(m=6)
結果表明,當m=6時,分區效果要好一些。根據表4的分析結果,選取m=6時的前5個區為核心區,即網站總入鏈數排名靠前的19個網站為核心網站,結果如表5所示。

表5 依據“總入鏈數”利用布拉德福定律方法測定的我國教育技術核心網站
此外,以網站的“網頁總數”為評價指標,采用與上述(1)~(3)相同的研究方法,同樣可以得到相應的核心區。為了便于比較,同樣取排名前19名的網站為核心網站,結果如表6所示。

表6 依據“網頁總數”利用布拉德福定律方法測定的我國教育技術核心網站
2.網絡影響因子法
網絡影響因子(Web Impact Factor,WIF)是從傳統計量科學中“期刊影響因子”的概念延伸而來,經過這些年的探索和積累,WIF研究取得了令人矚目的研究成果,逐步發展成為網絡信息資源定量評價的重要指標[15]。使用網絡影響因子來評價網站,可以消除歷史悠久、規模較大的網站在“吸引”網絡鏈接上所占據的優勢,從而更客觀地反映網站被利用的情況。
在本研究中,依據我們所收集的網絡數據,以網站的“總入鏈數”為分子、“網頁總數”為分母來計算各樣本網站的WIF。為便于比較,取WIF值排名前19的網站為核心網站,結果如表7所示。

表7 依據“網絡影響因子”測定的我國教育技術學核心網站
在本研究中,我們分別以“總入鏈數”、“網頁總數”和“網絡影響因子”為評價指標來測定我國教育技術核心網站,得到三組不同的核心網站(見表5、表6和表7,并在以下將這三種方法分別簡稱為A、B、C)。
總體上看,這三種方法的測定結果有一定差異,只有一個網站同時出現在三種測定結果中,即“中國教育和科研計算機網”。中國教育和科研計算機網是國內最權威的教育門戶網站,該網站提供中國教育、科研發展、教育信息化等與教育技術學密切相關的內容。因此,該網站被測定為教育技術核心網站是合理的,同時也從一定程度上反映了本文測定方法的有效性;另一方面,說明我國教育技術網站仍處于改進階段,不同的網站各有長處,但也存在各自的不足之處,因此特別權威的、公認的核心網站幾乎沒有。
通過對三種不同測量結果的比較分析,我們可以進一步發現以下特點:
(1)A和B方法均采用的是絕對值指標,其中有11個網站重復出現,重復率高達57.9%。采用絕對值指標的特點是網站規模越龐大則越有優勢。簡單地說,網站的總入鏈數或者網頁總數越大,則該網站越容易被測定為核心網站。例如,“21世紀教育網”作為一個國家級的教育資源網,教學資源容量巨大,網站規模可見一斑,因而在A、B方法中被測定為核心網站。
(2)在A和C的測定結果中,也有4個重復的網站,這是我們非常樂意看到的一種結果。A方法采用絕對值指標,C方法采用相對值指標,采用這兩種方法得到的共同的核心網站無論是在建設規模、資源容量,還是利用率上都相當可觀,可以確定為教育技術核心網站,這也在一定程度上說明了測量結果的可靠性。
(3)在A、B和C的測定結果中,絕大部分核心網站是國家級網站。特別是在A和B方法中,19個樣本都包含十個以上國家教育資源網。這說明國家在建設教育技術網站方面投入了較大的精力,而各省各地區在教育技術學科網站上的建設水平參差不齊,網站管理和應用等方面還有待改進。
(4)在C方法測定結果中,核心網站包含的網站類型較全面,且一些省市教育資源網和高等學校的網絡教育學院占有較大比例。這說明這些網站在利用率上要高于其它網站,因而被測定為核心網站。值得思考的是,其它一些網站,例如資源更為豐富的“國家基礎教育資源網”,專業底蘊深厚的各教育技術期刊網等,沒有被測定為核心網站,可能是因為這些網站存在利用率不高的問題。因此應該在這方面采取更多的措施和投入更多的管理,以免造成教育資源的浪費。
采用絕對值標準和相對值標準評測網站的重要程度,各有優劣。用絕對值指標評定時,可以以一種客觀的、直接的方式將結果展示出來,但是會受到網站規模大小、網站知名度等因素的影響,因而可能對結果產生一定的影響;采用相對值指標來測評時,結果可能更接近真實情況,但是由于各種搜索引擎對于各個變量的抓取方式或者定義不盡相同,則也會使網頁鏈接統計出現一定的偏差。但是,從本文的研究結果來看,這些方法都比較客觀地反映出我國教育技術網站的實際情況,且能夠相互印證、借鑒和補充。
通過以上實證研究,我們可以得出如下結論:
1.測量結果具有一定實用價值
本研究首先在樣本選擇上,科學界定教育技術網站;同時在研究方法上,運用了三種不同的方法,保證了測定結果的有效性和可靠性。此外,我們通過對測定結果的比較分析發現了目前教育技術網站存在的一些問題,從而引起網站建設者和使用者的廣泛關注,這對于教育技術核心網站的建設和改善起到很好的導向作用。
2.網絡信息計量學指標的運用,為教育技術網站的評價提供了新的方法和思路
目前的一些評價指標大多以定性為主,即使有定量指標,也只是較簡單的量化指標,不能滿足深層次的評價要求。本研究的開展在教育網站定量評價方面提供了一種有效的手段,在一定程度上能夠彌補教育技術核心網站在定量研究方面存在的不足。研究結果表明這種評價方法是科學、有效和可靠的。在以后的研究中我們將不斷探索、尋求更合理的方法,使評價結果更有效、更權威。
[1]張洋,弋云.應用網絡信息計量指標測定我國圖書情報學核心網站的實證研究[J].圖書情報知識,2011(1):82-87.
[2]邱均平,陳敬全,段宇鋒.中國大學網站鏈接分析及網絡影響因子探討[J].中國軟科學,2003(6):151-155.
[3]謝奇,張晗.中國大學網站的網絡計量學研究[J].現代圖書情報技術,2005(7):74-77.
[4]劉媞媞.基于鏈接分析的山東高校網站評價研究[J].泰山醫學院學報,2011(11):920-924.
[5]殷之明,冷熠.網絡信息計量實證研究——中國社會科學院研究所網站評價[J].科技情報開發與經濟,2009,19 (19):100-102.
[6]陳太洋,任全娥.中外企業網站的鏈接分析與網絡影響力評價[J].信息系統,2008,31(4):614-619.
[7]李蹊.基于鏈接分析的我國主要團購網站影響力評價研究[J].情報探索,2012(12):46-48.
[8]陳向東.一種新的教育網站評價方法——鏈接分析[J].中國電化教育,2007(7):64-67.
[9]陳向東.基于流量分析的教育網站評價[J].現代遠距離教育,2007(1):15-17.
[10]曹梅.教育網站評價的網絡計量模式初探[J].開放教育研究,2011(10):103-107.
[11]白銀,曹梅.國內教育網站評價研究概述[J].現代教育技術,2011(1):107-111.
[12]紀宏璠,江倩,雷體南等.教育技術學研究動態透視—《電化教育研究》2007-2010年載文分析[J].軟件導刊,2011(8):43-46.
[13]信息檢索系統的相關詞提示技術與評測[J].情報理論與實踐,2007,30(1):100-104.
[14]張洋.網絡信息計量學理論與實證研究[M].北京:科學出版社,2009.
[15]孫建軍,李江.網絡信息計量理論、工具與應用[M].北京:科學出版社,2009.
(編輯:楊馥紅)
G40-057
A
1673-8454(2016)09-0019-05
本文受湖北省教育廳人文社會科學研究項目“基于網絡信息計量學指標的國內教育技術核心網站實證研究”(項目編號:2012G031)資助。