摘要:該文運用數理統計的方法對我國目前的教育情況進行了分析。首先,應用回歸分析建立了從1990年至2006年17年來全國高校的招生人數與各產業從業人員數之間的回歸模型,然后對我國高校教育近幾年(1999年~2006年)的各專業畢業情況進行對應分析,得到一些結果,對我國的高校招生人數有一定的參考價值。
關鍵詞:回歸分析;回歸模型;回歸方程;對應分析;因子平面點聚圖;SAS程序
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2009)04-0903-03
The Analysis as to the Situation of Our National High Education
SONG Shuo
(College of Science, Wuhan University of Science and Technology, Wuhan 430065, China)
Abstract: In this paper, we analyze the situation of our national education by the method of mathematical statistics. First, we have built the regression model of the relationship between the number of the whole national new students' enrollment and each industrial workers from 1990 to 2006 by regression analysis. Second, nowadays, at the condition of our national high education, we have correspondingly analyzed the situation of each major's graduation and got a series of datas. We are sure that the data will five some valuable reference to our national new students' enrollment.
Key words: regression analysis; regression model; regression equation; correspondence analysis; plane graph of factor concentration; SAS program
1 引言
在當今全球日新月異高速發展的時代,優化調整產業結構已成為經濟持續穩定增長的重要途徑。而產業結構的改變就決定了就業結構的轉變,我國是農業大國,第一生產力占從業人員中比率較大,要將他們逐步轉化為二、三產業的勞動力,就需提高他們的知識技術水平和科學文化素質。中等技術學校和高等學校都是轉化勞動力的橋梁,因而大力提高高等學校的招生率成為我國勢在必行的教育目標。1999年,我國開始實行了高等學校全面擴大招生比率的方案,以提高全民整體素質,從而達到轉化勞動力以適應經濟高速發展的需要。但招生比率的擴大是會受到就業率限制的,所以本文通過建立數學回歸模型定量的探討就業結構對招生比率擴大的影響。
2 建立回歸模型
2.1 建立三大產業從業人員與高等院校的招生人數間的回歸模型
三大產業的產業特性對其從業人員的素質提出了不同的要求。根據常識我們知道,第一產業是農業,我國目前的農業基本上停滯在自然生產階段,沒有過多高科技技術運用,所以對勞動力素質的要求不是太高,而第二、三產業是工業、服務業等,其中高科技的運用較多,從而對高科技的要求頗高,對其從業人員的素質的要求就會高些。所以二、三產業的發展壯大是要求提高勞動力素質的關鍵,因而采用從1990年至2006年17年來全國高校的招生人數與各產業從業人員數之間建立回歸模型。得到結果如下:
Analysis of Variance
Sum ofMean
SourceDF SquaresSquare F Value Pr > F
Model 351686 1722937.24 <.0001
Error 136013.68638462.59126
Corrected Total 1657700
Root MSE 21.5079R-Square0.8958
Dependent Mean 102.02353 Adj R-Sq0.8717
Coeff Var21.08135
ParameterEstimates
ParameterStandard
Variable DFEstimateError t ValuePr > |t|
Intercept1217.09226 79.49459 2.730.0172
x41 -0.01161 0.00334-3.480.0041
x51 0.085840.014146.07<.0001
x61 0.049060.006317.78<.0001
由以上圖表分析知:
回歸方程為:Y=217.09226-0.01161X4+0.08584X5+0.04906X6(1)
(X4,X5,X6分別為第一,第二,第三產業的從業人員數)回歸方程中的F檢驗的置信度小于0.0001,方程顯著成立。X4,X5,X6在T檢驗的置信水平為0.005時,各回歸系數也顯著成立。
X4的系數為負值說明第一產業從業人員數與高校招生數呈負相關,在我國第一產業還處在原始的自然生產階段,沒有高科技的運作,對其從業人員的要求也比較低。我國的第一從業人員基本都是沒有接受中等教育的,所以他們的數量必將阻礙高等教育的開展。X5,X6系數均為正值說明第二,三產業的發展會促進高等教育的開展,二,三產業大多是知識型的人才構成,其從業人員的增加自然是源于高等教育發展的結果。而且第二產業主要是工業行業組成,工業凝聚了我國的高新科技人才,它對其從業人員的文化素質技術水平的要求自然比第三產業即服務業的要求高,所以X5的系數比X6的系數大。以上分析說明得到的回歸方程符合實情。因而我們可以根據我國現在的各產業從業人員人數現狀對高校的擴招人數做合理的規劃,以適應就業人員形式的要求。
2.2 建立三大產業從業人員與中等技術學校的招生人數間的回歸模型
高校是高素質人才培養的搖籃,是我國提高全民素質的主要支柱,而中等技術學校也是我國提高勞動力技術水平必不可缺的。它與三大產業從業人員間有什么關系,以及它們之間的關系與高等院校和三大產業從業人員間關系有何異同。所以采用從1990年至2006年17年來全國中等學校招生人數與各產業從業人員數之間建立回歸模型。得到結果如下:
Analysis of Variance
Sum ofMean
Source DFSquares Square F Value Pr > F
Model 3219227307.25407 111.44 <.0001
Error 13852.4483765.57295
Corrected Total 16 22774
Root MSE8.09771R-Square 0.9626
Dependent Mean 110.37647Adj R-Sq 0.9539
Coeff Var7.33645
Parameter Estimates
ParameterStandard
VariableDF EstimateError tValuePr > |t|
Intercept 129.3144829.929620.90.0452
x41-0.007710.00126 -6.13<.0001
x510.02747 0.00532 5.16 0.0002
x610.00287 0.00237 1.21 0.0478
由以上圖表分析知:
回歸方程為Y=29.31448 -0.00771X4+0.02747X5+0.00287X6(2)
(X4,X5,X6分別為第一,第二,第三產業的從業人員數)回歸方程中的F檢驗的置信水平等于0.0001,方程顯著成立。X4,X5,X6在T檢驗的置信水平為0.05時,各回歸也顯著成立。
與上述方程(1)結果相似,X4(第一產業從業人員數)的系數是負,X5(第二產業從業人員數)、X6(第三產業從業人員數)的系數都為正,說明第一產業從業人員抑制中等技術學校的發展,第二、三產業推動中等技術學校的發展。從(1)、(2)方程還可以看出,(1)方程中的系數均比(2)方程中的系數大,這說明各產業對高素質人才的需求遠遠大于對初等技術人員的需求。所以我們國家一方面要大力發展高等教育,同時也要兼顧中等技術學校的發展。
3 對應分析
對應分析,也稱相應分析,它是R型因子分析和Q型因子分析的基礎上發展起來的一種多元統計方法。它的具體原理在這里就不作介紹了。
鑒于因我國各方面人才需求不同高校培養各專業人才的比例也會相應有所調整,對我國高校教育近幾年(1999年—2006年)的各專業畢業情況進行對應分析,得到結果如下:
3.1 慣量和x2的分解
Singular Principal Chi-
Values InertiasSquaresPercents1428425670
----+----+----+----+----+---
0.04035 0.00163 10803.868.55% ************************
0.02166 0.00047 3111.6419.74% *******
0.01554 0.00024 1603.0910.17% ****
0.00603 0.00004 240.956 1.53% *
……
0.00238 15759.5 (Degrees of Freedom = 28)
由于前兩個特征根的累積貢獻的 百分比已達88.29﹪,說明用兩個公因子已能代表了變量與樣品的主要信息.其中的第一個公因子占68.55﹪,第二個公因子占19.74﹪.
3.2 變量的概括統計量
(其中Y1是人文學科,X7是工科,X8是理科,X9是農學,X10是醫學)。
Summary Statistics for the Column Points
Quality MassInertia
Y1 0.9533040.4005840.214518
X7 0.9468520.1165960.434386
X8 0.9349500.3756720.084693
X9 0.9204200.0361720.186009
X100.2089530.0709760.080394
從Quality(兩個公因子貢獻率之和)可看出,兩個公因子在前四個變量上的貢獻率都接近1,說明這些年我國在人文、理工、農業方面投入都相當多。從Mass(各變量的邊緣頻率)來看,Y1(人文學科)和X8(理科)占有絕對的優勢,即文、理兩科仍然是我國教育投入的重點,從Intertia(變量對特征值的貢獻)來看,X7(工科)的值最大,這說明工科也是我國高等教育投入的重點,說明工科在所有的學科當中處在相當重要的地位,也就是高校一直都把工科作為比較重要的培養學科,這與我國社會需求也是相符合的。
3.3 變量與樣品的因子平面點聚圖
Plot of DIM1*DIM2$YEAR.Symbol used is '*'.
,,^ f f f f f f f f f f f f f f ^ f f f f f f f f f f f f f f ^ f f f f f f f f f f f f f f ^ f f f f f f f f f f f f f f ^ f
DIM1
0.09^ * X7 ^
, * 1999 ,
,* X9,
,,
,,
0.046^^
,* 2006,
, X10 ** 2001,
,,
,* 2001,
0.000^ ^
, X8 * ,
,2002 ** 2003,
,2004 * * Y1 ,
,,
-0.046^ ^
,,
, * 2005,
,,
,,
-0.091^
■^ f f f f f f f f f f f f f f^ f f f f f f f f f f f f f f^ f f f f f f f f f f f f f f^ f f f f f f f f f f f f f f^ f f f f f f f f f f f f f f^ f f f f f f f f f
-0.3 -0.2 -0.10.00.10.2
DIM2
根據上面的變量與樣品的因子平面點聚圖,可以把1999年至2006年高校在各專科畢業生的側重點分為三類,第一類為1999年的高校畢業,這一年畢業生主要集中在工科(X7)和農學(X9)兩個專業。第二類為2000,2001,2006年的高校畢業生,在這三年里畢業生主要集中在醫學。第三類為2002,2003,2004年的高校畢業生,在這三年里畢業生主要集中在理科。
由此我們可知在2004年及此前我國的教育側重點在農業和工科。農業是我國的基礎產業,我國一直都很重視農業的發展,而九十年代初也正是我國由農業大國向工業大國轉型的重要時期,這與我國當時的情況是符合的。隨著時間的推移,人民的生活質量有了明顯的改善,人民將更多的精力投入到自己的健康狀況上,所以出現了1999、2001、2006年高校的畢業生在醫學業的集中。經濟的發展向來都是我國工作的中心,在高速發展的今天,理科尤其是作為基礎學科的數學越來越得到人們的重視。
4 結束語
第二、三產業對從業人員素質的要求較第一產業高,所以應加大對第二、三產業從業人員素質的培養。在這個過程中,要大力發展高等教育,同時也不能忽視中等技術教育的發展。文理一直是我國教育的重點,隨著經濟的發展,社會對理工科的要求也越來越高,所以我國高等教育在今后仍應以其為主。隨著人們生活水平的提高,人們對健康等的要求也有所提高,因而在今后的教育中應適當加大這方面的力度。
參考文獻:
[1] 樊家琨.應用多元分析[M].河南:河南大學出版社,1993.
[2] 張堯庭,方開泰.多元統計分析引論[M].北京:科學出版社,1997.
[3] 何曉群.現代統計分析方法與應用[M].北京:中國人民大學出版社,1998.
[4] 高惠璇等.系統使用手冊[M].北京:中國統計出版社,1997.
[5] 中國統計局.中國統計年鑒[M].北京:中國統計出版社,1990-2006.
宋碩(1981-),女,湖北武漢人,武漢科技大學信息與計算科學系教師,研究方向:統計分析。