大連理工大學(xué) 王子雄
數(shù)學(xué)建模的大致思路為:用數(shù)學(xué)的語言描述、簡(jiǎn)化、抽象實(shí)際問題,運(yùn)用計(jì)算機(jī)分析得出模型結(jié)果,再回到實(shí)際中檢驗(yàn)?zāi)P偷男Чㄟ^靈敏度檢驗(yàn)觀察模型的穩(wěn)定性,在確定模型的可行性后對(duì)未來情況進(jìn)行預(yù)判,或者給出相對(duì)于現(xiàn)狀更優(yōu)化的解決方案。數(shù)學(xué)建模的一般步驟為:情景分析→模型假設(shè)→模型求解→模型分析→模型檢驗(yàn)等。
在數(shù)學(xué)建模過程中經(jīng)常會(huì)遇到大量數(shù)據(jù)需要整理、分析,即數(shù)據(jù)處理。在建立模型的初始階段,對(duì)數(shù)據(jù)的分析有助于我們尋求變量間的關(guān)系,形成初步想法;有些模型還可以從大量觀測(cè)數(shù)據(jù)中,利用統(tǒng)計(jì)的方法直接建立,如回歸分析法、時(shí)序分析法等;還經(jīng)常利用數(shù)據(jù)來估計(jì)模型中出現(xiàn)的參數(shù)值,甚至還利用數(shù)據(jù)進(jìn)行模型檢驗(yàn),比較模型運(yùn)算出的理論值與相應(yīng)實(shí)際數(shù)據(jù)的大小。由此數(shù)據(jù)處理非常重要,下面介紹數(shù)據(jù)處理常用的方法和使用的軟件。
在數(shù)學(xué)建模過程中,需要計(jì)算數(shù)據(jù)的平均值、中位數(shù)、標(biāo)準(zhǔn)差、方差、最大值、最小值、置信度等。事實(shí)證明,只需要Excel,就可以解決這些基本的數(shù)據(jù)處理問題。Excel可以實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類、篩選、排序等操作,讓我們對(duì)數(shù)據(jù)有一個(gè)初步的認(rèn)知。我們還可以用Excel繪制直方圖、散點(diǎn)圖、折線圖,從而反映數(shù)據(jù)的分布信息,隨時(shí)間的走勢(shì)以及不同數(shù)據(jù)所占比等信息。
回歸分析是一種常用的數(shù)據(jù)分析方法,用來尋找自變量和因變量之間的關(guān)系,包括線性回歸和 Logistic 回歸。它從一組數(shù)據(jù)出發(fā),確定多個(gè)變量之間的具體函數(shù)關(guān)系之后,再對(duì)這些數(shù)據(jù)之間關(guān)系的可信度進(jìn)行檢驗(yàn)。在具體問題中,我們經(jīng)常會(huì)遇到一件事情受到多個(gè)因素影響的情況,回歸分析的原則是保留產(chǎn)生主要影響的變量,剔除影響不顯著的變量,從而減小誤差,使結(jié)果更貼合實(shí)際情況。回歸分析一般用來觀察未來數(shù)據(jù)的走勢(shì),作出預(yù)判,從而為決策者提供一些建議或解決方案。Matlab中的regress(),polyval()等函數(shù)都能進(jìn)行回歸分析。
在建模比賽中,經(jīng)常會(huì)遇到一類問題:尋找自變量x與因變量y的函數(shù)關(guān)系,這時(shí)候我們就需要采用插值與擬合的分析方法。插值是指在平面內(nèi)有一些離散的點(diǎn),通過規(guī)定格式的函數(shù)曲線將這些點(diǎn)連起來,進(jìn)而尋找離散點(diǎn)之外的其他地方的數(shù)值。常見的插值方法有Lagrange多項(xiàng)式插值、Hermite插值、分段線性插值和三次樣條插值等。擬合也是已知一些離散點(diǎn)(x1,y1),(x2,y2)…(xn,yn),不同于插值的是,擬合不要求所得函數(shù)經(jīng)過全部點(diǎn),只要求在某種意義下在這些點(diǎn)處的偏差最小。最常用的方法是最小二乘法。具體操作為:先選定一組函數(shù)r1(x),r2(x),…rn(x),它們是擬合函數(shù)的組成部分,函數(shù)f(x)=a1r1(x)+a2r2(x)+…+anrn(x),其中,系數(shù)a1,…,an為待定系數(shù),再利用最小二乘法確定系數(shù),即:

求出a1,a2,…an使得J(a1,a2,…an)最小。特別的,如果是多項(xiàng)式擬合,matlab提供命令polymit(x,y,n),n為最高次數(shù),xy為擬合數(shù)據(jù),a為所求的多項(xiàng)式系數(shù)。
該方法應(yīng)對(duì)的是高維數(shù)據(jù)問題。已知數(shù)據(jù)一共有n維指標(biāo):x1,x2…xn,變量之間存在一定的相關(guān)性,信息有重疊。因此要通過主成分分析方法克服相關(guān)性與重疊,通過原指標(biāo)的一些線性組合:

反應(yīng)原指標(biāo)的大部分信息,從而達(dá)到降維的目的。Matlab中的pcacov函數(shù)即可實(shí)現(xiàn)主成分分析的功能。該函數(shù)的調(diào)用方法如下:[vec1,lamda,rate]=pcacov(temp),temp為相關(guān)系數(shù)矩陣,vec1為主成分的系數(shù)矩陣,lamda為特征值矩陣,rate為特征值各自的貢獻(xiàn)率。
數(shù)據(jù)處理在數(shù)學(xué)建模中起著極其重要的作用,采用準(zhǔn)確合理的數(shù)據(jù)處理方法能夠完成看似復(fù)雜的實(shí)際問題,化繁為簡(jiǎn),將定性分析變?yōu)槎糠治觯茖W(xué)可靠。上述方法均為作者在參加數(shù)學(xué)建模比賽中用到的方法,易于理解且實(shí)用性強(qiáng)。掌握了Matlab的這些功能,可以大大提高數(shù)學(xué)建模的效率。
[1]施吉林,張宏偉,金光日.計(jì)算機(jī)科學(xué)計(jì)算[M].北京:高等教育出版社,2013(8).
[2]司守奎,孫兆亮.?dāng)?shù)學(xué)建模算法與應(yīng)用[M].北京:國防工業(yè)出版社,2015(4).