吳 晟,吳興蛟,李英娜,劉英莉
(昆明理工大學信息工程與自動化學院,云南昆明650500)
人們為了解世界,需要使用一種精確的語言來描述世界中某些特定現象,從而將現實世界現象理想化。數學建模就是一種使用數學方法解決各種實際問題的橋梁。隨著計算機技術的發展,數學建模成為一種越來越重要的知識技能和科研技能[1]。
在信息爆炸時代,信息的積累已經到了開始引發變革的程度,信息不僅變多,而且增長速度變快,甚至引發信息形態的變化,于是出現了“大數據”這個全新的概念[2]。
大數據時代下數學建模背景的改變會帶來一些具有時代特性的更改。在教學實踐中,如果還采用原先的教學模式難免使學習的知識跟不上時代步伐,因此需要對教學模式進行適當改進,使學為所用,讓學習跟上時代步伐。
傳統的數學建模一般著重于模型加程序,主要體現在研究內容、研究方法、研究結果3個方面[3]。傳統的數學建模一般注重于模型的運用和程序的編寫,對于數學建模課程的講授著重于模型的了解及模型的運用。
(1)創新作用:數學建模是一個理論創新過程,是將已有方法、理論在合理保障下運用新領域的過程,是用數學思維和語言規范現實問題的方式。通過建模,可以開闊思維,鍛煉不同角度思考問題的能力。
(2)綜合作用:數學建模是一個綜合學科的建模過程,也是一個團隊合作過程,將實際問題抽象為數學問題后使用計算機技術或者算法對問題進行求解;再使用書面語言描述求解過程。建模問題源于實際,用于解決實際問題。實際問題本身不受任何方法或者領域的約束,數學模型是為了用于解決實際問題,本身屬性決定其具有綜合性。
(3)橋梁作用:數學建模的橋梁作用主要體現在4個方面,一是溝通實際世界與理論研究;二是從課堂過渡到科研;三是聯系多學科,實現學科間交叉運用;四是促使非專業科研人員上升為科研人員。數學建模的實質是運用數學的方法創建一個描述現實世界某一事物的過程[4],是將現實世界事物抽象的過程,是建立客觀的現實世界標準描述的過程。數學建模需要經過問題發現—抽象—解決的科研過程,只是周期相較科研來說較短,然而科研所要求的精確和審慎在建模中也有充分體現。實際問題的學科劃分是社會分工的區分,劃分并不能真正把問題進行分解,需要多學科協同,建模就整合了多學科資源,建模要求對問題進行探究,對問題主要矛盾的選取是衡量研究者是否是一個合格科研人員的基本因素。
數學建模的運用已經滲透到了方方面面,可以說有問題的地方都有模型,對于數學建模在教學和學生學習階段的重要性不言而喻[5-9]。
大數據定義一直飽受爭議。IBM將大數據的定義概括為三V:數量(Volume)、種類(Variety)和速度(Velocity)[10]。數據的處理容量一般都是基于PB、TB而言的。大數據時代下對于數據的處理與發現有以下特征[11]:①數據收集是一種技術與業務并存的方式;②大數據技術與具體的領域結合更加緊密;③數據隱私成為又一敏感話題;④數據挖掘和分析技術成為社會高端技術;⑤大數據運用平臺越加廣泛。
針對這一背景,對于數學建模課程有以下建議和思考:
(1)將大數據的思維帶入數學建模課堂中。大數據開啟了一次重大的時代轉型,大數據正在改變我們的生活以及理解世界的方式,成為新發明新服務的源泉,而更多的改變正蓄勢待發。數學建模中的大數據思維方式主要涉及以下幾方面[12]:①強調整體性,大局觀。主要是對于建模數據的處理環節,傳統建模問題涉及的數據處理方式是強調使用部分數據替代整體數據的方式,也就是采用抽樣或者其他統計方式進行,往往強調的是局部樣本代替總體進行規律探尋,這種方式下會造成信息缺失和信息遺漏;而大數據下數據建模強調的是一個都不能少,也就是要使用全量數據進行規律發掘,這樣就要求模型對于數據的容錯率提升。②強調多樣性。小樣本時代,數據獲取都是通過不斷的核實和處理過的,數據具有天然的準確性,但是在大數據時代背景下,首先應該承認數據的多樣性,也承認那些非結構數據的合理性,要對這些數據進行處理。除了考慮處理結構數據也要考慮處理非結構數據。這就對于建模數據處理方式以及建模工具的探索必須有足夠多的了解以及應用,同時開始將建模的關注點從那些結構化數據轉移到非結構化數據上。③注重數據的平等性。在小樣本時代一般使用權值思想處理一些問題,強調數據貢獻度;但是大數據下,每個數據都應該考慮同樣的貢獻度,都應該得到相同的對待。④數據來源的多樣性以及數據的關聯性。小樣本強調數據的來源需要來自于同一領域,但是大數據時代需要的數據是來自不同領域的,數據來源考慮廣泛性。傳統的建模是一個針對某個領域的研究,大數據下的建模關注的是事物之間的連續性,正如數據挖掘中的啤酒與尿布的問題發現一樣。考慮問題時,不應該忽略數據間的關聯性。最后應該考慮數據的增長性。數據是在不斷更新的,數據規律的發現具有時效性。每次規律發掘總有時間起止點,只有在時間起止點的規律才是正確的規律,因為事物是不斷變化的。
(2)介紹大數據下建模數據處理的幾個階段性工作。大數據處理的關鍵是對于數據的預處理,數據的預處理是為了保證數據的質量,數據的預處理對于模型的保障有著重要的作用。數據處理主要是涉及數據的準確性、完整性、一致性、時效性、可信性以及可解釋性[13]。一般來說采用數據清洗、集成、變換、規約幾種方式進行數據處理[14]。
(3)帶領學生進行大數據建模實踐認知。針對這個方面可以采用泰迪杯數據挖掘大賽數據,或者騰訊數據挖掘大賽數據,讓學生真切理解何為大數據,擺脫那種紙上談兵的不實際行為。讓學生在老師的指導下真切地去操作數據,去體會數據處理的過程。
(4)介紹大數據挖掘處理平臺。工欲善其事必先利其器,現在的大數據處理如果都從零開始,使用統計和自己編寫算法無疑是困難的,現在網絡對于大數據處理的支撐工具紛繁多樣。根據大數據處理平臺的技術范圍可以概括為存儲平臺、計算平臺、分析挖掘平臺、數據可視化平臺以及集成5類。
根據其性質也可以分為線上線下兩種,如阿里云大數據處理平臺就是一款集成與線上的處理平臺,還有SPSSModeler是一款便于處理大數據的線下分析平臺,熟練掌握這些平臺可以幫助學生開展實驗研究,部分大數據挖掘處理平臺見表1。
(5)不斷探究大數據下模型的適用性。以前的模型想運用于大數據分布式處理平臺,就得有一定的改進。從教師的角度出發,研究一些大數據下適用的算法是一種科研的態度也是一種科研的責任。
(6)組織參加課外數學建模比賽和參加大學生數學建模競賽。培養學生建模能力的有效方式就是讓學生自己去實踐,“高教杯”數學建模競賽也有對于大數據的分析處理,這項比賽能讓學生將所學內容用到實際上去,全方位地促進學生對于問題的解決能力。
(7)培養學生對于新知識的自學能力。對于新知識的掌握是一種持久自我發展的有效方式,不斷學習新的知識,不斷將新知識融入到實際應用中。培養學生的自學能力一般有以下方式:為學生創造一個主動參與討論的課堂氣氛;課堂上課程結束之后有10多分鐘思考與消化該堂知識的時間,讓學生學會自我思考自我總結;每次課程結束之后布置一些課外自學內容;承認學生間的差異性,在對于問題的討論或者講述的時候不應該不加考慮地否定學生觀點,而是要引導其發現正確的答案。

表1 部分大數據挖掘處理平臺
[1]FrankR,WilliamP,StevenB.數學建模[M].4版.北京:機械工業出版社,2009:1-2.
[2]邁爾-舍恩伯格,庫克耶,盛楊燕,等.大數據時代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013:序1-2.
[3]韓中庚.數學建模方法及其應用[M].北京:高等教育出版社,2009:5-6.
[4]司守奎,孫兆亮.數學建模算法與運用[M].北京:國防工業出版社,2015:3-4.
[5]宋云燕,朱文新.淺析大學數學教學中數學建模思想的融入[J].教育與職業,2015(10):76-77.
[6]張美玲,趙有益,薛自學.大學數學教學中數學建模思想的滲透[J].赤峰學院學報(自然科學版),2017(4):207-208.
[7]杜金姬,秦闖亮,苑倩倩.數學建模在應用技術人才培養中的作用:以信陽學院為例[J].河南教育(高教),2017(2):79-81.
[8]李軍成,賈倩倩,陳國華.數學建模競賽對大學生本科畢業論文創新度的影響分析[J].教育現代化,2017(6):38-40;46.
[9]黎勇.數學建模與大學生創新意識和創新能力培養的思考[J].教育現代化,2017(6):35-37;46.
[10]周蘇,馮嬋璟,王碩蘋,等.大數據技術與應用[M].北京:機械工業出版社,2016:3-4.
[11]曾劍平.互聯網大數據處理技術與應用[M].北京:清華大學出版社,2017:5-6.
[12]黃欣榮.大數據時代的思維變革[J].重慶理工大學學報(社會科學),2014(5):13-18.
[13]韓家煒.數據挖掘概念與技術[M].北京:機械工業出版社,2012:55-56.
[14]張良均,王路.python數據分析與挖掘實戰[M].北京:機械工業出版社,2015:60-61.