楊祥生
摘 要:本文主要研究大數(shù)據(jù)背景下線性代數(shù)課程改革,根據(jù)大數(shù)據(jù)對(duì)線性代數(shù)的要求,在線性代數(shù)課程改革建議如下:適當(dāng)放寬學(xué)生對(duì)知識(shí)點(diǎn)的運(yùn)算能力要求,讓學(xué)生借助MATLAB等計(jì)算軟件運(yùn)算出計(jì)算結(jié)果;在線性代數(shù)教學(xué)過(guò)程中增加矩陣分解等內(nèi)容,以適應(yīng)大數(shù)據(jù)對(duì)線性代數(shù)的要求。
關(guān)鍵詞:大數(shù)據(jù) 課程改革 線性代數(shù) 矩陣分解
大數(shù)據(jù)就是指在一定時(shí)間范圍內(nèi)無(wú)法使用傳統(tǒng)數(shù)據(jù)庫(kù)工具對(duì)其進(jìn)行捕捉、管理、計(jì)算、分析和處理的數(shù)據(jù)集合。大數(shù)據(jù)主要有以下四個(gè)特性:數(shù)據(jù)容量大(Volume)、數(shù)據(jù)類型多(Variety)、數(shù)據(jù)存取速度快(Velocity)以及數(shù)據(jù)應(yīng)用價(jià)值高(Value)。
在“互聯(lián)網(wǎng)+”大數(shù)據(jù)背景下,許多實(shí)際應(yīng)用場(chǎng)景的分析對(duì)象我們都可以抽象的用矩陣來(lái)表達(dá)。大量Web頁(yè)面之間關(guān)系、微博用戶之間關(guān)系、文本與詞匯的關(guān)系等等都可以用矩陣表達(dá)。例如Web頁(yè)面之間關(guān)系用矩陣表達(dá)時(shí),可以用矩陣元素0和1來(lái)代表頁(yè)面A與頁(yè)面B的關(guān)系,0表示A和B之間沒(méi)有超鏈接,1表示A和B之間有超鏈接。
一、大數(shù)據(jù)對(duì)線性代數(shù)課程的影響與要求
“互聯(lián)網(wǎng)+”時(shí)代,信息以指數(shù)級(jí)速度增長(zhǎng),大數(shù)據(jù)的出現(xiàn),雖然這為推薦技術(shù)帶來(lái)了新的機(jī)遇,但同時(shí)也帶來(lái)了新問(wèn)題,如:大數(shù)據(jù)稀疏性問(wèn)題。雖然用戶和商品的數(shù)量巨大(這里的商品包括,網(wǎng)頁(yè)、文獻(xiàn)、音樂(lè)等信息數(shù)據(jù)),但是兩個(gè)用戶之間的選擇相重疊的部分卻非常小。如果用用戶和商品之間已有的選擇關(guān)系占所有可能存在的選擇關(guān)系的比例來(lái)表示稀疏度,[1]如淘寶網(wǎng)上有10億件商品,平均一個(gè)用戶瀏覽1000件商品,則稀疏度為百萬(wàn)分之一。數(shù)據(jù)非常稀疏就會(huì)影響絕大多數(shù)基于關(guān)聯(lián)分析的算法效果。一般數(shù)據(jù)規(guī)模越大,則越稀疏,因此處理稀疏數(shù)據(jù)的算法就非常重要。
大數(shù)據(jù)的技術(shù)開(kāi)發(fā)與線性代數(shù)的知識(shí)關(guān)系非常密切,例如在大數(shù)據(jù)分析和建模中是常用的技術(shù)手段有:矩陣、轉(zhuǎn)置、分塊矩、矩陣的秩、正交矩陣、向量、向量空間、特征值和特征向量等。
以矩陣為基礎(chǔ)的各種運(yùn)算,例如矩陣分解則是分析對(duì)象特征、提取信息的途徑,因?yàn)榫仃嚳梢源砟撤N映射或變換,因此分解后所得到的矩陣就代表分析對(duì)象在新空間中的一些新特征。所以,矩陣的特征值分解、奇異值分解(SVD分解)、主成分分析(PCA分解)、矩陣分解(MF分解)、非負(fù)矩陣分解(NMF分解)等等在大數(shù)據(jù)分析中的具有廣泛的應(yīng)用。
二、線性代數(shù)課程改革建議
線性代數(shù)課程主要是圍繞著行列式、矩陣、線性方程組這三大知識(shí)塊,展開(kāi)分析和討論。根據(jù)大數(shù)據(jù)對(duì)線性代數(shù)的要求,在線性代數(shù)課程改革建議如下:
(1)針對(duì)分塊矩陣、線性方程組、線性方程組解的結(jié)構(gòu)、方陣對(duì)角化等需要大量計(jì)算內(nèi)容,適當(dāng)放寬學(xué)生對(duì)這些知識(shí)點(diǎn)的運(yùn)算能力要求。用一些計(jì)算量小的典型算例替換原有復(fù)雜的算例,通過(guò)簡(jiǎn)單的算例讓學(xué)生掌握知識(shí)點(diǎn)的原理;對(duì)于復(fù)雜的算例,讓學(xué)生借助MATLAB等計(jì)算軟件運(yùn)算出計(jì)算結(jié)果,并要求學(xué)生給出計(jì)算軟件中的執(zhí)行命令。
(2)增添矩陣分解內(nèi)容。矩陣分解作用很多:矩陣填充(通過(guò)矩陣分解來(lái)填充原有矩陣)、清理異常值與離群點(diǎn)、降維、壓縮、間接的特征組合(計(jì)算特征件相似度)等等。在線性代數(shù)教學(xué)過(guò)程中增加矩陣的特征值分解、奇異值分解(SVD分解)、主成分分析(PCA分解)、矩陣分解(MF分解)、非負(fù)矩陣分解(NMF分解)等內(nèi)容。
三、推廣價(jià)值
本文主要研究大數(shù)據(jù)背景下線性代數(shù)課程改革,根據(jù)大數(shù)據(jù)對(duì)線性代數(shù)的要求,在線性代數(shù)課程改革建議如下:適當(dāng)放寬學(xué)生對(duì)知識(shí)點(diǎn)的運(yùn)算能力要求,讓學(xué)生借助MATLAB等計(jì)算軟件運(yùn)算出計(jì)算結(jié)果;在線性代數(shù)教學(xué)過(guò)程中增加矩陣分解等內(nèi)容,以適應(yīng)大數(shù)據(jù)對(duì)線性代數(shù)的要求。該研究具體豐富的理論和實(shí)踐價(jià)值。
參考文獻(xiàn)
[1]林子雨.大數(shù)據(jù)技術(shù)原理與應(yīng)用[M].北京,人民郵電出版社,2017,1-20.
[2]陳明.大數(shù)據(jù)核心技術(shù)與實(shí)用算法[M].北京,北京師范大學(xué)出版社,2017,36-37.