999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據專業課程教學改革探索

2021-11-28 01:27:51戴培山范敏
電腦知識與技術 2021年30期

戴培山 范敏

摘要:R語言數據分析編程課程是數據科學與大數據技術專業的重要專業課程,大數據專業及其相關課程建設尚處于探索階段。以《R語言數據分析編程》為例分析了大數據專業教學中存在的問題。并針對存在的問題,提出了相應的解決方案,包括建立完善的課程教學資源,突出實踐環節在人才培養中的重要作用,利用競賽提高學有余力同學的數據分析能力和綜合素質。

關鍵詞:大數據專業課程;課程教學資源;實踐環節;數據分析競賽

中圖分類號:TP311? ? ? ? ? ?文獻標識碼:A

文章編號:1009-3044(2021)30-0191-03

開放科學(資源服務)標識碼(OSID):

Exploration on Teaching Reform of Big Data Major—Data Analysis Programming With R

DAI Pei-shan1, FAN Min2*

(1. School of Computer Science and Engineering, Central South University, Changsha 410083, China; 2. School of Social Development and Management, Hunan Womens University, Changsha 410083, China)

Abstract: The course of data analysis programming with R is an important professional course for data science and big data technology major, and the construction of big data major and its related courses is still in the exploratory stage. This paper takes the course of data analysis programming with R as an example to analyze the existing problems in the teaching of big data major. In view of the existing problems, this paper puts forward the corresponding solutions, including the establishment of perfect teaching resources, highlighting the important role of practice in personnel training, and using the competition to improve the data analysis ability and comprehensive quality of the students who are willing to learn.

Key words: big data professional course; course teaching resources; practice link; data analysis competition

隨著數據獲取技術的飛速發展,數據處理在國民經濟和生產生活中起著越來越重要的作用。應運而生的數據科學與大數據技術專業旨在培養具有大數據思維、運用大數據思維及分析應用技術的高層次大數據人才[1-2]。中南大學是全國第一批開設數據科學與大數據技術專業的高校。該專業從2016年獲批以來,教育教學和人才培養還處于探索階段,對該專業相關課程的教育教學改革具有重要的意義。數據分析知識與技能是該專業的基本知識和能力要求,《R語言數據分析編程》課程是數據分析知識與技能訓練的重要載體。據我們所知,我校《R語言數據分析編程》課程是全國唯一將R語言與數據分析編程結合起來的一門課程。該課程教學體系的建立需要不斷進行探索和實踐。數據分析技能的培養需要在實踐中培養,實踐環節和授課環節具有同等重要的作用。因此,探討了《R語言數據分析編程》課程的教學實踐新方法。

1 國內外研究現狀

R是一個優秀的數據分析和制圖的軟件環境。R語言在國際和國內的發展現狀差異非常大,國際上R語言已然是專業數據分析領域的標準,但在國內R語言的應用領域還比較小眾[3-7]。造成這種情況的原因是多方面,這與版權意識,語言障礙,國際交流,知識普及等都有關。國外在R語言方面有大量的教學視頻和教學書籍可供使用。經典書籍有《R語言實戰》,《R語言編程藝術》,《數據挖掘與R語言》和《機器學習:實用案例解析》等。Coursera等慕課系統中也有許多R相關的在線課程。而國內高水平的教材和教學資源非常少,代表性的有薛毅的《統計建模與R軟件》和《R語言實用教程》,其他R語言數據分析的視頻主要源于收費不菲的線上或線下培訓班。

2 教學方法的改革

從國內外R語言教學的發展現狀來看主要存在兩大問題:

(1)大多數的R語言課程以介紹R語言語法結構為主,與R語言的強大數據分析功能特點脫節。由于該課程開設在大二和大三年級,在學R語言類課程之前會學習C語言,C++和Java等編程語言課程,因此會造成學生在學R語言編程知識時興趣缺乏。

(2)R語言教學以上課講授為主,實踐環節薄弱。從數據科學與大數據技術專業角度來看《R語言數據分析編程》應該是理論與實踐緊密結合的一門課程。新知識和新技術的飛速發展,導致各個專業課程越來越多,一個結果是各門課程的課時大幅壓縮。導致在課程教學中由于課時的限制,實踐環節往往被壓縮甚至忽略。R語言的學習曲線是比較陡峭的,入門難。僅憑課堂講授很難融會貫通的將其應用于數據分析與處理。

針對以上的問題,采取了如下教學改革措施:

1)制作了完整的《R語言數據分析編程》課程教學課件,填補了該課程教學課件的空白。教學課件章節明確,層次清晰。數據科學與大數據技術專業的核心技能是數據分析技能。根據這一專業特點,在教學課件制作過程中始終將R語言語法知識與實際的數據處理問題緊密相連,做到理論與實踐相結合。制作課件內容包括基本的數據集建立管理和圖形繪制,還包括統計分析技術介紹,以及數據分析中常用的機器學習算法。

2)制作了針對各個章節內容的源代碼資源。R語言集成開發環境RStudio有一個非常好的功能就是在代碼區域,只要按一個按鈕代碼就可以自動執行一條語句,光標選中一個語句片段后,就可以直接運行該語句片段。這種功能非常適合課堂演示代碼的運行過程。針對每一個章節的數據處理實例,制作各章節教學內容的源代碼資源,供教學演示和學生課下實踐使用。

3)在課程教學過程中,緊密結合大數據與數據科學專業的特點,始終圍繞數據分析這個核心任務,將R語言的語法結構知識與數據分析案例相結合,增加教學案例。首先,將數據分析的各個環節按照先后次序進行模塊化分析,將數據處理的整個過程分為數據采集和創建,數據集管理,數據的分析和數據可視化四個環節。教學過程緊扣數據處理的四個環節展開,教學過程中知識的講授和數據處理的演示操作穿插進行,促進學生理論與實踐的結合。

這里以R語言進行基本的數據可視化為例來說明案例教學的實施過程。之所以選擇數據可視化(圖形的繪制)為例是因為在數據分析和處理的過程中一圖勝千言,而R語言具有非常強大的繪圖和數據可視化功能。在介紹本部分的內容的時候,首先,介紹R語言中四種圖形系統,分別介紹他們的發展歷史,優缺點。使同學們對于R語言數據可視化有一個宏觀的了解。然后,聚焦到基礎圖形的繪制,對圖形的繪制離不開數據,要有一個使用的數據集,數據集的選取也要遵循:1)數據集要滿足展示數據可視化知識的數據特性;2)數據集不能太大,容易獲取;3)學生對數據集的信息比較熟悉。滿足這樣的基本條件才能使學習將主要的精力集中在數據可視化的方法上。這里選取R語言自帶的數據集mtcars。該數據是從1974年美國汽車趨勢雜志中提取的,包括燃油消耗和32輛汽車(1973-74型)的汽車設計和性能的11個指標。本次實驗用的指標是:車身重量(wt)與油耗(mpg)。接下,來給同學們展示一幅包含本章節課程主要知識點的數據可視化的結果圖片,啟發同學們根據圖片分析在數據可視化中包含的基本元素,主要有:點和線,坐標軸,題注,文本,圖例和數學公式等。這些元素又有線條特征和顏色等參數。在分析完數據可視化的基本元素后,需要了解一下數據的結構和內容??梢栽赗Studio平臺運行以下代碼進行數據結構和內容的查看,以及繪制帶連線的散點圖。然而,這樣繪制出來的線條是雜亂的,并不是我們預期的結果。接下來就可以引導學生思考出現這種情況的原因。

問題出在哪里?因為圖中的第一個點可能并不在wt軸的最左邊,如果第二個點的wt軸比第一個點的值大,那么就會出現線條由左往右畫的情況,造成線條交叉。解決的辦法是將mtcars數據框按照wt的值從小到大重新排序。代碼如下:

mymtcars<-mtcars[order(mtcars[,6]),]

plot(mymtcars$wt, mymtcars$mpg, type="b")

后面再以以上的繪圖為基礎,進一步擴展??梢愿淖兙€條和點的類型和顏色,這樣的代碼在課堂上直接演示并實施觀看運行結果,可以提高學生學習的興趣,避免課程講授模式與C語言,C++和Java等編程語言課程類似的教學模式造成的學生學習興趣缺乏。改變上圖繪制的折線顏色為彩虹色。首先,設置彩虹色的顏色數目為n= 6,調用rainbow(n)函數生成彩虹色。在繪制圖像時,col=mycolors參數引入剛生成的彩虹色。其他設置不變(其線條類型為點線,寬度為默認寬度的5倍,點的符號為空心六邊形,大小為默認符號大小的2倍)。

為提高學生的學習參與度,在授課的過程中要求學生分小組重復老師上課講解示例的代碼,加深體會。另外,在授課過程中還會穿插課堂測驗,了解學生學習效果。在本章節的授課過程中,課堂測驗的題目主要設計在圖形上數學公式的顯示和圖形的組合函數layout()函數的用法。主要原因是這兩個知識點比較抽象,通過實例和課堂測驗的雙重刺激加深學生對這兩個知識點的理解,學會靈活運用。

4)建立實踐教學云平臺,使學生在學習了理論知識后,可以在實踐平臺上及時運用自己所學的知識解決數據分析問題,提高知識的掌握和運用。在線實驗云平臺解決了實驗環境的限制,可以不用固定時間地點。實現實驗批改自動化,可以實時反饋實驗結果,存檔查詢方便,批改結果客觀,減少教師重復勞動。構建的云平臺實踐教學系統對每一章節都設計了大量緊扣教學內容代碼實踐題目,題目做完后,系統會根據學生提交結果自動批改。

例如聚類分析這一章中對于生成的二維坐標數據和鳶尾花數據集分別進行了層次聚類和K-means聚類的實踐教學。在生成二維坐標進行聚類中,利用引導和提示語句讓學生逐步完成聚類的整個過程。這里僅以生成數據為例做一下說明。

生成數據點:這里生成12個二維點, 這12個點中前4個的距離較近,中間四個的聚類較近,最后4個的聚類較近. 并繪制出這12個點在二維平面的分布圖。

在mycluster.R腳本里追加以下代碼:

1.(? ? )#生成數據點

2. (? )#設置圖像邊緣距離

3.(? ?)#數據點的x軸由正態分布產生12個隨機數,前四個數的均值為1,

#接下來四個數的均值為2,最后四個數的均值為3,方差都為0.2

4.(? ? ? )? #數據點的y軸由正態分布產生12個隨機數,前四個數的均值為1,

#接下來四個數的均值為2,最后四個數的均值為1,方差都為0.2

5.(? ? ? )#繪制x與y關系的散點圖

6.(? ? ?)#給個點加上標號

檢測條件: 檢測在RStudio控制臺是否有如下代碼的輸入:

1.( set.seed(1234)? );2.(par(mar = c(2, 2, 2, 2))? ?);3.(x <- rnorm(12, mean = rep(1:3, each = 4), sd = 0.2)? ?);4.(y <- rnorm(12, mean = rep(c(1, 2, 1), each = 4), sd = 0.2)? ?):5.(? plot(x, y, col = "blue", pch = 19, cex = 2)? );6.(? text(x + 0.05, y + 0.05, labels = as.character(1:12))? )

5)精心設計課程實驗。本課程有兩個課程實驗。其中之一為基于R語言機器學習算法的鳶尾花數據分析。實驗對鳶尾花數據各個特征的相關性進行分析,接下來實驗幾種常用的機器學習算法對該數據進行分類的效果,最后選出分類效果較好的方法。通過該實驗使學生理解觀察和分析數據的過程,學會使用常見的機器學習方法(如線性判別分析(LDA),分類和回歸樹(CART),k-最近鄰居(kNN),帶有線性內核的支持向量機(SVM),隨機森林(RF)和人工神經網絡)進行鳶尾花數據的分類,并評判分類效果。

6) 對學有余力的同學,以競賽帶動學生創新精神。國內外已經有一些著名的數據分析競賽平臺,參與其中的競賽可以極大的提高學生學時的積極性和主動性。國外著名的平臺有Kaggle(https://www.kaggle.com/),阿里的天池大數據科研平臺,數據城堡(DataCastle大數據競賽平臺)等。

大數據專業是新興專業,在專業的發展過程中,需要不斷地進行探索,鑒于該專業直接面向國民生產生活,學生專業技能的培養需要通過大量的數據處理訓練完成。通過以上教學改革措施的實施,突出了課程實踐環節的重要性,利用線上實驗項目解決課時限制與實踐環節需要加強之間的矛盾。因材施教,利用競賽提高學有余力同學的數據分析能力和綜合素質。

參考文獻:

[1] 周黎鳴,林英豪,李征,等.新工科背景下大數據專業課程建設[J].計算機時代,2021(1):102-105.

[2] 王元卓,隋京言.應用型大數據人才培養[J].高等工程教育研究,2021(1):44-49.

[3] 陽紅英.案例教學在《數據挖掘與R語言》課程教學中實踐與思考[J].中國多媒體與網絡教學學報(上旬刊),2020(8):106-107.

[4] 商豪.淺議本科教學中R語言的教學模式[J].理科愛好者(教育教學),2018(12):23,49.

[5] 柯朝甫.醫學本科生R語言教學初探[J].教育現代化,2018,5(48):233-234,245.

[6] 巴音達拉.淺談R語言在高等學校教學當中的重要性[J].教育教學論壇,2018(7):252-253.

[7] 郭念國.大數據時代R語言模擬在概率統計課程教學中的應用[J].河南教育(高教),2017(12):80-81.

【通聯編輯:唐一東】

主站蜘蛛池模板: 久久久久亚洲精品成人网| 国产亚洲欧美日韩在线一区二区三区| 国产污视频在线观看| 亚洲国内精品自在自线官| 99伊人精品| 免费观看无遮挡www的小视频| 亚洲天堂久久| 伊人久久大香线蕉综合影视| 亚洲欧洲天堂色AV| 亚洲精品成人片在线观看| 国产毛片高清一级国语 | 国产精品第| 久久永久视频| 狠狠五月天中文字幕| 婷婷六月综合网| 国产91色| 不卡的在线视频免费观看| 国产精品短篇二区| 伊人激情综合网| 国产精品自在在线午夜| 国产成人超碰无码| 欧美在线一二区| 97狠狠操| 久久黄色免费电影| 久久婷婷六月| 亚洲无限乱码一二三四区| 人妻中文久热无码丝袜| 久久人人妻人人爽人人卡片av| 成人精品在线观看| 婷婷六月天激情| 亚洲国产在一区二区三区| 97久久免费视频| 国产无遮挡猛进猛出免费软件| 2022国产91精品久久久久久| 韩日无码在线不卡| 午夜a级毛片| 日本在线欧美在线| 婷婷成人综合| 亚洲Va中文字幕久久一区| 在线国产欧美| 这里只有精品在线播放| 91精品视频在线播放| 黄色三级网站免费| 久久精品波多野结衣| 色天天综合久久久久综合片| 国产欧美自拍视频| 亚洲专区一区二区在线观看| 国产精品密蕾丝视频| 国产午夜在线观看视频| 丁香五月亚洲综合在线| 91麻豆精品国产91久久久久| 午夜老司机永久免费看片| 久久频这里精品99香蕉久网址| 欧美在线一级片| 国产真实自在自线免费精品| 国产成人做受免费视频| 久久青草热| 色窝窝免费一区二区三区 | 伊人精品视频免费在线| 午夜精品久久久久久久2023| 最新日韩AV网址在线观看| 国产成人亚洲精品色欲AV| 扒开粉嫩的小缝隙喷白浆视频| a免费毛片在线播放| 欧美色亚洲| 亚洲一区二区精品无码久久久| 伊人久久久久久久| 亚洲Aⅴ无码专区在线观看q| 国产精品视频免费网站| 中字无码av在线电影| 视频一区视频二区日韩专区| 91 九色视频丝袜| 秘书高跟黑色丝袜国产91在线| 亚洲无限乱码一二三四区| 欧美a在线视频| 亚洲国产成人在线| 久久久精品久久久久三级| 国产高清在线观看| 国产欧美日韩专区发布| 日本精品αv中文字幕| 91精选国产大片| 国产尤物jk自慰制服喷水|