陳園 周科 曹文麗



摘? 要:為適應應用型人才培養需要,針對“數據分析(Python)”課程的實驗教學中實驗項目停留在算法驗證、教學方法與實戰應用脫節、學生解決現實問題能力差的現象,通過分析目前主流的大數據平臺的特點,以武昌工學院已建普開大數據平臺為基礎,重建了“數據分析(Python)”課程的實驗教學體系,提出了線上線下教學模式,并將理論算法與實際應用案例相結合,實踐結果表明,該方法有效地激發了學生的學習熱情,提高了學生理論與實踐結合的能力,提高了教學質量。
關鍵詞:數據分析;普開大數據平臺;實驗教學改革
中圖分類號:TP39;G434? ? 文獻標識碼:A 文章編號:2096-4706(2023)24-0189-05
Research on the Experimental Teaching Method of Data Analysis (Python) Course Based on Pukai Big Data Platform
CHEN Yuan, ZHOU Ke, CAO Wenli
(Wuchang Institute of Technology, Wuhan? 430065, China)
Abstract: In order to meet the needs of cultivating application-oriented talents, in the experimental teaching of the “Data Analysis (Python) ” course, the experimental projects remain focused on algorithm validation, the disconnection between teaching methods and practical applications, and the poor ability of students to solve practical problems. By analyzing the characteristics of the current mainstream big data platform and based on the already established Pukai big data platform at Wuchang Institute of Technology, the experimental teaching system of the Data Analysis (Python) course has been reconstructed, the online and offline teaching mode is proposed, and theoretical algorithms are combined with practical application cases. The practical results show that this method effectively stimulate students' learning enthusiasm, improves their ability to combine theory with practice, and improves teaching quality.
Keywords: data analysis; Pukai big data platform; experimental teaching reform
0? 引? 言
近年來,隨著計算機技術的發展以及科技的進步,人們已進入到大數據的時代,人們的生活中處處都是大數據,大數據越來越廣泛地應用于生產生活的各個領域,應用型數據分析的需求和對大數據人才的培養需求也越來越迫切。“數據分析(Python)”課程根據目前數據分析發展狀況,將數據分析具象化,使用Python進行科學計算、可視化繪圖、數據處理,分析與建模,并詳細拆解學習聚類、回歸、分類三個企業案例,將理論與實踐相結合,為將來從事數據分析挖掘研究、工作奠定基礎。
本文結合“數據分析(Python)”課程在實驗教學中存在的問題和現狀,通過對比目前主流的大數據平臺優缺點,結合我校實際情況以及人才培養目標和要求,對該課程實驗教學方法和實施過程進行了研究,構建了基于普開大數據平臺的符合時代要求和課程特點實驗教學體系,在提高學生理論與實踐結合的能力的基礎上,以期為計算機類其他專業課程的建設提供參考與借鑒。
1? “數據分析(Python)”的課程特點以及實驗教學現狀
“數據分析(Python)”的課程特點以及實驗教學現狀:
1)課程知識點難,學生基礎情況各有不同。“數據分析(Python)”這門課中的理論知識原理,包含了多門學科知識,需要Python編程基礎的同時,還需要了解數據庫、機器學習、統計學等多門學科的知識。因此,學好這門課就需要學生具有一定的編程能力和扎實的數學基礎以及邏輯思維能力。這對學生的基礎提出了較高要求,“數據分析(Python)”是新時代新課程,具有內容多且廣、交叉性強等特點,覆蓋的知識點綜合性穿插較強,對于編程能力較弱、數學分析基礎差的學生來說,課程的難度很大,導致這部分學生有可能在這門課的學習上失去信心,從而失去了學習的動力。
2)時代日新月異,教學工具滯后脫節。“數據分析(Python)”與時代的脫節主要表現在教材與時代脫節以及教學工具的陳舊。目前,據了解,較多高校所使用的教材內容是3-5年前的舊版本,教材內容沒有與時代、技術的變化同步上,更無法及時應用到教學中去。另外,在教學工具上,教師們所使用的工具也比較陳舊,多數的軟件、集成開發環境的版本較早,沒有使用較新或者最新的版本,教材和教學工具的落后跟不上日新月異的技術變化,久而久之,是非常不利于學生們在學習中做到理論與實踐相結合。
3)重理論輕實踐,缺乏行業應用。目前的“數據分析(Python)”課程的教學多以理論為主,課堂上主要是填鴨式的方法教授課程原理,布置作業習題,學生課后完成相應的習題,總體來說,在課時的分配以及教師的教學中,重點還是以理論為主。而在實驗實踐上,多數教師是按照教學大綱,在實驗機房內教授學生對數值計算、可視化、數據處理、分類、聚類以及回歸等相關算法使用Python進行編程實現與分析驗證,課時設置不多,實驗內容簡單,且實驗教學的效果只讓學生停留在對算法原理的理解層面,缺乏對課程感性認識和實踐應用能力,這樣一方面致使學生學習興趣不高,另一方面,這樣的實驗實踐教學已經不能適應現代教學的要求。
4)實驗設備陳舊,實驗資源有限。在開設了大數據專業的眾多高校中,教學中最需要解決的問題就是配套的基礎實驗環境。目前大多數高校的實驗設備陳舊,許多設備使用年限長,且實驗環境只能滿足傳統計算機類實驗需求,而對于“數據分析(Python)”課程以及大數據專業其他專業課程,例如Hadoop等,沒有專業實驗教學平臺。同時,課程實驗難度大,目前的教學也缺乏配套課程實驗資源、教程、指導書、數據,導致實驗實踐教學難度越來越大。即使有些高校的更新了計算機設備,但是沒有搭建專門的實驗平臺,出現了無法對大數據環境進行快速部署,配置難度較高的難題。因此,為提升實驗教學效果,建設一個配置簡單的、符合“數據分析(Python)”課程實驗教學要求的實驗教學平臺十分必要。
2? 普開大數據平臺介紹
目前,主流數據分析與挖掘平臺可大致分為兩類:
1)非商業化、免費開源的數據分析與挖掘軟件:以Sklearn、Weka為代表,集成了“數據分析(Python)”中常見的機器學習的算法,用戶可以在平臺中集成自己的算法,源碼開放,用戶可以進行二次開發,滿足用戶一些個性化的需求。但此類軟件對數據類型和數據分析挖掘的任務支持并不完整,且缺乏具體的行業領域的應用,不能支持長時間的學習,更不能支持商業級的應用。
2)企業級大數據分析與可視化分析平臺。市面上中通用數據倉庫和數據挖掘軟件昂貴且難以使用,大量的專業術語、專業業務理論、數學知識和挖掘模型讓人無從下手。
與之對應,普開大數據平臺是商業化的數據分析和挖掘實驗平臺,實驗平臺的框架如圖1所示。
具有如下明顯優勢:
1)數據分析功能豐富。平臺集成了百余種算法組件,覆蓋數據預處理、回歸、分類、聚類等基礎數據分析內容,而且涵蓋情感分析、個性化推薦社交網絡分析等多種綜合應用場景。
2)真機實驗訓練。平臺各模塊相對獨立,交互式的實驗任務、實驗指導、項目上機操作,教學視頻、考試評分、數據監控等,保障學生靈活、快速地掌握“數據分析(Python)”核心技術及項目開發能力。
3)行業案例豐富。提供10大行業典型應用案例的數據包和視頻包,以及配套實驗手冊,邊學邊練,通過實際項目上機演練,多方位學習及訓練,很大程度上提高了學生對行業的認知,能夠做到理論與實踐相結合,與時代相接軌,提高了學生的學習興趣和動手能力。
4)良好的交互性。提供完善實驗教學項目體系、在線學習系統,平臺提供以“數據分析(Python)”課程學習、在線視頻、習題、線上測試、線上實驗為主線,典型案例貫穿知識點的學習模式,確保學生“數據分析(Python)”知識和應用技能。
5)操作簡單。實驗平臺采用B/S架構,學生無須安裝客戶端軟件,只需打開瀏覽器便能輕松訪問。簡潔易懂的交互界面,讓教學更輕松、更便捷。
3? 基于普開大數據平臺的實驗教學設計
“數據分析(Python)”依托于普開大數據平臺的實驗教學實施流程如圖2所示。
3.1? 課前
在實驗課前,教師在普開大數據平臺準備好教學資料(視頻、指導書、實驗環境)后,學生可以通過登錄普開大數據平臺訪問“數據分析(Python)”實驗項目,可先根據實驗指導書和資料預習實習內容,同時,教師可以根據實驗任務在平臺上發布預習作業,以了解學生對課前學習材料的掌握情況,從而保證實驗預習效果。
3.2? 課中
“數據分析(Python)”實驗內容以及實驗課的開展上,如圖3所示,普開大數據平臺提供師生可視化操作平臺的方式,供教師和學生進行操作。學生直接在瀏覽器上進行實驗,除了主界面,兩側界面分為左右兩欄,左欄為虛擬機與主機的交互操作,可供學生上傳下載實驗數據;右側界面為課中實驗提供了實驗指導書、實驗項目,同時,可供學生在實驗中記錄實驗筆記。在實驗項目中,提供了實驗指導書以及實驗視頻,學生在實驗時,可在線觀看實驗視頻,再根據實驗指導書一步一步完成實驗,并對實驗過程進行記錄。
在學生課前充分的預習后,教師提前準備了實驗環境虛擬機以及實驗數據,指導學生使用Python語言對數據分析中基本理論和算法進行驗證,包括的Numpy、Pandas、Matplotlib、Sklearn庫的基本操作,因此在實驗設計上,針對這部分基礎知識設計了實驗項目以及實驗指導,引導學生一步一步完成基本操作,為后續的綜合性實驗打下堅實的基礎。
除了基本算法和操作的驗證性實驗之外,普開大數據平臺提供了綜合應用場景供學生進行實操性實驗,如圖4所示。
因此,在本課程的實驗項目上,為了加強學生實操能力,除了常規的基礎驗證性實驗,須在實驗項目上增加綜合性操作實驗,學生可根據平臺提供的實驗環境,在虛擬機中根據實驗指導書部署實驗環境,按照數據分析的流程一步一步完成數據的讀取、預處理、標準化,并根據應用場景,選擇合適的模型進行分析,最終完成行業應用的分析,獲得實驗結果。
上述的實驗項目,得益于普開大數據平臺,所有的實驗操作過程可記錄、可視,教師可見,學生的實驗內容不再局限于簡單語法驗證,而時深入于行業應用,可以達到學以致用的目的。
3.3? 課后
學生完成實驗項目后,根據實驗過程中記錄在普開大數據平臺的實驗筆記,按照教師要求,可課后登錄普開大數據平臺,利用課后時間對實驗過程進行整理,對未解決的問題或者未完成的內容繼續進行,同時,整理實驗過程中記錄的實驗筆記,在線完成實驗報告,并提交給教師。同時,對于實驗課的反饋也可以通過普開平臺反饋給老師。如圖5、圖6所示。
教師除了可以通過平臺來發布實驗測試和批閱實驗報告,還可通過平臺后臺,對學生的實驗情況進行智能分析,包括學習路徑分析、簽到分析、考試分析、實驗報告分析。普開大數據平臺可進行實時在線或離線答疑,為師生提供快速實時的交流平臺,鞏固學生課堂所學知識,教師也可以根據分析結果以及學生的反饋,對實驗項目和教學方法進行改進。同時,平臺支持課件、視頻、手冊、圖片、軟件、數據及其他資源的上傳、下載、共享及刪除,可通過普開大數據平臺來構建“數據分析(Python)”課程的網絡教學資源共享平臺,為學生提供豐富多樣教學資源,方便學生提交作業和提問。如圖7所示。
4? 結? 論
本文結合普開大數據平臺的特點以及“數據分析(Python)”課程實驗教學的現狀,提出了適用于應用型本科院校的實驗教學思路,利用該平臺來建設的實驗教學資源和行業應用場景。除常規驗證性項目,提出了更高一層次的案例式實驗,力求將理論知識應用到實際行業應用,在打好基礎理論知識基礎的同時,也讓學生對專業知識有了感性認識,調動了學生積極性,更在很大程度了鍛煉和提高了學生的動手能力和實踐經驗。因此,基于普開大數據平臺的“數據分析(Python)”實驗課程教學方法總體上來說相對于傳統的實驗教學方法,提高了教學效率,保證了實驗教學效果,更加貼近教學目標,更加符合“數據分析(Python)”這門課開設的初衷。
參考文獻:
[1] 吳小東,林國新.大數據課程實踐教學平臺的建設 [J].福建電腦,2022,38(8):119-121.
[2] 谷瑞軍.基于Docker容器的輕量級大數據實驗平臺構建研究 [J].金陵科技學院學報,2019,35(4):1-5.
[3] 張敏,邊勝琴,郭茜,等.大數據技術實驗教學的研究與探討 [J].中國現代教育裝備,2020(17):6-9.
[4] 馬健,賀媛,李昕,等.基于大數據分析的高校實驗教學平臺設計 [J].現代電子技術,2022,45(13):159-164.
[5] 朱敏.《數據分析技術》課程實驗教學探析 [J].安徽警官職業學院學報,2022,21(3):107-111.
[6]蔡君,胡晨駿,康彬.“大數據分析”課程的教學改革與探索——以南京中醫藥大學計算機專業本科生“大數據分析”課程教學為例 [J].輕工科技,2022,38(6):149-152.
[7] 王振武.基于阿里云大數據平臺的“數據挖掘”課程實驗教學方法探討 [J].實驗室研究與探索,2018,37(6):192-196.
[8] 向陽,郭鑫,陳千,等.數據倉庫與數據挖掘教學實驗平臺構建研究 [J].教育教學論壇,2013(9):253-255.
[9] 賈媚媚,劉泉,馬曉普,等.面向新工科的數據挖掘實驗課程教學案例設計 [J].現代計算機,2021(3):80-83.
[10] 周瑋,辛政華,楊小瑩,等.基于Docker的人工智能實驗教學平臺研究與設計 [J].鄂州大學學報,2022,29(3):101-103.
作者簡介:陳園(1983.10—),女,漢族,湖北武漢人,高級工程師,碩士研究生,研究方向:數據分析、計算機應用技術;周科(1992.12—),男,漢族,湖北仙桃人,助教,碩士研究生,研究方向:大數據技術、計算機應用技術;曹文麗(1999.05—),女,漢族,湖北大冶人,碩士在讀,研究方向:大數據技術、計算機視覺。
收稿日期:2023-04-04
基金項目:武昌工學院2023年度校級教學改革研究項目(2023JY10)