黃晉 湯俊偉 羅瑞奇 陳佳


[摘 要] 基于對(duì)大數(shù)據(jù)專業(yè)實(shí)訓(xùn)教學(xué)的探索,將物聯(lián)網(wǎng)的云平臺(tái)和數(shù)據(jù)分析處理技術(shù)引入大數(shù)據(jù)課程實(shí)訓(xùn)教學(xué)中。針對(duì)大數(shù)據(jù)專業(yè)實(shí)訓(xùn)的特點(diǎn)和難點(diǎn),嘗試以云平臺(tái)為專業(yè)實(shí)訓(xùn)基本手段、以物聯(lián)網(wǎng)設(shè)備作為前端數(shù)據(jù)獲取技術(shù)組織教學(xué),以提高學(xué)生的綜合設(shè)計(jì)水平和實(shí)踐能力。針對(duì)前端數(shù)據(jù)預(yù)處理和后端數(shù)據(jù)智能處理需求,進(jìn)行前沿?cái)?shù)據(jù)分析的理論知識(shí)和實(shí)踐方法教學(xué),拓展學(xué)生的專業(yè)深度和廣度,為國(guó)家培養(yǎng)復(fù)合型信息技術(shù)人才。
[關(guān)鍵詞] 大數(shù)據(jù);物聯(lián)云平臺(tái);智能處理;實(shí)訓(xùn)
[基金項(xiàng)目] 2020年度湖北省自然科學(xué)基金計(jì)劃一般面上項(xiàng)目“基于MR影像的柔性生物組織變形場(chǎng)測(cè)量應(yīng)用研究”(2020CFB801)
[作者簡(jiǎn)介] 黃 晉(1982—),男,湖北武漢人,博士,武漢紡織大學(xué)計(jì)算機(jī)與人工智能學(xué)院講師,主要從事大數(shù)據(jù)方向研究;湯俊偉(1990—),男,湖北蘄春人,博士,武漢紡織大學(xué)計(jì)算機(jī)與人工智能學(xué)院講師,主要從事移動(dòng)安全與人工智能研究;陳 佳(1982—),女,湖北武漢人,博士,武漢紡織大學(xué)計(jì)算機(jī)與人工智能學(xué)院副教授(通信作者),主要從事圖像處理、人工智能研究。
[中圖分類號(hào)] G642 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1674-9324(2022)25-0033-04 [收稿日期] 2022-03-17
引言
大數(shù)據(jù)學(xué)科是隨著互聯(lián)網(wǎng)的飛速發(fā)展和數(shù)據(jù)科學(xué)的發(fā)展逐漸形成的,它針對(duì)數(shù)據(jù)獲取、數(shù)據(jù)分析和數(shù)據(jù)可視化各個(gè)環(huán)節(jié),利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)進(jìn)行數(shù)據(jù)傳輸,借助數(shù)學(xué)模型和人工智能算法進(jìn)行數(shù)據(jù)處理和分析,并利用二維和三維技術(shù)實(shí)現(xiàn)分析結(jié)果的可視化。在當(dāng)前世界信息化和全球化的趨勢(shì)面前,做好高等院校大數(shù)據(jù)專業(yè)的教學(xué)研究工作,為國(guó)家培養(yǎng)適應(yīng)形勢(shì)變化的復(fù)合型信息技術(shù)人才越發(fā)重要。
武漢紡織大學(xué)計(jì)算機(jī)與人工智能學(xué)院下設(shè)大數(shù)據(jù)專業(yè)和人工智能專業(yè),并于2019年開(kāi)始招收全日制本科生。開(kāi)設(shè)了大數(shù)據(jù)專業(yè)的全套本科課程,包括“數(shù)據(jù)科學(xué)導(dǎo)論”“數(shù)據(jù)采集與網(wǎng)絡(luò)爬蟲(chóng)”“數(shù)據(jù)分析與實(shí)踐”“大數(shù)據(jù)可視化技術(shù)”等。目前,我校大數(shù)據(jù)教學(xué)方面還有長(zhǎng)足的發(fā)展和較大的提升空間。
針對(duì)大數(shù)據(jù)課程的特點(diǎn),結(jié)合我們?cè)趯I(yè)實(shí)訓(xùn)中的實(shí)際經(jīng)驗(yàn),就大數(shù)據(jù)專業(yè)實(shí)訓(xùn)內(nèi)容提出自己的想法和若干建議,希望能為大數(shù)據(jù)專業(yè)建設(shè)提供新的思路。
一、大數(shù)據(jù)專業(yè)實(shí)訓(xùn)特點(diǎn)
(一)大數(shù)據(jù)專業(yè)實(shí)訓(xùn)的特點(diǎn)
1.大數(shù)據(jù)專業(yè)內(nèi)容涉及面廣。大數(shù)據(jù)是一門新興學(xué)科,也是一門綜合性很強(qiáng)的學(xué)科,涉及計(jì)算機(jī)網(wǎng)絡(luò)、人工智能和機(jī)器學(xué)習(xí)、概率論等諸多學(xué)科。
2.大數(shù)據(jù)專業(yè)基礎(chǔ)課程體系復(fù)雜。基礎(chǔ)類課程包括數(shù)學(xué)基礎(chǔ)課、計(jì)算機(jī)基礎(chǔ)課、大數(shù)據(jù)基礎(chǔ)課程;進(jìn)階類課程包括數(shù)據(jù)獲取類課程、數(shù)據(jù)分析和機(jī)器學(xué)習(xí)類課程、數(shù)據(jù)可視化類課程。每一類課程由若干門課程構(gòu)成,且課程之間存在較多的依賴關(guān)系。
3.大數(shù)據(jù)專業(yè)知識(shí)更新快,前沿性強(qiáng)。隨著互聯(lián)網(wǎng)的飛速發(fā)展,新的數(shù)據(jù)類型不斷產(chǎn)生,新的應(yīng)用需求不斷發(fā)展。這就要求針對(duì)新的需求和數(shù)據(jù)類型,提出新的大數(shù)據(jù)技術(shù)和理論,解決不斷出現(xiàn)的實(shí)際問(wèn)題。
(二)大數(shù)據(jù)專業(yè)實(shí)訓(xùn)中面臨的困難
大數(shù)據(jù)專業(yè)實(shí)訓(xùn)中的主要困難有:(1)大數(shù)據(jù)知識(shí)和技術(shù)資源相對(duì)獨(dú)立和分散;(2)理論知識(shí)和實(shí)踐知識(shí)結(jié)合得不緊密;(3)前沿內(nèi)容眾多且理論難度較大;(4)省屬高校學(xué)生能力參差不齊。
二、物聯(lián)云平臺(tái)實(shí)驗(yàn)的概念和模式
物聯(lián)云平臺(tái)實(shí)驗(yàn)是學(xué)科專業(yè)實(shí)訓(xùn)與云計(jì)算發(fā)展的產(chǎn)物。隨著計(jì)算機(jī)網(wǎng)絡(luò)和傳感器的飛速發(fā)展,海量數(shù)據(jù)大多數(shù)產(chǎn)生于該類平臺(tái)。基于該類型平臺(tái)進(jìn)行專業(yè)實(shí)訓(xùn)[1-3],能夠讓學(xué)生實(shí)際體驗(yàn)平臺(tái)的內(nèi)容和特點(diǎn),提高實(shí)踐能力。
現(xiàn)有物聯(lián)網(wǎng)設(shè)備主要包含多種類型的傳感器設(shè)備,如視頻、音頻、紅外等;其中樹(shù)莓派是一種使用廣泛的開(kāi)源嵌入式平臺(tái)[4,5]。該平臺(tái)選用的Linux操作系統(tǒng)是一種嵌入式的系統(tǒng)。目前云平臺(tái)包括新浪云、百度云和阿里云,這幾種云架構(gòu)[6,7]是類似的。其中新浪云使用較為廣泛,且部分可以免費(fèi)使用;阿里云商用最為廣泛,但是費(fèi)用較高;而百度云使用較少,不在我們考慮之列。
根據(jù)目前業(yè)界開(kāi)發(fā)應(yīng)用需求,并結(jié)合目前市場(chǎng)上提供的設(shè)備及在線云資源的情況,物聯(lián)網(wǎng)前端傳感器負(fù)責(zé)數(shù)據(jù)采集和預(yù)處理,擬采用基于平臺(tái)樹(shù)莓派的硬件平臺(tái)。該平臺(tái)軟硬件都具有較高開(kāi)放性,軟硬件支持非常豐富。后端云平臺(tái)負(fù)責(zé)數(shù)據(jù)管理,擬采用新浪云。
三、智能數(shù)據(jù)處理實(shí)驗(yàn)的概念和模式
智能數(shù)據(jù)處理實(shí)驗(yàn)是大數(shù)據(jù)專業(yè)和產(chǎn)業(yè)技術(shù)應(yīng)用深度融合的產(chǎn)物,將人工智能和數(shù)據(jù)挖掘中的各種技術(shù)和算法[8-10]在實(shí)訓(xùn)的實(shí)驗(yàn)中加以應(yīng)用。國(guó)內(nèi)外智能數(shù)據(jù)處理技術(shù)總結(jié)如下。
Tensorflow是由谷歌公司開(kāi)發(fā)的開(kāi)源深度學(xué)習(xí)平臺(tái),尤其擅長(zhǎng)分析圖像和自然語(yǔ)言,主要技術(shù)是使用卷積神經(jīng)網(wǎng)絡(luò),內(nèi)置各種最先進(jìn)的深度模型。Pytorch是另一種開(kāi)源的深度學(xué)習(xí)開(kāi)發(fā)平臺(tái),與Tensorflow類似,且其編程方式更加簡(jiǎn)潔并易于理解,硬件同時(shí)支持CPU和GPU。國(guó)內(nèi)也有自主研發(fā)的類似平臺(tái),如百度的飛槳(Paddle)和清華大學(xué)的計(jì)圖(Jittor),軟件部分實(shí)現(xiàn)了自主可控。智能數(shù)據(jù)處理實(shí)驗(yàn)?zāi)J饺鐖D1所示。針對(duì)具體的產(chǎn)業(yè)應(yīng)用需求,在物聯(lián)網(wǎng)平臺(tái)和云平臺(tái)上構(gòu)建數(shù)據(jù)處理算法支撐環(huán)境,進(jìn)行算法的學(xué)習(xí)和實(shí)踐。智能數(shù)據(jù)處理教學(xué)分為兩個(gè)部分的內(nèi)容。
(一)物聯(lián)網(wǎng)前端軟硬件學(xué)習(xí)和處理算法學(xué)習(xí)與實(shí)踐
物聯(lián)網(wǎng)前端設(shè)備負(fù)責(zé)原始數(shù)據(jù)的采集和數(shù)據(jù)的預(yù)處理,預(yù)處理通常采用機(jī)器學(xué)習(xí)或者圖像處理的方法。因此,需要學(xué)習(xí)在樹(shù)莓派的嵌入式Linux操作系統(tǒng)環(huán)境中進(jìn)行環(huán)境配置及編程實(shí)踐方法,將預(yù)處理后的數(shù)據(jù)通過(guò)網(wǎng)絡(luò)發(fā)送至遠(yuǎn)程云平臺(tái)。
(二)云平臺(tái)中數(shù)據(jù)分析算法學(xué)習(xí)與實(shí)踐
首先,學(xué)習(xí)內(nèi)容方面,在學(xué)習(xí)Python的基礎(chǔ)上進(jìn)一步掌握機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法的理論和實(shí)驗(yàn)。其次,技能實(shí)踐方面,需要掌握云平臺(tái)中各種算法庫(kù)的使用方法,以及算法集成技術(shù),為了將這些算法功能在項(xiàng)目工作中正常使用。最后,完成項(xiàng)目設(shè)計(jì)、程序設(shè)計(jì)實(shí)踐,并完成最終的演示和報(bào)告內(nèi)容。
四、大數(shù)據(jù)專業(yè)實(shí)踐教學(xué)方案
通過(guò)對(duì)現(xiàn)有應(yīng)用和教學(xué)經(jīng)驗(yàn)的研究,將物聯(lián)云平臺(tái)和智能數(shù)據(jù)處理算法應(yīng)用到大數(shù)據(jù)專業(yè)實(shí)訓(xùn)的教學(xué)實(shí)踐中。課程設(shè)置方案包括準(zhǔn)備階段、教學(xué)階段、實(shí)踐階段。
1.準(zhǔn)備階段:配發(fā)講義,其內(nèi)容主要與教材《Raspberry Pi用戶指南》(Raspberry Pi User Guide)和《利用Python進(jìn)行數(shù)據(jù)分析》(Python for Data Analysis)的內(nèi)容接近。本階段還要安排教學(xué)進(jìn)度,其進(jìn)度可以根據(jù)具體時(shí)間長(zhǎng)短對(duì)內(nèi)容進(jìn)行精簡(jiǎn)或擴(kuò)充。
典型教學(xué)進(jìn)度安排包括教學(xué)階段和實(shí)踐階段兩部分,總計(jì)16個(gè)學(xué)時(shí),具體分為四個(gè)階段。第一階段,基礎(chǔ)知識(shí)教學(xué)階段。安排2個(gè)學(xué)時(shí),主要介紹樹(shù)莓派及設(shè)備的安裝和使用,以及Linux系統(tǒng)安裝使用以及簡(jiǎn)單編程開(kāi)發(fā)。由于課堂教學(xué)時(shí)間非常有限,需要學(xué)生在課下熟悉和掌握Linux平臺(tái)c語(yǔ)言和Pyhton語(yǔ)言開(kāi)發(fā)方法和應(yīng)用實(shí)例。第二階段,系統(tǒng)架構(gòu)搭建階段。安排6個(gè)學(xué)時(shí),完成云架構(gòu)的設(shè)計(jì)和實(shí)現(xiàn)、傳感器網(wǎng)絡(luò)通信的協(xié)議和方法,以及應(yīng)用端的設(shè)計(jì)和實(shí)現(xiàn),同時(shí)要求學(xué)生在課下開(kāi)通云平臺(tái)賬號(hào),使用Python實(shí)現(xiàn)傳感器的數(shù)據(jù)采集、傳輸和云端存儲(chǔ),并學(xué)習(xí)使用php實(shí)現(xiàn)云平臺(tái)數(shù)據(jù)管理。第三階段,進(jìn)階實(shí)踐階段。安排4個(gè)學(xué)時(shí),完成數(shù)據(jù)分析核心算法,包括使用Python語(yǔ)言在Linux中實(shí)現(xiàn)數(shù)據(jù)預(yù)處理算法,使用php語(yǔ)言在云端實(shí)現(xiàn)數(shù)據(jù)分析算法。第四階段,評(píng)估階段。安排4個(gè)學(xué)時(shí),以小組的方式進(jìn)行,每組2~3人,選出1人為組長(zhǎng)負(fù)責(zé)溝通和安排工作,最終以小組為單位向大家講解和展示項(xiàng)目成果,并完成小組互評(píng)和教師點(diǎn)評(píng)。
2.教學(xué)階段:根據(jù)教學(xué)進(jìn)度安排,實(shí)施教學(xué)。教學(xué)過(guò)程中結(jié)合樹(shù)莓派的軟硬件資料和云端開(kāi)發(fā)的教學(xué)資源供學(xué)生參考和使用。針對(duì)不同的應(yīng)用場(chǎng)景,教師講解,學(xué)生組成合作小組,根據(jù)教學(xué)安排給出設(shè)計(jì)方案并完成系統(tǒng)搭建。
3.實(shí)踐階段:學(xué)生根據(jù)教學(xué)安排和內(nèi)容完成系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)工作。在設(shè)計(jì)階段,首先畫出整體層次框架,包括具體的功能模塊及模塊之間的交互內(nèi)容和方式。完成云平臺(tái)的搭建、前端物聯(lián)網(wǎng)設(shè)備的初始化和數(shù)據(jù)通信,以及設(shè)備端和云端的數(shù)據(jù)分析。通過(guò)團(tuán)隊(duì)合作,完成一系列的設(shè)計(jì)和實(shí)現(xiàn),進(jìn)一步鞏固、實(shí)踐所學(xué)習(xí)的理論知識(shí)。
五、教學(xué)心得體會(huì)
將物聯(lián)云平臺(tái)和智能數(shù)據(jù)處理教學(xué)引入大數(shù)據(jù)專業(yè)實(shí)訓(xùn)教學(xué)中,使得教學(xué)模式和方法產(chǎn)業(yè)化、智能化、規(guī)范化,旨在提高學(xué)生實(shí)際工程能力,擴(kuò)展學(xué)生知識(shí)的廣度和深度,并接觸業(yè)界最前沿的技術(shù)和知識(shí)。具體意義描述詳見(jiàn)圖2。
搭建包含物聯(lián)網(wǎng)的云平臺(tái)開(kāi)發(fā)環(huán)境,將專業(yè)實(shí)訓(xùn)和當(dāng)前產(chǎn)業(yè)應(yīng)用相融合。在實(shí)訓(xùn)教學(xué)過(guò)程中將傳感器硬件、物聯(lián)網(wǎng)、云平臺(tái)的軟件和硬件優(yōu)化組合,探索本類案例的產(chǎn)業(yè)特點(diǎn),旨在調(diào)動(dòng)學(xué)生學(xué)習(xí)積極性、深入實(shí)踐、鍛煉能力。通過(guò)該物聯(lián)云平臺(tái),整合大數(shù)據(jù)實(shí)訓(xùn)的相關(guān)資源,提供針對(duì)實(shí)踐的教學(xué)服務(wù),同時(shí)培養(yǎng)學(xué)生的工程能力和動(dòng)手能力。
引入智能數(shù)據(jù)處理的實(shí)訓(xùn)內(nèi)容,將人工智能和數(shù)據(jù)挖掘算法融入實(shí)訓(xùn)內(nèi)容。學(xué)習(xí)并探討產(chǎn)業(yè)和學(xué)術(shù)前沿的技術(shù)內(nèi)容,在此基礎(chǔ)上探索適合大數(shù)據(jù)專業(yè)的教學(xué)內(nèi)容和教學(xué)方法方式,在專業(yè)實(shí)訓(xùn)的教學(xué)過(guò)程中,講授算法的原理及算法的實(shí)際應(yīng)用場(chǎng)景。將算法能力培養(yǎng)與大數(shù)據(jù)專業(yè)實(shí)訓(xùn)融合起來(lái)。在此過(guò)程中,平臺(tái)和智能算法將共同發(fā)揮作用,旨在提高學(xué)生的算法應(yīng)用能力、拓展前沿知識(shí),為國(guó)家培養(yǎng)出面向產(chǎn)業(yè)的高素質(zhì)專業(yè)人才。
本論文的探索方向主要是鼓勵(lì)主動(dòng)自學(xué)、注重實(shí)踐、開(kāi)放思考。選擇的講授方式為線上線下結(jié)合的教學(xué)模式,激發(fā)學(xué)生學(xué)習(xí)熱情,提高學(xué)習(xí)的主動(dòng)性,提高學(xué)生的實(shí)踐動(dòng)手能力。通過(guò)物聯(lián)云平臺(tái)中各類應(yīng)用技術(shù),逐步提高學(xué)生的實(shí)踐動(dòng)手能力,擴(kuò)展知識(shí)的廣度和深度。
結(jié)語(yǔ)
在計(jì)算機(jī)教學(xué)中,專業(yè)實(shí)訓(xùn)是非常重要的一環(huán)。專業(yè)實(shí)訓(xùn)能夠提升學(xué)生的動(dòng)手能力,使學(xué)生能夠更加深刻地理解和掌握理論知識(shí),并初步掌握實(shí)際工程中分析問(wèn)題和解決問(wèn)題的能力。同時(shí),本次實(shí)訓(xùn)探索能夠完善學(xué)校實(shí)訓(xùn)內(nèi)容,并進(jìn)一步推動(dòng)實(shí)訓(xùn)與產(chǎn)業(yè)和實(shí)踐的深度結(jié)合。此外,所選軟件和硬件平臺(tái)成本較低且開(kāi)放程度高,不會(huì)給學(xué)校和學(xué)生帶來(lái)明顯的經(jīng)濟(jì)負(fù)擔(dān)。通過(guò)實(shí)踐教學(xué)證明了專業(yè)實(shí)訓(xùn)的可行性和有效性。然而實(shí)訓(xùn)的內(nèi)容和方式還有改進(jìn)的空間,需要在今后的教研中更進(jìn)一步地探索。
參考文獻(xiàn)
[1]王彤,夏利,張立立.基于樹(shù)莓派的計(jì)算機(jī)類專業(yè)實(shí)訓(xùn)教學(xué)探索[J].計(jì)算機(jī)教育,2018(1):25-29.
[2]關(guān)靜麗,艾紅,陳雯柏.基于樹(shù)莓派和Yeelink的開(kāi)放實(shí)驗(yàn)室監(jiān)控系統(tǒng)設(shè)計(jì)[J].實(shí)驗(yàn)研究與探索,2017(36):115-119.
[3]朱軼,曹清華.基于Android、樹(shù)莓派、Arduino、機(jī)器人的創(chuàng)客技能教育探索與實(shí)踐[J].實(shí)驗(yàn)技術(shù)與管理,2016(33):172-175.
[4]嚴(yán)莆青,朱劍林.基于Raspberry Pi的老年人室內(nèi)移動(dòng)監(jiān)測(cè)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].武漢:中南民族大學(xué),2017.
[5]李文勝.基于樹(shù)莓派的嵌入式Linux開(kāi)發(fā)教學(xué)探索[J].電子技術(shù)與軟件工程,2014(9):219-220.
[6]龔洪敏.基于云計(jì)算環(huán)境的優(yōu)質(zhì)資源共享平臺(tái)的研究[D].西安:陜西師范大學(xué),2013.
[7]吳玫.基于SAE與微信公眾平臺(tái)的校園信息化服務(wù)系統(tǒng)[D].上海:復(fù)旦大學(xué),2013.
[8]KRIZHEVSKY Alex, SUTSKEVER Ilya, HINTON Geoffrey E. ImageNet classification with deep convolutional neural networks[J]. Advances in neural information processing systems, 2012(25):1106-1114.
[9]GIRSHICK Ross. Fast R-CNN[C]. IEEE International Conference on Computer Vision (ICCV), 2015:1440-1448.
[10]SCHROFF Florian, KALENICHENKO Dmitry, PHILBIN James. FaceNet: a unified embedding for face recognition and clustering[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), 2015:815-823.
Exploration on the Professional Training of Big Data Based on IOT-Cloud Platform and Intelligent Processing
HUANG Jin, TANG Jun-wei, LUO Rui-qi, CHEN Jia
(School of computer Science and Artificial Intelligence, Wuhan Textile University, Wuhan, Hubei 430200, China)
Abstract: This paper explores the practice training and teaching of big data major, and explores the introduction of the IOT-Cloud platform and the data analysis and processing technology into the practice training of the courses of bid data major. According to the characteristics and the difficulties of big data professional training, we try organize teaching by taking the IOT-Cloud platform as the basic means of professional training and IOT equipment as the front-end data acquisition technology, so as to improve students’ comprehensive design level and practical ability. According to the needs of front-end data pre-processing and back-end data intelligent processing, we will discuss the theoretical knowledge and practical methods of cutting-edge data analysis, expand the professional depth and breadth of students, and cultivate compound information technology talents for the country.
Key words: big data; IOT-Cloud platform; intelligent processing; practice training