王麗銘 黑龍江財經學院
隨著大數據時代的到來,社會對大數據技術人才需求也越來越大,我國各高校開始申報數據科學與大數據技術專業,2016年,教育部發布《2015年度普通高等學校本科專業備案和審批結果》中“數據科學與大數據技術專業”,有3所大學獲批,2017年,教育部批準了32所高校,2018年,有250所高校獲批,數據科學與大數據技術專業得到迅猛發展,未來一片光明,同時很多高??礈适袌?,也對相關專業進行調整,增設出大數據方向的課程,以培養大數據與其它專業相融合的復合型人才。
我校屬于地方性本科高校,目標在于服務地方,培養應用型人才。我校在學習產出的教育模式(OBE)與自身情況相結合的情況下,建設數據科學與大數據技術專業,對學生畢業崗位定位于大數據架構工程師、開發工程師、平臺運維工程師、大數據分析師等,故開設包括高級語言程序設計II(Java)、數據庫系統及應用、Linux操作系統、面向數據科學的編程語言(Python)、應用統計學、大數據平臺及應用、Spark大數據技術、Storm流式計算等課程,其中Linux操作系統、大數據平臺及應用課程是面向大數據平臺運維工程師崗位的主要課程,大數據平臺及應用是在LINUX操作系統的基礎上講授hadoop集群及相關組件,如何將這門課程講好、讓學生學好,將學生培養成合格的大數據平臺運維工程師是本門課程建設的主要目的。
課程建設包括教育思想、教學方法、教學手段、教學過程、師資隊伍、等多方面的內容,從我校的實際情況出發,結合自身學校、教師、學生特點探討適合我校特點的本門課程建設。
一、 在新工科建設的背景下,我校一直致力于基于成果導向的(OBE)與我校專業課相結合的研究,故本課程也是以成果導向為指導,以大數據平臺運維工程師崗位需求為目標,對學生知識、能力等方面進行培養及訓練。
(一)大數據平臺運維工程師崗位職責:
1.負責hadoop、HBase、Hive、Spark等大數據平臺規劃、部署、監控、系統優化等,確保高可用;2.負責公司大數據平臺的運維管理工作,集群容量規劃、擴容及性能優化及各類異常和故障,確保系統平臺的穩定運行;3.為數據倉庫、數據挖掘建模等數據應用項目提供運行環境支持。
(二)大數據平臺運維工程師崗位要求:
1.掌握Linux操作系統的配置,管理及優化,能夠獨立排查及解決操作系統層的各類問題;2.熟練掌握Python, shell中的至少一門語言,有Python運維工具開發經驗優先;3.熟悉Hadoop生態及高性能緩存相關的各種工具并有實戰經驗,包括但不限于 Hadoop、HBase、Hive、Spark、impala、zookeeper、kafka、Elasticsearch、oozie、yarn、Scribe、Flume、Storm 等;4. 熟 悉 大數據平臺的監控以及調優,有獨立分析問題和解決問題的能力。
二、針對崗位需求,在本課程中制定培養目標如下:
1.理解hadoop生態圈內的相關組件,并能熟練應用;2.理解hadoop集群架構原理及安裝運維;3.理解HDFS工作原理,并能夠進行編程實踐;4.理解MapReduce工作原理,并能夠進行編程實踐。
由于本課程是一門實踐性很強的課程,故對實踐內容做如下設計:
1.hadoop 偽分布安裝實驗;2.hadoop平臺安裝實驗;3.部署YARN集群實驗;4.HDFS實驗;5.MapReduce實驗;6.部署Hive及應用實驗;7.部署ZooKeeper實驗;8.部署HBase及應用實驗;9.Spark安裝及應用實驗;10.部署Storm實驗;11.hadoop中其它組件的安裝及應用。
通過本課程學習,培養學生實踐動手能力、獨立思考問題和解決問題的能力,達到使學生能夠正確靈活地利用相關知識點來解決相關問題的目標。
三、本課程是一門理論與實踐并重的課程,所以課程設計是邊講邊練,講練結合的教學方式,先理論后馬上實踐,再總結實踐上升到理論支撐,大數據技術日新月異,進步飛速,所以讓學生學會己有的知識只是最低要求,重點是讓學生學會如何學習這些知識,如何運用這些知識解決實際工作中的困難。目前市場是有許多開發成熟的大數據實驗系統,并且有很多公司可以針對學校具體情況進行調整及修改,但是針對我校特點及對本門課程的定位等情況,本實踐環節以學生全部動手的思想為指導,進行實驗設置,具體如下:
1.實驗一的“hadoop偽分布安裝實驗”先讓學生在自己機器中進行安裝,以訓練學生對LINUX操作系統、虛擬機等技術掌握和應用,同時在自己機器上安裝hadoop相關組件,先對hadoop平臺有總體認識,配合理論教學,深入理解hadoop集群及生態圈中組件的應用;2.從實驗二開始,多個同學組合進行實驗平臺搭建,此時不再做偽分布式,而且讓學生將自己機器安裝LINUX操作系統,并進行hadoop集群的安裝布署,在安裝完成后進行測試及節點的添加等相關技術的實驗,以培養學生靈活應用hadoop集群的能力;3.在基礎平臺搭建完成后,其它實驗可以進行,將在hadoop平臺上進行編程開發,組件安裝,數據存儲,數據分析等操作。
四、本課程設計是以學生為中心,以OBE為支撐,強調學生學習獲得的最終能力及成果,為此課程整體進行反向設計,這樣使教師在教學過程中目標明確,方法多樣,能夠抓住學生,把整個教學過程融合到一起,但是這些環節中還有一個必不可少的環節就是考核,考核既是整個教學環節的最后一環,也是第一個環節,你教成什么樣子最終是否達到標準是考核的的目標,但是在OBE理念中,考核的不僅是知識,更重要的是能力,所以考核的設計至關重要,同是考核也是教學環節中的第一步,原因在于有教學目標,有考核目標,上課時的內容,過程,方法等一切手段都是為此服務,教學目標和考核也是相輔相承的,這幾個環節是密不可分的。
大數據平臺及應用課程不僅可以做為數據科學與大數據技術專業的一門專業課程,還可以做為計算機網絡、統計學等相關專業的方向課程,更可以做從事大數據平臺運維工程師的人員做為學習參考,故在課程建設過程中要進行微課、視頻錄像等教學資源的制作及開放。