楊慧
摘 要:在大數據時代背景下,各行各業都逐漸呈現出數據資本的現狀。但是,如何更好地處理大數據、應用大數據卻成為世界范圍內的共同難題,而作為與大數據最為緊密的領跑者——計算機專業被賦予眾望。故本研究從計算機專業的教學體系建設為契點,希望從課程群、教學方法、教學模型等角度出發,為高校的計算機專業在大數據處理方向的建設提供相關實證依據。
關鍵詞:計算機專業 大數據處理方向 教學體系 完善
中圖分類號:G642 文獻標識碼:A 文章編號:1672-3791(2018)12(c)-0038-02
在互聯網以及計算機科學快速發展的今天,每個行業都逐漸重視數據的觀測與分析,因為這些數據在一定程度上可以預測未該行業的走向,其中最為常見的就是我們日常生活中用到的各類只能軟件,它們為什么能夠知道我們個人的喜好呢?其很大程度上取決于后臺大數據的支持,我們在某個時刻瀏覽的網站及頻率均會產生記錄,累積到一定程度就會對我們的行為趨勢產生一定的了解。因此大數據處理一般包括數據收集、數據記錄、數據儲存、數據處理、產生導向結果等幾個方面。但是對于計算機專業的大數據處理方向的學生以及高校而言,如何建設教學體系才能培養出符合時代要求的數據分析師成為當下最迫切解決的問題。
1 大數據概述
1.1 大數據概念
對于大數據的概念,目前世界范圍內也沒有統一的定義,但是早在2008年《Science》雜志將大數據定義為“代表著人類認知過程的進步,數據集的規模是無法在可容忍的時間內用目前的技術、方法和理論去獲取、管理、處理的數據。從以上的定義中不難看出大數據的內容范圍非常之廣,并且對該數據的處理是一臺計算機所不能解決的,它的數據類型以及處理方式均遠遠超出傳統數據的范疇。
1.2 大數據應用現狀
查閱文獻發現在美國針對醫療方面采取的大數據分析結果為整個行業增值3000億元的價值,并且他們將大數據這一新興技術產業廣泛應用于空間站、航空航天、道路檢測等領域,其產生的價值是不可估量的。而在我國,隨著近些年互聯網產業逐漸與大眾相接軌,大數據處理以及收集的必要性逐漸被重視,國內已有的研究有針對消費行業的,也有環境質量監測的,更值得一提的是,很多高校都逐漸開設大數據收集與處理技術等具有針對性的專業,這說明我國的大數據處理技術已經做好漸入佳境的準備。
1.3 大數據處理技術
在大數據處理方面,具體分為以下幾個方面:(1)數據收集,在該領域,有WEKA、RapidMiner、Dryad、Pregel技術,WEKA是開源的集合大量承擔數據挖掘任務的機器學習算法,RapidMiner 可實現Excel、Access、Oracle等數據庫的訪問。(2)數據儲存:Google 較早開發了GFS,隨后基于Spanner 服務器的F1(fault tolerant distributed RDBMS)新型數據庫。微軟自行開發的分布式計算平臺Cosmos,主要包括存儲系統、執行環境、SCOPE(structured computations optimized for parallel execution),能夠存存儲和分析大數據集。
2 教學體系建設目標以及思路
2.1 建設目標
在我國當前階段,雖然大數據的收集領域有很多,但是由于是一個新興的產業,傳統的數據分析師已經不能應對當下數據的處理要求,但是大數據的應用領域之廣以及創新視角的變化又是非常快的。所以,筆者認為在大數據時代背景下的數據處理分析人員不僅要能夠具備良好的善于收集、分析數據的能力,而且更為重要的是要具備將這些大數據背后的分析結果能夠很好的應用到相應的領域并使其差生最大價值。
2.2 建設思路
由于各行各業均有大數據的存在,并且每個領域的數據分析利用視角也均會產生較大的差異,因此換句話說大數據分析這一行業是“魚龍混雜”的現象。但是作為培養大數據處理分析人員的高校或者組織單位,一定要有“追本溯源”的教學思路,所以無論在什么領域,都應該教會學生會應用最為基礎的數據分析技術,并且要能夠培養學生善于具體問題具體分析的敏銳度,能夠對數據應用的大趨勢把握不會出錯。因此,高校在培養學生的過程中,應該注重計算機編程、數學、統計等方向的基礎類課程,在這一階段之后就是結合當下的各個領域,讓學生們熟知在教育、生物科技、消費等基礎領域視角的數據具體價值,以便在實際應用的時候能夠有自己的思路。
3 教學體系建設內容
3.1 基礎課程
對于計算機專業的學生來說,基礎類的課程無疑有數學課程和計算機課程等兩個主要方面。對于前者而言,其課程主要涉及到高等數學、數理統計、離散數學、概率論等基礎課程。因為在對大數據進行挖取的過程中很多時候都會用到微積分、線性模型等數學知識。而對于后者而言,包括C語言、C++以及JAVA語言等,程序設計課程作為計算機專業的基礎課程,讓學生掌握解決問題的算法和算法實現的具體過程是該類課程的主要目標。
3.2 大數據方向課程
一般情況下大數據的處理有如下幾方面:(1)數據收集,在采集數據的過程中,當下比較成熟的方法有爬蟲、ETL工具等,需要分析人員將數據拔下來后能夠進行相應的分類處理。(2)數據儲存:在對大數據進行儲存的過程中,比較常用的就是分布式存儲,這樣做的好處就是能夠為后續的分析任務節省很多的時間與精力。(3)數據分析與建模:因為只有大量的數據在收集之后才會產生價值,并且才會在一定程度提高準確的趨向性。
3.3 大數據方向實踐課程
每個專業都會面臨一個共通難題,就是理論與實踐的有效結合,因此對于數據分析這種實踐性特別強的專業,更應該提高學生的實踐能力,因此,在教學的硬件設施方面,高校應該及時的為學生提供有效的實踐練習的實驗室或者具體的數據分析處理實踐基地。
3.4 教學策略與方法
與其他的專業相比,大數據處理方向的計算機可能相對比較枯燥,所以在如何做到“寓教于樂”,則需要教育者和相關部門進行相關思考。在筆者的調研和分析之后,學生都是存在很強的競爭意識,所以高校可以聯合有相同需求的高校定期舉行職業技能大賽等活動,可以在一定程度上激發學生自主學習和創造的能力,也能夠培養學生在團隊活動中的責任與擔當。
此外,教學還應當與學生的實踐相掛鉤,可以采取學分制的方法,要求學生在每學年、甚至每學期都得具有一定的數據分析實踐,這樣可以督促學生及時的將自己學習的理論知識用到實際當中,真正意義上做到學以致用。
4 結語
在大數據極速發展的今天,對計算機專業的數據處理學習者既提出了較高的挑戰,但與此同時更多的是給予他們機遇,一個脫胎換骨、不斷完善自己的過程;希望本文所提出的教學體系建設能夠為這個蛻變的過程貢獻其力量。更希望計算機專業的教育者更能夠在自己的實踐道路上及時對該內容做出有效調整。
參考文獻
[1] 趙曉娟.大數據時代計算機專業實驗教學改革研究[J]. 電腦迷,2017(6):169.
[2] 李鴻健.大數據時代計算機專業實驗教學改革研究[J]. 現代計算機,2013(13):29-31.
[3] 謝志明.基于CDIO的云計算與大數據課程體系建設[J]. 計算機教育,2017(1):47-52.