陳江林 姚繼美 孫永香
摘要:大數據作為國家基礎性戰略資源,大數據技術發展與應用前景非常廣闊。我校已經成功申報“數據科學與大數據技術”專業。如何在新形勢下根據學校自身教學資源與辦學條件科學設置人才培養目標,培養適應社會與經濟發展需要的、掌握該專業相關技術的合格人才、實現專業的可持續發展是目前專業建設必須考慮的首要問題。文中從專業內涵、專業建設基礎、專業應用前景、培養目標定位等幾方面做了闡述和研究。
關鍵詞:大數據;數據科學;大數據技術;培養目標
中圖分類號:TP311? ? ? 文獻標識碼:A? ? ? 文章編號:1009-3044(2018)35-0166-02
2015年8月,國務院頒布的《促進大數據發展行動綱要》中提出將大數據上升為國家戰略。2016年3月17日,《中華人民共和國國民經濟和社會發展第十三個五年規劃綱要》中提出:把大數據作為基礎性戰略資源,全面實施促進大數據發展行動,加快推動數據資源共享開放和開發應用,助力產業轉型升級和社會治理創新。全面推進大數據發展、加快建設數據強國,培養基于計算技術、數據分析技術、人工智能技術及學科應用交叉的復合型人才已刻不容緩。“數據科學與大數據技術”專業正是在此背景下設立的。教育部自2016年2月至2018年3月分三批批準公布了283所高校開設“數據科學與大數據技術” 本科專業。山東省第3批獲批的有13所高校,我校位列其中。
數據科學與大數據技術專業學科屬于交叉學科,以計算機科學、數學及統計學為支撐,以生物、醫學、管理學、環境科學、經濟學、社會學等學科應用為拓展。主要研究數據的采集整理、數據存儲與管理、數據分析等內容,從行業角度對含有高價值的海量數據集進行數據管理、分析、系統研發和應用。
專業的生存與發展關鍵是人才的培養。人才的培養又受到自身資源與辦學條件、經濟與社會環境、行業地域等諸多因素的影響。這些因素最終影響著人才培養目標的科學定位。
下面從專業內涵、專業建設基礎(自身的教育資源和辦學能力)、專業應用前景并結合其他高校的專業培養目標定位談一談我校“數據科學與大數據技術“專業應人才培養目標如何科學定位。
1 專業內涵
理解數據科學與大數據技術專業內涵,從以下3個方面介紹:
1) 數據科學:數據科學是大數據時代催生的一門新的學科。由于大數據技術的特點和重要性,數據科學的概念被國內外研究者認可,即數據處理技術將成為一個與計算科學并列的新的科學領域。著名圖靈獎獲得者Jim Gray認為:數據密集型科學發現將成為科學研究的第四范式,科學研究將從實驗科學、理論科學、計算科學,發展到目前興起的數據科學。
2) 大數據:大數據目前還沒有完整統一的定義。維基百科給出的定性描述是:大數據是指無法使用傳統和常用的軟件技術和工具在一定時間內完成獲取、管理和處理的數據集。Gartner研究機構給出的定義為:大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。我國《促進大數據發展行動綱要》中認為,大數據是以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合,正快速發展為對數量巨大、來源分散、格式多樣的數據進行采集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的新一代信息技術和服務業態。當今大數據一詞重點已非數據規模的定義,它更代表著信息技術發展進入了一個新的時代,代表著爆炸性的數據信息給傳統的計算技術和信息技術帶來的技術挑戰和困難,代表著大數據處理所需的新的技術和方法,也代表著大數據分析和應用所帶來的新發明、新服務和新的發展機遇。
3) 大數據技術:大數據技術就是從海量數據中有目的挖掘有價值數據的技術。目前對于“大數據技術”也沒有明確統一的定義。大數據技術的核心在于對大數據的分析處理。當前大數據技術的研究發展主要體現在基礎理論、關鍵技術、應用實踐、數據安全四個方面。基礎技術方面主要包含數據的采集、數據預處理、分布式存儲、NoSQL數據庫、數據倉庫、機器學習、并行計算、可視化等各種技術范疇和不同的技術層面;關鍵技術方面主要包括大數據格式的轉化、數據轉移和處理等是急需處理的核心問題;應用實踐方面主要包括數據管理、數據搜索分析和數據集成;數據安全方面主要包括大數據技術用戶隱私和數據質量。
專業內涵決定了學生所要學習和需要掌握的知識以及應該具備的能力,這是人才培養目標制定的依據之一。
2 專業建設基礎
1) 師資力量:信息科學與工程學院現有專任教師149人,其中教授24人,副教授71人。學院計算機學科專業有5個、數學與統計學相關專業2個對數據科學與大數據技術專業建設形成有力的支撐。學校成立的農業大數據研究中心協同基礎學科和應用學科的教師開展農業大數據的研究工作,同時從國內外招聘多名大數據管理、大數據分析方面的優秀人才,充實研究團隊,學院也有計劃地派出教師進行專業進修和參加大數據核心課程培訓。多元化的教育背景和研究經歷為數據科學與大數據專業的建設積累了雄厚的師資力量。
2) 基礎設施:我校已擁有比較完善的大數據研究軟硬件設施,建設、購買了20多套涉農數據庫和信息化系統,創建了500TB 的云平臺,建立了無棣“渤海糧倉”核心示范區等97 處教學示范基地。這些設施為該專業的課堂教學和實踐教學提供了有力保障。
3) 科研基礎:近3年來,學校農業大數據研究中心各科研團隊主持國家級、省部級信息化項目20余項,總經費1700余萬元;與中國農科院、復旦大學等37家單位開展協同創新研究。學校農業大數據研究中心擁有涉農數據庫、生物信息數據庫、農作物生長檢測數據庫、水文水利數據庫等近50T數據,為數據科學與大數據技術專業提供了項目支撐和數據資源。擁有多個大數據相關的科研平臺。這些項目研發經驗和數據積累為數據科學與大數據技術專業的開設提供技術支撐和保障。
4) 聯合培養:2013年我校率先在全國成立首家農業大數據研究中心,并組建農業大數據產業技術創新戰略聯盟;2017年3月我校以農業大數據為特色的計算機學科群入選山東省高水平應用型立項建設專業;2017年6月,我校牽頭,聯合青島農業大學、山東省農業科學院科技信息研究所等11家單位組建山東省農業大數據研究與應用協同創新中心。這些研究中心、戰略聯盟和協同創新中心,包括政產學研用各類主體,覆蓋山東乃至全國很多省市,且各成員單位具備較好的資源優勢、人才優勢等,為基礎學科和應用學科的教師協同開展農業大數據教學和研究工作提供了有力的支撐,為聯合培養數據科學與大數據技術專業人才和應用技術復合型人才提供了優勢與條件。
5) 行業與地域
山東省是農業大省,農業生產發達。我校又為農業院校,學校堅持服務“三農”的辦學方向,面臨著推進農業現代化、農業供給側結構性改革、山東省“兩區一圈一帶”戰略等任務要求,充分發揮人才培養、科學研究和技術創新的優勢,助力實現區域和行業發展目標是學校義不容辭的責任。
現代農業大數據工程作為國家實施大數據十項工程之一,重點在農業農村信息綜合服務、農業資源要素共享、農產品質量安全信息服務三個方面進行突破。
行業與地域的優勢確立了我校數據科學與大數據技術專業的人才培養應以農業大數據應用為特色,輔以多領域交叉的應用復合型人才。
3 專業應用前景
數據科學家是全球最緊缺的人才。數據科學與大數據技術專業的畢業生就業前景廣闊,可在政府部門、金融機構、企業和公司、科研院所、教育等行業從事數據庫開發與維護、數據挖掘與分析、市場分析與預測、人工智能產品設計與實現等相關工作。數據分析及數據處理的崗位報酬也非常可觀,在硅谷入門級的數據科學家的收入已達到幾十萬美元,在我國每年增速也非常快。目前國內外高校開展大數據技術人才培養的時間較短,掌握大數據處理和應用開發技術的人才異常短缺,技術人才供不應求。國內幾乎所有著名的IT企業,如百度、騰訊、阿里巴巴和淘寶、奇虎360等,都急需大量大數據技術人才。
社會需要是專業發展的基礎。人才的培養只有契合市場的要求,才能為專業發展提供更加廣闊的空間,提高專業辦學水平。
4 培養目標定位
不同學校對自身定位不同,所研究的領域和發展方向也不盡相同。我們也對不同的相同專業的高校專業培養目標進行了認真的對比研究。學校堅持“學用結合、學以實為貴,育人為本、學術至上”的辦學理念。數據科學與大數據技術專業屬于工科專業,培養目標主要培養大數據方面的工程技術人才。
綜上我校的開辦數據科學與大數據技術專業的教育資源及辦學條件、契合學校目標定位、結合行業和地域優勢、社會和經濟發展的需要等各方面因素考慮,我校數據科學與大數據技術專業人才培養目標可制定為:
數據科學與大數據技術專業旨在培養德、智、體、美全面發展,適應社會與經濟發展需求的數據科學與大數據技術及相關領域的應用型工程專業技術人才,具備較扎實的計算機科學、數學和統計學基礎知識,掌握大數據相關技術,能夠從事農業、金融、商務等領域的大數據管理、分析、處理、服務等相關工作,培養造就厚基礎、強能力、重實踐、廣適應的高素質人才。
大數據在帶來巨大技術挑戰的同時,也帶來巨大的技術創新與機遇。抓住機遇、適應社會與經濟發展的需要,實現專業可持續發展培養合格人才是每一個教育工作者所肩負的重任。
參考文獻:
[1] 陳欣,周龍福,曹耀欽.探索應用型本科數據科學與大數據技術專業人才培養方案的構建[J].現代工業經濟和信息化,2017,37(23).
[2] 朝樂門,邢春曉,張勇.數據科學研究的現狀與趨勢[J].計算機科學,2018,45(1).
[通聯編輯:光文玲]