章鳴嬛 張璇 郭欣 陳瑛



摘 要:數據庫類課程群是計算機類專業的重要必修課,數據庫技術也是數據工程流程鏈上的關鍵技術之一。以上海杉達學院信息科學與技術學院的相關專業為例,探索在大數據背景下,應用技術型本科高校數據庫類課程群的改革及深化路徑。項目組與業內知名企業開展深度合作,共同探討并制定了以數據庫技術為主導的課程群改革方案,對傳統的數據庫類課程進行了深化和更新。所給出的教改方案能提升學生的學習興趣,完善學生的知識體系。方案不僅對該校相關專業學生有良好的效果,對同類高校類似專業的數據庫類課程改革也具有積極的借鑒意義。
關鍵詞:數據庫類課程群; 數據工程; 應用技術; 教學改革
中圖分類號: Q334
文獻標志碼: A
Abstract:The database curriculum module consists of compulsory courses for computer majors; database technology is one of the key technologies in data engineering process chain. On the basis of the practice of College of Information Science and Technology, Shanghai Shanda University, this paper explores the background of big data the reform and deepening path of the database curriculum module in applied technology-oriented undergraduate universities. The college has, through in-depth cooperation with well-known enterprises, explored and developed a curriculum module reform plan dominated by database technology to deepen and reform the traditional database curricula. As a result, the reform plan has enhanced students' interest in learning and improved their knowledge system. In the authors view, the reform plan not only has good effectiveness for students of related majors in their university, but also is a significant reference for the reform of database curricula modules for relevant majors of university of its kind.
Key words:Database course cluster; Data engineering; Applied technology; Teaching reform
0 引言
在計算機技術的各類應用領域中,幾乎都要以強大的數據庫作為其軟件系統的有力支撐,因此數據庫類課程在計算機類專業的教學過程中占有非常重要的地位,是核心專業課之一[1]。隨著科技的進步與發展,人類社會正經歷著一場由大數據引發的革命,而數據庫技術正是數據處理的關鍵技術之一。在就業市場上,熟練掌握數據庫技術的人才也供不應求[2]。
上海杉達學院(以下簡稱“我校”)于2016年獲批教育部數據中國“百校工程”項目,建成“杉達-中科曙光”大數據學院(以下簡稱“大數據學院”),并于2017年9月首次招生。我校是上海地區唯一獲批該項目的應用型本科高校,擬以大數據學院為依托,培養數據工程方向的專業人才。
我校信息科學與技術學院的計算機類專業(或方向)包括:計算機科學與技術、軟件工程、計算機科學與技術(數據工程方向)。數據工程方向同時隸屬于大數據學院,以培養數據工程流程鏈的前端人才為主要教學目標。相較于計算機科學與技術和軟件工程專業,數據工程方向更重視數據庫技術在整個數據工程流程鏈中的貫穿和銜接。因此,傳統的數據庫類課程設置已不能完全滿足數據工程方向的教學要求。因此,針對該方向的教學目標,課題組依托2016年上海市民辦高校重點科研項目(“數據工程”應用技術型人才培養模式研究)和2017年教育部高教司協同育人項目(在大數據背景下探索“數據庫原理及技術”的課程改革),與業內知名企業開展了深度合作,以培養應用技術型本科人才為導向,設計出一條以數據庫技術為主導的課程群主線。
1 核心概念界定
1.1 數據工程流程鏈
數據工程流程鏈可視為面向數據的全流程處理的體系工程。簡略描述如圖1所示。
對圖1分析如下:
1) 經大量前期調研及分析發現,國內外不同高校對于流程鏈環節的重點把握各異,故對于“面向數據的全流程處理”的名稱也不盡相同。有稱“數據工程”[3];有稱“數據科學”[4,5];還有的提法比較籠統,稱之為“大數據”[6]。本文結合我校的實際情況,采用“數據工程”的提法。
2) 從流程鏈的位置及其技術深度來考慮,可將流程鏈分解為前端和后端。前端包括數據采集、數據存儲及數據管理、數據預處理、數據分布狀態分析等;后端包括數據建模和數據挖掘、人工智能及其行業應用等。對我校本科生的培養將主要定位于該流程鏈的前端,同時兼顧其后端的課程設置和人才培養。
3) “數據可視化”可置于該流程鏈的多處位置,故單列為一旁支。比如,在進行數據預處理、數據分布狀態分析以及數據建模、數據挖掘之后,均可利用數據可視化技術進行效果展示。
4) 流程鏈上各環節所需的能力涉及到多學科交叉,如計算機科學、統計學、應用數學及各應用領域。每一學科都提供了“數據工程”人才所需的必要能力[7-9]。
數據庫技術主要位于該流程鏈的“數據存儲及管理”環節中(虛線框內)。我校計算機科學與技術專業現行本科教學計劃中,數據庫類課程主要包括數據庫原理及技術(64學時)和軟件課程設計(32學時)。針對數據工程專業方向的教學要求,課題組基于計算機科學與技術專業的教學要求,設計了一條以數據庫技術為主導的課程群主線。
1.2 數據庫課程群
數據庫課程群可理解為以數據庫技術為核心的,融合其前驅和后續課程的,能夠較合理地培養學生相關能力的一套完善的課程體系。欲設計合理的數據庫技術類課程群,先要厘清該類課程的前驅和后續課程的關系。表1針對于數據工程方向的教學要求,列出了其主要的前驅及后續課程。
盡管數據工程方向的學生是以學習數據工程流程鏈上的技術為主,但也不可忽視學生的軟件開發能力。因此,在設計數據庫課程群時也應將軟件開發技術列入其中,進行綜合考慮。
我校對于數據工程方向學生的培養有兩個主要分支,即數據分析類和平臺運維類,且以前者為主。因此在設置課程時也須有明顯體現。由于本科生的培養應遵循“厚基礎”、
“寬口徑”的思路,不宜區分得太細,故以上兩個分支的區別將在選修課中加以體現。
2 傳統的數據庫類課程設置及其不足
2.1 傳統的數據庫類課程設置
傳統的數據庫類課程主要包括數據庫原理及技術(64學時)和軟件課程設計(32學時)組成。后者一般利用數據庫管理系統(DBMS)結合相應的編程語言,是對前者的強化和深入。
數據庫原理及技術課程的主要內容如圖2所示。
由圖2可見,數據庫原理及技術課程主要內容包含:關系數據庫的基本概念、關系運算、SQL語法、范式與數據庫設計等。基本命令主要有數據庫對象操作、表和視圖操作,以及基本的增、刪、改、查等命令。學生的上機實踐,一般是基于Windows平臺下的Server SQL或MySQL環境來練習。學生通過理論授課和上機實踐,完成本課程的學習。
2.2 存在的不足
不足之處表現為以下三個方面。
首先,傳統的數據庫課程中,一般只是針對某一章節來設計上機內容,這樣不易讓學生構建起全面、完整的數據庫知識體系,從而導致其數據技術的實踐能力差,不具備數據庫應用系統的開發能力,難以滿足行業對數據庫人才的需求。故需設置專門的課程設計環節來提升學生的綜合應用能力。
第二,隨著物聯網、云計算和大數據技術的發展,各行業數據增長迅猛。數據的海量化、多類型化、多維化使得數據庫技術從關系型數據庫向非關系型數據庫、單機處理向分布式處理的方向發展[10]。數據形式由傳統的數值類型變為圖像、文本、音頻、視頻等非關系型數據。為適應大數據時代的需求,數據工程專業方向應將非關系型數據庫技術(NoSQL)納入教學計劃中。
最后,許多優秀的數據庫管理系統都是免費、跨平臺的[11]。它們不僅可用于Windows平臺,在Linux平臺下的性能更為優越。因此,有必要讓學生盡早熟悉Linux操作系統,并學會在該平臺下熟練運用數據庫管理系統。
3 數據工程類應用技術型本科高校的“數據庫”課程群設計
3.1 課程群設計
根據以上分析,課題組以數據庫技術為主導,設計出數據工程類應用技術型本科高校的“數據庫”課程群。如圖3所示。
對圖3做如下的分析。
1) 數據庫原理及技術,由原先的64學時縮減為48學時。在精簡理論課程的同時,對上機學時略有削減。上機環節將在后續課程中得以專門加強。另外,將在本課程中講授非關系型數據庫NoSQL的基本概念。
2) 增設Linux操作實踐。該課程是“操作系統原理”的延伸和擴展,也為后續若干門課程打下基礎。
3) 增設基于Linux的數據庫課程設計。該課程是對前述兩門課的綜合和提高,是數據庫技術的主要實踐環節,旨在培養學生對于數據庫的綜合開發和應用能力。可以看到,該課程之后又延伸出兩條支線,分別是偏運維方向的Hadoop平臺技術和偏數據分析方向的數據挖掘及人工智能。值得注意的是,這兩條支線所涉及的課程內容無法截然分開,平臺運維和數據分析的知識往往是融為一體的。
4) 增設分布式數據庫,課程內容包含分布式及非關系型數據庫,是數據庫原理及技術和Hadoop平臺技術的重要后續課程。
5) 如1.2小節所述,數據工程方向的學生雖以學習數據工程流程鏈上的技術為主,但也不可忽視培養其軟件開發能力。因此,在程序開發語言和數據庫課程設計之后,開設了軟件課程設計。軟件開發能力對于后續的人工智能及其行業應用等課程也不可或缺,是這些課程的重要基礎。
可以看出,本課程群不僅涵蓋了數據工程流程鏈上的“數據存儲和數據管理”環節,還對流程鏈上諸多環節(如數據建模和數據挖掘、人工智能及其行業應用)加以貫穿融合,使得該流程鏈各環節不再是孤立的個體,成為一個有機的整體。
3.2 方案實施
上海杉達學院是應用技術型本科高校,信息科學與技術學院于2017年成功申請到上海市屬高校應用型本科試點專業建設項目。故我校培養的學生不但應具備扎實的理論基礎,更應深度契合人才市場的業務需求。因此,數據庫技術課程群的設計和落實,不僅調動了課題組內專業教師全力參與,還與甲骨文、中科曙光、華為等業內知名企業的富有經驗的工程技術人員通力合作,共同制定課程改革計劃并加以落實。
由于該課程群所涉及的課程內容相對較新,且具有較強的實踐性,因此除了讓專業教師加強自學和參加培訓以外,在授課模式上也采取“校企1+1”的模式。即,專業教師和企業工程師各帶一個班,工程師授課時,專業教師須隨堂跟課[12]。同時,針對企業工程師講解理論不夠深入的問題,專業教師也應及時提出并協助解決。
3.3 方案驗證
1) 針對2016—2018屆計算機科學與技術專業的本科生進行小樣本測試
項目組采用隨機抽樣的方式,在計算機科學與技術專業的學生中進行了小樣本測試。具體形式為:
(1) 隨機抽取大四畢業生,以“自主學習+教師指導”的方式開展數據庫領域的畢業設計課題研究。畢業設計選題匯總表,如表2所示。
(2) 在學生中成立興趣小組,利用寒暑假期間開展數據庫領域的應用課題研究。
(3) 指導學生開展數據庫領域的“雙創”活動。表3為2016—2017年市級“雙創”項目表。
結果顯示,參加試驗的學生遵循“以數據庫技術為主導”的課程主線,自主學習了其中的部分環節,取得了較好的試驗效果。他們或是畢業設計成績為優秀,或是在“雙創”活動中表現突出。
2) 針對2017級數據工程專業方向的本科生進行單環節測試
2017級數據工程方向的本科生嚴格按照上述思路來執行教學計劃。雖尚未學完全部課程,但學生已能厘清數據工程流程鏈及數據庫課程群的設置思路,對課程間的關聯十分明了,學習目標也十分清晰。據2018年10月的一次調查顯示,2017屆數據工程共有學生56人,近一半學生將數據庫、數據挖掘或人工智能作為未來考研的方向。項目組將繼續追蹤這批學生的學習情況。
4 總結
論文以上海杉達學院信息科學與技術學院的相關專業為例,探索了在大數據背景下,應用技術型本科高校應如何深化改革數據庫類課程的教學。項目組依托教育部及若干市級項目,與業內知名企業展開合作,探討并制定了以數據庫技術為主導的課程群改革方案。小樣本、單環節的測試表明,本文所提出的教改方案能有效提升學生的學習興趣,完善學生的知識體系,對同類高校類似專業的相關課程改革也具有一定的借鑒意義。
參考文獻
[1] 何永峰.本科轉型發展試點高校數據庫課程群建設及教學改革[J].長春教育學院學報,2018,34(8):30-32.
[2] 李敏君. 淺析大數據時代數據分析人才培養模式[J].電腦知識與技術,2018,14(12):118-124.
[3] 施達,楊晉浩,張志強,等. 數據工程類本科人才培養體系的探索與實踐[J].成都大學學報(社會科學版),2017,169(1):112-117.
[4] 徐昊,秦玥,黃嵐.面向通識教育的數據科學課程建設[J].計算機教育,2016,8(8):158-162.
[5] 陳振沖,賀田田.數據科學人才的需求與培養[J].大數據,2016,58(11):95-106.
[6] 周傲英,錢衛寧,王長波.數據科學與工程:大數據時代的新興交叉學科[J].大數據,2015,22(1):1-10.
[7] 陳雪平,馬強,黃恒振,等.大數據背景下普通高校統計學本科專業課程設置的探討[J].高教學刊,2018(21):70-72.
[8] 曹嘉君,王曰芬. 基于數據科學的知識創新服務應用模式構建研究[J].情報學報,2018,37(10): 971-978.
[9] 楊京,王效岳,白如江,等. 大數據背景下數據科學分析工具現狀及發展趨勢[J].情報理論與實踐, 2015, 38(3): 134-137.
[10] 趙友杰,曹涌,熊飛.大數據時代下數據庫課程和教學改革研究[J].電腦知識與技術,2018,14(22):87-89.
[11] 章邢,王敏.基于OCI和對象池技術的跨平臺Oracle數據源管理中間件的實現[J].信息化研究,2018,44(4):67-73.
[12] 劉暉,孫玉榮.大數據時代信息與計算科學專業校企合作人才培養方案研究[J].科教熱點,2018,20(7):8-9.
(收稿日期: 2019.03.04)