楊 川
(柳州職業技術學院,廣西 柳州 545006)
“十三五”時期,我國大數據產業取得了突破性的發展,在“十四五”規劃中,提出了“加快數字化發展,建設數字中國”新愿景[1]。柳州是一座歷史悠久的工業城市,由于產業環境的制約,大數據產業發展較為緩慢。近年來,柳州正加速發展大數據相關產業。2020年7月,柳州市人民政府印發《柳州市大數據產業發展專項資金管理辦法》(柳政規〔2020〕23號),該專項資金用于支持柳州市大數據產業發展方面的項目,重點支持工業、農業、服務業等領域5G、互聯網、大數據、人工智能、物聯網等新一代信息技術與實體經濟深度融合應用示范項目及課題研究項目。在吸引人才方面,柳州市政府先后出臺《柳州市關于加快新時代人才集聚的若干措施》《柳州市人才分類認定和獎勵補貼實施細則》和《柳州市引進高端人才(團隊)項目資金支持實施細則(試行)》等政策,鼓勵大數據人才到柳就業。柳州擁有柳鋼、上汽通用五菱、東風柳汽、柳工等國內外有名的制造業企業,當前工業互聯網的發展也給柳州大數據產業發展帶來了機遇。2020年11月,柳州市工業和信息化局印發《柳州市加快推動工業互聯網發展若干措施》,文件中指出要加快推進柳州工業轉型和高質量發展,推進工業互聯網新基建和工業互聯網平臺建設。近年來,“網紅小吃”柳州螺螄粉也帶動了柳州預包裝螺螄粉產業的發展。2021年7月,廣西壯族自治區人民政府印發《加快推進柳州螺螄粉及廣西優勢特色米粉產業高質量發展實施方案》,文件中指出要加快大數據平臺建設,對特色米粉產業進行工業互聯網標識化、管理信息化、生產數字化升級改造。大數據技術有望助力柳州螺螄粉產業高質量發展。
數據分析是指用計算機技術對數據進行處理、分析、可視化,進而得到能夠為人們決策提供參考的數據分析結論的技術。在大數據時代,數據分析是大數據企業的業務人員需要掌握的一項基本技能。傳統的數據分析工具主要是Excel和SQL數據庫查詢語言,分析的流程是先從數據庫中提取數據,再到Excel中進行相應的數據處理、分析和可視化。這樣的分析工作存在以下缺點:第一,分析流程中使用的工具不一致,分析過程較為繁瑣;第二,只能進行簡單的數據分析,對一些復雜的、特殊的數據分析需求不容易實現。
Python是一門上手快、功能多的編程語言,特別在數據挖掘、人工智能領域有著成熟的技術框架。在數據分析領域,Python中的Pandas和Numpy庫能夠解決絕大多數的數據分析問題。使用Python進行數據分析擁有眾多優點[2]:第一,Python語法簡單、易學、好上手;第二,Python能夠通過API對接SQL數據庫,同時也有著完善的數據分析框架,能夠打通數據分析從數據獲取到分析、可視化的完整流程;第三,Python中成熟的數據分析框架結合Python的編程語法能夠實現很多復雜的數據分析需求;第四,Python在數據挖掘、人工智能領域的應用廣泛,用Python做數據分析項目有廣闊的擴展空間。
柳州職業技術學院(以下簡稱“柳職院”)一直致力于培養地方區域產業所需的應用型人才,2020—2021年,柳職院與地方企業深度合作,建設智能制造產業學院、柳州螺螄粉產業學院,助力地方產業的發展。“Python數據分析”是該校大數據技術專業開設的一門專業基礎課,旨在培養該專業學生運用Python處理分析數據的能力。柳州區域大數據產業的發展,也對職業教育提出了新的要求。一方面,大數據分析相關的崗位需求在增加,在工業互聯網發展的大背景下,柳州不少大型制造業從2020年開始招聘大數據分析人才。另一方面,在柳州市,有數據分析相關崗位需求的行業分布開始呈現扁平化發展趨勢,即對數據分析人員有需求的行業范圍很廣,且對數據分析人員的能力要求不高。因此,在柳州市大數據產業飛速發展的今天,培養區域產業發展所需的數據分析人才應是柳州高職院校大數據專業應用型人才培養的方向。
綜上,在高職院校中將“Python數據分析”課程打造成一門通識課程是有必要性的,也是可行的。實際上,很多本科院校已經在非計算機專業開設了Python相關課程。結合柳州市的區域大數據產業發展背景,構思、開設“Python數據分析”通識課程,讓機電、汽車、財經等專業的學生也能夠接觸、學習到Python做數據分析的基本方法,這樣更有利于學生在進入崗位后更順利地開展數據分析工作。
柳職院“Python數據分析”課程面向學校大數據技術及人工智能專業大一下學期的學生進行授課,主要講述運用Python進行數據處理及分析的方法,涵蓋數據讀取、數據清洗、數據分析、數據可視化等內容。該課程需要以“Python程序設計”作為前置課程,“Python程序設計”主要講述Python語言的基本語法和編程方法。當前“Python數據分析”的課程內容章節體系如圖1所示。

圖1 “Python數據分析”當前課程內容章節體系
如圖所示,目前課程的內容和章節設置采用的是“理論+項目”的傳統結構。這種結構的優點主要有:第一,能夠將知識點梳理得很清晰;第二,在講述完所有的知識點之后再對綜合項目進行講解,有助于學習、理解大型的綜合項目。另一方面,當前的章節內容和結構也存在明顯的缺陷。
1.理論知識太多,學生學習難度大
高職學生的學習基礎較弱,抽象知識的學習能力較為欠缺,較多乏味的理論知識學習對他們來說是一種巨大的考驗。若要將“Python數據分析”做成一門通識課程,面向眾多其他專業的學生開設,課程的易學性將是首要考慮的問題[3]。此外,設計“Python數據分析”通識課程,考慮到其他專業學生沒有學過Python語言基礎知識,還應該考慮在課程中融入Python語言基礎的內容,作為課程的第一部分內容。
2.課程缺乏足夠的企業實際數據分析項目和案例
目前課程中的項目和案例較少,涉及的場景和領域也較為單一。一方面,缺少項目案例教學使得課程學習較為枯燥,特別是對于其他專業的學生而言。另一方面,缺少案例也使課程的實用性較低,建設服務柳州地方大數據產業的“Python數據分析”課程,應該在課程內容中提供若干具體的、實際的企業數據分析應用案例和項目,提高課程的實用性。
傳統的高職“Python數據分析”課程教學主要采用講授法、案例教學法、任務驅動法等教學方法[4]。教學過程包含講授教案、演示代碼案例、布置實操任務、任務驗收及反饋、布置作業等。“Python數據分析”采用傳統教學模式開設通識課程存在以下幾方面問題。
1.被動地學習非本專業知識導致學習效果不佳
對于大部分非計算機類專業學生來說,學習一門編程語言尚且不易,何況還要用這門編程語言來完成一些具體的應用,這更是對學生提出了更高的要求。傳統的教學方法更多強調教師的主觀能動性,對于學生來說學習是被動性的。對于全新的知識,被動學習會大大影響學習的效率。
2.學習基礎差異性導致部分學生跟不上學習進度
高職學生的一大特點就是學習基礎差異性。部分學生在中學時期的學習條件不好,有的甚至沒有接觸過電腦。此外,通識課程面向不同專業開設,不同專業的學生計算機基礎也存在差異性。對于基礎存在差異的學生,若一刀切地采用傳統的教學方式將可能導致基礎較差的同學難以跟上學習的進度。
3.缺乏實際應用項目教學導致課程的實用性不強、吸引力不足
非計算機專業的學生選學“Python數據分析”通常是因其認為相關知識能夠對他們未來的發展有幫助,相比計算機專業學生,他們更注重Python數據分析在他們的專業領域的具體應用,而原“Python數據分析”課程中設置的各領域的數據分析項目太少,對其他專業學生的吸引力不足。
在原課程“Python數據分析”教學內容基礎上,設計面向全校高職學生開放的“Python數據分析”通識課程。在課程的教學內容和模式上主要有兩點調整:第一,將“Python程序設計”的Python語言基礎相關內容整合到“Python數據分析”通識課程中;第二,對原“Python數據分析”中的理論知識章節內容進行重構,減少理論知識的堆積,以項目化的形式封裝章節的理論知識。基于Python數據分析應用相關知識,圍繞數據分析、數據可視化、數據挖掘幾個專題,以電商、工業、金融等大數據領域的具體數據分析項目作為載體,將Numpy、Pandas、Matplotlib、Sklearn庫中的Python數據分析的知識概念整合起來,提高課程和其他專業課程的契合度,增加課程對其他專業學生的實用性和吸引力。從總體看,課程的章節內容結構仍然采用“理論+項目”的形式,總體結構如圖2所示。

圖2 課程章節內容總體結構
第一部分內容是Python語言基礎。這部分內容主要講述Python的基本語法及編程方法,是學習所有Python其他知識和應用的基礎。章節內容主要包含Python簡介、變量、運算符和表達式、數據類型、程序控制結構、函數、模塊和包。這個章節雖然側重知識點理論講述,但是,在內容設計上,在各個知識點中設置相應的案例教學能有效提高學生的學習效率和興趣。例如,在講授for循環和if語句時,可以參考Excel中常見的單元格和if函數公式的常見應用,設計一個案例將某個分數列表(如[95,90,80,……])轉為一個分數等級列表(如['優秀','優秀','良好',……])。第二部分內容是Python數據分析基礎。這部分內容主要講述用Python進行數據分析及其應用的預備知識。具體內容包括數據分析概述、Python數據分析環境配置、數據讀取、Pandas數據分析常用對象。這部分重點講述Pandas數據分析常用對象其中的表格對象和序列對象,理解好表格對象和序列對象中的屬性和方法是學好Python數據分析的關鍵所在。第三到第五部分是項目教學模塊。其中,第三部分是數據分析模塊,這部分主要講述Python中數據分析的基本方法和一些平時可以用Excel等軟件實現的常見數據分析項目,具體知識點包括數據類型轉換、分組分析、交叉分析。第四部分是數據可視化模塊,主要講述Python中的Matplotlib庫及其相關畫圖方法。第五部分是數據挖掘模塊,主要講述一些常用的數據處理方法,如數據清洗、數據標準化,以及一些簡單的數據挖掘算法,如聚類算法、回歸算法、分類算法。這三個章節的相關知識點都將封裝到汽車、電商、金融等不同專題的數據分析項目中,通過項目教學的靈活配置,能夠提高課程的更新頻率,增強課程的吸引力和生命力。
其中,項目案例內容的建設是課程內容建設的關鍵。“Python數據分析”通識課程的定位是服務柳州大數據應用型人才的培養,在項目案例建設方面應該爭取找到當地企業真實的數據分析案例和項目作為教學內容。可以考慮從以下兩種方式加強項目案例內容的建設。
1.加強和本地相關企業的合作
學校和教學團隊應該加強和本地企業的合作,如在相關領域和企業開展大數據分析項目方面的合作,積極將項目成果轉化為教學資源。另一方面,團隊老師可以到企業掛職,協助企業完成項目的同時完成項目教案的開發。
2.嘗試拓寬教學項目來源領域
除了本地企業外,也可以嘗試尋找外地企業的項目案例作為課程教學資源。許多國內發達地區的優秀企業擁有大量的數據分析項目案例,可以嘗試通過多元化方式獲取這些資源,封裝到課程中去。
針對上述“Python數據分析”通識課程教學方面可能存在的問題,對課程的教學方法作出如下設計。
1.混合式教學法
為了更好激發學生學習“Python數據分析”課程的主觀能動性,應該提供線上課程供學生課前學習。特別是在理論部分,讓學生在課余時間通過線上課程先對Python的基本概念和知識體系有所了解,帶著問題和目的來到線下課堂和老師學習,有利于發揮學生的主觀能動性。當然,本課程應該采用混合式教學的方式進行,在線下教學部分,重點通過實際操作演示、任務布置和驗收來引導學生繼續學習。
2.分層化教學法
針對學生分層化明顯的問題,應該制定明確的分層化教學策略。例如,設計和布置有層次性的任務和作業,對于基礎較差的學生不要求他們做完所有的作業,但需要他們掌握一些基本的知識和方法。提供足夠的線上資源給基礎較差的學生學習,通過“線下指導、線上自測”的教學方式帶動基礎較差的同學掌握基本知識內容,使這部分學生也能夠從學習中獲得正反饋,找到成就感。
3.分組學習教學法
鼓勵學生組成學習小組,圍繞小組內同學們感興趣的專題開展學習和實踐。在教學中布置的任務和作業要體現不同專業的數據差異性,提供不同場景的任務和作業供不同專業、小組的學生學習、實踐。考核方式上,允許學生以小組的方式提交項目作業,不同小組可以對不同專題的數據分析項目開展合作并完成項目。分組學習教學法一定程度上也能夠緩解學生分層化明顯的問題,帶動學生學習的積極性。
4.項目式教學法
正如教學內容中設計的一樣,側重項目式教學是“Python數據分析”通識課程順利開展的關鍵。課程教學過程中應該注重結合不同專業的具體數據分析問題,講述具體項目的知識點和項目實施過程及方法,讓課程真正對學生有實用性,能夠真正幫助學生解決一些專業學習中遇到的企業實際問題,培養學生解決大數據分析問題的實踐能力。
信息時代的發展帶來了地方產業的轉型升級,這對職業教育提出了新的要求。“Python數據分析”通識課程旨在培養更多順應地方經濟社會發展需求的大數據分析應用型人才,助力地方大數據產業發展。課程建設中提出了“輕理論,重項目”的教學內容結構和混合式教學、分層化教學等多元化教學方式。未來,“Python數據分析”課程將在通識課程改革上進一步探索、實踐,聚焦學生的學習情況和反饋,真正地將這門課做成一門對各個專業學生有吸引力、切實服務于地方產業發展的新課程。