羅世奇 田生偉

摘? 要 結合地方院校的特點,發揮鄂東南地區的戰略地位與優勢,在目前人工智能概論課程的基礎上,增加課程互動環節、翻轉課堂,探索在新形勢下進行自然語言處理項目式教學,為數據科學與大數據技術專業的開展奠定堅實的基礎。
關鍵詞 人工智能;自然語言處理;項目式教學;大數據技術
中圖分類號:G642.0? ? 文獻標識碼:B
文章編號:1671-489X(2020)04-0104-02
Introduction of Natural Language Processing Project Teaching Strategy//LUO Shiqi, TIAN Shengwei
Abstract This paper combines the characteristics of local colleges and universities to give play to the strategic position and advantages of the southeastern region of Hubei. On the basis of the current intro-duction to artificial intelligence, increase the interactive part of the?course, flip the classroom, explore the introduction of artificial inte-lligence and natural language processing project-based teaching in the new situation, and lay a solid foundation for the development of data science and big data technology.
Key words artificial intelligence; natural language processing; pro-ject-based teaching; big data technology
1 前言
隨著人工智能時代的發展,數據海量爆炸式增長。從20世紀中葉人工智能被提出,到現在的深度學習、知識圖譜、區塊鏈,人工智能技術經歷了一系列的起伏。湖北理工學院于2018年申報數據科學與大數據技術專業獲批,從2018年9月開始,在全校范圍內開設人工智能概論公選課,之后將繼續開設大數據概論公選課。人工智能人才培養已經成為社會發展的趨勢。本文將探索項目式教學,增加課程互動環節、翻轉課堂,為企業培養“三用”(能用、好用、耐用)人才。
2 背景
湖北理工學院地處黃石市,是以工科為主,重點培養應用型人才的省屬普通高等學校。學校設置“數據科學與大數據技術”專業勢在必行。
2015年8月19日,國務院發布《關于促進大數據發展的行動綱要》,提出信息技術與經濟社會的交匯融合引發了數據迅猛增長,數據已成為國家基礎性戰略資源。隨后的11月,中共中央十八屆五中全會提出國家大數據戰略,將大數據上升為國家戰略。我國在“十三五”規劃中提出:“實施國家大數據戰略,推進數據資源開放共享。”2016年12月18日,工業和信息化部印發《大數據產業發展規劃(2016—2020年)》,制定了“創新驅動、應用引領、開放共享、統籌協調、安全規范”的發展原則,全力推進“中國制造2025”。在這樣的契機下,大數據領域必將迎來建設高峰和投資良機。
2016年9月,湖北省為貫徹落實《國務院關于印發促進大數據發展行動綱要的通知》,頒布《湖北省大數據發展行動計劃(2016—2020年)》,該計劃就立足本省的固有優勢,發展湖北省大數據產業的主要任務、推進思路和發展目標等方面提出明確要求。
2017年8月,湖北省黃石市政府發布《黃石市智慧城市建設“十三五”規劃》,規劃指出以推進大數據建設、“互聯網+”行動計劃為契機,全面加強信息基礎設施建設,加快推進產業轉型升級,培育發展經濟新動能,不斷提高社會管理精度,主動創新民生服務新模式,挖掘改革創新和融合發展的新潛力,打造創新驅動和智能轉型新優勢,全面實現“興業、惠民、善政”的目標,推動全市經濟和社會發展邁上新臺階。
從上文可以看出,發展大數據產業和培養大數據人才,不僅是國家的發展戰略選擇,而且是湖北省實現科學發展、轉型升級的必然選擇,還是黃石市實現跨越發展、后發趕超的有效途徑。截至目前,全國有250所高校開設“數據科學與大數據技術”專業,湖北省開設“數據科學與大數據技術”專業的高校有11所,分別是中國地質大學(武漢)、武漢理工大學、武漢輕工大學、武漢工程科技學院、湖北大學、湖北工業大學、湖北工程學院、中南財經政法大學、華中農業大學、華中師范大學、武昌理工學院。可以看出,鄂東南地區沒有一所高校開設該專業,武漢地區有10所高校開設該專業,占總數的90%。2018年,湖北理工學院申報“數據科學與大數據技術”專業并獲得批準。
3 項目式教學探究
應用型本科院校不僅要培養學生扎實的理論知識,更重要的是培養學生的實踐動手能力。理論是實踐的基礎,實踐是理論的升華,扎實的實踐能力是學生就業強有力的保障,同時為企業培養“三用”人才也是高校的社會責任。通過項目式教學,高校的專業/課程需要與時俱進,結合地方應用特征,同時發揮學科優勢。人工智能概論課程是“數據科學與大數據技術”專業的基礎,這門課程涵蓋了多學科的知識。人工智能概論研究領域廣泛,通過多學科技術的融合,能培養復合型人才。通過人工智能+X模式,結合其他學科的知識背景,運用項目式教學的相關理論,達到活學活用的效果。
自然語言處理是研究計算機處理人類語言的一門技術,包括分詞,詞性標注,命名實體識別,實體關系抽取,句子/段落/篇章級別情感分析,地域、宗教、性別歧視識別,機器翻譯,信息檢索等研究領域。利用項目式教學研究人工智能+自然語言處理,主要是利用深度學習知識對自然語言文本進行處理與分析。目前國內研究比較好的高校有哈爾濱工業大學、清華大學、北京大學、中國科學院、蘇州大學、新疆大學等。地處“一帶一路”建設要點的新疆大學,對于中亞語系的研究較深,主要涉及漢語、維吾爾語、哈薩克語、藏語、土耳其語等。通過參考這些領先院校的先進經驗,為項目式教學奠定堅實的基礎。
首先,從網絡媒體中抽取相關的語料,建立相應的語料信息。語料庫的構建并不是一蹴而就,需要經歷一個漫長的時間。結合地方語言構建語料將是一個很好的選擇。2019年年初,學校公共文化研究中心隨州方言調查項目完成并通過驗收。通過地方語言的研究,挖掘方言所承載的地方文化精髓,為建設湖北方言文化多媒體平臺、出版湖北語言資源集、保護與傳承湖北方言文化、建設國家語言資源庫作出新的貢獻。語料信息構建完成之后進行分詞,目前分詞工具眾多,代表性的有兩種。
1)語言云,以哈工大社會計算與信息檢索研究中心研發的語言技術平臺(LTP)為基礎,為用戶提供高效精準的中文自然語言處理云服務。
2)ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),是中科院計算所研制的中文詞法分析系統,2009年調整命名為NLPIR分詞系統,主要功能包括中文分詞、詞性標注、命名實體識別、新詞識別,同時支持用戶詞典,支持繁體中文,支持GBK、UTF-8、UTF-7、UNICODE等多種編碼格式。
如圖1~圖5所示,分詞之后,根據詞性以及句子成分對文本進行實體關系抽取、詞頻統計分析、文本分類、情感分析等。
4 結語
本文通過項目式教學方法,剖析新形勢下人工智能概論課程同自然語言處理知識相結合的教學理念,相信具有地方特色的人工智能培養思路及培養模式改革,可面向地區經濟發展構建可持續的專業課程體系和培養體系,也必將對湖北理工學院應用型人才培養產生深遠意義及影響。
參考文獻
[1]黃美儀,陳長城,張立.培育面向人工智能大時代的創新人才:佛山市禪城區創新創客教育實踐探索[J].教育與裝備研究,2017(12):9-12.
[2]田生偉,于炯,帕里旦·吐爾遜,等.實踐教學在軟件工程專業教學中的改革與建設[J].中國教育技術裝備,2011(27):20-22.
[3]田生偉,于炯,帕力旦·吐爾遜,等.軟件工程創新創業實踐人才培養模式改革[J].中國教育技術裝備,2013(21):54-56.
[4]錢育蓉,于炯,王衛源.產學研結合的軟件工程專業碩士研究生培養模式:以新疆大學軟件學院為例[J].教師,2014(17):22-24.
[5]賀文武,劉國買.數據科學與大數據技術專業核心課程建設的探索與研究[J].教育評論,2017(11):31-35.
[6]歐衛華,夏道勛,等.“數據科學與大數據技術”專業實踐教學體系構建研究[J].軟件導刊,2018,17(5):107-109.
項目來源:湖北理工學院2019年校級教學研究項目(基金編號:2019C07);新疆維吾爾自治區科技人才培養項目“自治區重大教改項目:邊疆區域環境下的卓越軟件工程師培養模式研究”(基金編號:QN2016YX0051);湖北理工學院2019年度校級科研項目(19XJK03Y)。
作者:羅世奇,湖北理工學院,助教,研究方向為惡意代碼(435003);田生偉,新疆大學軟件學院院長,教授,博士生導師,研究方向為自然語言處理(830046)。