向函,吳應江,丘文峰,侯潔,趙云
(廣東醫科大學生物醫學工程學院,東莞 523808)
人工智能屬于交叉學科,其涉及數學、計算機、神經生物學等諸多領域知識,是推動當今世界發展的重要動力。我國已經充分認識到人工智能與教育融合發展的重要性,國務院發布的《新一代人工智能發展規劃》中提出,加快人工智能高端人才培養,建設人工智能學科,發展智能教育[1],在政策引導下一些地區和學校已經初步開展了此類教學改革的探索。在醫療領域,人工智能技術有助于解決醫療資源短缺、分配不均、醫患關系緊張等問題[2],其在醫學圖像處理、基因分析、醫療仿真等方面都有突出表現,特別是當下迅速發展的基于深度學習的AI技術為醫學研究做出了巨大貢獻[2-4]。本文以廣東醫科大學在信息管理與信息系統專業教學中進行人工智能實踐教學為例,討論了在現有基礎上,引入人工智能教學內容,制定培養方案并付諸實踐的具體方法。
廣東醫科大學的信息管理與信息系統專業從1997年開辦已有24年歷史,結合醫學、計算機科學、管理學等學科內容,有比較完善的教學體系,培養的學生主要從事醫院信息系統相關的開發、維護工作。該專業的專業基礎課包括:醫學知識模塊、數學知識模塊、計算機知識模塊、實踐教學模塊。根據專業的理論教學,設置較多的實踐課程,如課程實驗、重要的專業課程(數據庫原理與應用、數據結構、數據庫開發技術等)的課程設計。安排企業見習1周和為期29周的實習。
人工智能的飛速發展及在醫療領域應用的展開,對信息化人才培養提出新的要求。①傳統課程需增加哪些新知識,以滿足新時期的需求。②如何在保證現有核心課程和培養大方向不變的前提下調整教學。③能否在現有培養模式下做出新突破,提升教學質量。
人工智能屬于多領域交叉學科,需要具備數學、計算機編程和具體的業務相關知識(醫學知識)。深度學習代表目前性能最強的人工智能的發展方向,也屬于必備的基礎知識[5]。此外,人工智能的落地實現也屬一大難點,尤其在以理論教學為主的學校教育中,此問題尤其突出。
人工智能在發展初期,學者們基于數學理論做了大量研究,經過幾十年發展,已經有很多相當成熟的算法,尤其是深度學習的出現,使不少計算機視覺中的傳統難題得到了滿意的解決方案,如目標識別、人臉檢測等。不少學者們也將深度學習技術應用到醫學圖像處理領域,并獲得了不錯的進展。例如,將深度學習的圖像分類技術應用在CT、PET、MRI等系統,判斷病人是否患有某種疾病;圖像分割與檢測技術應用在預測腦血栓潛在位置、檢測異常腦血管結構等領域[2-4]。
目前,阻礙人工智能在各領域里廣泛應用的最大問題在于算法落地,而非理論研究。例如,Resnet分類網絡,在給定實驗數據集上的準確率已經超過人眼,人臉識別算法的準確率也已經無限接近于百分之百,但這些經典算法,應用于實際場景中會碰到諸多完全不同于實驗室環境的問題,如場景不同、時間和光照條件稍作改變,則算法效率急劇下降。醫學影像在數據采集、圖像特征等各方面與通用圖像有很大區別,如醫學圖像大多數采用放射、磁共振、超聲等成像方式,而通用圖像大多數是自然光成像;醫療圖像多為單通道灰度圖,而通用圖像為彩色圖片;同體態的醫學圖像相似度相當高,應著重與細節識別,而通用圖像區分度很大,著重于整體識別即可。由上所述,各類算法在處理醫學圖像中效率下降的問題也非常突出,各大廠商都在積極探索算法實際應用的方法。因此,培養學生的實踐能力,充分運用所學知識將已有算法有效應用于醫療信息相關領域的能力是培養重點。
該專業已有C++語言、數據結構與算法、數據庫原理、數據庫開發技術等傳統程序設計領域相關課程,學生鍛煉了基礎的編程能力。結合專業的現狀和醫學人工智能領域的需求,加入如下教學內容:
(1)機器學習,從基礎出發培養學生理解并應用各類AI算法的能力。
(2)將原有開設的“C#語言”改為“Python程序設計”。Python語言本身語法相對簡單,可以讓使用者注重于算法本身,而非繁瑣的語法規則,是人工智能領域的首選編程語言。以此培養學生使用人工智能基本算法和處理大數據的能力。
(3)在已有課程中增加相關知識,如:操作系統概論里增加人工智能算法必備的linux系統使用章節;計算機圖像處理課程中,重新設計教學計劃,著重講解矩陣、卷積、灰度、常見特征提取算法等內容。
在教學課程加入上述必修內容之外,通過自愿報名的方式,12名學生加入了課外小組的實踐教學環節,進行小班課外學習,進行網絡教學、課堂、實驗室多種形式的授課。加入深度學習相關算法的教學。內容包括基礎算法的Python實現、卷積神經網絡基礎(卷積、激活函數、全連接)、反向傳播算法、優化算法基礎、卷積神經網絡設計與應用。
當然,野村谷名貴樹木不止于銀杏。萬畝山林,珍稀樹種應有盡有。白龍山乃大別山一支,綠色基因庫資源一脈相承。
由淺至深安排教學內容。首先使用經典的Lenet算法設計5層卷積神經網絡,識別手寫字符集mnist。根據具體代碼和運行過程,講解卷積(如:卷積核大小、數量)、激活函數(常見激活函數的使用)、全連接層概念,講解反向傳播算法及優化算法(如:SGD,ADAM)的目標和原理。在掌握了基本網絡的基礎上,引入Resnet[7]等高級網絡,進行復雜圖像分類實驗,講解算法評價指標(如召回率、精確率、交并比)。引入具體適合醫療領域的圖像分割技術,講解Unet[8]原理及最新進展。
每周一次,學生以匯報形式總結學習到的內容,并提出問題,在小組內討論。期間,學生普遍對基礎網絡分類、圖像分割技術比較感興趣。對理論知識涉及較多的反向傳播算法、優化算法等有較多問題。安排學生自主匯報,有助于及時發現,并針對性解決問題。
現有的通用深度學習算法如Resnet,Unet等,最初都應用于通用數據集,醫學方面的很多應用還處于探索階段。針對此類問題,在講解了基礎知識之后,進行針對性的醫學應用。智能醫療有很多的發展方向,例如醫學影像處理、診斷預測、疾病控制、健康管理、康復機器人、語音識別病歷電子化等,其中醫學影像處理是研究較多的領域。現存為數不少的開源影像數據集可用來進行科學研究,如ChestX-ray14是由NIH研究院提供的X光數據集[9],其標注了14種不同肺部疾病。2020年的新冠疫情,很多研究機構投入大量資源進行了相關研究,同時貢獻了很多開源的數據集,如 COVID-CT[10]、ACCD of COVID-19 test?ing[11]。結合現實情況和教學需求,選擇肺部圖像數據集,做針對性教學,如:使用分類網絡對肺部CT自動分類、判定新冠肺炎;使用Unet進行肺部CT圖像的病灶自動分割;等。
除日常教學之外,組織并引導學生參加各類實踐活動。采用工程驅動式或項目驅動式教學方式,培養學生興趣,充分調動學生主觀能動性,積極引導學生盡早從事設計、研究活動。通過建設學生創新中心,提供軟、硬件資源,培養學生實踐、創新能力。每年學校舉辦軟件設計大賽,積極引導感興趣的學生參賽,并成立興趣小組參加國家、省、市各類各級比賽,如全國大學生計算機設計大賽、數學建模大賽等,以賽代練。一方面提高學生學習興趣,另一方面利用比賽檢驗實踐教學改革的成效。
很多新興人工智能的技術在醫學中的應用處于初步應用階段,存在不少待解決問題。在分析和解決問題的過程中學生鍛煉了基本的科研能力。①采用引導的方式將學生從被動學習轉向主動研究。科學研究都是建立在前人工作基礎上的。學生在學習了專業課程后,掌握一定的基本概念、方法和技能,需要了解所研究領域已有的研究成果。指導學生閱讀經典文獻,進而自主搜索最新研究進展方向,將新成果應用到自己的問題中。例如:學生學習圖像分割算法后,通過閱讀經典文獻發現,增強圖像邊緣可以提升分割精度,于是在算法分割之前進行預處理,得到了更好的分割結果,這有效提升了學生的研究興趣,以后做相關實驗前都會先搜尋已有方案,研究是否有更好的方案組合。②指導學生獨立完成科研論文。在進行人工智能教學過程中,引導學生將遇到的問題、研究得到的解決方案和研究體會記錄下來,撰寫成論文是科研工作的不可缺少步驟,也可以鍛煉學生的科研能力。學生長期學習專業課程,缺少語文寫作鍛煉,撰寫論文需要一定指導,經過老師指導論文立題、撰寫、修改成文的各個環節,學生的文字表達能力也得到較大提升。
在學校舉辦的軟件設計大賽中,往年的學生作品以學生信息管理、醫院管理、醫學網站等軟件設計為主,2020年,人工智能的參賽項目數量激增,達到總數量的60%以上,可見學生對此類方向的學習興趣相當高。
2020年,信息管理與信息系統專業大二、大三的3名學生組隊參加第13屆中國大學生計算機設計大賽-人工智能分賽,結合學校醫學的特點,參賽作品是“基于深度殘差神經網絡的新冠肺炎CT圖像檢測”。初次參賽即獲得了國家賽的二等獎。
2020年11月,由中國醫院協會信息專業委員會舉辦的“CHIMA2020醫院新興技術創新應用優秀案例”評選中,信息管理與信息系統專業在校生自行研發的“AI新冠助手”項目獲得人工智能創新應用區優秀獎,是唯一一個由在校生組隊參賽并獲獎的項目。
除了參加各類競賽,組織有能力的學生參加符合自己能力水平的學術交流會議。2020年華南醫院網絡信息大會上,信息管理與信息系統專業大三本科生論文《基于深度卷積神經網絡的肺炎X光圖片病灶檢測》,獲得優秀論文獎(共計58個單位、217篇投稿,20篇優秀論文獎),有史以來首次有在校生以第一作者發表論文并獲得優秀獎。
面對人工智能的熱潮,切實有效地開展相關教學工作,有助于提升學生能力,增強其社會競爭力,提升學校教學質量。醫學院校理工科基礎薄弱,開展人工智能的教學面臨很多困難,不能直接復制其他理工科院校的教學模式,只能采用漸進改革的方式試點執行。通過在主要課程中加入新教學內容、尋找醫學應用點發揮醫學院校特長、課外興趣小組教學、以賽代練和引導學生進行初步科研工作等方式進行人工智能教學是切實可行的方法。