呂俊杰,陳麗娜,何月涵
(生物信息科學與技術學院,黑龍江 哈爾濱 150081)
【探索與實踐】
人工神經網絡課程在生物信息學專業的教學實踐與探討
呂俊杰,陳麗娜,何月涵
(生物信息科學與技術學院,黑龍江 哈爾濱 150081)
人工神經網絡是在神經生理學、生物學、數學、計算機學等學科發展的基礎上提出的,模擬人類大腦的結構和思維方式處理、記憶信息的一門學科。在處理信息方面,相比于傳統人工智能方法具有非線性適應性,目前,在多個領域得到了成功的應用。本文主要根據人工神經網絡在生物信息學相關專業的教學實踐,從教學方式、教學方法、學科建設等方面進行探討。
人工神經網絡;教學實踐;教學方法;生物信息學
人工神經網絡是在神經生理學、生物學、數學、計算機學等學科發展的基礎上提出的,模擬人類大腦的結構和思維方式處理、記憶信息的一門學科。具體來說,早在20世紀40年代,隨著醫學、生物學家們對人腦神經的結構、組成以及信息處理的工作原理的認識越來越充分,有學者提出以數學和物理方法對人腦神經網絡進行抽象,并建立簡化的模型,用以進行信息處理,這種應用類似于大腦神經突觸聯接的結構進行信息處理的數學模型,稱之為人工神經網絡ANN(Artificial Neural Network)[1]。
在人工神經網絡中,各種待處理的對象(數據、特征、字符、抽象的模式等等)都可用神經元處理單元表示。這些神經元主要可以分為輸入神經元、隱含神經元和輸出神經元三大類。其作用各不相同,作為輸入神經元的處理單元用來與外界產生連接,接收外界的信號輸入;隱含神經元處于中間層,為信息處理的不可見層;輸出神經元主要實現結果的輸出。神經元之間相互連接,連接的權重反映了各神經元之間的連接強度,神經元之間的連接關系中蘊含著信息的表示和處理。人工神經網絡主要是在不同程度、不同層次上模擬大腦處理信息的風格,具有非程序化、較強的適應性、自組織性、并行分布式等特點,其實現主要是通過網絡的變換和動力學行為,涉及數學、生物學、人工智能、計算機科學、非線性動力學等多個學科[1]。作為一門活躍的邊緣性交叉學科,在處理信息方面,相比于傳統人工智能方法具有非線性適應性,成功地應用于神經專家系統、模式識別、組合優化、預測等多個領域,尤其在生物信息學領域得到了廣泛的應用。生物信息學是20世紀末發展起來的一極具發展潛力的新型學科。人類的基因中蘊含著大量有用信息,利用神經網絡可以對這些海量的信息進行識別與分類,進而進行相關的生物信息學分析。如利用神經網絡分析疾病與基因序列的關系,基于神經網絡對蛋白質結構的預測,基因表達譜數據的分析,蛋白質互作位點的預測等等,都取得了很好的效果[2]。
因此,在生物信息相關專業的本科生中開設人工神經網絡課程尤為重要。經過多年的研究發展,已經提出上百種的人工神經網絡模型,這就需要教師針對不同的專業背景,不同層次的學生,講授不同模型的核心思想、推導過程、實際應用等等。本文主要根據人工神經網絡在生物信息學相關專業的教學實踐,從以下幾個方面進行探討。
神經網絡作為一門偏于理論分析的學科,傳統的教學模式,即首先講解模型的起源,接下來介紹模型的核心思想,然后就是一連串的數學公式推導,面對滿黑板的公式,學生很難提起興趣去認真學習相應的模型。所以,如何激發起學生的學習積極性,讓學生重視這門課程,更好地掌握課程內容,掌握相關的模型理論基礎、核心思想,更好地服務于本專業,是人工神經網絡教學者亟待解決的問題。
首先,在導課的時候要生動,以引起學生對將要學習的內容的好奇心,讓學生有興趣投入到課堂學習內容中去。布盧姆說過:“最大的學習動機莫過于學生對所學知識有求知的興趣。”只有在這種動機下的學習,才會提高自身的主動性與自覺性,達到提高教學質量的目的[3]。例如,在講解hopfield神經網絡的時候,通過舉例對蘋果、橘子的質地、形狀、重量等特征的描述,運用“0,1”進行量化描述,然后應用神經網絡就可以進行有效地分類;對于旅行商TSP問題,也可以通過hopfield神經網絡尋找到最優路徑。那么,這些問題是如何解決的呢?就需要大家來一起揭開hopfield神經網絡的神秘面紗。其次,由于神經網絡涉及大量的數學公式與數學方法,學生往往會有畏懼的心理,這就需要教師幫學生澄清思想誤區,現在很多用于數據分析與計算的軟件,如matlab工具箱、R軟件里面都有很成熟的人工神經網絡軟件包,所以,學生只需要理解其工作原理、核心思想,學會使用現成的人工神經網絡軟件包處理數據,在熟練應用程序包的基礎上,對相應的神經網絡模型進行優化,改進,并且與其他的人工智能算法相結合,更好地為本專業服務。第三,在講授人工神經網絡理論內容的時候,要摒棄傳統的呆板式的推導過程,以往的神經網絡教學方法注重理論分析,通常是一連串的公式推導,公式中又涉及大量的符號,計算起來復雜又煩瑣,學生會覺得索然無趣,厭學情緒嚴重。在教學過程中,教師要精心設計,創設出特定的問題環境,將所學內容與本專業相結合起來,多講應用,啟發和誘導學生選取合適的神經網絡模型來解決本專業的實驗數據分析與處理等問題。
除了在理論課堂上將基本的理論知識傳輸給學生,教師還應該安排若干實驗教學內容,讓學生以實驗為主,將理論課上所學的知識運用到解決實際問題中來,理論聯系實際,主動操作思考,觀察,分析,討論,以培養學生解決問題的能力。一旦學生自己動手處理一些問題后,很自然地就會對人工神經網絡產生一種親切感,并能強烈激發起學生繼續探究下去的興趣。對于同一問題,可以讓學生選取不同的網絡模型,設置不同的參數,甚至可以讓學生自己動手編寫相應的網絡模型程序,并且給予改進,根據得出的結果來評價模型在解決實際問題時的好壞,以及模型改進的效果。作為授課教師,需要不斷優化實驗教學內容,在生物信息學專業開設人工神經網絡課程,實驗教學主要是針對生物信息專業的海量生物數據處理與分析的實際需要,培養學生綜合運用人工神經網絡方法和生物信息學知識,進行信息的分析與處理。除了在實驗課堂上給學生最大的自由發揮空間外,課后作業也盡量以開放式問題的形式給出,比如,可以讓學生選取相應的網絡模型處理本專業的一些實際問題,例如,數據的分類、聚類等等,其中,數據來源可以不同,類型也可自由選取,最后給出相應的模型參數設置、方法的改進、實驗結果,也可以安排學生自己查詢文獻進行學習,并安排學生作報告。這樣,學生可以在世界范圍內了解神經網絡的在本專業的應用情況,又能提高英語的讀寫能力,還能鍛煉學生做科研報告的能力。
由于生物信息學是一門新興的交叉學科[4],這就要求人工神經網絡的授課教師要熟練掌握生物信息相關專業的知識,教師的業務水平必須得到充分保證,才能給學生以全面透徹的指導。學院應該本著自主培養與重點引進的原則,優化教師隊伍的專業結構和學歷結構,提高教師的自身修養。授課教師要將課堂的理論知識聯系實際生物問題進行講授,讓學生感受到人工神經網絡在本專業的應用,提高學生的學習效率,同時也需要閱讀大量的專業文獻,提高編程技巧和數據庫應用能力,讓自己成為一名合格的復合型教師。同時,人工神經網絡課程的實驗,高度依賴于計算機網絡等設備,因此,相關的軟硬件設施的建設也必不可少,由于,基因組測序技術的發展,目前生物信息學研究所用的數據都是海量的,神經網絡訓練起來所需時間太長,不能用普通的電腦完成,需要專門的服務器來處理,學校有關部門應在條件允許的情況下,配備機房,購買服務器,以及相關的軟件,為學生創造良好的環境,讓學生完成課程內容。
最后,人工神經網絡涉及數學、計算機、人工智能和神經學等專業知識,因此,需要授課教師加強與其他相關專業教師的交流與合作,并滲透到授課過程中去,讓學生在學習人工神經網絡網絡時能將各專業聯系起來,更好地解決生物信息學中的問題,要想成為一名合格的人工神經網絡課程教師,首先要成為一名復合型的教師,不僅要具備教學和科研能力,同時也要具備計算機、生物學、信息學等多學科的知識。
[1]朱大奇,史慧.人工神經網絡及其應用[M].北京:科學出版社,2006.
[2]朱偉,史定華,王翼飛.人工神經網絡在蛋白質二級結構預測中的應用[J].自然雜志,2003,(3):167-171.
[3]趙俊,李曉紅.趣味教學法在預防醫學教學中的運用[J].現代醫藥衛生,2005,21(15):2089-2090.
[4]張陽德.生物信息學[M].北京:科學出版社,2004.
G642.0
A
1674-9324(2014)17-0208-03
呂俊杰(1982-),女,黑龍江齊齊哈爾人,博士,哈爾濱醫科大學,講師,主要從事人工神經網絡、生物信息類專業教育教學與研究工作。