馬文濤
摘要:生物信息學的產生標志著生物學研究模式的變革,其本科課程的建設倍受關注。目前,生物信息學課程建設的主流思想是注重實踐,引入諸如案例式教學、問題式教學或任務驅動式教學等新型教學模式。然而,生物信息學作為一個學科本身,具有強烈的理論內涵和普遍規律。本文強調了傳統課堂在傳授這些知識方面的不可替代作用,并舉例說明了其中應講授的基本思想和基礎概念。最后,這里提出,注重理論和簡單實踐的導論性課程和注重實踐的新型課程應分開建設,并同樣重視。
關鍵詞:傳統授課方式;理論聯系實踐;大學教學;跨學科課程
中圖分類號:G642.3 文獻標志碼:A 文章編號:1674-9324(2018)40-0122-03
一、生物信息學:從科學到教學
生物信息學是一個生物學和數學以及計算機科學交叉而形成的新興學科。現在人們一般認為其英文說法“bioinformatics”是由時任弗羅里達州立大學超算中心基因與生物物理組主任的林華安(H.A.Lim)博士在1987年首創,從此標志該學科的誕生;不過,也有人指出,早在1968年,已經有教材采用相關概念[1]。無論如何,生物信息學仍是一個比較新的學科,它隨人類及其他生物基因組計劃的進行而蓬勃發展,研究范圍逐漸擴展到整個生命科學領域。現在,生物信息學是生物學研究模式革命的標志,正如諾貝爾獎獲得者吉爾伯特(W.Gilbert)所言:“基于全部基因都將知曉并以電子技術可操作的方式駐留在數據庫中,新的生物學研究模式的出發點應該是理論的。科學家將從理論推測出發,再返回到實驗中去,追蹤或驗證這些理論假設。……生物學家不僅必須成為計算機學者,而且也要改變他們研究生命現象的途徑”[2]。順應科學發展的趨勢,生物信息學的大學教育也迅速開展。在美國,最早于1990s中期即開始培養相關的博士和碩士。目前幾乎每所美國和歐洲綜合性大學均開設生物信息學課程。現在,我國各高等院校也逐漸和國際接軌——一般來說,有著生物學或生物技術專業的學校都在努力建設生物信息學課程。然而,生物信息學非常特殊,其課程建設并不容易。首先,它是一門跨專業學科,僅有生物學背景遠遠不夠,還需要數學和計算機方面的背景;但傳統上,生物專業的學生在這方面的基礎課程力度不夠。其次,由于涉及到生命科學領域的方方面面,它的內容跨度很大,比如,從“序列比對分析”到“分子進化分析”,再到“分子結構分析”,其中涉及到的生物學知識和算法知識都很不相同;其結果是,計劃的課時往往難以覆蓋。然后,它的理論和實踐內容都很重要,但側重點上卻有很大的不同,難以緊密結合。
目前,解決這些矛盾的一個普遍采用的辦法就是“放棄”理論,專注于實踐。的確,不少關于生物信息學的教學改革的思路就是如此,即所謂“案例式教學(Case-based Learning)”、“問題式教學(Problem-based Learning)”和“任務驅動式教學(Task-based learning)”等等[3-5]。如此,理論和實踐相結合的問題當然沒有了;計劃的課時也因為對理論方面的放棄而足夠了;甚至,計算機和數學方面的基礎似乎也不那么重要了——只要會查數據庫以及會用軟件來“解決”實際問題就行了,最多用數據處理能力較強的腳本語言(如Perl或Python等)寫寫小程序就已經是“小專家”了。然而,這樣培養出來的“人才”能配得上生物信息學這個改變生物學面貌的革命性學科嗎?顯然不是,這個問題需要引起足夠重視。我們在高等教育的課程建設上仍然需要注重學科的基本理論思想和基礎概念的傳授,才不至于流于“實用主義”,才能為我國培養具有“學科高度”的相關人才。下面,筆者結合本校生物信息學本科教學實踐的經驗來談生物信息學理論教學需要注重的三個方面的內容,而這些方面顯然是傳統課堂形式中的傳授內容,將使生物信息學的魅力展現無疑。
二、生物信息學的內容特色:生命的信息內涵
正因為是新興學科,生物信息學并沒有一個統一的定義,幾乎每一本相關教材中都有自己的定義。根據一個較權威的來源——人類基因組計劃第一個五年總結報告(1995,美國)中的提法:生物信息學是利用信息技術對生物信息進行獲取、儲存、分發(查詢)和分析,以解釋這些信息數據所蘊涵的生物學意義的學科。從這個定義中,我們可以看出兩個和信息有關的關鍵詞:“信息技術”和“生物信息”。其中,第一個代表本學科用到的方法,在一般的教材和課堂教學中都會充分強調。然而,對于第二個,“生物信息”,也即本學科研究的內容(對象),我們往往在講解中不夠重視——似乎大家都清楚:想想那些基因序列和蛋白質序列就知道了。不過,大家真的清楚嗎?這些信息是怎么來的?為什么信息對于生命這么重要?為什么“生物信息學”現在這么熱門,卻沒有相應的“物理信息學”和“化學信息學”等等?這些正是涉及到“生物信息學”作為一個學科的基本問題。大家都知道,化學對于生物學十分重要,生物專業的學生要學習很多化學方面的課程。如果有人說:“化學對于生物學不僅僅是一種方法,生命現象植根于化學的規律之上”,我們都不會有太多異議。然而,如果說:“信息學對于生物學不僅僅是一種方法,生命現象植根于信息學的規律之上”,很多人就會疑惑了。但這個卻是事實,生命世界里的各種現象和信息緊密相關。比如,遺傳是信息的代代相傳,而進化是信息的演化。信息論的鼻祖申農(C.E.Shannon)指出,信息的產生來源于選擇(“不確定性的消除”);而顯然,進化中產生的基因組信息就源于“自然選擇”[6]。一個更加顯見的例子是,分子生物學中的中心法則就是一個信息傳遞和轉化的流程,昭示著“生命的核心機制就建立在信息的流轉之上”。那么,如果說化學代表著生物學的一面,則信息學就代表著它的另一面。所以,我們在課堂上講清楚“生命的信息內涵”十分重要,將使學生理解到生物信息學的根本意義。
三、生物信息學的研究方式:算法思想的意義
算法,通俗來說就是計算的方法。計算機的基本工作原理就是基于計算的,因此,如何進行計算對于計算機來說就至關重要,關系到它能否完成我們希望它完成的任務。對于生物信息學來說,算法其實就是其分析問題的方式和解決問題的途徑。顯然,這又是一個生物信息學理論課堂必須強調的內容。在課堂上,首先,我們要講解算法相關的基本概念,強調其嚴格的“步驟性”和面向“任務”的特性。其次,需要講解算法的最重要特性:正確性、時間復雜度、空間復雜度、并行可能性及其可實現性(變成代碼的難度)等等。然后,可以介紹一些經典的算法思想,如貪婪算法、窮舉算法等等。當然,這些基本知識的傳授對學生理解生物信息學的工作方式是很有意義的。比如,經典序列比對搜索工具Blast,對時效要求非常高,一方面是因為其搜索的數據庫的規模巨大,另一方面是因為來自全世界的網上訪問。所以,在講Blast算法的時候,我們要讓學生理解它是如何實現它的高效率的,其中就涉及到其對時間復雜度的降低以及貪婪算法思想的應用等。再如,在講分子進化分析時,如果介紹“最大似然法”的算法,我們就可以向學生講解其窮舉算法的思想。生物信息學課講算法,決不僅僅是傳授不同問題的具體解決方法,更重要地是讓學生體會生物信息學的工作方式。生物專業的學生通過這些內容可以知道:“原來,生物學研究還可以這樣進行”;而數學或計算機專業的學生會很興奮地發現,原來他們所學到的知識和技能可以如此地應用于解決生物學問題。這些內容極可能觸發這些學生的興趣,讓他們進入生物信息學的殿堂,成為具有“學科”高度和眼界的相關人才。這樣才能使我國在生物信息學領域也可能有思想和理論的原創性,而不只是世界先進思想的跟隨者或實踐者。
四、生物信息學應用軟件的利用:研究結果的評估
當然,很多生物背景的學生并不會真正進入生物信息學領域。他們關心的只是怎么樣利用生物數據庫,以及怎樣運用別人開發好的軟件工具進行自己的研究。那么,傳統課堂的理論講授能不能在這方面也起到作用呢?
答案是肯定的。也許數據庫查詢方面的結果差異并不會很多,然而,用不同的軟件,即使針對同樣的問題并利用同樣的數據,也往往得到不同的結果。有的時候,這些結果的區別還很大。那么,如何評估這些結果對于我們得出有效結論就至關重要。比如,在構建進化樹的時候,各種構樹方法可能得到不同的結果,我們要說明:各種方法的假設,它們對其假設的敏感性(即如違背假設,結果會不會錯得離譜),它們的統計特性(如估計一致性:樣本數據增加時,是否能傾向正確的樹),以及實踐過程中它們的一般表現如何(即符合實際情況程度的評價)等等。總的來說,我們的策略應該是,各種方法都用——如果結果很相似,則此結果的可信度很高;如果結果明顯不同,就需要考慮上述有關假設、統計學以及符合程度等方面的評價。再如,在講解蛋白質結構預測的內容,我們可以介紹兩年一屆的世界范圍內的預測競賽:“CASP(Critical Assessment of Structure Prediction)”。各個參賽軟件的結果都不同,甚至可能相差甚遠;從而讓學生深刻地體會到,不同工具分析得到的結果不同是生物信息學研究領域的常態。的確,站在科學的高度,從研究方法上去評價生物信息學分析的結果,并基于生物學的背景知識去探討這些結果的意義十分重要——絕對不是會用某個或某些個軟件,就是生物信息學的專家了。
五、完備的生物信息學課程體系:兼得理論和實踐之妙
生物信息學的發展日新月異,方法和內容上的更新都非常迅速。我們的理論課堂上需要傳授的內容一定要站在相當的高度,需要把生物信息學中不變的東西提煉出來,讓學生去體會。上述三個方面,從生命的信息內涵,到生物信息學的研究方式,再到生物信息學軟件工具的利用方式,無一不是經得起時間考驗的。當然,這里強調生物信息學基本理論思想和基礎概念的重要性,并不是否定實踐對這門學科的重要性。相反,我們要告訴學生,生物信息學是一個實踐性很強的學科,緊密聯系實踐,才能更深刻地體會和掌握它,才能在嶄新模式下的生物學研究中游刃有余。因此,一個好的方式是將生物信息學開成兩個課堂:傳統的講授課堂和新興的注重實踐的課堂。在傳統的講授課堂中,應強調上述的基本理論思想和基礎概念,講解基本的數據庫和通用的應用軟件工具的運用;而在注重實踐的新型課堂下,我們可以采用案例式教學、問題式教學、任務驅動式教學等方式。鑒于信息對生命科學的核心意義,建議前者開成必修課(可稱“生物信息學導論”,考慮到知識背景,應開于分子生物學之后)。而實踐課應該延后一學期,開成專業選修課(可稱為“生物信息學實踐”)。另外,由于一般來說,高校的研究生生源有很大差異,而生物信息學對現代生物學研究至關重要,所以這兩門本科課應該通開于研究生,記選修學分。總的來說,這樣就“兼得理論和實踐之妙”——我們可以期待,采取這種模式的生物信息學大學教育將為我國培養既有科學眼界、又有實踐能力的生物信息學人才。
參考文獻:
[1]Hodgman TC,French A,Westhend DR.Instant Notes in Bioinformatics,2nd edition[Z].Taylor & Francis Group,2010.
[2]Gilbert W.Towards a paradigm shift in biology[Z].Nature,1991,(349):99.
[3]劉念.案例教學法在《生物信息學》本科教學的應用[J].考試周刊,2016,(78):152,191.
[4]朱柳村,李嘉睿.生物信息學創新教學模式的探究[J].安徽農學通報,2017,23(6):179-181.
[5]鄒先瓊,林軍,廖錦鋒.任務驅動教學法在生物信息學教學中的實踐與思考[J].教育教學論壇,2017,(28):209-210.
[6]Ma WT.The essence of life[Z].Biological Direct,2016,(11):49.