999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

EMBOSS和EMBnet

2021-12-31 07:23:56
生物信息學 2021年4期
關鍵詞:數據庫生物信息

羅 靜 初

(北京大學 生命科學學院,北京大學生物信息中心,北京 100871)

Abstract:An article entitled “Application examples of EMBOSS sequence analysis program”has been published in the Chinese Journal of Bioinformatics(Volume19,Issue 1,2021).It made a description of the European Molecular Biology Open Software Suite (EMBOSS).Initiated in the late 1990s by the European Molecular Biology Network (EMBnet),EMBOSS is an international collaborative project mainly among European countries.It is one of the critical open source bioinformatics software packages with popular tools used in the bioinformatics field.Based on the author’s own experience,this article tries to look back the ins and outs of the EMBOSS project,to trace the route that the EMBnet was born and became an international organization,and to have an overview of the contribution that EMBnet made to the development,service,education,and training of bioinformatics.Hopefully,it may give readers,especially the younger generations,some hints about the birth and growth of bioinformatics in early days.

Keywords:Bioinformatics;Bioinformatics software;EMBOSS;EMBnet

1 生物信息學

二十世紀九十年代誕生的國際互聯網(Internet),為信息時代的到來奠定了基礎,也催生了生物信息學這一交叉學科。DNA雙螺旋結構模型的提出、遺傳密碼的破譯,以及蛋白質三維空間結構的測定,開創了從分子水平上探索生命規律的新時代。DNA測序技術的成熟和產業化,為人類基因組計劃的實施提供了技術儲備。

就在生命科學研究高速發展的同時,計算機科學技術也取得了突飛猛進的發展。計算機在生命科學領域中的應用,可追溯到二十世紀八十年代。《核酸研究》(Nucleic Acids Research,NAR)半月刊于1982、1984和1986年第1期出版專輯,刊登分子生物學數據庫以及核酸和蛋白質序列分析文章。1985年,《計算機在生物學中應用》(Computer Application to Biosciences,CABIOS)創刊,標志著計算機在生命科學領域中的應用日趨成熟。而生物信息學作為一個學科,則誕生于二十世紀九十年代。1988年,美國國家生物技術信息中心(National Center for Biotechnology Information,NCBI)創建時,英文“生物信息學”(Bioinformatics)這一術語尚未廣泛使用。生物醫學文獻摘要數據庫PubMed檢索結果表明,“Bioinformatics”在文獻雜志中廣泛使用,始于二十世紀九十年代初。1994年,歐洲生物信息學研究所(European Institute of Bioinformatics,EBI)成立時,生物信息學作為一門新興學科,已悄然而生。1998年,CABIOS正式改名為《生物信息學》(Bioinformatics),并成為當前生物信息學權威雜志之一。

實際上,生物信息學和計算生物學這兩個學科很難嚴格區分,英語“Bioinformatics”和“Computational Biology”這兩個術語也經常混用。PubMed醫學主題詞(Medical Subject Headings,MeSH)數據庫(https://www.nlm.nih.gov/mesh/)就把Bioinformatics與Computational Biology列在同一個條目中。國際計算生物學學會(International Society for Computational Biology,ISCB)官方網站(https://www.iscb.org/)則稱ISCB為“計算生物學和生物信息學一級專業學會”(Leading Professional Society for Computational Biology and Bioinformatics)。十分有趣的是,ISCB的官方期刊有兩個,一個就是Bioinformatics,另一個則是Public Library of Sciences (PLOS)Computational Biology。

作為一門新興學科,要給生物信息學下一個嚴格的定義,似乎并不容易。若以目前較為流行的組學數據為研究對象,則可以大體描述如下。以核酸、蛋白質等生物大分子數據為主要研究對象,以基因組、轉錄組、蛋白組、代謝組等組學數據和文獻資料為主要研究基礎,以計算機為主要研究工具,以計算機網絡為主要研究環境,構建各種類型的數據庫,開發新一代生物信息軟件,對浩如煙海的原始數據進行存儲、管理、注釋、加工和提取生物信息,用于藥物設計、疾病診治、品種改良和環境治理等領域。同時,利用數理統計、模式識別、神經網絡、遺傳算法、支持向量機和隱馬氏模型等各種理論和方法,結合分子生物學、遺傳學和基因組學等生命科學各領域研究成果,對大量生物信息進行查詢、搜索、比較、分析,從中獲取基因和基因組復制、轉錄、翻譯、修飾和調控等理性知識,探索生命起源、生物進化及細胞、器官、個體和群體的發生、發育、發展等生命科學中重大問題,搞清它們的基本規律和時空聯系。

2 生物信息學軟件

不言而喻,生物信息學軟件在生物信息學領域中具有無可替代的特殊地位。首先,生物信息軟件的研究開發本身就是生物信息學領域的重要組成部分;而所開發和集成的各種軟件工具、應用程序和分析平臺,為核酸和蛋白質序列和結構以及高通量組學數據的分析提供了必不可少的手段。

生物信息軟件開發包括許多方面,核酸和蛋白質序列分析軟件的開發起步較早。1977年,英國劍橋醫學研究委員會(Medical Research Council,MRC)分子生物學實驗室(Laboratory of Molecular Biology,LMB)Rodger Staden在NAR上發表題為“利用計算機處理序列數據”(Sequence data handling by computer)的文章,開創了生物信息軟件開發和集成的先河[1]。文章介紹了他編寫的核酸和蛋白質序列分析程序,包括序列存儲、編輯、轉換,限制性內切酶搜索、密碼子使用頻率統計、序列相似性比較等。程序采用人機交互運行模式,在內存僅為28 kb的PDP11/45小型計算機上可處理長達6 000 bp的DNA序列。以后20多年,他一直致力于生物信息軟件編寫,完成了分子生物學領域第一個免費軟件包Staden的開發。序列裝配是該軟件包的主要模塊之一,在早期基因組測序和裝配中起了重要作用。2004年Staden退休,該軟件包由他年輕的同事James Bonfield繼續維護(http://staden.sourceforge.net/)。

1997年,筆者在英國倫敦癌癥研究基金會(Imperial Cancer Research Fund,ICRF)從事合作研究期間,有幸參觀了MRC實驗室,拜訪了Staden博士。2002年,James Bonfield博士應邀在北京大學舉辦的生物信息培訓班上介紹了Staden軟件包。值得一提的是,英國劍橋MRC實驗室是國際知名分子生物學研究機構,弗雷德里克·桑格(Frederick Sanger)、弗朗西斯·克里克(Francis Crick)、詹姆斯·沃特森(James Watson)、馬克斯·佩魯茨(Max Peruts)、約翰·肯德魯(John Kendrew)、悉尼·布倫納(Sydney Brenner)和約翰·薩爾斯頓(John Sulston)等十多位著名諾貝爾獎獲得者曾在MRC工作。約翰·薩爾斯頓是人類基因組計劃英國團隊的主要負責人,2002年獲諾貝爾生理獎,筆者有幸參加了在英國基因組園區舉辦的慶祝會(見圖1)。

圖1 約翰·薩爾斯頓同事祝賀其榮獲諾貝爾獎Fig.1 Sir John Sulston at the party after the announcement of the 2002 Nobel Prize

微型計算機(簡稱微型機,Microcomputer)的普及,使計算機在分子生物學中的應用得到了長足的進步。基于微型機的序列分析軟件于八十年代中期開始使用,后來發展成DNAStar、PCGene、MacVector等商業軟件。1986年,美國亞利桑那大學分子生物學教授David Mount應邀為北京大學生物系(1993年改名為生命科學學院)舉辦為期一個月的生物技術和基因工程講習班,帶來了他編寫的程序DNA Management (DM),作為DNA和蛋白質序列分析工具。DM基于微型機編寫,當時北京大學生物系僅有一臺處理器為Intel 8086的微型機,配有512 K內存、10 M硬盤和兩個軟盤驅動器,外帶12英寸單色顯示器。程序DM成功安裝在這臺微型機上。Mount教授還帶來了一盒軟盤,每張軟盤容量為360 kb,存放了核酸序列數據庫GenBank和蛋白質序列數據庫(Protein Information Resource,PIR)。

程序DM采用交互式會話菜單,使用相當方便,除用文本方式輸出分析結果外,還可繪制簡單的圖形,如環形質粒DNA限制性內切酶位點等。軍事醫學科學院基礎醫學研究所吳加金研究員全程參加了該講習班。隨后的幾年,他領導的團隊編寫了基于微型機的序列分析軟件“金鑰匙”(Goldkey),填補了國內生物信息領域軟件開發的空白[2]。Mount教授編著的“Bioinformatics:Sequence and Genome Analysis”2001年由美國冷泉港出版社(Cold Spring Harbor Laboratory Press)出版,2002年由科學出版社購買版權并以影印本形式出版。復旦大學鐘楊主譯的中譯本于2003年由高等教育出版社出版。2004年,本書第2版出版;2006年,同濟大學曹志偉將第1章翻譯成中文,由科學出版社出版了本書第2版的中文導讀版。

九十年代以來,微型計算機很快普及到科研究機構、大專院校、乃至千家萬戶。基于微型機的生物信息軟件不斷涌現。除DNAStar、MacVector等一些商業軟件外,不少由學術單位編寫的軟件可免費下載和使用,如序列編輯、顯示和分析軟件BioEdit、多序列比對軟件ClustalW、系統樹構建軟件MEGA等。與此同時,基于UNIX的開源操作系統Linux日趨成熟,而基于Linux系統的軟件逐步成為生物信息領域的主流軟件,例如數據庫搜索軟件BLAST和FASTA,基因組序列裝配軟件PHRED/PHRAP、基因結構預測軟件GenScan和GeneID等,其中最為著名的是歐洲分子生物學開放軟件包(European Molecular Biology Open Software Suite,EMBOSS)。

3 EMBOSS軟件包

EMBOSS軟件包的誕生有一個鮮為人知的故事。二十世紀八十年代,美國Wisconsin大學遺傳計算研究組(Genetics Computing Group)開發了分子生物學軟件包GCG[3]。該軟件包起初基于多用戶小型機系統Vax/VMS開發,在一臺服務器上安裝后,多個用戶可同時使用,后來移植到Unix平臺。GCG整合了許多常用序列分析工具,功能相當齊全,美國和歐洲不少科研機構和高等院校均購買并安裝了該商業軟件,供本單位研究人員使用。經過多年開發和商業化運行,上世紀八十年代至九十年代中期,GCG軟件包成為歐美各國最為流行的基于Unix服務器的多用戶序列分析軟件。由于GCG軟件包實際上是許多已發表算法的實現或現有程序的整合,發行初期,其源代碼對外公開。歐洲生物信息學網絡組織(European Molecular Biology Network,EMBnet)等許多學術機構和個人在此基礎上進行了二次開發,增加了許多新程序,形成了名為EGCG的軟件包。EGCG最初的含義為歐洲(European)GCG,后來,因為參加開發的人員不再限于歐洲國家,該軟件包的名字也就改為擴充的(Extended)GCG。

九十年代末,由于人員變更和商業模式的改變,GCG軟件包不再公開源代碼,EGCG開發不得不終止。為此,EGCG的主要開發者Peter Rice和Alan Bleasby等決定另起爐灶,拋開GCG而自行開發另一套分子生物學軟件包,即EMBOSS軟件包。這一計劃得到了EMBnet成員的大力支持和積極參與。基于前期EGCG軟件包現有基礎,EMBOSS項目很快取得了實質性進展。1999年4月,Peter Rice在北京大學舉辦的講習班上演示了EMBOSS的第一個程序seqret。

之后不久,基于Needleman-Wunsch動態規劃算法的全局比對程序needle,基于Smith-Waterman算法的局部比對程序water,以及點陣圖可視化序列比對程序dottup和dotmatcher等程序也很快完成。基于GenBank/EMBL等核酸序列數據庫、PIR和Swiss-Prot等蛋白質序列數據庫的格式轉換和序列特征信息提取等一系列程序為用戶提供了極大方便,而字串統計、密碼子分析、酶切位點鑒定、重復序列識別和CpG島預測等核酸序列分析程序,以及組分統計、跨膜螺旋識別和二級結構預測等蛋白質序列分析程序,則是EMBOSS軟件包最具特色的核酸和蛋白質序列分析程序。本世紀初,Peter Rice領導的EMBOSS研發團隊受聘于歐洲生物信息學研究所,完成了該軟件包的主要開發和集成,編寫了系統的幫助文檔[4]。2009年,Peter Rice領導的EMBOSS團隊得到英國生物技術和生物科學研究委員會(Biotechnology and Biological Science Research Council,BBSRC)資助,繼續進行EMBOSS軟件包的開發(見圖2)。

圖2 EMBOSS軟件包的主要開發者和EMBOSS彩繪圖標Fig.2 Major developers of EMBOSS(Peter Rice and Alan Bleasby)and the EMBOSS logo in color painting

除了EMBOSS開發團隊自行編寫的程序外,EMBOSS還整合了不少其它常用生物信息軟件包,如基于隱馬爾可夫模型的蛋白質結構域序列譜構建和結構域識別軟件包HEMMER、系統發育分析軟件包Phylip及RNA二級結構分析和預測軟件包VIENNA等。2016年發布的EMBOSS 6.6.0版包括300多個程序,十多個類別,是生物信息領域內容最為豐富、功能最為齊全的序列分析軟件包,同時包括JEMBOSS、PISE、wEMBOSS、mEMBOSS等多個Web接口程序,均可免費下載安裝(見圖3)。

圖3 EMBOSS軟件包主頁(http://emboss.open-bio.org/)Fig.3 Main website of the EMBOSS software package

4 EMBnet

顯而易見,EMBOSS軟件包的誕生,得益于歐洲分子生物學網絡組織EMBnet。EMBnet成立于1988年(https://www.embnet.org/wp/about/history/),主要發起單位為德國歐洲分子生物學實驗室(European Molecular Biology Laboratory,EMBL),英國Daresbury國家實驗室,以及法國、荷蘭和瑞典等幾個西歐發達國家從事計算機在分子生物學中應用的學術機構和高等院校。EMBL位于德國海德堡,是歐洲重要分子生物學實驗室,由歐盟各國政府提供經費支持。1989年五月,當時的14個歐盟成員國都加入了EMBnet。

1991年,EMBnet獲歐盟生物技術研究領域創新、開發和增長(Biotechnology Research for Innovation,Development and Growth in Europe,BRIDGE)框架計劃資助,進入了快速發展時期。九十年代中期,EMBnet成員單位達到28個,包括英國、德國、瑞士等西歐國家,波蘭、斯洛伐克和匈牙利等東歐國家,以及以色列和土耳其等。在教育部和學校領導的大力支持下,北京大學蛋白質工程和植物基因工程(現更名為蛋白質和植物基因研究)重點實驗室于1996年加入EMBnet,同年加入的還有澳大利亞國家基因組信息服務中心(Australian National Genomic Information Service,ANGIS)和俄羅斯莫斯科州立大學。此后,南非、加拿大、印度、古巴等世界各大洲許多國家也紛紛加入EMBnet。1998年EMBnet成立十周年時,已經發展到37個成員單位(見圖4)。

圖4 歐洲分子生物學網絡組織節點分布(1997年)Fig.4 Distribution of EMBnet nodes (1997)

4.1 國家節點

EMBnet成員單位稱節點(Node),按成員單位的性質分為國家節點(National Node)和專業節點(Specialist Node)兩類。根據EMBnet章程,每個國家只能有一個國家節點,由政府部門推薦本國從事計算生物學的學術機構或高等院校,并向EMBnet提出申請,在EMBnet年會上由全體成員無記名投票,得票超過三分之二者通過,成為新的成員。每個成員單位指派一名代表,稱節點負責人(Node Manager)。

由于人力資源、經費來源、硬件設施、網絡環境和所在單位支持程度的差別,不同國家節點的情況各不相同。其中影響和貢獻較大的有英國、荷蘭、瑞士、瑞典和意大利等幾個國家節點。英國的國家節點為Daresbury國家實驗室的SeqNet項目組,負責人為Alan Bleasby,也是EGCG和EMBOSS項目的主要開發者之一。荷蘭的國家節點為內梅根大學(University of Nijmegen),負責人為Jack Leunissen。由于EMBnet注冊在荷蘭,荷蘭節點也承擔財務管理等日常事務(見表1)。

表1 歐洲分子生物學網絡組織國家節點(1998年)Table 1 National nodes of EMBnet(1998)

此外,EMBnet也不定期聘請一些兼職教員,為各成員單位舉辦各種類型的培訓班、講習班。如英國劍橋大學的David Judge,英國愛丁堡大學的Frank Wright等。

4.2 專業節點

EMBnet規定,每個國家除一個國家節點外,可以設立一個或多個專業節點(Specialist Node)。截止1998年,EMBNet專業節點共有9個(見表2)。和國家節點一樣,專業節點也指派一名節點負責人。專業節點中影響較大的有歐洲生物信息學研究所EBI(https://www.ebi.ac.uk/)和桑格研究所(Sanger Institute,https://www.sanger.ac.uk/)。EBI是歐洲分子生物學實驗室EMBL設在英國的分部,建于劍橋南部小鎮辛克斯頓基因組高新園區內,與桑格研究所毗鄰。英國人類基因組圖譜項目資源中心(Human Genome Mapping Project Resource Center)也設在該園區內。

表2 歐洲分子生物學網絡組織成員專業節點(1998年)Table 2 Specialist nodes of EMBnet(1998)

EBI基于EMBL原有幾個計算生物學和生物信息學研究組擴充而成,是歐洲最大的生物信息學研究、開發和服務機構。1981年,由EMBL創建的核酸序列數據庫(EMBL Data Library,簡稱EMBL)正式發布[5]。蛋白質結構分析、預測和設計是EMBL另一個重要學研究方向,知名學者Chris Sander任研究組負責人。上世紀八十年代至九十年代,系統分析了當時蛋白質結構數據庫(Protein Data Bank,PDB)已經測定的結構,構建了一系列蛋白質結構相關數據庫。

桑格研究所建于1992年,主要經費由英國生物醫學慈善機構惠康信托基金會(Wellcome Trust,https://wellcome.ac.uk/)提供,是英國最大的基因組測序中心,承擔了人類基因組計劃30%測序任務。1999圣誕節前夕,桑格研究所宣布完成22號染色體測序,這也是人類基因組計劃最先完成測序裝配的第一條染色體。桑格研究所和EBI同在辛克斯頓的基因組園區內,為數據共享和項目合作提供了極大便利,著名基因組數據庫和分析系統ENSEMBL(http://www.ensembl.org/)就是兩個單位合作的結果。

4.3 運行機制

EMBnet設有執行委員會(Executive Board),委員會由四名成員組成,除主席和秘書外,還設有一名成員負責財務。EMBnet日常事務由執委會主席通過郵件組與節點負責人商定。執委會由全體成員在年會上無記名投票選舉產生,執委會分工由四名成員商定。除執委會外,另設公共事務(Publicity and Public Relation)、教育培訓(Education and Training)和技術管理(Technical Management)三個委員會,每個委員會也各由四位成員組成。無論是國家節點或專業節點負責人,均可競選執委會和其它三個委員會委員。

EMBnet每年舉行一次年會,年會時間地點由節點負責人提出申請,經全體成員討論通過后確定,通常是在各成員單位所在國家和城市輪流舉行。不論是國家節點還是專業節點,每個成員單位每年繳納1 000歐元會費,主要用于舉辦年會的交通食宿等費用。通常,舉辦年會的同時,也舉行生物信息學學術討論會或專題培訓班。

4.4 軟件開發

EMBnet的宗旨,是把分散在各國的計算生物學領域人力物力組織在一起,為本國和其它國家提供數據庫和軟件等生物信息資源服務。值得一提的是,EGCG及其后續的EMBOSS項目,就是EMBNet各成員單位之間合作的典范。EMBnet的另一個合作項目,就是基于文本的數據庫信息檢索系統SRS[6]。SRS的英文原文是Sequence Retrieval System,直譯為序列提取系統,主要開發者為EMBL的Thure Etzold。SRS免費提供所有學術單位,最初用于檢索EMBL和GenBank等核酸序列數據庫、PIR和Swiss-Prot等蛋白質序列數據庫等以文本形式保存的序列和注釋信息。通過對數據庫條目中的關鍵詞建立索引,以瀏覽器界面提供簡單檢索和高級檢索功能。用戶可通過蛋白名、基因名、物種名等基本信息,以及序列條目中的大量注釋信息,快速高效地對某個或幾個數據庫進行檢索。SRS后來擴充到PubMed文獻摘要數據庫、Pfam,PRINTS和 Prosite等蛋白質結構域和功能位點數據庫,PDB,DSSP,HSSP和FSSP等蛋白質結構和分類數據庫。有的SRS服務器上安裝的數據庫多達幾十個乃至上百個。EBI成立后,Etzold帶領的SRS開發團隊從德國海德堡搬到英國辛克斯頓,繼續進行開發。九十年代末,許多EMBnet節點都安裝了SRS系統[7]。鑒于許多生物技術和藥物開發公司對SRS系統的需求,上世紀末,SRS開發團隊成立了軟件開發公司,SRS也成了商業軟件,最新版的SRS 8.0不再免費提供學術單位,包括EBI在內的大部分SRS服務器不得不終止服務。

4.5 教育培訓

EMBnet的另外一個重要任務,是舉辦各種類型的講習班、培訓班,除了培訓數據庫和軟件開發等生物信息領域專業人員外,也為從事分子生物學實驗的最終用戶進行培訓。例如上面提到的開源軟件Staden和商業軟件GCG,以及數據庫檢索系統SRS等。1997-1999年,筆者以學生身份,先后參加了Alan Bleasby在英國Daresbury國家實驗室舉辦的網絡資源講習班、David Judge在劍橋大學舉辦的序列分析培訓班、James Bonfiled在劍橋MRC-Lab舉辦的Staden軟件包安裝使用培訓班,以及Thure Etzold在EBI舉辦的SRS系統管理員培訓班,為筆者日后舉辦多次生物信息培訓班和開設“實用生物信息技術”課程積累了經驗[8]。

4.6 網絡刊物

自1994年起,EMBnet不定期出版EMBnet新聞(EMBnet.news)網絡刊物,并于2010年更名為EMBnet雜志(EMBnet.journal,https://journal.embnet.org/),報道各節點硬件和網絡建設、數據庫和軟件開發、教育和培訓等進展,介紹網絡生物信息資源和生物信息軟件使用經驗。該網絡刊物提供的生物信息數據庫和軟件使用快速指南(https://www.embnet.org/wp/quick-guides/),至今依然是生物信息初學者的簡明手冊(見表3)。

表3 EMBnet快速指南Table 3 EMBnet Quick Guides

2012年,EMBNet加入了國際生物信息學教育和培訓組織(Global Organization for Bioinformatics Learning,Education and Training,GOBLET)[9]。作為該組織的主要成員之一,EMBnet為國際生物信息學的教育培訓發揮了重要作用(https://www.mygoblet.org/)。本世紀初,英國倫敦大學專業節點負責人Terresa Attwood受聘英國曼徹斯特大學,繼續進行生物信息數據庫和軟件開發。她為GOBLET編寫了生物信息學詳盡指南(https://www.embnet.org/wp/critical-guides/),詳細介紹蛋白質序列數據庫UniProt和neXtProt、蛋白質結構數據庫PDB,以及生物信息領域中最常用的序列相似性數據庫搜索系統BLAST(見表4)。

表4 EMBnet詳盡指南Table 4 EMBnet Critical Guides

2000年2月,由EMBnet主辦的期刊生物信息學簡報(Briefings in Bioinformatics,BiB)正式出版,主編為資深生物信息學家Martin Bishop,包括筆者在內的許多EMBnet節點負責人應聘為編委會成員(https://academic.oup.com/bib)。2017年,中國科學院北京基因組研究所章張應邀擔任亞洲地區副主編。該雜志主要刊登生物信息軟件和數據庫等綜述,介紹生物信息領域最新進展,是生物信息學領域極具影響力的重要雜志。

5 EMBnet中國節點

EMBnet成員單位的首要任務是為本國分子生物領域提供基本的生物信息資源服務。1996年10月,北京大學蛋白質工程和植物基因工程重點實驗室加入EMBnet后,該重點實驗室主任兼國家863生物領域蛋白質工程專家組組長顧孝誠教授積極推動與北大計算中心和北大圖書館學術文獻中心合作,建立了北京大學生物信息中心(Center for Bioinformatics,CBI),開始通過計算機網絡,為國內用戶提供數據庫資源和軟件工具等服務。1997年9月,EMBnet年會在意大利巴利(Bari)召開,作為EMBnet中國節點負責人,筆者第一次參加這次年會,結識了英國節點負責人Alan Bleasby、荷蘭節點負責人Jack Leunissen、SRS主要開發者Thure Etzold等多名歐洲生物信息學領域早期研究開發人員。

獲EMBnet資助,1998年4月在北大舉辦首次生物信息講習班,來自全國各地的近百名學員參加了培訓,Alan Bleasby、Jack Leunissen和ThureEtzold等五位EMBnet節點負責人和兼職教師應邀擔任培訓班教師。1998年10月,EMBnet十周年紀念會在英國辛克斯頓EBI召開,應會議主持人Peter Rice邀請,筆者在會上播放了講習班實況錄像,給與會者留下了深刻印象。獲國際遺傳工程和生物技術中心(ICGEB)資助,1999年4月在北大舉辦第2期生物信息講習班班,10位EMBnet節點負責人和兼職教員為培訓班學員做報告或講課。年過六旬的著名理論物理學家郝柏林院士以學生身份全程參加了該講習班,并于講習班后不久撰寫了“建議盡快組建國家級的生物醫學信息中心”的院士建議,和夫人張淑譽老師一起編寫了國內第一本生物信息學書籍《生物信息學手冊》。

2000年9月,獲國家自然科學基金委員會資助,以國家863生物領域首席專家強伯勤院士為團長的中國生物信息學代表團參加了在瑞士洛桑舉行的EMBnet年會,訪問了瑞士生物信息研究所(Swiss Institute of Bioinformatics,SIB)、Swiss-Prot數據庫、羅氏公司和蘇黎世聯邦理工學院。瑞士在生物信息學領域中有著特殊地位,蛋白質序列數據庫Swiss-Prot于1986年誕生于瑞士日內瓦。SIB構建的蛋白質分析專家系統(Expert of Protein Analysis System,ExPASy)則是重要生物信息資源網站,收集了幾百個生物信息數據庫和軟件工具網址。鑒于網絡帶寬限制,歐洲以外其它國家訪問該網站受到一定影響。為此,ExPASy在拉美、澳大利亞等地設有鏡像。這次訪問的直接結果,就是與瑞士生物信息研究所商定,ExPASy亞洲鏡像就設在北大生物信息中心,為國內用戶提供了極大方便。

二十多年來,作為EMBnet國家節點,北大生物信息中心得到國家教育和科研計算機網(CERNET)的大力支持,在生物信息資源建設、人才培訓和基礎教學,以及數據庫和軟件開發等方面做了一些工作[10]。

值得高興的是,中國科學院北京基因組研究所大數據中心(BIGD,https://bigd.big.ac.cn/)于2016年成立,并于2019年成為國家基因組科學數據中心,而基因組所于同年加掛“國家生物信息中心”牌子。EMBnet國家節點的任務,正在由該所年輕的生物信息學團隊承擔[11]。

6 結 語

作為一門交叉學科,生物信息學的誕生還不到三十年。最近十多年來,隨著新一代基因組測序技術的誕生,高通量組學數據快速積累,ENSEMBL等各種類型的基因組數據庫紛紛上網,Bowtie和 BWA等各種組學數據分析軟件也不斷涌現。作為以傳統的單個基因或基因家族、單個蛋白或蛋白家族為主要分析對象的EMBOSS軟件包,盡管它在組學數據分析中無能為力,但由組學數據分析得到的靶標基因或蛋白的深入分析依然離不開該軟件包中的大量工具。目前,EMBOSS軟件包開發項目已經結束,該項目主要負責人Peter Rice受聘于AXIOMEDIX公司,擔任客戶部主任(https://axiomedix.com/about/team/)。作為EMBOSS軟件包的主要開發者,Peter Rice仍然負責維護該軟件包。作為開源軟件,EMBOSS的維護開發需要生物信息領域中的同行共同努力。

本世紀初,鑒于EBI和NCBI等國際生物信息中心提供的生物信息資源越來越多,部分歐洲國家不再在人力物力上繼續支持EMBnet國家節點,德國、瑞士、英國、比利時等國家節點先后退出EMBnet。最近幾年,根據歐洲和世界各國的實際情況,EMBnet組織模式作了調整,有條件的成員單位可繼續以國家節點方式保留會員資格,同時也吸收生物信息學研究團體和個人為為團體或個人會員。希望國內生物信息領域有志者積極參與,為國際國內生物信息學特別是生物信息資源服務和教育培訓做出應有的貢獻。

致 謝

感謝鮑一明、朱偉民、章張等人對本文的修改意見。2021年10月,中國科學院北京基因組研究所(國家生物信息中心)成為EMBnet中國節點,鮑一明博士擔任節點負責人。

猜你喜歡
數據庫生物信息
生物多樣性
天天愛科學(2022年9期)2022-09-15 01:12:54
生物多樣性
天天愛科學(2022年4期)2022-05-23 12:41:48
上上生物
當代水產(2022年3期)2022-04-26 14:26:56
第12話 完美生物
航空世界(2020年10期)2020-01-19 14:36:20
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 在线精品亚洲一区二区古装| 色综合中文字幕| 国产制服丝袜91在线| jizz国产视频| 国产二级毛片| 午夜激情福利视频| 一区二区欧美日韩高清免费 | 色婷婷综合在线| 不卡色老大久久综合网| 永久免费无码日韩视频| 欧美日韩另类国产| 99草精品视频| 国产视频 第一页| 亚洲中文无码h在线观看| 亚洲国产日韩一区| 成人av手机在线观看| 亚洲天堂久久久| 亚洲人成影院在线观看| 亚洲综合婷婷激情| 97国产在线视频| 亚洲国产系列| 制服无码网站| 欧美在线三级| 国产一级毛片高清完整视频版| 国产丝袜丝视频在线观看| 综合亚洲网| 自拍偷拍欧美日韩| 欧美特黄一免在线观看| 午夜精品一区二区蜜桃| 97色伦色在线综合视频| 中文字幕无线码一区| 在线亚洲小视频| 精品天海翼一区二区| 在线免费亚洲无码视频| 日本不卡在线视频| 又爽又大又黄a级毛片在线视频| 五月天天天色| 色婷婷成人| 亚洲免费人成影院| 婷婷综合色| 久草中文网| 亚洲视屏在线观看| 综合色区亚洲熟妇在线| 992tv国产人成在线观看| 久久免费观看视频| 中文字幕亚洲电影| 亚洲精品天堂自在久久77| 永久免费无码日韩视频| 午夜性刺激在线观看免费| 亚洲美女久久| 国产久操视频| 久草视频中文| 在线精品自拍| 国产AV无码专区亚洲A∨毛片| 亚洲人成在线精品| 精品视频一区在线观看| 精品国产电影久久九九| 国产十八禁在线观看免费| 成人午夜天| 黄色三级毛片网站| 国产高清精品在线91| 亚洲精品国偷自产在线91正片| 一级毛片免费不卡在线| 伊人丁香五月天久久综合| 日韩欧美国产另类| 国产一级二级在线观看| 国产精品福利导航| 少妇精品网站| 99热国产在线精品99| 欧美日韩综合网| 国产精品无码一二三视频| 日本精品视频一区二区| 国产精品久久久久无码网站| 国产成人亚洲精品色欲AV| 国产精品成人一区二区| 国产69囗曝护士吞精在线视频 | 国产精品久久国产精麻豆99网站| 国产美女精品人人做人人爽| 尤物在线观看乱码| 精品国产91爱| 国产精品专区第1页| 日本福利视频网站|