崔春舜,余 輝,高東平,楊 淵
人類生物資源是人類社會生存與可持續發展不可或缺、生命科學原始創新、獲得知識產權以及健康產業的物質基礎,是保障國家生態安全、人類健康安全的戰略性資源[1]。人類生物資源已經成為經濟和社會可持續發展的重要戰略資源,包括人類遺傳資源、生物樣本資源以及干細胞資源等。由于其重要的戰略作用,美、英等發達國家正在全世界范圍內以尋求科研合作的方式獲取各地人類生物資源建設資源庫,印度、巴西等發展中國家也在不斷投入資金支持本國人類生物資源的開發、保護和利用。我國56個民族源遠流長,保持有純家譜系的人類遺傳資源,同時,我國疾病譜復雜多變,因此建設人類遺傳資源庫存儲保護我國人類遺傳資源、建設人體生物樣本庫,對了解復雜疾病背后的危險因素和作用機制等具有重要戰略意義。另外,圍繞開發、保護和利用我國人類生物資源的目標,掌握國內外重要人類生物戰略資源庫的建設進展十分重要。作者對人類遺傳資源庫、生物樣本庫以及干細胞庫3種類型的資源庫的建設現狀進行情報調研,通過文獻調研、各資源庫的官方統計與年度報告分析國內外人類生物戰略資源庫建設中的問題,并給出國內的資源庫建設相應的對策建議。
1.1 國外人類遺傳資源庫建設現狀 歐洲生物信息研究所(European Bioinformatics Institute,EBI)建立于1994年,位于英國劍橋南部的維康信托基因園,是歐洲分子生物學實驗室的一部分。該組織致力于為科學研究提供免費的公共生物數據、一系列服務和工具以及進行生物信息學基礎研究的培訓。2016年,來自63個國家的624個機構進行的186個研究項目加入了EBI,有來自8個國家的22個公司是EBI的成員。EBI 2016年新加入2個國家,總成員國17個。2016年期間,數據庫每天處理2 700萬個數據請求,每月運行1 270萬個計算任務。EBI構建的元基因組學數據庫在2016年數據量增長了11倍。EBI構建了一個名字為“BioStudies”的數據庫用來存儲非傳統數據如圖像、單細胞表達集以及基因表達規律等。截至2016年底,EBI存儲生物信息數據量:核酸序列數據庫存儲數量5.91 PB;物種和菌株的基因組42 529個;元基因組樣本超過9萬個;基因表達試驗220萬;蛋白質序列7 100萬;大分子結構1.2萬多個。EBI免費提供的最新的分子數據資源,可通過ENSEMBL數據庫訪問核酸信息資源,UniProt數據庫訪問蛋白質信息資源,并提供包括Clustal Omega序列對比工具、InterProScan蛋白質特征序列搜索工具等分析工具[2]。
日本的DNA數據庫(DNA Data Bank of Japan,DDBJ)始建于1986年,由國立遺傳學研究所負責數據庫的建設、維護及數據的傳播。截至2015年底,DDBJ的核酸數據庫中DDBJ序列閱讀檔案存儲了2.51 PB序列數據,其中包括1.7 PB的sra格式文件和0.81 PB的fastq格式文件。2015年提交至DDBJ有1 156 001條數據記錄,數據庫中增加的記錄有1 282 165條[3]。DDBJ提供免費可用的核苷酸序列數據,通過在getentry中輸入登錄號、在ARSA輸入關鍵字以及TXSearch分類數據搜索方式獲取序列信息,研究人員可通過D-Way通道提交自己的序列數據[4]。
GenBank是美國國立生物技術信息中心(National Center for Biotechnology Information,NCBI)建立的DNA序列數據庫,旨在向研究人員提供最新的和全面的基因序列信息。截至2018年2月底,GenBank數據庫共收錄2 536億多個堿基和2億多個核酸序列。每2個月數據庫會發布一個說明文檔,此文檔內容是關于當前數據庫版本的詳細信息以及接下來數據庫更新的變化情況。NCBI對GenBank數據的使用或分發沒有任何限制,用戶可通過核苷酸序列檢索、BLAST序列對比、使用NCBI e-utilities程序以編程方式檢索序列等方式獲取數據[5]。
EBI、GenBank以及DDBJ合作,采用統一的數據標準,3個數據庫每天交換數據,保持數據一致性,3大基因庫在存儲功能外均提供計算、模擬實驗以及序列對比分析功能。
1.2 我國人類遺傳資源庫建設現狀 2016年9月22日,總部位于深圳的中國國家基因庫正式投入運行。中國國家基因庫計劃建成“三庫兩平臺”的業務結構和功能,“三庫”由生物樣本資源庫、生物信息數據庫和生物活體庫組成,“兩平臺”為數字化平臺、合成與編輯平臺。國家基因庫已存儲了眾多生物資源樣本,一些樣本正在陸續從原來分散儲存的地點運往基因庫,截至2016年底,存儲總量已達1 000萬份。在這些數據當中,除了基本的生物資源樣本和信息之外,還儲存了人類疾病和物種多樣性的相關數據。目前,罕見病數據庫已檢測了3 000多個家庭,新發現400多種罕見病,癌癥數據庫中包含了上萬份不同種類的數據。2017年9月,國家基因庫又啟動了“國家基因庫青海高原活體庫”植物資源采集和科學考察項目以及國家基因庫眼基因庫項目[6]。 國內其他基因庫建設項目包括從2009年開始,華大基因與地方政府展開合作,到2016年總計完成27萬多份樣本的檢測,包括產前無創、遺傳性耳聾、地中海貧血、新生兒遺傳代謝病、宮頸癌篩查等[7]。
由國家衛健委主管,國家衛健委科學技術研究所牽頭建設的國家人類遺傳資源共享服務平臺由中華民族遺傳資源中心、國家重大疾病遺傳資源中心、國家生殖遺傳資源中心、特殊人群遺傳資源中心、自然人群遺傳資源中心、極端環境遺傳資源中心、干細胞遺傳資源中心以及分子影像資源中心8個資源中心組成,每個中心下由不同的資源專題組成,比如中華民族遺傳資源中心下有中華民族永生細胞專題、中華民族分子畫像遺傳資源專題等4個專題,每個專題下列出所屬的數據庫信息。平臺現已建成北京、上海以及華南3個創新中心,推動我國人類遺傳資源的標準化整合、共享服務體系的進一步完善[8]。
2.1 國外生物樣本庫建設現狀 英國生物樣本庫始建于1999年,為大型的前瞻性人類遺傳隊列生物樣本庫。在2006—2010年間募集了50萬名40~69歲的英國人志愿者,存儲志愿者的血液、尿液和唾液樣本以供進一步分析[9]。2016年4月宣布建立內臟器官掃描圖像數據庫項目,計劃使用核磁共振成像以及其他技術了解心臟、大腦、脂肪、骨骼和血管疾病成因與發病機理,涉及癌癥、老年癡呆癥、關節炎和骨質疏松癥、冠狀動脈心臟病等疾病,該項目計劃掃描10萬人群的圖像數據,截至2018年1月,已招募21 332名項目參與者。英國生物樣本庫對每項申請采取250英鎊的固定收費模式,學科研究員與準入小組委員會對所有申請進行評估通過后提供樣本[10]。
丹麥國家生物樣本庫建立于2012年,截至2018年2月,存儲有963萬余份生物樣本,存儲量前3位的生物樣本分別為血清420萬份、干血斑樣本220萬份以及血漿130萬份。獲取生物樣本需先獲得研究倫理委員會的支持,然后向丹麥健康數據管理的科學服務部門提交申請,申請由丹麥國家生物樣本庫審查后提供生物樣本資源[11]。
美國國家癌癥研究所牽頭建立的人類組織協作網絡(Cooperation Human Tissue Network,CHTN),始建立于1987年,目前由東部分部賓夕法尼亞大學醫學院、大西洋中部分部弗吉尼亞大學醫學院、中西部分部俄亥俄大學維克斯納醫學中心、兒科全國兒童醫院、南部分部伯明翰阿拉巴馬大學醫學院以及西部分部范德比爾特大學醫學院6個部分組成。自成立以來,CHTN向3 400多名科研人員提供了100多萬份標本,在2013—2017年間,CHTN向美國和加拿大批準的研究人員以及國際上的少數研究人員提供了235 710份生物樣本。2016年,CHTN向433名通過了倫理審查委員會評審研究人員提供了49 832份樣本,其中,72%的樣本由CHTN部門提供,而其余28%的樣本由CHTN醫療中心聯盟提供。研究人員提交CHTN申請獲取生物樣本,其申請由外科病理學家審查可行性通過后CHTN向研究人員提供生物樣本[12]。
泛歐洲生物樣本庫與生物分子資源研究中心(Biobanking and Bio-Molecular Resources Research Infrastructure,BBMRI)擁有16個成員國、3個觀察國以及1個組織,涵蓋了超過30個國家的225個機構成員的生物樣本庫。該聯盟最新開放的4.0版目錄公布其樣本庫網絡中涵蓋了1 431個生物樣本庫和生物樣本集合[13]。
韓國國家研究資源中心由科學部的信息、通信和技術與未來規劃以及韓國國家研究基金會支持建立。目前分為5個核心中心(人類資源、動物、植物、微生物和融合物),包括有36個資源中心,其中人類資源6個、動物8個、植物3個、微生物12個以及融合物7個[14]。
加拿大腫瘤信息庫網絡于2004年在加拿大健康研究所癌癥研究所的資助下成立,旨在促進癌癥決定因素的研究,更好地了解癌癥預防和早期發現,并預測和改進藥物反應以及尋找新的靶向藥物[15]。
國際上的生物樣本庫各有特色,如英國生物樣本庫以固定目的的項目的方式收集隊列人群的生物樣本資源;BBMRI則致力于多國樣本庫的標準化工作;韓國國家研究資源中心則發展多物種的生物樣本資源庫。同時各國在建設生物樣本庫的時候均十分重視倫理審查。
2.2 國內生物樣本庫建設現狀 1994年,在國家自然科學基金重大項目“中華民族基因組中若干位點基因結構的研究”第一子課題“中華多民族基因組的保存”的資助下,建立了中華民族永生細胞庫,收集了具有代表性的47個民族70個群體的樣本,建立了存有3 982株永生細胞株的細胞庫和近7 210例個體的DNA庫。2002年,中山大學腫瘤防治中心腫瘤資源庫建成了世界上最大規模的鼻咽癌樣本庫,截至2017年年初,腫瘤資源庫平臺已采集并保存血標本及相關信息超過16.5萬例、組織標本及相關信息3.6萬份以上[16]。2009年5月,北京市科委正式啟動疾病資源庫項目建設工作,并委托首都醫科大學牽頭成立項目管理委員會、項目專家委員會和項目工作委員會,統一協調首都醫科大學附屬北京天壇醫院、佑安醫院、地壇醫院等11家研究機構分別承擔腦血管病、肝炎、艾滋病等12種疾病的資源庫建設工作[17]。2016年6月,由生物芯片上海國家工程研究中心牽頭,一期投資近1億元人民幣的上海張江生物銀行開始建設,生物樣本資源庫的一期工程已經完成,已達100萬樣本存儲能力。二期工程于2017年10月完工,達到1 000萬樣本儲存能力。該項目三期工程啟動在建,預計總投資3~5億元人民幣,樣本儲存量達到5 000萬[18]。2007年,復旦大學與江蘇泰州開展全面科技合作,在中國醫藥城建立了復旦大學泰州健康科學研究院,以泰州500萬常駐人口為中國人群的代表人群,以其中35~65周歲的城鄉社區居民作為研究對象,關注中國人群高發的多種慢性疾病(如心腦血管疾病,多種代謝性疾病,消化道腫瘤等),到目前為止,已建成約20萬人的社區健康人群隊列,并建設了與之相配套的大型隊列樣本庫,庫存約150萬份,種類包括血液、唾液、齒縫菌、尿液、大便及固體組織樣本等[19]。
3.1 國外人類干細胞庫建設現狀 世界骨髓庫(The World Marrow Donor Association,WMDA)建立于1994年,總部位于荷蘭萊頓市。WMDA是一個志愿組織,各國骨髓庫都可以自愿參加,旨在消除跨國查詢、捐獻和移植的障礙,讓各國骨髓庫交流、討論和共同發展。截至2016年8月底,WMDA由50個國家的74個骨髓庫和36個國家的57個臍血庫組成。據最新的2016年年報,其臍血庫中共保存臍血70萬余份,2016年增加臍血存儲3.6萬份,人類淋巴細胞抗原(human lymphocyte antigen,HLA)-A、HLA-B以及HLA-DR型干細胞捐獻者達到9 400多萬,其中捐獻數量超過100萬的國家為美國、中國、德國、波蘭和英國5個國家[20]。
美國骨髓庫是WMDA里最大的骨髓庫成員,1986年成立,至今已有700多萬名志愿者,捐獻方式有骨髓捐獻和外周血造血干細胞捐獻,每年的捐獻量為4 000多例,截至2016年底已完成8萬多例骨髓移植供給[21]。
德國骨髓庫于1991年建立,是WMDA里規模第二大的骨髓庫成員,截至2018年2月,共有796萬名志愿者,向6萬多名患者提供了骨髓[22]。
英國干細胞庫由英國醫學研究理事會于2003年耗資900萬英鎊建成,是全球第一個干細胞庫,它的建設目標是收集全球所有的細胞系,并提供給科研人員開展研究,目前已存儲了24個可供研究的細胞系[23]。
澳大利亞生物平臺下的干細胞數據庫項目由澳大利亞研究理事會于2012年投資建立,研究人員將通過該項目與澳大利亞的其他研究人員、組織和行業實體合作,并開展國際合作,其中,已開展合作研究的機構包括:美國的哈佛干細胞共同研究中心和加州干細胞研究所,加拿大的Lunenfeld-Tanenbaum研究所,英國Sheffield大學,日本京都大學和理化學研究所以及荷蘭Leiden大學。2016年,英聯邦政府國家合作研究基礎設施戰略也為澳大利亞生物平臺下協作性多能干細胞數據計劃捐款了100萬美元用于干細胞數據庫建設[24]。
越來越多的干細胞庫成為WMDA的一員,成為其聯盟成員,可以更好地滿足干細胞需求者的移植需求,更有利于資源庫的標準化建設,英國干細胞庫則注重細胞系儲存的的全面性。
3.2 國內人類干細胞庫建設現狀 中國造血干細胞捐獻者資料庫(China Marrow Donor Program,CMDP),簡稱“中華骨髓庫”,它的前身是1992年經衛生部批準建立的“中國非血緣關系骨髓移植供者資料檢索庫”,截至2017年底,CMDP捐獻造血干細胞采集量突破7 000例,登記有240多萬造血干細胞志愿捐獻者。據最新的CMDP 2016年報,CMDP總庫容已超過234萬人份,數據更新并上傳至WMDA數據庫,在庫參與檢索庫容量達99萬人份,累計為臨床提供造血干細胞6 198例,其中向國(境)外捐獻247例。2016年全年,為臨床提供初次檢索查詢服務8 590人次,接受復查申請2 888人次,通過WMDA網站為臨床提供錯配檢索1 356人次;年內完成造血干細胞捐獻828例,同比提升19%,其中向國(境)外捐獻24例[25]。
中國干細胞信息平臺下包括北方、南方、華東和中科院4個干細胞資源庫,截至2017年9月,北方干細胞庫已存儲有不同物種的多能干細胞、成體干細胞及體細胞673株,并建立了臨床級的人胚胎干細胞、成體干細胞及體細胞26株;南方干細胞庫利用已建立的高效穩定的誘導性多能干細胞(induced pluripotent stem,iPS)技術平臺,建立了羊水、臍帶、骨膜、尿液、皮膚、牙周膜、牙髓、牙齦等不同組織來源的iPS細胞系,以及地中海貧血、脊髓性肌萎縮、特納綜合征、肝豆狀核變性、系統性紅斑狼瘡、家族性出血性腎炎、血友病、帕金森、唐氏綜合征等疾病的iPS細胞系,總計超過50種;華東干細胞庫建立并儲存了人胚胎干(embryonic stem,ES)細胞株、疾病患者iPS細胞株、大鼠ES樣細胞株、小鼠ES細胞株、小鼠iPS細胞株、小鼠孤雌干細胞株等,總計約40株。同時,對所建的干細胞系進行了系統的鑒定,其中ShhES2和ShhES3 2株Hesc細胞系完全符合國際標準,已通過檢驗并被收入英國干細胞庫的總庫。中科院干細胞庫已收集、保存了100余種各類胚胎干細胞、iPS細胞、成體干細胞、間充質干細胞和其他細胞系,總庫容超過1萬株[26]。
4.1 資源庫應建設統一的信息管理系統 近年來我國人類生物戰略資源庫的信息化建設不斷取得進展,但尚未形成統一的信息管理系統,不同存儲資源的庫之間信息共享機制并未建立。資源庫的信息化建設是其資源利用避免成為“死庫”的關鍵進程,成熟的信息管理系統能夠對庫中存儲的核酸、細胞以及生物樣本等實現包括搜索、保存、分析和管理等功能。采用分布式架構的信息管理系統,針對不同的專業資源庫進行不同功能權限的設置,主系統則提供公共計算服務。
4.2 資源庫的建設應進行合理規劃 國內各地人類生物戰略資源庫建設如火如荼進行,如2001年天津協和干細胞庫正式運營、2009年北京市科學技術委員會啟動“北京重大疾病臨床數據和樣本資源庫項目”等,而在什么樣的自然以及社會環境的地點建設資源庫,建設什么類型的資源庫,多大規模的資源庫才能滿足當地人民的健康需求等諸如此類的問題都需要當地政府甚至是國家層面根據當地人口密度、存儲地自然環境、醫療科研需求以及人民健康需要進行合理規劃。
4.3 建立完善的安全機制 人類生物戰略資源是當前國際生物技術及其產業發展競爭的焦點,國外研究機構以科研合作的名義獲取國內基因資源的事件屢見不鮮,因此在資源庫建設過程中資源以及信息的安全保護機制必不可少。在管理系統建設方面通過設置身份認證、對不同身份用戶設置不同權限、使數據發送后不可抵賴的不可否認性、保證數據的完整性以及對數據進行加密等方式保護信息數據的安全,同時對管理人員進行規范培訓。在資源儲存方面通過入庫之前進行微生物檢測等保證資源質量、建立起一套資源庫管理標準來規范人類生物資源從采集到入庫以及儲存過程中的管理與質控。
4.4 提高資源庫資源供給與利用能力 建設資源庫的目的就是利用資源,國內目前很多商業用途甚至公益用途的生物樣本庫僅僅提供存儲服務,致力于延長存儲時間,但從科研人員的角度出發,存儲的目的是用于科研,過長時間的存儲并不是建資源庫的主要目的,而應該是資源的供給和分析利用。與國內的超算中心如天津中心、廣州中心以及深圳中心等建立合作,利用其計算能力結合自身存儲資源的特點開發科研平臺提高資源庫的資源數據分析利用能力,這不僅可以輔助科研,更能更好的滿足人民的健康需求和支持相關產業發展。
4.5 建立資源庫聯盟整合現有資源 在已有的人類生物戰略資源庫的基礎上搭建資源庫聯盟,以資源庫之間的信息整合為主線,為資源庫信息的共享、科研協作、人才交流以及標準支撐提供平臺。比如WMDA、CHTN、BBMRI等聯盟組織就致力于打造合作平臺,提供信息共享、分析等功能,越來越多的資源庫加入聯盟,為人類健康事業的發展貢獻力量。
我國擁有豐富的人類生物戰略資源,盡管國內人類生物戰略資源庫的數量以及規模也在不斷擴張,存儲的資源質量也在不斷提升,但通過了解對比國內外資源庫的建設現狀,發現國內尚缺乏統一的管理和規劃,質量提升的同時也應配套規范的標準。因此,在不斷加快資源庫的建設規模的同時提供高質量的資源,科學規范的管理資源、快速安全的共享資源以及保證資源庫的可持續性,是我們亟待解決的問題。