◎ 文/周海淑
大數據時代的需求、計算技術的進步推動生物統計學進入了一個前所未有的發展時期。大規模基因組測序、蛋白質組學或代謝組學等研究、醫療電子健康記錄等都使得生物數據飛速增長,而要從這些海量的數據中獲取有用的信息,轉化為知識,生物統計學便可以大顯神威。
何為生物統計學?
生物統計學是一門結合統計學、概率論、數學和計算的方法來提高我們對生物醫學學科理解的學科(Zelen, 2006),是對生物醫學數據進行分析、測量、控制和解釋不確定性的一門科,其目的是科學地設計試驗,并對所得試驗數據進行分析,達到減少試驗次數、縮短試驗周期、迅速找到最優化的試驗方案或數學模型的目的。近年來,隨著人們在醫學、制藥學等領域研究的不斷深入,越來越多的科學問題需要以量化研究依據作為支撐。生物、醫學等學科由實驗科學走向實用科學時都離不開統計學。隨著互聯網時代的到來,大數據的盛行,生物統計學正日益廣泛地應用于醫學科學研究中,為醫學研究提供了手段和方法,是醫學研究不可分割的部分。
2015 年8 月在美國華盛頓州西雅圖市召開了聯合統計會議(Joint Statistical Meeting, JSM)——JSM 是全球最大統計盛會之一,由美國統計協會(ASA)舉辦,內容涵蓋統計理論及其方法在各領域的應用。在為期6 天的會議中共發表了近千篇關于生物統計學研究的報告,涉及老年學、醫學圖像學、基因組學、臨床診斷學、流行病學等多個分支,由此可見生物統計學越來越受到研究者以及產業界的重視。
隨著應用領域不斷深化,統計方法的應用水平不斷提高,生物統計學目前已深入到醫療及公共衛生的各個領域并廣泛應用在諸多方面:(1)臨床試驗方面,從試驗開始到結束,很多工作涉及生物統計,包括試驗的設計、數據管理、撰寫統計分析計劃、統計分析與解釋、協助完成臨床試驗報告等;(2)生物醫學數據的因果推斷方面,因果推斷是生物醫學領域一個重要且富有挑戰性的問題。在評估新的干預措施與治療效果因果效應時,隨機試驗是公認的金標準設計。但是,在實際的隨機試驗過程中,常常不能很好地按照計劃實施試驗,存在違背隨機化的情況(比如截斷死亡、非依從性、缺失數據),即存在被破壞的隨機試驗。在被破壞的隨機試驗中,常規的統計學方法不再有效,需要采用新的統計方法來處理被破壞的隨機試驗中因果效應的估計問題;(3)精準醫學方面,個體化治療方案選擇是現代醫學研究中最關注的熱點問題之一。患者需要根據自己的病情選擇最優的治療方案,醫生也需要根據各治療方案的特點針對最適宜的患者進行個體化治療。最優個體化治療方案選擇的臨床經驗的設計和分析需要生物統計學;(4)健康醫療大數據分析方面,健康醫療大數據是新時代重要的基礎性戰略資源之一,其應用發展將推動健康醫療模式的革命性變化,有利于擴大醫療資源供給、降低醫療成本、提升醫療服務運行效率,將對我國經濟、社會、科技和人民生活生產等產生重大而深遠的影響,具有巨大發展潛力和商業價值,健康醫療大數據的正確分析需要生物統計方法。以上種種,使得生物統計學日益成為現代醫學研究中不可分割的一部分。
在這樣的機遇面前,國外生物統計學科發展迅速,且影響深遠。國際上的知名醫學院、公共衛生學院的生物統計學均為重點學科,實力雄厚。比如美國新聞(US News)排名前10 位的公共衛生學院中,生物統計學系規模最大的聘用了60 多名教師。《新英格蘭雜志》亦將生物統計學的貢獻列為近500 年醫學領域排位第四的里程碑式重大事件。運用大數據加強與醫療技術、產品、服務和群眾健康需求對接,有助于促進健康產業發展,釋放健康消費潛力。由于健康醫療大數據主要包括醫療機構的診療數據、醫療費用數據、公共衛生與疾病監測數據、自我健康管理數據、網絡數據等,因此具有數據量大、數據類型和結構復雜等特點,這使得生物統計學研究也面臨著海量數據、非隨機數據及極小樣本數據等挑戰。
值得正視的還有,相較于國外,國內生物統計學科作為一門獨立的學科而言,其規模和學術地位仍顯不足,這一問題日益突出:我國的生物統計學在學科體系中尚沒有明確的位置。生物統計學在中國一直以來都被稱為“衛生統計學”(health statistics),隸屬于預防醫學下,教學著重于統計方法學在公共衛生領域的應用。目前我國培養出來的衛生統計學人才較偏重于應用,缺乏統計方法學的研究及數學背景,在新的統計方法研究上較難趕上國際生物統計學的水平。此外,國內生物統計學科與醫學研究結合尚不夠緊密。醫學研究需要大量生物統計人員的參與,而目前專業的生物統計學人才缺乏,因此限制了國內醫學研究的發展。綜上,國內生物統計學在學科成熟度、學科功能及專業定位方面還存在不少誤區,這些成為國內生物統計學發展道路上迫切需要解決的問題。
為促進國內生物統計學科的發展,縮小與國外先進國家的差距,在北大醫學部醫學和公共衛生研究的基礎上,結合數學科學學院、北京國際數學研究中心在數學和統計理論方法研究上的優勢,由北大校本部和醫學部共同建立了一個跨學部、跨院系、新體制的生物統計系,以助力北大“雙一流”建設,探索生物統計方法學在轉化醫學、精準醫學、大數據研究等領域的應用。2018 年11 月16 日,北京大學生物統計系成立,首屆系主任由國際知名的生物統計學家、國家“千人計劃”特聘專家周曉華教授擔任。新成立的生物統計系隸屬于公共衛生學院,由數學科學學院和北京國際數學研究中心共建,是國內第一家在綜合性大學成立的生物統計系,也是第一個跨數學科學,醫學及公共學科的生物統計系,將對提高我國生物統計專業人才培養的質量、促進多學科交叉和融合等,產生重要的現實意義和長遠意義。
在北大成立生物統計系的儀式上,周曉華教授在致辭中介紹,在未來發展方面,北大生物統計系將立足中國,面向全球,有效整合北京大學及國內外各種優勢資源,致力于使生物統計學科進入國際一流學科的行列,以“改革創新、科學發展”為主線,優化學科整體布局,增強學科內源創新能力與可持續發展能力,加強創新人才培養、推進學科交叉,實現整體建設的全面、協調、可持續快速發展,努力建設既能從事統計方法學研究又能將其應用在醫學科學及公共衛生學研究的人才的國家級培養基地,促進醫學研究發展和統計學發展的研究基地的盡快落成。
北大生物統計系將充分結合北大數學科學學院及北京國際數學研究中心在數學和統計理論方法的優勢,以及北大醫學部在醫學和公共衛生研究上的優勢,全力促進生物統計學科的發展。在培養生物統計專業人才、建立健康研究的協作中心、生物統計方法學的研究和探索方面持續努力,同時加強與臨床醫學、數學等學科的聯合,探索生物統計方法學在轉化醫學、精準醫學、大數據研究等領域更廣泛的應用。
21 世紀是生命科學的世紀,而要對生命現象揭示得越深刻越徹底,需要運用的統計學知識就越多。正在突飛猛進的生命科學無疑將在大統計學理論與方法的推動下更加深刻地揭示出生命現象的本質,生物統計學將成為研究生命科學不可缺少的重要工具,引導我們更好地探索生命的奧秘,把人類對生命世界的認識提高到一個新水平。千帆競發,百舸爭流,中國生物統計學的新篇章已經開啟,周曉華教授帶領的北大生物統計系研究團隊正以切實的行動實踐著他們的愿景和發展理念,不斷締造新的傳奇。對未來,我們充滿希冀。