黃鵬杰,林勇,張夢歡,呂琳,劉振浩,裴瀟倜,許林鋒,,謝鷺
1.上海理工大學醫療器械與食品學院,上海200093;2.上海生物信息技術研究中心,上海201203;3.中國科學院分子細胞科學卓越創新中心,上海200031
腫瘤藥物敏感性預測研究是精準醫學的重要分支。當前,腫瘤精準醫學不斷發展,基于生物標志物和臨床病理特點的抗腫瘤靶向治療方法得到普遍應用[1]。在合適的時間對不同癌癥患者采取個性化預防、治療和用藥指導,能使某些類型腫瘤的客觀緩解率和5年生存率均有較大程度提高,同時對癌癥病人的副作用比傳統方法小,這是精準醫學在腫瘤領域應用的成功典范[2]。
近年來,人工智能因為底層技術突破和海量數據驅動而不斷發展,而生物信息領域隨著第二代測序技術的發展產生大量的組學和藥物反應數據,將兩者結合能極大輔助腫瘤精準醫學的發展。基因組學研究不斷深入,大量研究表明腫瘤的產生、分化以及藥物治療和基因密切相關[3],通過基因表達譜來預測腫瘤藥物的敏感性應答成為當下熱點。Geeleher等[4]通過乳腺癌的細胞系和藥物數據,建立了以嶺回歸(Ridge regression)算法為基礎的基因表達和藥物敏感性的回歸模型;Menden等[5]利用CGP數據集,通過神經網絡算法來建立藥物應答預測模型;基于隨機森林算法,Riddick 等[6]利用NCI-60 數據訓練回歸模型來預測藥物敏感性;Gupta 等[7]研究了基于支持向量機和多種基因組類型的回歸方法。
這些方法不僅促進了癌癥藥物基因組學的發展,也為預測藥物敏感性提供了有效途徑,但當前研究缺少對大批量藥物和細胞系基因數據的有效處理,同時模型所采用算法不多且精準度還不夠高。……