孟祥峰,王 浩,張 超,李佳戈,李靜莉
(中國食品藥品檢定研究院醫(yī)療器械檢定所,北京 102629)
當(dāng)前,我國醫(yī)學(xué)人工智能產(chǎn)業(yè)得到快速發(fā)展,審評、審批制度改革持續(xù)推進,且近些年陸續(xù)出臺了多個相關(guān)醫(yī)學(xué)人工智能的審查指導(dǎo)原則[1-4],國內(nèi)外也有多種針對不同數(shù)據(jù)模態(tài)和疾病的產(chǎn)品上市或進行研究[5-9]。在評價方面,人工智能醫(yī)療器械標(biāo)準(zhǔn)化技術(shù)歸口單位起草了多個標(biāo)準(zhǔn)并公開向社會征求意見[10-13],但醫(yī)學(xué)人工智能產(chǎn)品檢測手段目前還滿足不了實際需求,產(chǎn)品上市前的算法評價主要依賴臨床確認,人力、物力成本投入較大。即使臨床機構(gòu)已經(jīng)建立了數(shù)據(jù)庫和操作平臺,但如果沒有按照標(biāo)準(zhǔn)要求對數(shù)據(jù)標(biāo)注、數(shù)據(jù)庫質(zhì)量和算法等開展質(zhì)量評價,所開發(fā)的人工智能產(chǎn)品也很難滿足臨床使用要求。醫(yī)學(xué)人工智能產(chǎn)品檢測是統(tǒng)一生產(chǎn)與監(jiān)管評價標(biāo)準(zhǔn)、顯著降低企業(yè)成本、縮短產(chǎn)品上市周期、支撐新興產(chǎn)業(yè)發(fā)展的必要舉措,然而醫(yī)學(xué)人工智能產(chǎn)品檢測服務(wù)目前還普遍存在局限性,比如以單一病種為維度的標(biāo)準(zhǔn)數(shù)據(jù)集建設(shè)無法滿足多目標(biāo)、多用途產(chǎn)品的檢測需求;業(yè)內(nèi)很多公司嘗試自行開發(fā)檢測平臺來滿足中試加速和針對性調(diào)優(yōu)的需求,導(dǎo)致重復(fù)投入、方法不一、數(shù)據(jù)集質(zhì)量和產(chǎn)品指標(biāo)缺乏可比性,大大影響了我國新興醫(yī)學(xué)人工智能產(chǎn)業(yè)的創(chuàng)新發(fā)展。
以往人工智能產(chǎn)品的檢測模式多為局部的、分散式的模式,從數(shù)據(jù)集創(chuàng)建、數(shù)據(jù)標(biāo)注、數(shù)據(jù)質(zhì)控、測試集生成到產(chǎn)品性能評價[14-16]的各個環(huán)節(jié)相互孤立,不同機構(gòu)建立的數(shù)據(jù)集兼容性、可比性難以控制。……