999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

醫學大數據與人工智能標準體系:現狀、機遇與挑戰

2021-10-12 00:39:40張知非楊鄭鑫黃運有詹劍鋒
協和醫學雜志 2021年5期
關鍵詞:標準

張知非,楊鄭鑫,黃運有,詹劍鋒

1首都醫科大學生理學與病理生理學系,北京 1000692中國科學院計算技術研究所,北京 1000863廣西師范大學計算機科學與工程學院,廣西桂林 541001

醫學造福于人類的發展歷史,在某種意義上就是一部“醫學標準化”的歷史。近年來,隨著醫學大數據和人工智能(artificial intelligence,AI) 在醫學領域的廣泛應用,迫切需要制定以下3類標準:(1)訪問、存儲和共享醫學大數據的數據標準;(2)設計醫學任務和數據集用于測試醫學AI能力的測試基準(benchmarks);(3)使用和評價醫學大數據和AI的行為規范(codes of practice)。這在擴展醫學標準內涵的同時,在理論基礎、倫理道德和技術風險方面均帶來一系列挑戰,要求我們必須結合醫學、計算機科學和計量學重新審視和完善當前的醫學標準體系。

1 醫學大數據與AI標準的內涵

醫學大數據和AI領域相關的醫學標準大致分為兩類,第一類是計量標準,包括標準方法、參考物或參考標準[1- 2]。標準方法是用于實驗室和臨床檢測以及醫學服務質量評價的標準程序和方法。參考物或參考標準用于定義試劑和藥物的屬性、校準測試設備或驗證方法是否正確執行。第二類是規范性文件,包括標準規范、協議以及法規等[2- 3]。標準規范包括數據標準、術語標準和醫學信息系統標準,數據標準定義了數據及其存儲和傳輸的格式標準[4];術語標準包括結構化詞匯、術語、代碼集和分類系統;醫學信息系統標準用于定義醫學從業者,如醫生、護士、技師、研發人員,使用信息系統相互協作的工作方式與接口。協議在醫學和生物學領域大量使用,用來描述為了正確完成測量和程序必須嚴格遵守的詳細方法。法規是實施法律的規則,具有更強的約束力。

在醫學科學研究及醫學臨床實踐中引入大數據與AI相關科學技術后,包括數據、算法、系統及醫學從業人員在內的新的智慧醫學科學體系,極大豐富了醫學科學體系的內涵。其中算法是精確定義的一系列操作,通常包含輸入、輸出、有限性、確定性和可行性5種特性,是計算機處理信息的本質[5]。為推動醫學大數據與AI領域的發展,相應的標準體系亟待制訂。醫學大數據與AI標準體系應涵蓋醫學大數據相關標準、公共數據集、測試基準和行為規范4部分(圖1),各組成部分密切相關。

醫學大數據相關標準是采集、處理和使用醫學數據的標準,其推動了公共數據集的構建,而公共數據集又是制訂醫學標準的基礎。測試基準是用于評估醫學AI算法或系統有效性和安全性的標準及其工具實現,本質上是一種計量標準。測試基準通常包括評價指標、基準數據集、算法以及工具實現,基于統計學理論,公共數據集標準化后,可得到用于評價特定醫學任務的基準數據集。行為規范用于指導應用和評價醫學大數據和AI,明確倫理和責任邊界。

關于醫學數據的準入、質量控制和審核等相關標準,涵蓋在醫學大數據相關標準的定義和內涵中,篩除低質量甚至錯誤的原始數據過程在構建公共數據集這一醫學數據標準化流程中得以體現,即圖1中的第一個標準化步驟。此外,公共數據集在醫學相關標準的指導下,基于統計學理論,可得到基準數據集,這一過程體現為圖1中的第二個標準化步驟。

2 醫學大數據與AI標準的現狀

2.1 醫學大數據標準

醫學健康領域已積累了大量數據,然而受制于大數據管理與分析、隱私保護以及系統交互操作技術瓶頸等,醫學大數據在提升醫學服務質量、效率、創新潛能方面仍有待提升[6]。當前醫學數據標準化工作主要聚焦于醫學術語、數據格式與交換標準等方面。

國際上,醫學領域的數據標準和術語標準已相對成熟,這些標準為不同機構交流及醫學數據共享奠定了基礎。例如,ICD- 10是成熟的疾病分類標準[7];LOINC是標識檢驗醫學及臨床觀測指標的標準[8];SNOMED CT包含了一整套便于計算機處理的醫學術語[9];DICOM是醫療影像存儲和交換協議的標準[4];HL7是軟件應用之間傳輸和管理衛生健康數據的標準[10]。

我國醫學大數據標準化工作起步相對較晚,近年來相關機構和組織出臺了多項政策和標準以推動衛生健康信息的標準化建設。2016年國家出臺了《電子病歷共享文檔規范》[11],該文件包含57項與電子病歷相關的衛生行業標準。中國醫師協會于2020年底發布了《肝膽疾病標準數據規范:肝癌 CT/MRI 影像采集和處理標準》[12],是我國第一個肝膽疾病影像數據標準。

2.2 醫學AI標準

AI目前已應用于臨床醫學的各個階段,包括疾病的篩查/分診、診斷、預后、決策支持以及治療方案推薦等(圖2)[13]。2019年,我國國家藥品監督管理局制定了《深度學習輔助決策醫療器械軟件審評要點》,加強了AI醫療器械注冊申報工作指導[21]。2021年初,美國FDA發布了基于AI與機器學習軟件的醫療設備行動計劃,該行動計劃討論了基于AI技術的醫療設備審查與監管[22]。

2.3 公共數據集

ADNI(Alzheimer’s Disease Neuroimaging Initiative)公共數據庫包含阿爾茨海默病相關的臨床、影像、遺傳和生物標志物等數據[23],旨在針對阿爾茨海默病進行早期檢測和跟蹤。MIMIC(Medical Information Mart for Intensive Care)數據庫是重癥監護醫療信息相關數據集[24],包含生命體征、影像、人口統計學特征信息和診斷信息等,該數據庫便于科研人員開展智能重癥醫護技術的研究。TCGA(The Cancer Genome Atlas)數據庫存儲和管理關于癌癥基因組數據的各類信息,以構建癌癥基因組圖譜[25],該數據庫旨在提高診斷、治療和預防癌癥的能力。

然而,大部分公共數據集存在如下問題:(1) 數據存在患者群體偏向特征,目前公開數據集多無中國人群數據;(2) 數據整理繁雜,需要大量醫學領域背景知識;(3) 數據總量較少,難以滿足醫療和研究使用。

2.4 測試基準

AD DREAM Challenge是一套評價和預測阿爾茨海默病的測試基準,包含ADNI公共數據集以及相應的最新算法[26]。Christov等[27]提出了一套基于輸血過程的測試基準,該基準包含輸血過程定義、屬性或需求等內容。IICBU 2008是一套生物圖像分析的測試基準,提供了生物圖像數據集和一組生物成像問題實例,該測試基準可用于評價不同的生物圖像分析方法[28]。

已有的測試基準存在數據集單一、無法模擬真實臨床場景等局限性。目前仍缺乏一套受到廣泛認可且持續更新維護的測試基準,用于客觀評估和量化AI技術在醫學領域的應用能力。許多醫學 AI 技術在人工構造或選擇的單一醫學任務中達到了較高準確率,然而在真實場景中,醫學從業人員是在開放式的環境中處理開放式的問題,因而在特定和單一任務的測試基準上達到較高的準確率缺少實際意義[29]。

2.5 行為規范

AI技術的復雜、不確定和難以解釋等特性給醫學體系帶來了巨大風險。目前應用和評價醫學AI系統行為規范的研究仍然較少。當前的醫學指南大部分只關注規范和指導醫生本身行為,缺少對業界評價和使用AI技術的倫理、責任的行為規范。

SPIRIT-AI是一份評估AI干預的臨床試驗方案的規范指南,該指南的發表旨在提高AI干預臨床試驗方案的透明度和完整性[13]。此外,與SPIRIT-AI同步的還有CONSORT-AI,該指南針對臨床試驗報告制定了統一的標準規范,從而提高臨床隨機對照試驗(randomized controlled trial, RCT)的報告質量,減少RCT報告中重要信息缺失的情況[30]。

2.6 標準化

目前,針對相同的標準化主體(subject of standardiza-tion)存在多種不同的規范指南,不同組織和研究機構之間難以做到統一標準。另外,由于醫學從業人員的標準化培訓水平參差不齊,導致大量醫學數據的處理并不規范。這些問題使得現有的標準化成果難以充分發揮作用。

3 醫學大數據與AI標準的機遇與挑戰

醫學大數據與AI從不同方面增強了醫學從業人員、患者、醫學單位以及醫學界的能力,除需制訂醫學大數據與AI信息系統互聯互通標準外,醫學大數據與AI標準還存在如下機遇與挑戰。

3.1 機遇:在保護隱私的前提下促進創新

臨床醫學數據涉及隱私保護、數據所有權等問題。國內外對健康數據的安全和隱私有著嚴格的規定,代表性的規定有美國的《健康保險便攜性和責任法案》[31]和我國的《國家健康醫療大數據標準、安全和服務管理辦法》[32]《中華人民共和國數據安全法》[33]《中華人民共和國人類遺傳資源管理條例》[34]。然而具體實踐中,通常即使使用者完全按照相關標準和規范對臨床數據進行訪問和處理,醫學機構也不愿失去對數據資產的控制權,比如要求數據不出機構。

考慮到臨床醫學數據的價值以及涉及到的隱私保護問題,如何在保證數據安全和機構數據資產所有權的前提下訪問數據并促進創新是重要的課題。國際測試委員會(BenchCouncil)發布的聯邦學習測試床FLBench是解決這一重大挑戰的起點。FLBench可用于幫助研發人員研發、校驗以及評價算法和系統[35]。目前該測試床已包含超過2600名受試者的數據,包括醫學問卷數據、臨床量表數據、臨床試驗數據、生理數據、血液檢測數據、腦脊液檢測數據、尿液檢測數據、醫學影像數據以及基因數據。同時可公開訪問的系統提供了場景配置功能,可根據系統提供的配置文件組合以上數據,構建多種阿爾茨海默病相關的篩查及診斷場景,并作為AI算法或模型信息輸入使用。目前系統已經預設了6個配置文件:3個單機臨床醫學場景和3個聯邦學習臨床醫學場景。另外,研究人員可通過調整配置文件定義臨床場景,用于開發及驗證臨床AI算法及產品。

3.2 挑戰

3.2.1 醫學大數據標準的挑戰

在醫學大數據標準方面,國內外科研人員相繼發布了多項規范性文件,使海量醫學大數據的管理和獲取變得更加便捷。然而,醫學大數據的來源和類型通常是多樣和異質的。例如,電子健康記錄數據集具有數千個特征維度,包含患者人口學特征、診斷過程、治療過程、隨訪等內容[36],涵蓋包括圖像、文本、結構化或非結構化的數據類型。以阿爾茨海默病為例,臨床醫生和研究人員需收集臨床、遺傳、影像和生化生物標志物等多種不同類型的數據[23]。

海量的多源異質性數據增加了從業人員的認知難度。此種情境下,數據存儲和處理系統需要集成不同的數據源和數據類型,而目前已有的數據標準和相應的數據處理系統主要針對相對單一的任務數據源進行設計和開發。考慮疾病分類和醫學數據的多樣性,針對特定領域和特定疾病的多源異質數據,制訂綜合的醫學大數據采集、處理和使用標準,基于此類標準開發新的綜合系統,是目前醫學大數據和AI領域亟待解決的問題[29]。

3.2.2 測試基準的挑戰

與傳統計量標準相比,測試基準相對抽象。目前測試基準在測量條件構造、隨機度估計和校準方面還缺少堅實的理論基礎。例如,我們無法從理論上計算測試基準評價特定醫學AI任務的精度和隨機度,更難以開展計量溯源(metrological traceability)的分析。只能通過實際測試獲得精度和隨機度的估算,其結果依賴于特定的基準數據集。我們必須從計算機科學和計量學的角度重新審視當前的測試基準基礎理論,發展科學和公允的測試標準。

臨床問題通常具有不確定性和開放性,目前的測試基準往往針對特定單一任務,與實際的臨床應用存在巨大鴻溝。在臨床診斷領域,大多數AI技術僅針對單一疾病進行診斷,而在真實的臨床診療場景中,常見的共病現象使得大量AI技術瞬間喪失診斷能力[37]。在智能醫學領域,由于疾病分類的多樣性、臨床醫生研究任務的復雜性以及醫學大數據的多源異質性,構建全面且公平的測試基準十分具有挑戰性[29]。一個理想的測試基準必須保證數據的多樣性以及算法評價體系的完備性。

3.2.3 行為規范的挑戰

目前,對AI模型的機理仍缺少足夠的認識,其結果缺少可解釋性,難以明確責任邊界。目前應用和評價醫學AI系統行為規范的研究亦缺失嚴重。未來需制定相應標準乃至相關法規,明確醫生、管理者和新技術之間的職責,明確應用這些新技術倫理準則、邊界條件以及產生負面行為的責任邊界。

在傳統醫學領域,RCT研究是衡量醫療技術的金標準。RCT廣泛用于醫學領域某種技術或藥物有效性的評估和檢測。隨著AI技術在醫學領域的應用,傳統RCT標準需要加以改進和完善。目前只有2項已發表的研究針對醫學影像診斷任務將深度學習算法與臨床醫生進行了比對,幾乎所有的AI系統應用均未在臨床RCT中進行廣泛的測試[38]。AI技術在醫學領域的主要問題是泛化能力,即便是RCT也無法很好地評估這一點[39]。隨著應用范圍的擴大、應用場景的變化,AI技術在RCT中的測試效果可能會越來越與真實結果相背離。因此,當AI技術應用于醫學領域后,傳統的RCT研究不再適用于評估新興的智能醫學技術,如何制訂新的評價標準與規范是目前面臨的一項挑戰。

盡管當前的醫學AI技術研究已經到了白熱化階段,但關于醫學AI評價指標及算法設計標準的研究仍較少。Huang等[37]和Parikh等[40]探索性地以臨床結局以及患者收益作為評價醫學AI系統的指標,Rivera等[13]和Liu等[30]同時發布了醫學AI算法的臨床實踐指南,規范了醫學AI算法開發及驗證中的各個步驟。上述研究呼吁研究人員從臨床角度出發,以臨床研究中已有的生物統計方法學標準為參考,擴展醫學AI算法的設計標準及評價指標。

3.2.4 標準維護的挑戰

標準化是一項耗費人力和時間的工作。隨著智能醫學領域的快速發展,標準和測試基準需要被妥善更新和維護。在保證維護效率的前提下,降低維護成本是一項重要課題。

針對新興的智能醫學技術制定相應的數據標準和評價標準極具挑戰性。隨著醫學領域的不斷發展和進步,新興的醫學數據類型可能應運而生,傳統的醫學數據類型也可能被舍棄。因此,醫學數據標準需要隨時應對新的變化。

測試基準的快速更新迭代也是一項重大挑戰。智能醫學領域具有數據驅動和快速迭代的特點,測試基準必須及時更新基準數據集,增加最新的算法。目前大多數AI臨床應用都使用監督學習的方法,隨著無監督學習方法和自監督學習方法不斷引入智能醫學領域,需要不斷更新和升級算法。

4 醫學大數據與AI信息系統未來架構

未來,隨著信息技術的進一步發展,結合大數據與AI增強的醫學信息系統將進一步落地,因此筆者大膽提出了以醫學科學大裝置、大數據和AI賦能的醫學信息系統為核心的標準架構(圖3)。醫學科學大裝置作為公共醫學基礎設施,是推動醫學大數據與AI發展的重要工具,其獨立于各個醫學機構,主要向外提供五大功能:(1)醫學AI模型訓練和融合服務;(2)計算資源服務;(3)關鍵數據存儲服務;(4)測試基準自動維護服務;(5)AI醫療器械注冊審查服務。醫學科學大裝置將在隱私保護和AI資源共享、關鍵數據長期安全存檔、測試基準和AI醫療器械注冊審查、私有信息系統互連互通等方面發揮積極作用。

圖3 醫學大數據與AI信息系統新架構

除提供傳統的醫學信息系統功能外,大數據和AI賦能的醫學信息系統將充分利用大數據和AI提升醫學資源利用率和醫學服務質量。典型的應用包括針對慢性疾病的個性化健康大數據系統[41]、用于糖尿病患者視網膜病變篩查的IDx-DR系統[42]以及冠脈血流儲備分數計算軟件[43]等。

當然,信息安全保護在醫學大數據與AI信息系統新架構下仍應得到充分重視。一方面,應提高系統安全性,防止新系統受到外部攻擊導致信息和數據泄露;另外一方面,傳統的信息安全保護和新興的聯邦學習等技術應得到恰當使用,確保各機構信息資源及用戶隱私得到保護。

作者貢獻:張知非負責撰寫、修訂論文;楊鄭鑫和黃運有負責檢索文獻,撰寫論文;詹劍鋒提出選題思路,并撰寫、審校論文。

利益沖突:無

志謝:感謝湯飛和康國新博士研究生參與本文調研。

猜你喜歡
標準
2022 年3 月實施的工程建設標準
忠誠的標準
當代陜西(2019年8期)2019-05-09 02:22:48
標準匯編
上海建材(2019年1期)2019-04-25 06:30:48
美還是丑?
你可能還在被不靠譜的對比度標準忽悠
一家之言:新標準將解決快遞業“成長中的煩惱”
專用汽車(2016年4期)2016-03-01 04:13:43
2015年9月新到標準清單
標準觀察
標準觀察
標準觀察
主站蜘蛛池模板: 日韩最新中文字幕| 国产在线八区| 毛片国产精品完整版| 一个色综合久久| 色婷婷天天综合在线| 欧美国产中文| 五月天天天色| 亚洲一级毛片免费观看| 日本在线亚洲| 九九热视频精品在线| 91成人免费观看在线观看| 99草精品视频| 91在线高清视频| 亚洲愉拍一区二区精品| 欧美精品导航| 白浆免费视频国产精品视频 | 日本道中文字幕久久一区| 99久久精品免费看国产电影| 欧美丝袜高跟鞋一区二区| 亚洲国产成人综合精品2020 | 日韩成人在线网站| 在线观看精品自拍视频| 午夜a视频| 成人蜜桃网| 国产在线观看一区精品| 国产性生交xxxxx免费| 亚洲国产日韩欧美在线| 国产欧美日韩va另类在线播放 | 色偷偷一区二区三区| 美臀人妻中出中文字幕在线| 亚洲精品无码在线播放网站| 久996视频精品免费观看| 欧美亚洲另类在线观看| 无码网站免费观看| 亚洲人在线| 成人福利在线视频| 无码 在线 在线| 国产青青草视频| 国产av剧情无码精品色午夜| 中文字幕亚洲精品2页| 国产乱人免费视频| 老司机aⅴ在线精品导航| 日韩欧美一区在线观看| 久久99热这里只有精品免费看| 久久午夜影院| 久久精品免费国产大片| 国产精品久线在线观看| 亚洲大尺码专区影院| 国内黄色精品| 成人av手机在线观看| 亚洲看片网| 老色鬼久久亚洲AV综合| 亚洲中久无码永久在线观看软件| 日韩精品无码一级毛片免费| 91精品国产自产91精品资源| 亚洲日韩AV无码一区二区三区人| 全部毛片免费看| 国产午夜小视频| 91小视频在线| 国产超薄肉色丝袜网站| 高潮爽到爆的喷水女主播视频| 中文字幕天无码久久精品视频免费 | 亚洲AⅤ综合在线欧美一区| 精品国产一二三区| 婷婷综合色| 欧美成人精品一级在线观看| 国产在线八区| 视频一本大道香蕉久在线播放 | 国产在线啪| 欧美a在线看| 综合五月天网| 九九热免费在线视频| 免费a在线观看播放| 久久综合丝袜长腿丝袜| 永久免费无码日韩视频| 国产成人a在线观看视频| 国产成人精品男人的天堂下载| 国产91精选在线观看| vvvv98国产成人综合青青| 亚洲精品桃花岛av在线| 亚洲IV视频免费在线光看| 亚洲午夜综合网|