晏丕松,項毅帆,李強,陳睛晶,林浩添
[1.中山大學中山眼科中心,眼科學國家重點實驗室,廣州 510060;2.云智道智慧醫療科技(廣州)有限公司,廣州 510080;3.中山大學醫學院,廣州 510080]
醫學人工智能研究的發展和智能醫療模式的興起,有望改善目前醫療供需不平衡的現狀,提高優質醫療資源的覆蓋率和可及性,為建立更全面、高效、精準的醫療服務模式和醫療改革提供可能。醫療大數據是醫學人工智能研究發展最重要的土壤,而數據的收集、存儲和管理一直是各研究項目的重中之重[1]。隨著數據體量不斷增加,數據的模態與屬性變得更為多樣、復雜,加上開展多中心研究的迫切需求,建立標準化數據中心對積累高質量的數據資源和推動醫學人工智能的發展極為重要[2]。
人工智能技術可對人類長期醫療實踐中產生的大量數據資料進行更大規模和更深入的分析,使珍貴的醫療信息資源得到更充分合理的利用,并可根據數據的類型和訓練任務,建立不同應用場景的人工智能醫療系統[3]。目前,醫學人工智能的研究發展迅速,針對不同疾病、不同任務的醫學人工智能系統層出不窮,實際使用方式和訪問途徑也缺乏相關的應用規范和統一管理。整合不同應用場景的醫學人工智能系統,搭建可滿足多種疾病診療需求的智能醫療云服務平臺,為患者提供智能醫療服務的統一訪問端口,無論是對增強智能醫療服務的可及性和安全性,還是提高智能醫療模式的管理效率,都具有重要意義[4]。
眼科作為醫療人工智能發展的領先學科,在人工智能數據中心的整合與標準化、人工智能系統的研發與智能服務云平臺的搭建等方面積累了豐富的實踐經驗和工作基礎[5-6]。本文以眼科為研究基礎,對眼科數據中心和智能服務云平臺的建設經驗進行總結分析,為眼科及其他醫學專科開展人工智能研究,建立數據中心和搭建智能服務云平臺提供參考。
眼科數據中心的建設內容,包括數據收集、錄入、整理、標注、擴展、備份、恢復以及分類數據中心的構建、數據中心的管理與維護等方面的內容,具體工作和管理流程如下。
明確數據中心的數據類型與不同類型數據的采集標準。眼科數據類型可分文字、圖像、視頻和其他4大類,所有數據應包括性別、年齡、檢查時間等基本信息,并與住院號或門診號相關聯。
第一,文字數據主要包括門診和住院病歷,健康體檢記錄等。第二,圖像數據主要包括裂隙燈顯微鏡、眼底相機、光學相關斷層掃描儀等眼科檢查設備產生的二維圖像和由計算機斷層掃描、磁共振設備等檢查設備生成的三維圖像,由不同儀器生成的圖像數據都應該分別以統一的格式和屬性(包括并不限于分辨率、對比度)存儲在數據中心。目前多數圖像數據為DICOM格式,DICOM不僅是圖像的存儲格式,還是不同成像設備產生的不同格式數據之間相互轉換的中間形式。第三,視頻數據主要為患者檢查過程錄像,可以由avi,rmvb等格式存儲,最好使用統一的格式編碼、視頻分辨率、視頻碼率和視頻幀率,同時在數據中心記錄其相應的保存路徑。第四,其他數據包括音頻,四維影像等醫學數據。所有數據類型應分別以統一的格式儲存,以便后期的整合與分析。
數據錄入包括紙檔記錄轉為電子記錄和直接電子記錄兩類。紙檔記錄轉為電子記錄需要逐樣本、逐項發現可能存在的記錄錯誤,在轉錄入時應避免出現誤差。直接電子記錄在檢查無誤后可將各數據結果直接轉入數據中心。
數據錄入需遵守以下原則:第一,搭建數據中心分類錄入平臺,實現數據按疾病、按診療項目、按數據類型分類錄入;第二,所有錄入的數據應該保持準確,由專人對錄入數據進行核實,如發現錯誤,應重新錄入并再次檢查;第三,錄入數據的過程應安全、保密,只能數據錄入者才有數據查看權限,特定的管理人員才可擁有數據修改權限;第四,對數據結果編碼可方便數據錄入、識別和分析。
數據整理包括數據清洗及缺失數據的處理。數據清洗是數據質量控制的起點,其本質是一個發現問題、解決問題的過程。清洗過程主要關注數據質量問題,包括相似重復記錄、不完整記錄、邏輯錯誤、異常數據等,并確定數據質量問題的性質及位置,對數據進行修正,并對數據修正過程歸檔保存。缺失數據的處理方法有刪除法、加權調整法、單一填補法、多重填補法,根據缺失數據的比例、類型和重要程度選擇相應的處理方法。
數據標注的目的是人工提取數據中所包含的信息,為后期數據分析,機器學習模型的構建打下基礎。數據標注流程及規范包括:第一,根據所需標注的數據類型確定標注方式,如圖像數據包括圖像分類、目標檢測、圖像分割,從而明確標注所需的軟件工具;第二,確定標注層級關系,在標注之前根據眼科學知識體系,確定不同標注標簽的層級關系,以網狀圖或者樹狀圖的形式表示;第三,確定標注標簽的統一標準,制定不同眼科疾病和不同病灶的標注模板,保證對同一眼科疾病、病灶、部位的相同標注。
在構建分類數據中心時需遵循以下原則:第一,所保存的數據需包含完整的樣本信息和標簽信息,且樣本和標簽信息一一對應;第二,所保存的數據按照疾病分類保存在相應的目錄下,并且為方便使用,每個目錄以及目錄下的每個樣本數據都應按照特定的方式統一命名,即通過當前目錄名字或者樣本名字,可以知道目錄或樣本的詳細分類情況;第三,所保存的每個分類需要有相應的說明內容,包括數據類型、數據數量、數據標簽獲得方式等。
數據擴展可分為存儲數據的擴展和數據中心的擴展。存儲數據的擴展較為簡單,只需將符合要求的數據添加到數據中心。當數據量增加到一定程度時,現有的計算機資源可能不足以保存和處理現有數據,從而需要對數據中心進行擴展。數據中心的擴展分為橫向擴展和縱向擴展,可分別通過增加服務器或升級現有服務器的配置實現。
建立一套科學高效的安全管理制度可提高數據利用效率、保障數據中心的安全。數據中心安全管理制度的內容應詳細規范各級操作流程、明確管理責任以及責任追究機制,防止出現由于工作態度、作風等因素引發數據中心安全事故。所以,安全管理制度應包含以下方面的內容:第一,明確數據平臺運行和安全管理的具體措施,如數據備份、數據加密、數據權限管理、數據傳輸安全、數據檢查等;第二,明確平臺管理責任,落實各級平臺運行維護管理人員的責任,建立追責和處罰制度;第三,建立安全應急預案,應對各類突發的數據平臺安全事故。
數據備份與數據恢復是數據中心信息安全的一個重要保障。為應對不同類型的數據丟失,多種數據備份策略極為重要。備份方式分為完全備份、增量備份、差分備份、按需備份等,可根據數據中心的數據情況和備份內容,按需采取多種策略搭配的備份方式。
基于眼科數據中心積累的數據資源,可以研發一系列眼科人工智能預測、篩查、診斷、治療、隨訪系統并進行臨床應用。將系統部署到服務云平臺,開放給患者、醫生和醫療單位,通過互聯網進行訪問的端口,提供相應的醫療服務。對提高眼科人工智能系統的服務效率、可及性、推廣眼科人工智能產品都具有重要意義[4,7]。
智能服務云平臺的建設包括一般智能服務云平臺的建設和基于互聯網醫院的智能服務云平臺的建設。一般智能服務云平臺的建設不需要依賴于實體醫療機構及互聯網醫院平臺,是比較常見的智能云服務形式。智能服務云平臺的系統架構可如圖1所示。1)用戶層:用戶包含但不限于社區服務中心等醫療單位醫務人員、幼兒園和中小學等學校單位醫務人員、后臺管理人員、大眾用戶(家長/學生)。2)展現層:根據不同的使用場景及用戶需求,可分為手機APP、平板APP、電腦PC、微信公眾號不同的應用形式。3)應用層:各系統功能模塊,包括診療系統、健康管理與服務系統、數據分析管理系統、后臺管理系統。可實現檔案管理、在線門診、遠程問診、一鍵轉診、健康教育、健康計劃、數據分析等功能。4)應用支撐層是基于分布式多層構架和組件技術構建,具有跨領域和通用性的特質。兼顧穩定性、伸縮性、安全性以及效率等方面的要求,保證系統完整性。做到統一標準、統一交換、統一管理、統一認證、互聯互通和資源共享。應用支撐層所提供的服務包括注冊服務、病歷調閱服務、影像查看服務等。5)數據資源層主要是實現各系統的數據存儲,需要解決數據存儲的結構、模型、內容、數據庫管理軟件的選型等。包括管理數據、業務數據、多媒體數據等。6)物理層主要指與系統對接的檢驗檢測設備,通過與系統間的對接,實現數據的實時傳輸。
眼科智能服務云平臺的部署可分為3級:家庭,學校和社區,基層和三甲醫院等醫療單位(圖2)。通過接口對接、網絡傳輸等方式,實現各系統之間的數據互通,從而實現“就診者-基層醫療機構-上級專家醫院”之間的業務協作和資源共享。并通過“診療設備-軟件系統-數據中心”之間的互聯互通,實現數據的管理和分析等需求。
該級智能服務云平臺的建設一方面要滿足家庭、學校、社區等場景下患者使用眼科智能診療系統的醫療需求,另一方面要滿足醫生可對智能診療系統的診療結果進行復核的工作需求。患者端的智能服務云平臺的建設形式包括實現基于移動終端瀏覽器、小程序、終端軟件等智能診療系統的訪問和應用[8]。患者在手機、平板等移動終端連接到智能服務云平臺,輸入年齡、性別等就診信息,對平臺上不同診療系統的功能進行選擇和使用。患者可以根據個人就診需求,選擇相應的功能并在智能系統的指導下輸入文字信息并上傳相應圖片信息,即可獲得相應的診斷結果和醫療建議。醫生工作端可以24 h對人工智能診療系統的診斷結果和診療建議進行復核,保證云平臺服務的質量和效率。

圖1 眼科智能服務云平臺的系統架構Figure 1 System structure of ophthalmic intelligent service cloud platform

圖2 眼科智能服務云平臺的應用架構Figure 2 Application structure of ophthalmic intelligent service cloud platform
該級智能服務云平臺的建設主要滿足社區和基層醫院為患者提供眼科相關智能診療服務的需求。部分基層和社區醫院缺乏相應的眼科檢查設備和眼科醫生,智能服務云平臺可以將眼科醫療資源下沉到基層醫院,建立適用于社區和基層醫院的眼科智能服務模式[9]。基層和社區醫院的患者和醫生可以將患者信息、檢查圖片、報告等上傳到智能服務云平臺,獲得相應的診療結果和醫療建議,輔助基層和社區醫院醫生開展診療活動,將優質眼科醫療資源賦能到基層和社區醫院。綜合醫院及專科醫院的醫生專家可對基層和社區醫院的智能診療過程進一步復核與確認,保證其決策的準確性和安全性(圖3)。

圖3 社區及基層醫院患者診療流程Figure 3 Diagnosis and treatment process of patients in communities and primary hospitals
該級智能服務云平臺的建設主要解決綜合醫院和專科醫院眼科患者眾多,眼科醫生的工作效率與患者醫療需求差距較大的問題[10]。將智能服務云平臺上相關的眼病診療系統與相關眼科圖像采集設備和成像系統相連接,患者在接受相應的眼科檢查后,可即刻在移動終端查詢診斷結果和治療建議,打通了部分檢查環節和診療咨詢環節之間存在的空間和時間壁壘,減少了醫生的工作負擔,提高了患者的就醫效率和就診體驗[11]。此外,基于實體綜合醫院和專科醫院的部署互聯網醫院智能服務云平臺,診療流程符合互聯網醫院的管理規范,以進一步提高智能服務云平臺的安全性和準確性。
現階段眼科數據中心和智能服務云平臺的建設存在兩大難點:1)各大醫院眼科數據中心建設關于數據整理及標注缺乏統一標準,各個眼科數據中心無法實現數據互通和資源共享,導致醫院間的“信息孤島”;2)優化智能服務云平臺建設框架,整合多維度眼科數據集,搭建多種眼病通用診斷的智能服務云平臺。
眼科數據中心和智能服務云平臺的建設有助于實現醫療數據資源的充分利用,開發出高準確性和普適性的醫學人工智能系統,并對智能系統進行統一整合、管理與推廣,保證智能平臺提供的醫療服務的準確性和安全性[12]。該模式可以在眼科專科以外的其他醫療專科進行推廣和應用,對于促進醫學人工智能系統的研發與普及,推動醫療模式的智能化改革,具有重要意義[13]。