馮婷婷
(蘇州大學附屬第一醫院 感染科,江蘇 蘇州 215000)
大數據是在社會生活各個領域不斷涌入的海量多源異構數據集合。從本質上來說,大數據的戰略意義是一種核心信息資產,其價值不在于數據量的多與少,而在于從看似閑置數據中挖掘出新的價值。近年來,大數據已然成為重塑傳統模式的革新型力量,國務院印發的《關于印發促進大數據發展行動綱要的通知》,把大數據提升至國家重要戰略。感染病臨床大數據是醫療大數據的重要分支。隨著各大醫院信息化建設的不斷推進,各類信息化應用系統已積累了龐大的臨床業務數據,涵蓋病患診治的全流程各環節,不論從數據資源量還是數據類型的多樣性上來看,感染病臨床大數據都有著良好的發展基礎。
感染病臨床大數據涵蓋了收費、病例、診療操作、藥物使用、化驗、X 光片、CT 影像、基因測序等,數據資源豐富且多源異構:在數據屬性上,其可分為靜態數據、動態數據、定期更新數據等;在文件大小上,其可分為超大型、大型、小型及碎片化文件等;在數據結構上,其可分為結構化、半結構化及非結構化數據;在數據來源上,其不僅源自信息化系統與紙質化辦公,而且隨著高科技公司推出的各式各樣的可穿戴式智能設備,由智能傳感器隨時監測的人體動態數據也將匯入大數據架構中去。從大數據技術應用場景看,感染病臨床大數據有著巨大的潛在價值。
(1)數據上的集成度不高。臨床數據具備海量、多源異構等大數據共性特征,對大數據的集成化管理是第一步,數據庫設計及數據遷移、采集、匯交、存儲尤為關鍵,現階段大多數醫院都沒有建設真正基于共享交換機制的大數據平臺,這就造成了大數據資產大多處于閑置以及分散存儲的狀態。
(2)管理上的細化度不夠。在臨床數據的管理上,需細化數據上傳、存儲、分析、安全防護等流程,并打造管理工具。在數據上傳上,需基于不同應用場景需求來定制上傳工具,解決數據上傳效率較低的問題;在數據存儲上,并解決海量數據轉儲擴容受限問題,需搭建分布式彈性分布架構,以滿足臨床數據的快速增長需求;在數據分析上,針對大量數據資源閑置且無法快速調動計算資源進行分析的現狀,需建立基于大數據的智能化分析架構;在安全防護上,需將大數據作為重要資產放在突出位置,從制度上來規范,從網絡、硬件、軟件等設施上來保障,并對數據資源進行篩選分類、優化存儲、資源訪問權限控制等以保障大數據資產安全。
(3)分析上的智能化不強。
在智能化應用上,應為臨床一線人員實現“數據拿得到”“數據用得上”“數據看得見”。首先需打通醫院各系統的數據鏈路,統一數據源管理標準與接入規范,研發高效采集工具;其次需將大數據治理、分析、共享的能力匯集在數據中臺,實現業務價值的極速分析。最后需通過機器學習洞察數據內在,挖掘高價值信息。
為應對上述不足,感染科臨床教學與大數據技術的結合將更多從人的培養、從內源動力上發揮重要作用。
(1)培養大數據的概念意識。教師應培養學生們具備大數據的概念意識,熟知大數據的內涵與外延,理解大數據的技術價值及其背后龐大的經濟與社會價值,洞察其與臨床研究應用、醫患服務模式改造、全民醫療服務應用、院企合作模式重塑等方面的高度內在關聯,讓學生們不論何時何處,都能第一時間意識到大數據應用所能帶來的改變。
(2)培養大數據的技術技能。教師需將大數據的技術架構、原理流程及其技術工具進行詳實的剖析,如跨平臺GIS、云端一體化、分布式、大數據存儲、大數據計算、空間可視化等技術,使得學生們可將大數據作為一項有效手段,將大數據與其自身的目標任務靈活予以結合,輔助自身的學習、科研、實習等工作。
(3)培養大數據的業務應用。教師需增強學生們使用大數據技術的主動性與技術能力。在大數據應用場景中,臨床科研無疑是重點。如針對某種疾病,基于臨床治療過程中的電子數據,通過大數據分析模型與算法,計算得到服務產品并輔助醫護人員臨床決策。
自2000年開始,國家要求在高等醫學院校設立全科醫學課程,為將來醫學生從事全科醫學工作打下基礎,到2020年,基本上實現全科醫生在城鄉配置上達到每萬居民有2~3 名全科醫生[3],為全面配合國家整體安排,促使全科醫學教育能更好地適應衛生事業需求,提高理論教學質量,積極探索全科醫學教學模式具有十分重要的意義[4]。作為其中的重要分支,對感染病科臨床教學模式的探索是非常必要的。
本質上說感染病臨床教學與大數據技術在目的導向上是完全一致的,在四個維度予以深度融合:
(1)數據。數據是基礎,通過構建一個可控的數據賦能平臺,有效實現內外部數據的集約統一,并建立標準化的數據交換接口,為大數據分析與場景應用提供前提。
(2)分析。分析是核心,基于大數據中心,并借助大數據計算引擎的超強運算能力,來協助教學過程中的統計分析工作,提升各個場景下的工作效能。
(3)場景。場景是支撐,借助教學過程中所積累的數據,設置各個業務使用場景并提供具體場景下的改進建議,完成經驗沉淀。
(4)創新。創新是目標,考慮全新的創新思維、創新理念、創新模式,堅持以數據創新帶動教育創新,實現臨床教育、大數據技術、應用場景的跨界碰撞與創新融合。
(1)感染病臨床教學與大數據接入技術。教師與學生們面臨的數據類別多樣,不僅包括感染病教學數據、臨床數據與科研數據,而且還包括傳統測繪的矢量數據、影像數據、傾斜攝影模型、BIM 模型、街景數據、點云數據等。學生們需熟練掌握各類數據的處理與接入技術,掌握數據處理平臺、桌面工程平臺、空間數據引擎、關系型及非關系型數據庫等基礎知識與操作技能,熟練操作多源數據的格式轉換、坐標轉換、誤差校正與平臺接入等,保證數據的正確性與完整性。
(2)感染病臨床教學與大數據存儲管理。針對上述已處理好的正確數據信息,需數據庫軟件進行存儲管理,同時需大數據引擎與數據庫軟件進行交互,教師與學生們由此可實現對各類數據的管理作業。數據庫包括關系型數據庫與非關系型數據庫,其中Postgres-XL、MongoDb 等非關系型數據庫支持分布式、彈性擴容、底層開源的技術路線,能更好匹配大數據應用環境,大數據引擎包括文件數據源引擎、分布式文件數據源引擎、數據庫引擎、分布式數據庫引擎和Web 引擎等。教師與學生們可根據使用需求,通過各個引擎調用空間數據及各類非空間業務屬性數據。
(3)感染病臨床教學與大數據分析計算。基于已集約存儲的大數據資源,教師與學生們更大的責任挑戰在于挖掘數據價值,使其真正服務于教學、臨床與科研工作。大數據分析計算能力主要是基于分布式計算框架,將多種格式的數據轉化為大數據分析的基本單元,基于空間索引對象實現性能優化,并以此作為輸入輸出條件進行多重空間與時間的分布式查詢和分布式分析操作。教師與學生們通過熟練使用各類大數據分析工具,可從空間、時間、屬性多個維度了解和認知大數據。
單就大數據分析計算的內容而言,其主要包括數據匯總、范圍匯總、區域匯總、屬性匯總、軌跡重建、要素連接等,教師與學生們需要深刻領悟并熟練掌握以上技術點:第一,數據匯總包括密度分析、聚合分析,密度分析用于計算每個點的指定鄰域形狀內的每單位面積量值,可得到指定屬性的聚集情況,聚合分析用于計算點的空間分布并進行屬性統計,不僅可設置格網、多邊形,而且也可設置多個屬性字段進行多種條件下的統計計算。第二,范圍匯總是通過疊加查詢,匯總統計某一范圍內要素的指標統計值。第三,區域匯總用于計算區域內的目標數目、長度或面積并進行屬性統計,不僅可直接匯總屬性值,也可將被統計對象相交部分作為權重,進行帶權重值的精細化統計。第四,屬性匯總用于對屬性信息進行分組統計分析,其輸入的大數據類型可以是點、線、面或純屬性大數據,支持設置多個分組字段,并支持設置多個統計字段。第五,要素連接是根據位置、時間和屬性信息,找到要素之間關聯關系,其支持屬性、空間、時間三種特性的匹配。第六,地圖匹配是動態匹配漂移的點到路網,其輸入大數據類型是點,關聯數據類型是路網。
(4)感染病臨床教學與大數據服務管理。在感染病教學過程中,教師與學生們需要將大數據資源、大數據計算分析的成果以標準化服務的方式予以共享,這樣才能讓更多人便捷獲取到相關教學研究成果,才能不斷擴大其在臨床教學及其他相關領域中影響的深度與廣度。在服務至上的時代背景下,人們更愿意通過標準化的服務接口來調用大數據資源,來實現大數據計算分析的能力,只有這樣,才能將教學成果真正固化保存下來,做到不論時間、地點、終端類型、立項目的、個人身份等的差異,只要調用標準化的服務接口,都能得到標準化的數據資源或計算成果,這才能真正實現跨平臺、跨終端、跨域的大數據共享。就大數據服務管理的內容而言,其主要包括大數據目錄服務、分布式分析服務以及流數據服務,現將主要技術點予以簡單闡述:第一,大數據目錄服務支持用戶查看、檢索各類數據,包含關系型數據、時空大數據、瓦片數據和大數據文件共享數據,使用戶可直接使用已注冊的數據進行分析,無須配置數據的連接信息、元信息等,從而保證數據的安全和易用。第二,分布式分析服務實現了大數據分析服務發布、處理和管理能力,內置了分布式計算框架,利用其先進的分布式調度和分布式計算機制能夠快速分析和處理高量級的空間大數據,并將分析結果予以自動發布服務。
(5)感染病臨床教學與大數據可視化。教師與學生們需要將數據及自身分析的成果以更美觀、更符合人機交互性的方式予以呈現,由此大數據可視化就非常重要。大數據可視化不僅支持二維可視化,也支持三維可視化,既支持靜態渲染,也支持動態渲染,將在地圖界面上以分段專題圖、標簽專題圖、儀表盤、聚合圖、密度圖、熱度圖、統計圖表、文檔文件、多媒體圖像等多種方式予以呈現,使得大數據分析結果更加豐富、立體、直觀,使得教師與學生們可以更容易掌握大數據分析的宏觀空間規律性。
(6)感染病臨床教學與大數據運維管理。面對不斷累積的大數據體量,教師與學生們需要具備大數據運維管理能力,這就類似于在紙質化辦公、計算機辦公時代對各類紙質資料、電子化資料的常態化管理,教師與學生們需要在現今的大數據時代,在物理環境或者基礎云環境上具備大數據的運維能力。鑒于大數據已然成為一項成熟的技術路線,已然成為一項基礎技能與技術工具,眾多的大數據供應商所提供平臺產品也已然非常完備,因此在多源基礎環境下的快速部署、資源管理、運維監控已更加智能,部署運維已更加簡單便捷。
作為一項成熟的革新型技術路線,大數據將從以下幾個方面對感染病臨床教學產生影響。
(1)教學目標的改變。考慮到大數據技術的開放型、共享型、服務型的架構,其將在臨床教學中凸顯其社會化共享、社會化服務的特征,大數據是需要打破行業及部門之間的邊界壁壘,需要跨界的數據共享、智慧共享、大數據計算分析及標準化服務,這符合產學研跨界融合的大趨勢,也契合感染科臨床教學的社會化意義。
(2)教學內容的改變。大數據時代的教學將推動“以教師為中心”向“以學生為中心”的轉變,從宏觀群體走向微觀個體,使“經驗式”轉變為“數據服務”教育模式[1]。因大數據是一項自成體系的技術路線,具備完整的技術框架、原理流程、功能組件,這就需要在教學內容中不僅突出講述大數據相關的基礎理論知識點,而且需要在其與感染科實際交叉案例中予以深入淺出地剖析,幫助學生們掌握技術分析方法。當然這也體現在臨床實習過程中,如何基于大數據技術,充分發揮臨床資源優勢,尤其是典型病人的臨床表現、體征、疾病演變過程等,讓學生們將枯燥的理論知識與實際病癥相結合,進而不斷加深對理論知識的理解。
(3)教學模式的轉變。第一,要強調大數據技術與角色互換的結合。傳統的“老師白天在教室上課,學生晚上回家做作業”的方式將變化為在家學習教學視頻,課堂上討論問題、分析案例、教師答疑的方式[2]。通過借助大數據這一技術工具,感染科臨床教學已不僅僅是簡單的重復教學,而是在學生的學習過程中起到重要的引領作用,可利用可視化平臺、仿真模型和智能化醫學模擬技術,使學生盡可能真實地體驗或模擬醫療技術復雜而又精密的過程。課后,學生又可在網上對知識點進行檢測,對薄弱環節記錄、補救[1]。
第二,要強調大數據技術與教學案例的結合。案例教學法是一種以案例為基礎的教學法,起源于20 世紀初美國哈佛大學醫學院、法學院,后經哈佛大學商學院推廣應用并發展,現已成為一種成熟的教學方法[7-8]。PBL 是以問題為導向的教學方法的簡稱,此教學模式源于加拿大McMaster 大學,由美國神經病學教授Barrows 于1969年試行,至今已有四十余年歷史,目前已經成為國際上較為流行的教學方法[9]。在臨床實習中將兩種新的教學模式理念與方法相互融合,起到較好的教學效果[10]。基于大數據技術,可將案例以模型算法的方式固化下來,通過不同的輸出變量與權重比例,可實時完成案例推演模擬及二三維可視化,最終經過教師與學生們的研討,可對教學案例有著更深層次的理解。
(4)教學平臺的改變。大數據技術在教學平臺的改進作用也是顯而易見的,大數據技術將更多效能發揮在數據資源與智慧資源的共享,教師和學生們可根據自身需求在云端調用所需的數據及模型算法,便于完成相應的教學課題或理論研究,并將研究成果后上傳云端,成為后續的智慧基礎。同時,在原先模擬病房教學方式上,大數據也可有較為廣泛的應用空間。原先模擬病房是模仿臨床工作情境的部分或者全部內容進行訓練,使學生有如身臨其境之感[5]。模擬病人可由具有專業知識的醫護人員來扮演,也可以讓學生自已來扮演。也可采用多功能的模擬“患者”,可編輯各種不同病情的模擬病人,通過改變系統來設置標準化的“患者”,給學生對“患者”進行病例分析[6]。運用大數據技術,可將模擬過程固化到計算機系統中去,并可在云端循環往復、不斷升級,為提升教學體驗提供技術支持。
大數據在臨床教學領域具有得天獨厚的優勢,可實現優質教育資源最大程度地整合、共建、共享和共用,有效解決教育資源分配不均、共享難的問題。
我國全科醫學教育的發展目標是:建立起具有中國特色的、適應衛生事業改革發展需要的全科醫學教育體系,培養一大批能滿足人民群眾基本衛生保健需求的全科醫學教育體系人才。只要有合格的全科醫師才能有合格的“守門人”,合格的全科醫生將是今后所需的衛生人才,醫學教育應及時緊跟衛生事業改革之需要。高等醫學院校面對未來努力培養合格的全科醫生。因此,發展全科醫學教育、培養全科醫師,已成為醫學教育改革重要的內容和高等醫學院校的一項長期且緊迫的任務[4]。
為達成以上目標,感染科臨床教學的改進思考就尤為重要,其與大數據技術存在密切的內在聯系。大數據在分布式存儲、數據分析、數據可視化等諸多方面都有著明顯的技術優勢,這些都是與感染病臨床教學緊密結合的關鍵技術點。因此,在教學過程中具備大數據意識只是一個起點,更重要的是在今后的教育工作中運用這一技術工具予以賦能實施,使學生們能從中得到技術的支持與思維上的啟示,讓我們教育工作者共同為大數據時代下的臨床教育工作貢獻自己的力量。