李儒銀,李 洋,羅志宏△
(1.重慶醫科大學附屬第一醫院 400016;2.成都體育學院,成都 610041)
突發公共衛生事件是指突然發生,造成或可能造成社會公眾健康嚴重損害的重大傳染病疫情、群體性不明原因疾病、重大食物和職業中毒及其他嚴重影響公眾健康的事件[1]。近年來,國內外突發公共衛生事件頻發,如2003年的非典型肺炎、2009年的甲型流感、2014年西非的埃博拉病毒及2019年的新型冠狀病毒肺炎(簡稱新冠肺炎),都給國家建設、人民利益、社會經濟造成了巨大損失,甚至一度引發公眾恐慌情緒。而歷次突發公共衛生事件均會產生大量的疫情相關數據,要充分了解疫情數據信息,才能做到“心中有數,手中有策”[2]。所以,如何有效管控突發公共衛生事件中產生的數據,協調突發公共衛生事件數據的有效開放和利用,有利于各級政府部門對疫情整體發展情況做出客觀判斷,部署防控措施;有利于執行部門制訂科學防控方案,把握重點工作方向;有利于衛生部門合理配置資源,提高工作效率;還有利于疫情防控的國際合作和民眾安撫。
“關聯數據(Linked Data)”的概念由TIM于2006年提出,是“互聯網+”時代,進行大數據管理、發布和服務的核心技術之一。目前,關聯數據已經在藥物知識發現、智慧醫療建設、醫學資源共享和醫學信息學知識體系構建等領域有諸多應用實踐[3]。為了充分發揮關聯數據在突發公共衛生事件數據管控中的價值,筆者論述了關聯數據應用于突發公共衛生事件數據開放平臺的必要性和技術實現路徑,并以新冠肺炎疫情數據為例,設計了基于關聯數據的疫情數據開放平臺。同時,也分析了平臺建設過程中可能存在的一些問題。
利用關聯數據技術,將公共衛生領域的結構化數據通過網絡進行關聯和共享,充分挖掘信息價值,實現信息高效利用、提升信息協同效率,能夠給予數據更大的附加價值[4]。以新冠肺炎為例,筆者發現:有關新冠肺炎疫情的數據類型多樣、渠道豐富,有政府部門官方網站的數據,有醫藥衛生行業的主流媒體數據,有社交網絡的數據,有第三方支付平臺的數據等。這些信息的全方位、深層次、多渠道傳播,使公眾對新冠肺炎有了全面的認識和了解,增強了民眾的防護意識。但這些數據之間存在內容重復、真偽難辨等現象,且數據平臺之間的數據缺乏統一標準、管理混亂、共享性差、內容深度挖掘不足等問題。
由此可見,突發公共衛生事件數據的管理中還存在諸多問題,不利于公共衛生部門做出科學決策,也增加了疫情管控、醫療資源協調的難度,使得許多具體工作難以有效落實和開展;同時,突發公共衛生事件數據的不規范發布還容易引發大眾的信息焦慮和心理恐慌。所以,建立行之有效的突發公共衛生事件數據開放平臺勢在必行。
將關聯數據技術嵌入到突發公共衛生事件數據開放平臺建設中,由公共衛生部門進行統一規劃、統一建設、統一協調、統一管理,能夠有效推動公共衛生突發事件數據管理。
突發公共衛生事件具有生命周期,其演變階段可分為疫情潛伏期、疫情暴發期和疫情恢復期[5],在疫情發展的不同階段,數據信息存在較為明顯的差異,但也會有交叉重復。疫情潛伏期的數據包含疫情監測監控、趨勢預測、風險評估、防護指南、輿情防控等;疫情暴發期的數據包括病毒檢測、疫苗研制、醫療救助、物資調用、人員流動、患者上報、虛假謠言等;疫情恢復期的數據包括整理疫情起因、爆發過程、損失評估、事后分析等。根據疫情發展的不同階段,研究者構建了突發公共衛生事件數據整合框架,見圖1。

圖1 突發公共衛生事件數據整合框架
根據關聯數據語義描述的步驟,筆者認為突發公共衛生事件疫情數據的語義描述步驟為,(1)疫情數據標識:采用統一格式進行標識,便于疫情數據的規范化處理和集中管理;(2)疫情數據集選擇:參考MeSH主題詞表、醫學標準術語和通用語,或自定義新的術語為數據集命名;(3)疫情數據資源描述框架的描述:使用固定格式的計算機語言描述不同數據,創建訪問入口,通過搜索引擎檢索數據;(4)疫情數據鏈接:在規范化的數據描述之后,建立疫情數據的網絡鏈接;(5)疫情數據語義發布:將不同來源、不同類型的疫情數據轉換為關聯數據類型,嵌入數據的版本號或標識符,進行數據發布;(6)疫情數據平臺維護與運營:及時更新平臺數據,關注疫情數據的維護和實時更新。
采用關聯數據技術實現了后臺數據的規范、統一管理,便于各類用戶的訪問、瀏覽與檢索。針對用戶的操作需求,選擇專門的關聯數據搜索引擎,或嵌入關聯數據瀏覽器。同時,對疫情數據進行分類導航,根據疫情發展態勢,適時更新不同階段的數據類型。
新冠肺炎是新中國成立以來在我國發生的傳播速度最快、感染范圍最廣、防控難度最大的一次重大突發公共衛生事件[6]。本平臺依托關聯數據技術,構建新冠肺炎數據開放平臺框架[7],見圖2。通過整合各種類型、不同來源的新冠肺炎疫情數據,進行統一標引,數據解析、提取與合并,利用資源描述框架機制進行描述,建立計算機可識別的鏈接和語言,在Web頁面上發布數據,提供訪問接口,嵌入用戶導航界面,使用戶通過互聯網進行瀏覽和檢索,促進新冠疫情數據互聯互通和深度應用。

圖2 新冠肺炎數據開放平臺
數據標準化是實現數據開放共享的基礎。突發公共衛生事件數據開放平臺的建設會涉及不同類型、非結構化數據,如疫情監測數據、病毒檢測工具、疫苗研制信息、物資調用信息、防護指南信息、患者就診信息等,以及各種醫學專業術語等。所以,面對龐雜的突發公共衛生事件數據,需要全面收集、分類、整理和組織,制訂科學的數據規范標準,實現語義上的互操作。
突發公共衛生事件數據的收集過程中,通常會涉及患者隱私信息,如個人背景信息、健康狀況、病歷信息等,一旦被泄露,會對患者的日常生活帶來很大困擾。所以,數據開放的過程中,需要設定專門的隱私保護屏蔽技術,保障患者隱私權。此外,需要把握病毒檢測和疫苗研發中科學數據開放與保護的平衡點,同時對涉及的臨床試驗、科研倫理問題,成立專門的倫理評估系統和審查機制,保證科學研究順利開展[8]。
明確數據權利,保護數據主體、數據生產者、數據控制者和參與者、數據客體的利益平衡,才能促進數據的合理開發和使用。突發公共衛生事件中產生的數據,按照來源可分為個人數據、商業數據、政府數據、醫療機構數據,這些數據由哪個部門主張收集、如何兼顧公共利益和個人信息保護,以及所收集到數據的權利界定與歸屬問題均關系到數據的合法利用。所以,有必要主張數據權利,采取技術措施降低風險,避免因個人信息泄露、濫用而引發人身損害、財產損失,甚至是公眾恐慌和政府信任減損[9]。
數據開放在突發公共衛生事件數據監測、分析和利用等方面起到了積極作用,如歐盟創建的新冠肺炎數據共享平臺。但科學界定數據開放范圍、審批數據開放對象,需要成立專門的審查機構進行嚴密審核,依法確定完全公開、適度公開、申請公開、保密等權限;申請者依托機構認證,簽署保密協議和合理使用協議等證書。同時,還需要關注數據保護問題,必要的時候限定數據分析的用途。
由于突發公共衛生事件具有不確定性、群發性、演變復雜性、高危害性等特點,需要快速、準確地獲取并有效地收集、利用相關數據,以提高應急響應的科學性和效率,降低疫情帶來的危害和負面影響。本研究基于關聯數據技術,提出突發公共衛生事件數據開放平臺的建設方案,展現了數據開放平臺在疫情防控工作中的廣闊應用前景。未來研究可以依托數據開放平臺,針對疫情防控中產生的科學知識、科研成果、政府決策、醫療救治等數據信息,形成專題資源數據庫,強化突發公共衛生事件大數據分析和智庫建設。