李傳朋 董興魯 馮路達 高 穎
(1 北京中醫藥大學東直門醫院,北京,100700; 2 北京中醫藥大學中醫腦病研究院,北京,100700)
隨著醫療信息化的發展,影像報告、臨床病歷記錄、穿戴設備監測等數據不斷被記錄存儲。這些真實世界數據不僅來源途徑廣泛,還具有數據體量大、數據類型多以及增長速度快的特點。它們既包含結構化的臨床病歷字符信息,又包含非結構化的圖像、音頻及視頻等資料[1-2]。而計算機軟件設備的豐富和文本語言挖掘能力的提升,進一步加強醫療健康數據的可利用性,給中醫真實世界研究既帶來了機遇,又帶來了巨大的挑戰。一方面,在這海量增長的數據資源里,潛藏著有價值的臨床規律等待被挖掘。但另一方面,大量數據源源不斷產生,對醫師或研究者來說如同置身于數據海洋中,疲于對數據的管理,冗雜的數據難以被其所利用[3]。此外,還存在相同的醫療數據被存儲于多個數據庫,數據的反復采集造成人力資源的浪費以及數據的非標準化使其難以被共享等問題[4-6]。并且現有研究以項目研究為中心,強調在項目期內的數據采集的完整性和有效性,缺乏對遠期的管理和評價及發病前基線的采集和評估[7]。這些問題的核心在于數據管理不完善和使用不充分,而數據管理不完善和使用不充分的關鍵在于前期臨床信息采集模式的局限,其制約著中醫臨床研究的發展。基于此,本團隊梳理了現有采集的問題,并基于真實世界數據的特點提出了中醫臨床信息的采集模式,以期為中醫臨床研究提供一定的參考和借鑒。
1.1 臨床數據的來源場景較局限 真實世界研究更加關注患者在真實診療和生活環境下的健康相關數據,這些數據常產生于多種場景。但是目前基于電子病例報告表的采集,多數圍繞醫院環境,對于患者在其他場景的健康數據采集仍具有一些局限,無法充分反映患者診療和疾病變化的全過程。主要表現在,一是從個體的生活場景來看,患者的活動場所包括了醫療機構、社區、家庭,而現有臨床數據的采集側重于患者在醫療機構發生診療的數據,研究數據常常來源于醫院的研究型科室,僅僅當患者進入醫院參與研究以后,才開始定期跟蹤采集患者的數據,而患者在社區及家庭發生的診療及病癥變化情況則少有涉及。二是從患者入院經過的場景來看,涉及疾病突發現場、救護車、門診、病房等,數據在門診及病房的數據采集較為密集,而在疾病現場、救護車等場景產生的數據采集有所不足。三是從醫療機構來看,數據采集常發生在三級醫院的科室,而一二級的醫院、社康中心及診所的數據來源不足,不同級別的醫療機構患者人群和種類不一樣,造成患者的代表性不夠。總之,數據場景的局限造成臨床只能獲得有限區域的數據,導致傳統的中醫四診信息采集多數只能在患者隨訪或復診時獲得,無法連續獲得患者在家庭社區環境里的四診變化信息,進而影響中醫干預效果的評估。
1.2 臨床數據采集的角色較單一 現有臨床研究數據采集往往發生于研究者對入院患者的檢查、診斷及研究報告表的填寫,這樣獲得的數據常常是研究者面向患者單一維度的數據采集,而缺少其他維度的數據,如患者的自我報告數據,患者自我報告反映了患者對于自身狀態和他們對于未來健康與疾病的認識[8],缺少了這部分數據,難以了解患者自身視角下的疾病對生理和心理社會性的影響程度以及干預方式對其生命質量的改善效果。此外,臨床醫師常忙于醫療工作,無法很好地顧及臨床不斷增加的科研數據的錄入[9],由于現有場景臨床數據采集角色偏少,缺少人員替代醫師完成患者某些基本健康信息的采集錄入,給臨床醫師造成了巨大的工作負擔,同時也導致臨床數據采集質量和效率的低下。
1.3 數據的豐富性和客觀性較欠缺 除了數據場景和采集角色較局限外,現有場景下數據的豐富性和客觀性仍然有所欠缺。雖然在目前醫療數據的井噴式增長情況下,表面看似醫療數據具有較大的規模,但由于醫療數據的量級在不同維度的分布具有差異性,研究某一方面問題數據仍可能缺乏足夠的豐富性。另外,研究者往往采集其關注和其認為重要的信息,而對于其有所忽略或難以人工獲得的信息則少有采集,缺乏相應的采集工具能代替或輔助醫師采集到這部分數據。當患者在無專人跟蹤和自我監測不足的情況下,院外的健康數據處于相對缺乏的狀態,即使研究者在患者入院后進行回顧性問診,得到的信息也是零散和主觀的,造成這些場景下獲得的數據的豐富性和客觀性有所欠缺。此外,數據缺失也是真實世界數據面臨的重大問題之一,如以醫院管理信息系統(Hospital Information System,HIS)來說,由于醫務工作者日常的工作重心在于收治患者,當臨床醫師忙于醫療事務,對患者在院內外發生的診斷治療、藥物使用以及患者的結局指標關注和記錄不夠及時,進而造成這種事務型醫療獲得的真實世界數據常常出現許多數據項目的缺失[10]。
1.4 跨場景的醫療健康數據的連貫性和共享性較差 當患者的數據產生于不同的場景時,由于缺乏對接和交互機制,不同場景下的醫療健康數據之間缺少共同的數據定義、結構和交換標準,數據之間的連貫和共享受到了嚴重的影響[11]。一方面,患者在不同醫療場所下發生的診療數據,由于不同醫療機構之間數據缺乏互聯互通及個體診療數據融合的途徑,各醫療單位成了一座座信息孤島,對患者數據前后的連貫形成了巨大的阻隔[12]。此外,即使是在同一醫療機構,個體醫療數據逐漸趨于立體性,患者在整個醫療過程中涵蓋門診、住院、檢查、監護等各個環節,各個環節的醫療健康數據并沒有形成連貫的融匯整合方法,難以被臨床科研有效利用[13-14]。另一方面,可穿戴設備和互聯網技術的普及應用,使得個人生活健康數據和互聯網數據獲得了極大的增長,但是這些數據并沒有和臨床醫療數據形成很好的鏈接,這就導致臨床醫療數據與患者的日常生活起居的健康數據處于相對分割的狀態,不能被很好整合利用[15-16]。不同場景下的醫療健康數據之間的不連貫,使得臨床研究難以獲得連續性數據。
1.5 個體健康數據采集的時間范圍較短 隨著健康觀念從“以治病為中心”向“以健康為中心”的轉變,對個體生命健康范圍的全程化關注可為疾病的預防和康復的研究提供數據支持[17-18]。過去大多數臨床研究以一個項目或一次診療為核心,重點關注患者在疾病階段或者項目階段的健康數據。而當項目或診療結束以后,研究者常缺乏對患者的連續追蹤和遠期隨訪,造成疾病治療與后期康復數據的不連續。此外,在患者發病之前,也同樣存在著對患者的亞健康和健康的生命健康數據關注不夠,無法對個體從健康到疾病的演變全過程規律進行充分的研究。
中醫真實世界臨床信息采集以人為核心,一是圍繞采集對象的數據產生場景,從對象居住的家庭,工作娛樂的地方到數據對象發生診療關系的醫院,對數據產生的場景進行全覆蓋,打通醫療場所和生活場所數據采集的無縫對接。二是在數據采集的角色上,構建醫師、研究者、科研助理、科研護士、患者自我報告及醫療設備自主采集等多種角色的采集模式。三是在數據采集的工具上,充分利用現有的診療設備、隨身穿戴設備、智能家居設備及運動健身設備,擴展真實世界數據采集的工具。四是在時間維度上,整合從健康、亞健康、疾病到終點結局的生命健康周期的數據采集,進而構建出可融入真實世界數據特點的多場景、多角色、全時空的中醫臨床信息的采集模式。
2.1 擴展數據采集的來源場景 建立多場景化的數據采集,可充分利用健康數據管理軟件和物聯網技術,打通多場景數據源通道,以患者為核心,有效利用互聯網資源及大數據管理,以共享數據鏈為目標,構建患者“醫院-社區-居家”多場景聯動的數據連續采集共享模式。當患者在醫療機構進行醫療診治或救護時,可充分運用移動監測設備和物聯網技術采集患者在救護車、門診、普通病房、重癥監護室等不同場景下流轉的各項診療數據和醫療設備的監護和診療數據,并將其關聯統一上傳至同一數據管理平臺[19-20]。對于醫療機構本身來說,可擴展到患者在不同級別的醫療機構的診療場景,保證患者數據來源具有代表性。當患者在社區時,可運用物聯網和互聯網等技術,搭建健康數據管理平臺,充分運用平臺記錄社區內個體的基本資料,包括個人健康檔案、家庭檔案、年度體檢、生活能力評估等信息,方便研究者對患者開展有效的健康數據管理[21]。借助云端平臺將患者日常疾病管理評估信息進行上傳,以便患者在醫院就診時進行數據共享[22]。當患者居家時,可基于智慧家居物聯網系統,在居民授權下,圍繞居民的健康管理需求,以人工智能、電子數據和互聯網為支撐,為居民提供醫養、康復、居家監護等協同一體化的健康數據管理[23-24]。通過智能家居設備記錄患者在家庭的飲食情況,如五味偏嗜、飲食情況、胃口等信息,監測日常起居的睡眠情況,如入睡時間、睡眠長度、睡眠深淺等與生命健康相關的數據。在干預、康復、隨訪、保健等健康服務過程中使患者在家庭也可獲得連續性的健康數據監測。
2.2 增加數據采集的角色 從數據采集角色來說,過去主要是醫師面對患者的單一維度,這樣就造成臨床數據采集的類型和質量主要由醫師決定,會不可避免地造成采集數據具有一定的片面性,所以擴展信息報告角色對于豐富數據的維度具有十分重要的作用。一是探索設置更多科研助理和科研護士,科研護士可從醫囑執行者的角度協助醫師采集數據,可彌補醫師采集數據視角的不足,提高數據采集的質量和效率。二是將患者納入數據采集的角色,可從患者自身角度了解疾病對生理和心理社會性的影響程度以及檢驗干預方式對其生命質量的影響,體現循證醫學所倡導的充分考慮患者自身感受即以人為本的思想。三是將醫療設備、大健康設備納入數據采集的角色,它們的優勢在于沒有主觀傾向性,采集的數據相對客觀,作為人采集數據的重要補充,醫療設備可將患者在醫院的檢查和治療后的生命體征數據進行采集,而以穿戴儀器為主的大健康儀器可將患者日常的生理病理指標參數進行有效的記錄。總而言之,通過擴展科研助理、科研護士、患者、醫療儀器、大健康儀器等數據采集角色,盡可能多地納入多源數據,保證數據的豐富性[25]。
2.3 豐富數據采集的工具 近年來穿戴手環儀器、生物傳感器等多種數據記錄采集儀器的出現為采集多源信息提供了契機。體外穿戴儀器如智能手環、智能眼鏡、智能胸帶得到了廣泛應用[26]。此外,隨著醫療技術的發展,醫療植入儀器如腦起搏器、人工心臟等也獲得臨床的使用。傳統醫療檢查設備如計算機斷層掃描術(Computer Tomography,CT)、磁共振成像、胃腸內窺鏡等也早已實現了數據采集和上傳的功能。這些設備都可作為臨床數據采集擴展的端口。在家庭和社區的場景下,可利用智能手環、智能手表等穿戴儀器對患者的心率、血壓、脈律等進行監測,在突發心肌梗死時可及時上傳危機數據并預警[27]。而腦機接口、腦起搏器等不僅可以作為診療的醫療儀器,還可監測人體平時的腦電波,可作為醫療和健康監測數據采集的兩用醫療設備[28-29]。同樣,利用人工心臟等醫療植入儀器替代相應臟器功能的同時還可監測體內局部血流、血壓及溫度等信息,也可作為數據采集的端口[30-31]。此外,通過社區健身房中的運動設備可記錄個體的運動強度、體能耐力等健康信息。而在醫院場景下,可通過磁共振成像、CT、內窺鏡結合計算機設備等在檢查的同時進行健康信息的采集和上傳。智能手機軟件作為數據的上傳和采集、存儲中轉站,也可記錄個體的運動、外賣餐飲情況等生活健康相關信息[32]。信息采集端口的多元化大大增加了數據采集的便利性,它不受場合、時間的限制,保證了數據采集的成功率。從信息科學的角度來看,多源頭的采集大大增加了信息的冗余性,不同來源的采集端口數據可以相互核對,保證了數據的準確性。
2.4 建立個體健康信息的全生命周期采集 前沿數字技術和智能設備的興起,為構建從健康到疾病的全生命周期的數據采集提供了技術支撐,在人群健康與疾病之間建立有序數據采集的銜接,可解決現有臨床研究采集時段較局限的問題,打通生活健康數據與疾病診療數據之間的壁壘,將為更好地研究疾病的發病過程及早期干預提供數據支撐。一方面,從生命個體的健康-疾病狀態角度,將個體的健康、亞健康、疾病、終點結局全部納入數據采集的范疇。在居民授權后,建立居民數字健康檔案,在居民健康期,采集健康生理參數,如血壓、血脂、血糖、脈象等指標,以此建立人體正常水平的基線值,可用于與疾病病理參數的對照。在亞健康期,采集人體機體的相關指標,以此建立人體的亞健康模型。而在疾病期,采集患者的診療信息及疾病證候變化過程。對終點結局的數據記錄,將為疾病的發病特點和預后轉歸的研究提供數據支持。另一方面,從居民個體的健康數據類型來看,統籌納入體質監測數據(如中醫體質類型、身高、體質量等)、健康檢測數據(如血壓、血糖、脈律等)、飲食生活數據(如五味飲食偏好、吸煙、飲酒、睡眠情況)、基因蛋白組學數據(如基因測序)、診療檔案數據(疾病診斷、藥物使用等)等多種數據,建立生命個體的全方位數據采集。總而言之,基于從健康到疾病的全生命周期的數據采集,可從生命健康信息的時間維度獲取全面、全程的個體數據。
中醫辨證論治、整體觀及個體化診療的思維特點決定了中醫診治患者的過程具有較強的動態性。并且患者所處場景不固定,涉及到家庭-社區-醫院多種場景的流轉,而望聞問切等四診合參的診治方式所產生的數據也具有多種多樣的類型,這些問題導致現有臨床信息采集模式難以滿足中醫臨床研究的需要。而中醫真實世界臨床信息采集模式的建立,可滿足中醫真實世界數據采集的需要,服務于中醫臨床研究多方向的探索。一是服務于疾病發病與發病節氣及地域氣候之間的關系研究,通過采集患者在不同地域、不同時間的健康數據,探究不同節氣和地域因素對疾病證候的影響。二是服務于中醫疾病證型轉變規律的研究,通過連續采集患者發病前、發病后的治療及轉歸的全生命周期數據,可充分闡明疾病證型的演變規律,為中醫在疾病不同階段的干預措施提供理論依據。三是服務于中醫藥干預措施的臨床評價,在其指導下全面采集患者在真實診療情況下中醫診斷及處方信息,收集中醫藥干預的有效性及安全性相關信息,可為中醫藥干預措施的療效評價及藥物經濟學效益提供依據。在有效性評價方面,可在評價原有適應證的基礎上,進一步明確并優化中藥臨床用藥的最佳劑量和療程。此外,基于真實世界研究,全面監測藥品偶發、遲發、長期合并用藥的不良反應,可為藥物的安全性評價提供支持[33]。另一方面,中醫多維度、全時空的信息采集,也可為患者的健康飲食、健康運動、健康心理、健康睡眠、健康生活方式以及康復的全方位研究提供豐富的數據支撐。
本文基于中醫臨床信息采集中存在的數據的來源場景較局限、數據采集的角色較單一、數據的豐富性和客觀性較欠缺、跨場景的醫療健康數據的連貫性和共享性較差、個體健康數據采集的時間范圍較短等問題,提出了構建中醫臨床信息采集模式的對策,主要從擴展數據采集的來源場景、增加數據采集的角色、豐富數據采集的工具、建立個體健康信息的全生命周期采集4個角度詳細闡述了構建中醫臨床信息采集模式的對策,并探討了利用此模式可服務于中醫臨床研究的潛在方向,為真實世界研究的數據采集提供了一些方法學參考。
真實世界數據產生的場景廣泛及原有采集模式的局限,造成了臨床獲得的數據分布散亂,數據結構不一致,給數據的管理和應用帶來了巨大的障礙。而信息采集是臨床數據進入系統的第一階段,是解決數據管理和應用難題的關鍵。因此,本團隊基于真實世界數據的特點從數據場景、采集角色、采集工具及個體生命周期4個維度構建了中醫臨床信息的采集模式。它不僅為中醫真實世界研究提供工具支持和臨床服務,也能通過多維度的信息采集提高臨床數據的客觀真實性和數據翔實程度,提升現有臨床研究的質量。此外,它還能提高后期隨訪數據采集的便利性,為研究項目結束后的延續性研究提供支持。本團隊設計的真實世界臨床信息采集模式也面臨著一些局限性,首先是仍然過多地依賴主觀數據,現有智能工具不能較好地完成所有數據的精準采集,人工采集數據所占比例仍然較大。其次,對現有數據的利用,涉及非結構化到結構化的轉換,目前的數據系統還無法完全實現自動轉化,未來解決這個問題有賴于標準化和信息化數據的進一步發展。另外,對現有多媒體數據進行優化分析時,在數據轉化分析和高維數據壓縮的過程中還存在著數據噪聲以及數據合并造成信息丟失的問題,未來有賴于數據統計分析方法的發展和信息處理方式的進步。總之,真實世界數據的采集模式若要進一步優化提升,一方面有賴于采集工具的進步,如依賴腦機接口技術和電子皮膚等技術工具的成熟,便于精準收集腦電波、人體體表溫度等生理病理的連續數據;另一方面,也有賴于數據標準化和結構化的創新,以便于對不同來源的海量多維度數據進行更好的處理和存儲分析。綜上所述,中醫臨床數據采集模式的建立和優化,將給中醫真實世界研究提供一個有力的工具支撐。
利益沖突聲明:本研究所有作者不涉及相關利益沖突。