999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人體健康態信息評價規范研究

2022-11-15 12:38:08胡迪坤高偉東于偉泓徐海燕韋張婉鈺李東輝敏許嶺翎何書勵王現強田美策王煜非
中國醫藥科學 2022年20期
關鍵詞:信號設備質量

胡迪坤 高偉東▲ 于偉泓 徐海燕 韋張婉鈺 李東輝 黃 蓉 彭 敏許嶺翎 盧 強 何書勵 王現強 田美策 王煜非

1.北京郵電大學信息與通信工程學院 泛網無線通信教育部重點實驗室,北京 100876;2.北京協和醫院眼科,北京 100730;3.北京協和醫院呼吸科,北京 100730;4.北京協和醫院內分泌科,北京 100730;5.北京協和醫院神經科,北京 100730;6.北京協和醫院營養科,北京 100730;7.中國醫學科學院阜外醫院 國家心血管病中心,北京 100037;8.上海市第六人民醫院糖尿病研究所,上海 200233

健康是社會公眾關注的焦點和熱點,也是幸福指數的關鍵指標之一。為了讓人們以更好的狀態面對未來快節奏的學習、工作、生活以及競爭挑戰,健康管理作為一門學科和行業正在興起并日趨完善。健康管理通過采集人們的生理信息、社會環境信息與健康數據來預測受測者的健康狀態。在建立人體健康態信息數據庫的過程中,數據采集的不規范與設備良莠不齊導致了目前的健康信息采集混亂、評估結果準確性無法得到保障。為了保障用于準確評估人體健康態的高質量數據,推動健康態評價的科學化和規范化,本研究針對不同類型健康數據進行分析,設計了健康數據的質量控制規范,為后期醫療和健康應用提供依據。

1 資料與方法

1.1 數據采集

本研究依托于國家重點研發計劃“主動健康和老齡化科技應對”專項課題(2018YFC2000803),隸屬于“主動健康產品和人體健康態評估的安全有效體系及標準體系研究”項目。該項目在全國不同地域,針對不同人群,構建體溫、體重、體脂率、血壓、心電、心率、血氧、血管彈性、心肺音、血糖、腦電、呼吸、睡眠、眼底、屈光狀態等數據采集的協同網絡,實現健康態數據的動態實時上傳及統一管理。數據采集地除了北京協和醫院、中國醫學科學院阜外醫院等課題參與單位,還包括醫院體檢中心、基地醫院、社區衛生服務機構、健康數據中心、居民家庭等其他數據源,實現多中心的數據采集,避免數據來源單一、設備型號單一導致的數據偏差。

數據種類與采集量:①心血管健康采集靜息血壓、動態血壓、心率及心率變異性300例,Holter動態心電圖500例以及長程的心電監護數據300例;②糖代謝健康采集無創穿戴式血糖監測、SMBG血糖監測與CGM持續血糖監測300例;③睡眠健康采集睡眠腦電圖、睡眠質量睡眠結構、睡眠體位、鼻息氣、肢體運動等睡眠多導圖PSG數據100例,可穿戴式睡眠監測設備(智能手環、體動儀2~3種)500例與睡眠監測床墊200例;④視健康采集眼底成像照片5000例;⑤呼吸道健康采集呼吸氣體分析數據、肺功能指標與指壓式血氧檢測數據200例;⑥日常健康數據采集測試者體溫、身高、體重、體重指數(BMI)與體脂含量1000例。在測試過程中,根據實驗條件與實驗設計需要,受測者分別進行以上一類或者多類的健康項目數據采集。

1.2 實驗數據分組與標簽獲取

建立人體健康信息數據的過程中,測試者會接受視健康、呼吸健康、糖代謝健康等8大類22項健康信息的采集[1]。獲得的健康數據類型不局限于離散型數值數據,還包括時間序列數據、影像數據、文本數據等多模態數據,這些多模態的數據之間在數據結構、數據類型和信息內容上都具有顯著差異。隨著中檢院牽頭起草的IEEE P2801醫學人工智能數據集質量管理國際標準的正式發布[2],揭示了未來對健康數據質量管理方面的需求提出了更高的要求。為此,本研究針對健康信息數據研究了數據質量控制的方法,建立多個節點的健康數據質量控制體系,根據數據采集設備、采集流程和方法、采集場景、數據的可重復性和可信度,制訂相應的數據采集和質量控制的標準和規范。

對于數據采集人群的納入以及排除標準由各科室專業人員決定。理論上獲取的8類數據分別對應8類人群,如睡眠科數據獲取人群以患有睡眠障礙的中老年人群為主,血壓數據是從參與社區體檢人群中獲取。數據的采集標準以及數據標記流程由多位該領域的從業人員,根據其業內的專業知識給出數據質量評價結果。數據質量的標簽分為3類,0表示存在嚴重數據質量問題被認為不可用的數據;1表示數據中帶有一些異常但仍被認為是可用的普通信號質量;2表示信號質量好。每個樣本需至少3個人進行標記。當同一組樣本2個人標記結果與第3個人不同時,按少數服從多數原則。當同一組樣本3個人標記結果均不相同時,視為信號質量普通。由于不同數據對信息的靈敏度要求不同,所以不同數據的質量標簽樣本的對應的時間長度不同。為了后續建立測試者一體化的數據質量報告,與專家進行溝通將不同數據的質量標簽對應的時間長度控制在1 min的整數倍。不同數據類型的質量標準與標簽獲取的難度也不同,時序連續型數據和影像類數據如眼底照片、腦電等具有豐富的信息且數據的質量標準成熟,所以可以得到完整的數據質量標簽。相比之下,血壓、血糖、呼吸氣體成分等靜態離散型數據的信息量少且業內沒有完善的規范標準以獲取質量標簽,所以可以用于研究不同設備與不同操作規范對該類健康信息的影響。

1.3 實驗方法

信號質量標簽獲取的完整度以及后續訓練采用的人工智能模型都與數據類型密切相關,本研究建立的健康數據的質量控制方法根據健康數據的類型分為3類:①針對血壓、血糖、呼吸氣體分析等離散值類型的數據質量控制方法;②針對心電監護、腦電、PSG等持續性輸出數據類型的數據質量控制方法;③針對眼底照片、屈光檢測圖像、腦電圖等影像輸出數據的質量控制方法。

1.3.1 離散數據類型質量控制模型 離散健康數據類型是由多項個體生理指標:血壓的3項指標、血糖的4項指標以及測試個體的身高、體重等基本信息構成。該類數據除明顯的數據異常、數據缺失和數據格式異常外,常見的異常還包括數據范圍異常,數據趨勢性異常和突然波動性異常。但由于其信息量少且各項指標間關系的不明確性,所以難以得到離散數據的質量標簽,通常需要通過無監督聚類學習方法進行估計[3]。

對于離散數據的波動性異常,可通過觀測一類指標中的多個屬性之間是否出現異常。如在呼吸的3項指標中的呼吸氣體分析、肺功能指標、指壓式血氧檢測,這3個屬性之間具有高度的耦合關系而非獨立[4]。所以突然波動檢查是根據測試組內3項指標的突然性波動或者對屬性間數值是否合理進行的監測。由于屬性之間的高度相關性,所以采用拐點法與基于密度的離群因子來聯合判別異常[5]。離散型數據質量控制除了對明顯的異常數據進行篩選,還可以用于研究不同設備與不同操作規范對該類健康信息的影響。對主動健康設備與醫用設備采集的數據的統計學特征進行比較,以及對規范操作和不規范操作條件下獲取的數據統計學特征進行比較,通過控制環境變量和設備變量,將標準設備以及規范操作視為標準值,記錄其他條件下的健康態參數見圖1。根據圖1可以得到不同測試條件下健康參數的偏差與分布情況。

1.3.2 時序連續數據質量控制模型 時序連續的健康數據是記錄個體一段時間內生理參數變化的數據,如睡眠心電、睡眠眼電以及睡眠心沖擊信號等。針對時序連續類型的數據,人類專家視力檢測的規則是依據數據的波形特性,即根據信號的幅度特性與周期特性將數據劃分為正常數據段落與異常數據段落[6]。專家通過異常信號占整體信號長度的比例來判別該段信號整體的數據質量。由于獲取連續數據質量標簽的工作量遠大于影像數據,且數據質量標簽反映異常數據的嚴重程度具有模糊性,所以本研究采用半監督學習方法進行訓練。將整段數據劃分為多段的信號單元,通過無監督學習聚類得出這些信號單元中的異常項,最后根據整段數據中異常單元的分布與占比情況有監督學習得出信號整體的數據質量標準。

為了增強訓練模型的泛化能力,將時序信號的波形特性抽象為特征向量。提取出特征包含熵值類特征(樣本熵、能量熵、多尺度熵等)[7]和數學統計類特征(均值、均方差、方差)[8]。基于PCA技術的半監督學習方法訓練標簽不完整的模型。該方法大致分為無監督學習過程與監督學習過程。在無監督學習過程中,利用PCA故障檢測的原理將信號一個特征窗內的多維特征作為t時刻的在線數據進行故障檢測。根據數據異常占比越大信號質量越差,且多導聯的數據之間具有相似度高的性質。對故障檢測模型中的特征和參數進行調整,獲取最佳故障檢測方法,即信號通過故障檢測聚類后,信號質量越高的樣本中檢測出的異常數據段落越少,同時多導聯數據之間的故障檢測結果越相似。基于最佳的故障監測方法,將多導聯的連續數據轉化為0-1的最佳故障檢測矩陣結果。采用有監督學習的方法建立故障檢測結果與人工標簽之間的映射關系。多組連續的故障檢測結果作為訓練集,對應的人工標簽作為標簽集,可以訓練出特征映射矩陣。根據在線故障檢測結果與特征矩陣得到在線數據的質量估計結果,整體流程見圖2。如果全程只采用機器學習,一方面對訓練樣本的需求量大大增加,另一方面也增加了參與處理的數據量和運算的復雜度,會令算法難以運用在實時的線上輸出模式。而只采用無監督學習進行故障檢測則缺少了性能的反饋,往往難以獲得較好的分類效果。相比本研究采用的半監督學習方法,綜合兩種不同學習方法更加適用于臨床實踐的需求。

圖2 時序連續數據的質量控制流程

1.3.3 圖像數據質量控制模型 對于影像類數據,其質量標簽的獲取難度較低,易于得到完整的數據質量標簽,所以人工智能模型的選擇上主要采用有監督的學習方法。相比其他兩類數據類型,影像數據擁有豐富的信息量。在不同的場景下圖像中的有效信息具有差異性,因此通過視覺檢測相對于基線顯著變化的時頻區域,利用圖像分割技術劃出感興趣的區域(ROI)縮小目標范圍[9]。如在腦電圖像中,根據腦電的δ波(1~3 Hz)、θ波(4~7 Hz)、α波(8~13 Hz)和β波(14~30 Hz)所處頻段特性,用快速傅里葉變化公式分別計算出不同頻段數據在圖譜中的大致位置,并篩選出目標圖像范圍[10]。信號處理是進一步的定位目標數據并將其干擾項分離的過程。

為了增強模型的泛化能力使系統更廣泛地適用于多種健康影像數據的場景,本研究從處理后的圖像數據中提取通用特征ERS/EDR,手動提取特征和卷積網絡自動抓取的圖像細節特征[11]。其中通用特征中包含有圖像平滑度、熵聚焦準則、歐拉數、前景與背景能量比,這些屬性能直觀反映圖像特性的特征[12]。手動提取特征的獲取則需要結合數據的信號知識和醫學的背景,運用這些特征區分和識別常見的運動偽影、汗性偽跡、工頻干擾等特殊圖像質量異常現象[13]。自動抓取的圖像細節特征則是利用深度學習網絡從圖像信息中篩選一些肉眼難以發現的隱形特性。將這些特征進行融合并輸入到學習網絡中用于訓練特征到質量標簽的映射。最后基于有監督學習的圖像質量自動評價體系,利用諸如Weka機器學習工具箱[14],將至少3個單獨的分類器的輸出融合在一起。用于融合的集成分類器是一個投票系統,它使用“最小概率”組合規則組合不同分類器的后驗概率得到最吻合訓練標簽的判別結果[15]。當影像數據是時序連續型場景,每個樣本序列之間具有較強的時間相關性。則需要補充隱馬爾科夫模型或動態貝葉斯模型來獲取樣本在時間序列上的連續性關系[16],整體流程見圖3。

圖3 圖像類型數據的質量控制流程

2 結果與討論

2.1 離散型健康數據的數據統計

通過對離散型數據在不同設備與不同情境時測量的健康態參數的統計與比較,本研究得到不同健康態參數在規范操作與非規范操作下的數據統計,見圖4。圖4中測量點距離坐標軸對角線越近則表示醫用設備與主動健康設備在該環境下的差異越小。圖4顯示非規范操作對主動健康設備測量舒張壓的影響遠大于測量收縮壓。在相同測試環境下,主動健康設備與醫療設備對收縮壓的測量基本一致。而對于舒張壓的測量醫用設備與主動健康設備測量的結果則有明顯的差異。通過對情景的進一步細分,將測試環境分為4類,分別比較4類環境下主動健康設備與醫療設備對舒張壓的測量偏差如圖5。圖5顯示,在情景1下,主動健康設備的測量結果普遍偏高,而在情景2下主動健康設備測量的結果則普遍偏低。由此得知在操作不規范時,主動健康設備測量的舒張壓不準確,且誤差的偏移與具體的操作習慣有關。

圖4 不同操作規范下醫用設備與主動健康設備的健康態數據

圖5 不同操作規范下醫用設備與主動健康設備的健康態數據

2.2 時序連續數據與圖像數據的質量評價規范

對時序連續數據和圖像數據質量控制模型的訓練,按照通常訓練集和測試集的劃分方案,大約80%的數據被用來訓練,剩余約20%的數據被用于測試。對健康數據尤其是具有完整質量標簽的圖像數據和部分質量標簽的時序連續型數據進行訓練后,在測試樣本中混淆矩陣的情況見圖6。圖6顯示該質量控制模型對信號質量具有顯著的區分能力。針對圖像數據類型與時序連續數據類型質量控制的性能見表1。

圖6 圖像數據與時序連續數據質量的混淆矩陣

表1 圖像數據和時序連續數據預測性能(%)

對于同種數據類型但不同場景的數據,如心電數據和腦電數據,眼底圖像和腦電圖像之間的訓練性能雖然存在一定差異但整體性能與均值性能偏差在±2%~8%。與時序連續數據相比,圖像數據的偽影,偽跡等干擾比時序性信號更顯著,所以在圖像質量控制中質量控制的性能優于時序連續數據的質量控制。但在臨床的運用中除低質量數據無法使用外,中質量與高質量數據均可以正常使用,兩者識別模糊對實際影響不大。所以在時序連續數據中雖然質量控制的性能不如圖像數據,但仍具有臨床使用的價值。

本研究質量控制的方法借鑒了模型遷移的思路,在保留同類數據的一些共性特征外,通過專家建議與數據分析添加該數據的個性化特征。提高模型利用率的同時也考慮到了各類數據之間的場景差異,切合了健康數據管理的運用場景。綜上可知,本研究建立的健康數據質量控制方法可以較好地運用于人體健康態數據。如前文所述,人體健康數據的質量控制可用于保障人體健康信息化的準確性,并降低異常數據的干擾。為了驗證本研究的質量控制是否達到該效果,以睡眠心沖擊信號為例,本研究分別計算了整體數據的幅度熵特性、周期熵值特性以及信號比,見表2。由表2可知,通過質量控制獲取的高質量數據的幅度與周期的熵值均降低,即信號幅度和周期的穩定性變強。而信號的信噪比也得到提升,從而驗證了質量控制方法可以保障健康信息化數據的準確性。

表2 質量控制對數據的影響

3 總結

本研究研究了圖像健康數據、時序連續健康數據和離散健康數據這3種不同數據型的質量判別方法,實現了多模態人體健康數據的評價規范化。利用模型遷移的思想,通過數據的共性特征和該數據的個性特征聯合訓練,解決了相同數據類型但不同場景下模型泛化能力不足的問題。但本研究目前只關注了不同數據類型之間的差異,未來可以進一步考慮不同數據類型之間存在的數據耦合關系,對更多模態的數據進行融合。

猜你喜歡
信號設備質量
諧響應分析在設備減振中的應用
“質量”知識鞏固
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
質量守恒定律考什么
完形填空二則
做夢導致睡眠質量差嗎
基于MPU6050簡單控制設備
電子制作(2018年11期)2018-08-04 03:26:08
基于FPGA的多功能信號發生器的設計
電子制作(2018年11期)2018-08-04 03:25:42
500kV輸變電設備運行維護探討
工業設計(2016年12期)2016-04-16 02:52:00
基于LabVIEW的力加載信號采集與PID控制
主站蜘蛛池模板: 中文字幕亚洲精品2页| 亚洲无限乱码一二三四区| 99精品伊人久久久大香线蕉| 国产丝袜啪啪| 亚洲激情99| 青青草原国产一区二区| 女人18一级毛片免费观看| 国产一区二区三区精品久久呦| 国产成人乱无码视频| 片在线无码观看| 香蕉蕉亚亚洲aav综合| 久久青草精品一区二区三区| 欧美h在线观看| 亚洲三级影院| 久久永久精品免费视频| 日本成人在线不卡视频| 午夜国产精品视频| 久久国产av麻豆| 91精品国产情侣高潮露脸| 免费女人18毛片a级毛片视频| 乱码国产乱码精品精在线播放| 欧美性爱精品一区二区三区| 一边摸一边做爽的视频17国产 | 国产精品久久久久无码网站| 精品国产成人a在线观看| 国产微拍一区| 亚洲精品无码久久毛片波多野吉| 欧美日韩久久综合| 内射人妻无码色AV天堂| 激情六月丁香婷婷| 精品一区二区三区视频免费观看| 色综合五月婷婷| 国产精品理论片| 国产永久免费视频m3u8| 婷婷综合色| 国产成人精品免费av| 精品久久久久成人码免费动漫 | 国内精品小视频福利网址| 日本黄网在线观看| 亚洲男人天堂2018| 国产欧美日韩18| 久夜色精品国产噜噜| 亚洲欧美日韩另类在线一| 久久人搡人人玩人妻精品一| 国产精品福利尤物youwu| 91色综合综合热五月激情| 欧美在线免费| 国产欧美在线| 美女一区二区在线观看| 狠狠v日韩v欧美v| 青青操国产| 在线免费不卡视频| 亚洲国产第一区二区香蕉| 日本一区二区三区精品国产| 婷婷午夜影院| 欧美日韩动态图| 国产午夜福利片在线观看| 18禁不卡免费网站| 99re66精品视频在线观看 | 国产美女人喷水在线观看| 国产欧美视频在线观看| 国模极品一区二区三区| 国产爽妇精品| 免费观看成人久久网免费观看| 日韩毛片免费视频| 欧美在线中文字幕| 午夜毛片免费观看视频 | 日本成人一区| 伊人久热这里只有精品视频99| 日本人妻丰满熟妇区| 狼友视频一区二区三区| 91亚洲精品第一| 黄色片中文字幕| 国产制服丝袜无码视频| 国产又色又爽又黄| 一本无码在线观看| 大学生久久香蕉国产线观看| 人妻无码中文字幕一区二区三区| 婷婷色一二三区波多野衣| 国产精品久久久久鬼色| 亚洲国产亚综合在线区| 中国成人在线视频|