



關鍵詞: 健康信息學; 信息資源管理; 健康信息技術; 健康信息服務; 健康信息行為
DOI:10.3969 / j.issn.1008-0821.2024.08.013
〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2024) 08-0137-16
隨著人民生活水平的不斷提高, 人民群眾健康問題得到廣泛關注, 習近平總書記提出“以人民為中心, 以健康為根本” 的健康觀[1] 。《“健康中國2030” 規劃綱要》指出, 健康服務供給總體不足與需求不斷增長之間的矛盾依然突出[2] 。信息技術在醫療健康領域的應用, 有助于推動健康產業轉型升級, 促進健康服務供給側結構性改革, 推進健康中國的建設。健康信息學融合了信息科學、情報學、生物學、生命科學以及醫學等多種學科, 運用信息學的理論方法解決健康科學研究和健康社會服務中的問題[3] , 對我國的醫療健康服務和公共衛生事業的發展有著重要意義。
健康信息學起源于醫學信息學, 最早可追溯到1959 年Ledley R S 等[4] 發表在Science 上的關于輔助醫生診斷決策的論文, 為后續基于計算機的醫療決策支持提供了視角[5] 。醫學信息學的結構框架[6]和學科背景的討論[7] 為該學科的方法學和技術知識的范圍奠定了基礎, 而后經過數十年的發展, 健康信息學開始面向醫學服務與實際應用[8] , 逐漸成為主流。學界對醫學信息學和健康信息學的概念、范疇以及他們之間的關系尚未形成共識。因此, 本文采用廣義的健康信息學的范圍, 將信息技術應用于滿足用戶的健康需求、解決相關健康問題和醫學決策, 解決醫療健康、公共健康、環境健康、人口健康、消費者健康等社會健康問題, 通過理論、技術和方法支持醫療、保健和護理服務的提供, 服務于個人、社區和社會[3,9] 。
隨著人工智能和互聯網技術的發展與應用, 智慧醫療、在線問診、健康社區和電子健康記錄等與健康相關的技術與服務蓬勃發展, 健康信息學得到了信息資源管理、計算機科學與技術、醫藥衛生等多個學科領域學者的廣泛關注[10] , 已成為信息資源管理學界發展規劃和研究的熱點[11-12] 。2021 年中國科技情報學會成立健康信息學專委會并舉辦首屆健康信息學論壇[13] , 2023 年信息資源管理學科發展戰略研討會明確提出, 將健康信息學列為信息資源管理下屬的二級學科[14] 。健康信息學領域近些年學術成果數量不斷上升, 研究方向也多種多樣, 由于健康信息學的學科交叉性, 研究主題相對分散, 這使學者很難把握國內外健康信息學領域的研究現狀。因此, 本研究旨在通過對國內外信息資源管理領域的健康信息學研究的梳理, 探究國內外信息資源管理領域健康信息學的最新現狀與發展趨勢, 對比國內外健康信息學研究主題的異同, 為我國健康信息學的研究提供參考。
1研究數據與方法
國內外眾多學者對健康信息學的學科發展、研究主題以及發展趨勢進行了探討。朱慶華等[9] 分析了健康信息學的起源和發展現狀, 周曉英等[3] 探討了學科范疇和中國健康信息學的發展, 王若佳等[12]總結了學科范疇以及知識體系之間的關聯關系, 岳麗欣等[15] 梳理了近30 年國內外健康信息領域發展歷程, 李世娟等[16] 梳理了國外健康信息學理論應用研究現狀, 尚曉倩[17] 利用突變檢測法分析了2013—2022 年健康信息領域研究熱點并預測了前沿趨勢,Tian P 等[18] 以Web of Science 為數據源分析了健康信息學的主題結構和演變趨勢, Kim Y M 等[19] 采用文本挖掘方法提取健康信息領域的主題詞并聚類分析研究主題, Marques I C P 等[20] 通過文獻調研梳理了健康信息領域的數字化進程。本文選取2021年以來發表的健康信息學相關的論文作為研究對象,采用內容分析法對選取的論文進行分類歸納總結,以對比健康信息學國內外最新的研究進展。
1.1數據獲取
本文首先采集了信息資源管理領域SSCI 和CSSCI 期刊論文數據, 刊源參照“圖情新文” 公眾號, 根據其前期對國內外信息資源管理代表性期刊的調研工作, 最終確定了43 本期刊。論文出版時間界定在2021 年1 月1 日—2023 年7 月10 日, 具體步驟為: 首先利用“圖情新文” 服務底層的信息資源管理領域論文分類器, 該論文分類器依托于課題組研究生對信息資源管理領域論文的編碼標注數據以實現論文的自動分類, 并通過調用相應大模型翻譯接口, 實現對英文論文標題、摘要、關鍵詞的自動翻譯, 并對選定時期內中外文期刊論文數據集進行分類, 提取歸屬“健康信息學” 類目的中英文論文; 再在該論文數據集中, 提取標題、關鍵詞中包含“醫”“病”“藥”“健康”“衛生” 等字樣的論文; 兩者合并后經過人工核對與篩選, 最終得到847 條外文文獻, 389 條中文文獻, 具體統計信息如表1 所示。
1.2研究方法
本文采用內容分析方法, 通過人工編碼對采集的文獻進行歸類。在初步編碼階段調研并借鑒不同學者的健康信息學研究主題分類進行初步編碼, 王若佳等[12] 將研究內容分為人工智能算法應用、用戶與信息行為、人機交互系統應用、信息技術的臨床應用、信息與知識服務、信息存儲與組織、信息檢索與系統、文獻與信息計量, 岳麗欣等[15] 概括為健康信息管理與服務、健康信息素養與教育、健康信息保護與信息技術影響、健康信息交流與傳播4 個方面, Tian P 等[18] 分為5 個子主題, 包括健康信息需求和搜尋行為、健康信息素養、社交媒體中的健康信息與電子健康記錄。參照以上學者的研究,筆者研究團隊5名碩士生對文獻集進行了初步分類標注, 標注過程發現健康信息學的學科交叉性強、研究內容多種多樣, 經兩名教師和標注人員參照初標結果進行頭腦風暴討論, 最終將文獻類目定為健康需求與搜尋行為、健康信息技術研究、健康信息服務、公共衛生健康、健康信息素養、健康信息學中的文獻計量、社交媒體中的健康信息, 并制定各類目標注的編碼標準如表2 所示。由于各類別有交叉關系, 在分類過程中以文獻的研究內容和研究方法為參考進行分類。隨后, 由全部標注人員根據該標準交叉核查調整初標結果, 標注結果不一致的論文經小組討論后達成一致。
這7個類目基本涵蓋了信息資源管理領域中健康信息學研究的主題, 其中健康需求與搜尋行為、健康信息技術研究、健康信息服務是基礎主題, 表明信息資源管理領域學者對健康信息學的研究, 仍然遵循從用戶、技術、服務三要素開展的基本范式;其他4 個主題屬于健康信息學與信息資源管理子領域的交叉研究, 如與文獻計量學的交叉、與社交媒體的交叉。總體看來, 信息資源管理領域健康信息學研究的主題結構如圖1 所示。
2 國內外健康信息學研究主題對比
健康信息學在信息資源管理領域的研究主題非常豐富, 尤其是人工智能等信息技術的發展與應用促進了健康信息學進一步發展, 健康信息學主要包括健康需求與搜尋行為、健康信息技術研究、健康信息服務、公共衛生健康與健康素養和其他與健康信息學交叉學科的研究, 各類文獻占比情況如圖2所示。其中, 因外文數據來源包含生物醫學和健康信息學同行評審期刊Journal of the American MedicalInformatics Association, 其文獻多聚焦于健康信息技術研究與應用, 使得外文文獻中健康信息技術研究論文較多。本文對各主題下論文進一步進行篩選,針對不同的細分研究點, 挑選其中有代表性的論文進行歸納, 對比不同主題下國內外的研究特點和異同。
2.1 健康需求與搜尋行為
健康信息行為是當前健康信息學研究的一個主流方向, 在信息資源管理領域, 健康信息行為的研究一般從人、健康信息、健康信息技術與應用三者之間的交互關系展開[21-22] , 健康信息的研究主題側重于用戶的健康需求與搜尋行為。在特定情景下,個體因認識到健康知識不足而產生健康信息需求[23] ,在滿足健康信息需求過程中, 個體又會產生相應的信息搜尋行為, 主要包括個體如何搜索、查找和利用與疾病、促進個人健康和其他威脅健康因素相關的信息[24] 。近年來, 信息資源管理領域健康需求與搜尋行為研究的主題主要包括健康信息需求、信息搜尋行為及其影響因素、健康信息交流與共享等方面。
健康信息需求是健康信息行為的動機[21] , 研究者關注了不同特征用戶的健康信息需求[25-26] , 在國內外廣泛關注突發公共衛生事件的大背景下, 公共衛生事件中的用戶健康信息需求成為研究熱點[27-30] 。國外研究往往聚焦于微觀視角, 多數研究側重挖掘特定細分群體的健康信息需求, 并由此優化對這些用戶群體的健康信息服務, 例如幼兒母親[31] 、大學生[32] 、患者[33] 、患者家屬[34] 、自殺幸存者[35] 等;國內研究多聚焦于宏觀視角, 側重對健康信息需求的層級分類與體系構建[36-37] 、主題挖掘[29,38] 、演化趨勢分析[39-40] 。國內也有學者結合其他研究主題分析用戶健康信息需求, 例如陳明紅等[41] 從健康視頻彈幕視角提取用戶信息需求主題, 盛姝等[42] 通過構建在線健康社區的用戶畫像和挖掘主題特征揭示不同群體的行為差異和特征, 趙文靜等[43] 探究健康需求與科研產出的動態關系。總體看來, 國內研究更側重于從特定需求場景(如事件)出發探析用戶整體的健康信息需求, 而國外研究更側重于從特定用戶群體出發探析其健康信息需求。
健康信息行為是明確信息需求的健康信息發現行為[19] , 健康信息搜尋行為的研究主要關注兩個方面: 信息搜尋行為的特征及其影響因素。國內外研究探索了醫生[44] 、失語癥患者[45] 、老年人[46-47] 、少數民族[48] 、大學生[49-50] 等群體信息搜尋的信息源及渠道、形成機制和行為特征。目前, 用戶健康信息搜尋行為影響因素的分析主要依托心理學與社會學理論, 如社會支持理論[51-53] 和SOR(刺激—組織—反應)模型[54-55] 。盡管采用的理論基礎相近,但目前學界對健康信息行為的影響因素尚未達成一致。即使對于同一因素, 不同研究間得出的影響程度結論也存在差異, 這對該類研究的實踐可靠性帶來影響。有部分學者試圖用定性研究方法解析健康信息行為影響因素, 如扎根理論[26,56-57] 和定量研究方法元分析[58-59] , 但這類研究目前仍處于探索階段, 還未形成被廣泛認可的影響因素理論模型。此外, 不少研究還進一步聚焦于健康信息搜尋過程中的特定行為或現象, 例如信息規避行為的影響因素[60] 和關鍵路徑[61-62] 、信息過載[63] 對健康信息搜尋行為的作用。
健康信息交流與共享行為的研究對象多為在線健康社區中的用戶, 國內外文獻的側重點有所不同。國內研究關注健康信息交流中的知識需求[64-65] 、知識共享[66-69] 、知識貢獻[70] 、知識采納[71-72] 行為; 外文文獻則更關注用戶的認知機制與認知變化[73-75] 、信息交互過程的動機與反饋[76-78] , 以及健康信息交流的主題與表達方式[79-80] 。
2.2 健康信息技術研究
健康信息學與計算機科學、信息管理系統等學科相互交叉[12] , 國內外健康信息領域的研究應用了大量信息技術模型、算法, 在信息資源管理領域中, 國外健康信息技術研究數量更多、研究對象更豐富。國外研究內容包括心腦電圖等醫學數據分析與醫療診斷、疾病診斷與預測、精準藥物、藥物組合等, 而國內研究集中在醫學的知識組織與挖掘和知識服務。生物醫學中的信息大部分以非結構化或半結構化形式存儲, 自然語言處理技術的應用有助于智能化處理并提取有價值的信息, 如進行醫學文獻的自動簡化[81] 、篩選[82] 與分類[83] , 醫學命名實體識別[84-86] , 構建醫藥領域的知識圖譜[97] , 醫學領域知識問答[88-90] 與知識表示[91] , 虛假信息識別與預測[92-93] , 以及在線健康社區和社交媒體情感分析[94-95] 等。受限于隱私保護以及數據安全, 健康數據管理存在諸多亟需解決的問題[96] , 國外研究分別從數據隱私[97-98] 、數據治理[99-100] 、數據共享[101-102] 、數據倉庫[103] 和數據挖掘[104-105] 的角度探討了健康數據管理的方法和途徑并提出相應建議, 我國健康信息數據管理相關研究較少。
電子健康記錄和臨床決策支持系統的研究與應用也是健康信息技術的熱門研究主題。電子健康記錄儲存著患者的人口統計信息、病歷信息、處方、檢測結果、放射學圖像、臨床記錄等內容[106] , 電子健康記錄不僅提高了就醫效率, 其豐富的數據是健康信息學和醫學研究的重要數據來源。國內信息資源管理領域對電子健康記錄的研究較少, 處于理論研究階段, 齊虹[107] 運用文獻調查法對國外電子健康記錄的語義信息整合研究做了綜述, 牟冬梅等[108] 基于情報學理論提出對電子病歷數據的管理與優化建議。國外對電子健康記錄的技術及可用性[109-110] 、電子健康記錄的標準與法律倫理[111] 、安全使用[112] 、數據規范性[113] 與數據使用情況[114] 等問題進行深入研究, 以推動電子健康記錄的高效、安全使用, 也有研究調查了醫護人員在電子健康記錄使用過程中產生倦怠感的原因, 并提出改善建議[115-116] 。電子健康記錄為疾病診斷與預測提供了豐富的數據, 例如已有不少研究基于電子健康記錄進行診斷與識別疾病[117-118] 和預測疾病發展康復情況[119-120] , 利用電子健康記錄進行藥物劑量監測、藥物濫用判斷以及探究藥物之間的相互作用[121] 。由于隱私和數據安全等因素, 國內獲取電子健康記錄數據難度較大, 相關研究也比較缺乏。臨床決策支持系統通過有針對性的臨床知識、患者信息和其他健康信息來增強醫療決策, 從而改善醫療保健服務[122] 。臨床支持決策系統可以提供醫療診斷、警報系統、疾病管理、處方、藥物控制等服務[123] ,目前仍處于探索階段, 相關研究主要為臨床決策支持系統的設計與優化[124-125] 、決策系統的實際應用及遇到的障礙[126-127] 以及對目前臨床決策支持系統技術模型的探索[128-129] 。
2.3健康信息服務
健康信息服務廣義上是為滿足用戶健康信息需求提供的服務, 可囊括大部分健康信息學的研究,本研究把明確服務平臺或服務對象的文獻歸為健康信息服務。國內外健康信息服務的研究聚焦于公共圖書館、醫療應用程序的健康信息服務, 服務質量評估和服務體系建設。國外對健康信息服務的研究較為分散, 與其他研究主題的交叉性也更大, 例如提供健康信息服務的應用程序設計[130] , 識別影響在線健康信息服務質量和用戶使用意愿[131] 與因素[132] 。國內對健康信息服務的研究有70%以上和圖書館相關, 包括探索國內外公共圖書館健康服務的價值認知和實踐[133-136] , 研究圖書館健康信息服務的發展歷史[137] 和服務策略[138-139] , 探究特定人群的健康信息服務和服務質量評估[140] , 例如老年人[141-142] 、大學生[143-144] 、弱勢群體[145-146] 。除此之外, 也有很多學者關注健康信息服務[147-149] 和健康領域知識服務[150-153] 體系構建。
2.4 健康信息學的交叉學科主題
2.4.1公共衛生健康
公共衛生是通過社會有組織地努力預防疾病、延長壽命和促進健康的科學[154] , 突發公共衛生事件是公共衛生健康研究的一大熱點, 其中輿情研究受到國內外學者的廣泛關注, 包括識別突發公共衛生事件中的輿情特征[155-156] 、變化模式[157] 、傳播演化規律[158-160] , 也有學者關注謠言識別方法[161-164] 、謠言傳播者識別[165-166] 、謠言傳播路徑[167-168] 以及辟謠效果[169] 。公共衛生健康與其他研究主題聯系緊密, 例如有學者探討了公共衛生健康中的隱私保護[170-172] 、健康信息需求[173-174] 以及少數群體[175-176]醫療需求等相關內容。
2.4.2健康信息素養
健康信息素養是指個人獲取、分析、理解并利用信息做出合理的健康決策的能力[177] , 健康信息素養相關研究與其他健康信息學研究主題相互交叉, 分散在多個研究主題中, 例如國內外學者的研究角度包括探索健康信息素養與健康信息行為的關聯[178-179] , 分析公共圖書館健康素養教育現狀及如何提高公眾健康素養[180-181] , 以及衡量特定人群的健康信息素養水平[182-184] 。國內外對健康信息素養理論研究包括健康素養的研究現狀與趨勢分析[185-186] 、量表構建[187] 、健康信息素養教育[188] 、健康素養評價與影響因素[189-190] 、健康信息素養提升策略[191-192]以及健康信息管理[193-195] 。健康信息素養是國內外學者持續關注的研究熱點, 對推動我國衛生事業的發展以及提升居民健康水平有著積極的影響, 預計未來會有更多研究關注如何提高不同人群的健康信息素養。
2.4.3健康信息學中的文獻計量
文獻計量學通過統計學、數學等計量分析方法探究文獻的外部特征和文獻之間的關聯與變化規律,進而探討科學技術的研究現狀與發展趨勢[196] 。已有學者識別了健康信息學的突破性論文[197-198] , 探索了健康信息學的研究主題、研究熱點與演化趨勢[17,199-202] , 國外部分研究聚焦于更小的研究領域,例如某一疾病或藥物研究的文獻計量分析[203-205] 。
在學術影響力以及科研產出上, 近幾年國內研究集中在學術影響力評價方法和評價指標的構建[206-207] , 以及與社會影響力的比較研究[208] 。國外研究從作者性別或期刊之間的差異角度分析, 探索了生物醫學領域的學者在性別上的生產力差異[209] 、科學傳播差異[210] 、引用差異[211] 以及學術研究中的性別不平等程度[212] , 分析了作者學術年齡與學者學術生涯的關系[213] 、反復出現在學術成果中的作者與其專業度的關系[214] 。在期刊差異對比方面, 有學者對不同學科的期刊出版效率差異[215] , 不同醫學期刊特征如語言、出版商、同行評議流程和收費等[216] , 以及論文作者在不同期刊中科學貢獻識別[217] 進行比較分析。有問題的科學文獻發表和學術不端行為是眾多學者關注的問題,有學者長期跟蹤撤回文章的引用情況后, 發現偽造的數據仍被引用[218] , 部分研究探索了生物醫學文獻中的撤稿的文章特征, 包括撤稿原因、作者的身份、合作類型和資助信息[219-220] , 并分析了撤回文章在發表時間、國家(地區)、期刊及影響因子、主題等分布情況[221] 。文獻計量學應用于確定研究趨勢、評價學術影響力以及評價科研成果質量上,健康信息學中的文獻計量相關研究, 呈現了健康信息學的學科研究趨勢與學科特點, 是了解健康信息學的重要途徑。
2.4.4社交媒體中的健康信息
隨著社交媒體的發展, 越來越多的用戶在社交媒體發布、分享、討論健康問題, 研究數據源主要為微博、微信公眾號、Facebook 和Twitter。目前,國內外研究比較分散, 研究角度也多種多樣, 在社交媒體虛假信息識別上, 國內外研究了虛假信息的來源、語義、主題、情感和傳播特征[92,222-226] , 也有學者分析了虛假信息傳播行為影響因素[227] 和辟謠信息主體[228] 。部分研究與健康信息行為緊密相關, 例如探究社交媒體用戶的信息需求[229] , 信息交流與共享行為、共享動機和影響因素[230-236] , 信息共享意愿[237] , 共享信息的創建過程[238] , 微信公眾號信息采納及影響因素[239-240] , 社交媒體中的健康信息的情感分析[241-243] 。還有研究探索用戶對社交媒體中的官網賬號的信任度[244-245] , 社交媒體中健康信息內容存在種族偏見風險[246] , 通過信息特征預測社交媒體上健康信息是否能被采用[247] ,了解社交媒體中公眾對藥物批準的看法[248] 。社交媒體是健康信息重要的數據來源之一, 可以看出,學者關注點集中在社交媒體中健康信息的傳播方式與用戶健康信息行為, 以及了解社交媒體中的公眾的健康信息需求并進一步提供健康信息服務。
3總結與展望
3.1總結
縱觀近年來國內外信息資源管理領域學者對健康信息學開展的研究, 研究主題非常豐富, 研究內容多彩, 研究成果數量豐厚, 分析發現: 健康信息需求與信息行為和健康信息服務是國內外學者的關注熱點, 理論研究與實踐研究方法已趨于成熟。在研究內容上, 國內傾向于分析特征、影響因素以及演化趨勢, 國外研究對象更多元。健康信息技術方面, 國外相關研究內容廣、數量多, 尤其是在電子健康記錄與臨床決策支持系統方向上, 也與國外的電子健康記錄公開度高有一定聯系, 國外研究對健康數據管理、疾病監控與預測的關注度也更高; 國內研究集中在知識組織、挖掘和知識服務上。
對健康信息學的交叉學科主題的研究國內外差異不是很明顯, 國內外公共衛生健康研究熱點集中在群眾的公共衛生需求和突發公共衛生事件的輿情研究; 健康信息素養聚焦在理論研究、影響因素和健康素養評價; 健康信息領域的文獻計量研究, 國內集中在評價方法和評價指標的構建, 國外研究更關注作者性別或者身份差異和期刊之間的差異與學術影響力以及科研產出的關系; 社交媒體中的健康信息研究比較分散, 多以社交媒體中的健康信息數據為研究內容, 對用戶的健康需求與健康行為進行分析。
3.2展望
對比國內外研究異同點, 為我國健康信息學的發展帶來了諸多啟示, 我國健康信息學的學科發展尚未形成統一體系, 健康信息學的進一步發展離不開健康信息學理論、方法和技術以及健康信息人才的支持[3] , 本文借鑒國外的理論與實踐經驗, 得出以下啟示:
國內在健康信息技術研究及應用上較為薄弱,未來研究可以從兩個方面進行: 一是應用層面, 需要進一步增強健康信息學與情報學、計算機科學等學科的聯系, 在醫學數據分析、醫療診斷、疾病診斷與預測等實際應用上引入成熟的理論和算法模型;二是優化健康數據管理, 強化健康數據管理標準化,探索健康數據共享模式, 制定數據隱私管理規范,并加強電子健康記錄數據, 尤其是心電圖、腦電圖、基因組數據等多種形式數據的儲存與應用, 以便充分發揮其在疾病診斷與預測中的作用。
國內研究需要擴展健康信息服務領域, 除了傳統的公共圖書館健康信息服務, 還可以進一步挖掘特定細分群體的健康信息需求, 以更具針對性地提供健康知識服務。例如, 為殘障人士、文盲、患有特定疾病的患者等特定人群提供健康信息服務, 如在線咨詢、遠程醫療等, 將健康信息視覺化或聲音化, 把復雜的健康概念和信息轉化為直觀易懂的形式, 以滿足特殊人群的健康知識需求。
健康信息學研究可以加大與其他交叉學科的融合, 比如組建跨學科合作團隊, 加強信息資源管理與醫學的關聯, 促進知識交流, 進行相應健康信息學的人才培養和隊伍建設, 同時鼓勵跨學科項目和研究資助, 支持跨學科團隊的合作研究項目, 從而推動學科之間的相互影響和創新, 為解決復雜的健康問題提供更有效的解決方案。