岳麗欣 劉自強* 陳旖旎
(1.南京師范大學新聞與傳播學院,江蘇 南京 210024;2.南京師范大學融媒傳播與輿情治理研究中心,江蘇 南京 210024;3.中國人民大學信息資源管理學院,北京 100872)
21世紀以來,隨著人們生活水平的提高,世界各國(地區)愈發重視健康問題,健康信息數量和規模也大幅增長,如何對海量健康信息進行有效管理并利用,成為研究人員關注的重要研究問題[1-2]。隨著學科交叉、學科融合的不斷深入,逐漸形成醫學領域、生命科學領域、計算機領域和健康信息領域融合的發展趨勢,有效促進了健康信息領域相關研究的進一步拓展深化。
目前,健康信息領域處于快速發展階段,涌現了許多新的研究成果,研究主題在幾十余年內發生了深刻變化,但研究成果多集中于某一具體領域,針對整個領域進行的宏觀研究相對缺乏,不便于研究者把握整個領域的熱點和重點、演變過程和發展趨勢。隨著計算機技術的快速發展,能夠實現研究主題識別與演化分析的方法和工具層出不窮,基于這些優秀的研究工具與方法,針對健康信息領域的研究主題識別及演化進行深入研究,有利于把握健康信息領域整體的發展現狀與未來發展方向[4-5]。
本文以健康信息領域期刊論文的研究主題為研究對象,對期刊論文中的健康相關研究主題進行識別和發現。定量化、可視化地測度與揭示領域研究主題的擴張與收斂的客觀演變現象,并綜合內部文本和外部引文進行健康信息領域研究主題擴張與收斂模型構建,以此為基礎,對研究主題的擴張與收斂變化特征進行分析。在研究主題擴張與收斂特征分析結果基礎上,對健康信息領域的研究主題進行時序演變分析,總結歸納該領域研究主題的動態演化規律。
隨著經濟的發展和生活水平的不斷提高,信息時代的到來促使公眾的生活發生了巨大變化,人們對健康的關注度也越來越高,關于健康的討論也一直是與公眾密切相關的重要問題。因此,對健康信息領域的研究也逐漸展開。
已有研究多集中于健康信息管理與服務、健康信息素養與教育、健康信息保護與信息技術影響、健康信息交流與傳播等方面。比如:Hamid H A A等[6]對醫療大數據中涉及的隱私問題進行研究,并設計了個人健康信息保護模型。Chang S J等[7]對健康信息教育的影響進行研究,通過信息動機行為技能模型,以行為理論為基礎對老年人參與健康信息教育課程前后的電子健康素養進行評價。楊夢晴等[8]通過對“平臺—PHIM—健康目標”模式進行介紹和研究,提出促進個人健康信息管理水平的合理建議。向前等[9]基于個人健康檔案的特征,創新性地將區塊鏈技術應用于個人電子健康信息管理中,實現健康信息的共享,為醫療機構和行業的健康信息管理提供新的思路。劉詠梅等[10]針對老年人的在線健康信息服務使用價值展開研究,設計價值研究方案論證在線健康信息服務對老年人的利弊。概括來說,目前國內外健康信息領域的研究多集中于某一具體方面,缺乏對整個領域宏觀層面的研究,本文將從宏觀視角出發,對整個領域的研究進展、研究現狀進行歸納總結,并探索領域發展的規律模型。
圖情領域中的“主題演化”是指基于科技文獻之間的引用、耦合等關系對科技文獻進行集合分析,通過主題識別等方法識別出研究主題,并基于時間序列窗口進行階段劃分,對研究主題在時序上的變化現象進行分析,進而對整個學科領域的研究內容、研究現狀、研究熱點以及研究趨勢進行分析概括[11-12]。目前,關于“主題演化”的研究主要集中在兩個方面:一是引文網絡特征視角下的研究主題演化:羅雙玲等[13]基于引文網絡識別領域主題,提出將半積累概念引入引文網絡,通過社區主題識別方法識別研究主題,并基于引用強度構建主題識別演化路徑。王卓等[14]通過構建引文網絡對學科領域間研究主題的演化進行分析,對學科融合中研究主題的發展變化進行總結,并對學科領域的發展演變趨勢進行總結;二是文本特征視角下的研究主題演化:譚春輝等[15]通過LDA主題模型抽取研究主題,并基于主題生命周期識別熱點主題,結合時間片構建主題的演化路徑,從數據挖掘研究的理論維度和應用維度來對比分析國內外數據挖掘領域熱點主題演化的區別與聯系。朱光等[16]基于LDA模型識別領域研究主題,然后利用共詞分析繪制語義更為獨立的主題凝聚子群,在此基礎上,從時序關聯維度計算相鄰窗口下主題間的相似度構建演化路徑,分析信息隱私領域的研究主題演化情況。概括來說,目前領域研究主題演化相關成果大都側重主題演化路徑識別[17-18]及其可視化[19-21]的實踐工作(即如何有效識別研究主題演化路徑、繪制主題演化路徑圖譜等問題),缺少對領域研究主題的規模、結構特征變化演化規律的深入揭示,難以有效把握領域知識增長過程中的研究主題時序演化特征,影響了領域研究主題演化分析的準確性和科學性。
因此,本文擬從知識增長、擴散過程中研究主題擴張與收斂現象切入,探索健康信息領域研究主題結構性、系統性時序變化問題,即對知識增長過程中的研究主題擴張、收斂時序演變過程進行動態跟蹤建模,以期揭示健康信息領域研究主題擴張與收斂的基本特征,并以之為基礎,歸納、總結健康信息領域研究主題的動態演化規律。
PubMed數據庫由美國國家醫學圖書館下屬的國家生物技術信息中心(National Centerfor Biotechnology Information,NCBI)研發,是目前全球使用最廣泛、收錄文獻最全的生物醫學類文獻數據庫,涵蓋生物、醫學、健康信息、健康保健系統、護理和臨床科學等諸多領域的學術期刊,與Web of Science數據庫相比,它具有面向特定學科領域(如健康信息領域)更加專業、全面、公開免費、更新速度快和配套檢索工具便利等特點。因此,本文選取PubMed數據庫作為數據來源。
為了保證數據獲取的科學性和有效性,本文通過文獻調研、專家咨詢等方式,確定若干能顯著代表健康信息領域的檢索詞,通過PubMed數據庫人工標引主題詞[MeSH]提高查準率和人工標引主題詞[MeSH]+自由詞限定提高查全率,具體使用PubMed主題檢索結合題名檢索的方式構建檢索式。本文研究所需要的健康信息領域研究數據的收集獲取步驟,包括健康信息領域文本數據的獲取、處理,以及健康信息領域引文數據的抓取和處理。
具體檢索式為:“health information”[MeSH Major Topic] OR “health information”[Title] OR “health communication”[MeSH Major Topic] OR “health communication”[Title] OR “E-health information”[MeSH Major Topic] OR “E-health information”[Title] OR “health informatics”[Title] OR “health management”[Title] OR “Electronic Health Records”[Title]。將文本可用性(text availability)限定為包含abstract,文獻類型(article type)限定為期刊論文(Journal Article),即Filters applied:Abstract,Journal Article,數據時間跨度為1974—2020年。然后下載研究數據,包括題名、作者、摘要、發表時間等題錄數據,導出格式為純文本格式(PubMed Format),然后進行去重、過濾空值等數據預處理操作,最終得到有效研究數據10 216條。本文以5年為一個時間段對健康信息領域數據集進行時期劃分,由于1980年之前健康信息領域文獻數據較少,所以單獨將1974—1980年劃分為一個時期,后面每5年為一個時期,共計劃分為9個時期,分別為:1974—1980年、1981—1985年、1986—1990年、1991—1995年、1996—2000年、2001—2005年、2006—2010年、2011—2015年和2016—2020年,健康信息領域數據集在不同時期的數量分布情況如圖1所示。

圖1 健康信息領域不同時期數據分布
通過時間窗口劃分方法將連續自然年份等距劃分為一個時期,可以有效解決數據的短期偶然波動問題,將離群點的影響降低,所以,對研究數據進行時期劃分是目前學科領域研究主題發展、演化分析研究中的必要步驟。
為了有效揭示健康信息領域研究主題發展演化規律,本文采用的研究方法包括以下幾個子步驟(篇幅所限方法步驟不再展開,重點放在結果分析部分),基本框架如圖2所示。

圖2 方法框架
第一步,從內部文本和外部引文兩個維度進行健康信息領域研究主題擴張與收斂程度計算。具體來說,在LDA主題識別結果基礎上,綜合研究主題相關文檔數量以及主題詞分布概率,從內部文本測度研究主題擴張與收斂程度;在健康信息領域引文網絡構建結果基礎上,利用Node2vec算法模型對各個時期引文網絡進行特征提取并表示為高維向量,然后通過T-SNE算法將引文網絡節點向量進行降維,并根據歐式距離測度同一研究主題內部引文網絡節點最遠距離,進而實現從外部引文維度進行研究主題擴張與收斂程度計算。
第二步,在基于內部文本和外部引文兩個維度的健康信息領域研究主題擴張與收斂程度計算結果基礎上,利用科學、嚴謹的數學模型對研究主題擴張與收斂時序變化數據進行跟蹤建模,結合模型構建結果總結、歸納健康信息領域研究主題的擴張與收斂時序演變特征。
第三步,對不同類型的研究主題內容進行分析,根據生命周期理論,結合模型構建結果,將健康信息領域研究主題發展變化過程歸納為萌芽階段、探索階段、加速發展階段、穩定發展階段、衰落階段等(目前發展到第三個階段),依據健康信息領域研究主題內容分析和研究主題演化階段劃分以及原因分析結果,對健康信息領域幾十年來研究主題的動態演化規律進行總結歸納。
本文設計的研究方法具有以下特點與優勢:①從方法技術發展歷程來看,隨著基于神經網絡的嵌入技術的成熟,特別是Node2vec等算法模型的廣泛使用,基于嵌入技術對科技文獻的引用特征進行向量表示學習(引文特征轉換為可計算向量),與LDA模型等傳統機器學習方法相結合,可以有效提高科技文獻分析的深度和全面性(外部引文和內部文本特征的融合)。此外,本文方法是新興神經網絡技術和經典機器學習方法的結合,在一定程度上可以說明文本方法是可行、合理的;②從研究結論方面來看,和定性綜述方法(人工綜述效率低,海量科技文獻的解讀難免疏漏)相比,本文方法將定量與定性分析相結合,能夠更加高效、準確地揭示學科領域研究主題的發展規律,特別是健康信息領域處于快速發展階段,涌現了許多新的研究成果,研究主題在幾十余年內發生了深刻變化,單一定性綜述方法難以有效揭示其演化規律,因此,本文設計的研究方法是十分有必要的。
根據研究方法所述步驟,基于LDA模型分別處理不同時期的健康信息領域文本數據,從而得到各個時間窗口健康信息領域主題,其中,部分健康信息領域研究主題識別結果(研究主題分布時期、具體序號及其下位主題)如表1所示。

表1 部分主題識別結果
在健康信息領域主題識別結果基礎上,結合研究數據時期劃分,按照研究方法進行健康信息領域研究主題擴張與收斂程度計算并構建數學模型,為健康信息研究主題動態演化規律分析奠定基礎。
按照研究方法所述步驟,本文利用Node2vec算法、LDA模型等技術方法進行健康信息領域研究主題擴張與收斂計算。首先,結合時期劃分和健康信息領域研究主題識別結果,分別計算各個時期基于內部文本的健康信息領域研究主題擴張與收斂程度(綜合主題文檔數量和主題詞分布概率進行測度),進而得到內部文本特征下的健康信息領域研究主題擴張與收斂時間序列。然后,基于Node2vec算法對健康信息領域各個時期引文網絡進行特征提取并表示為高維向量,通過T-SNE算法將引文網絡節點向量進行降維,并分別計算各個研究主題所占空間面積(直徑由各個主題內部節點最遠距離確定)的時序變化,得到外部引文特征下的健康信息領域研究主題擴張與收斂時間序列,各個時期研究主題擴張與收斂計算結果如圖3所示。

圖3 各時期健康信息領域研究主題擴張與收斂
在各個時期研究主題擴張與收斂計算結果基礎上,將基于內部文本和外部引文的研究主題擴張與收斂程度時間序列數據進行融合,得到融合內外特征的健康信息領域研究主題擴張與收斂時間序列,以散點圖的形式繪制時間序列趨勢圖以輔助函數模型選擇。然后,進行數學擬合建模工作,通過大量實驗進行模型選擇、參數調試,從而構建模型方程并確定具體參數。最后,得到健康信息領域研究主題擴張與收斂模型,根據健康信息領域內部文本和外部引文融合的主題結構演變時間序列4種走勢(一直快速增長、一直增長但近時期增長減緩、波動增長以及近幾個時期開始下降),將所構建的模型方程總結、歸納為研究主題擴張ExpGro1模型、研究主題擴張ExpGro2模型、研究主題收斂Logistic模型和研究主題收斂BiHill模型4種,基本信息如表2所示。

表2 健康信息領域研究主題結構演變模型信息
具體來說,健康信息領域研究主題可以根據模型構建結果分為4類:具有收斂特征(收斂Logistic模型)的研究主題,如圖書館健康信息服務、健康信息管理、健康信息共享、健康信息交流、信息需求分析、健康管理、健康意識等;波動收斂特征(收斂BiHill模型)的研究主題,如區域衛生信息化、健康決策、信息質量評價、健康教育、健康促進等;具有擴張特征(擴張ExpGro1模型)的研究主題,如健康信息傳播、健康信息搜尋、跨理論模型、新媒體信息技術、信息服務體系、健康信息教育、信息服務評價等;具有波動擴張特征(擴張ExpGro2模型)的研究主題,如患者健康信息、電子健康檔案、信息平臺建設等。
根據模型構建結果分析可知,健康信息領域研究主題不單在數量上呈現出快速增加趨勢,而且部分研究主題基于經濟社會、信息技術的不斷發展有了新的內容,或者衍生出新的研究主題,或者研究主題的規模漸趨穩定。此外,部分研究主題在一段時期內發展速度加快,之后速度放緩,再之后重新加速,呈現出波動上升的狀態,尚未出現研究主題消亡的情況。選取典型的研究主題對以上4類研究主題進行具體的內容分析。
1)收斂特征(收斂Logistic模型)典型研究主題內容分析
典型研究主題:圖書館健康信息服務。圖書館健康信息服務產生于20世紀70年代,此時處于健康信息領域發展萌芽階段;20世紀90年代,圖書館健康信息服務的相關研究逐漸增加,研究內容不斷發展和擴大;到了21世紀增速加快,研究內容逐漸趨于穩定。圖書館健康信息服務是健康信息領域和圖情領域融合發展的產物[22],由于學科的不斷融合,健康信息領域結合圖情相關的理論與方法在健康信息服務方面取得重要研究成果,圖書館健康信息服務主要包括圖書館健康教育和圖書館健康服務兩個方面。
圖書館健康信息服務相關研究在前3個時期處于穩定增長狀態,研究范圍逐漸擴大;在第4時期快速增長,研究內容和規模迅速擴大;在第7時期增速放緩,研究內容和規模趨于穩定。因此,圖書館健康信息服務是健康信息領域研究的重點內容,未來的發展趨勢依舊是增長狀態,但若無新概念的介入,增速將逐漸放緩,成為健康信息領域一個比較成熟的研究主題。
2)波動收斂特征(收斂BiHill模型)研究主題內容分析
典型研究主題:區域衛生信息化。區域衛生信息化產生于20世紀90年代[23],處于健康信息領域發展的探索階段,自形成起就具有穩步增長的發展特點,尤其在2010年后迎來小小的發展高峰,相關研究逐漸增多,但區域衛生信息化的研究內容自形成起尚未出現太大變化,屬于波動收斂的研究主題。
區域衛生信息化產生初期,即在第4、5時期屬于逐漸增長的發展趨勢,在這個時期主要對區域衛生信息化的可行性進行論證評估,并初步探討如何建設的問題;第6時期的研究仍然是論證可行性,沒有新研究內容的擴展,研究增速放緩;第7時期,信息技術的飛躍式發展為區域衛生信息化提供了方法和思路,研究內容和規模迅速擴大;第8時期對于區域衛生信息化系統的構建與評價研究已逐漸趨于成熟;第9時期研究主題進一步穩定。區域衛生信息化呈現出動態收斂的特征,是健康信息領域的重要研究內容。
3)擴張特征(擴張ExpGro1模型)研究主題內容分析
典型研究主題:健康信息傳播。健康信息傳播產生于2005年前后,處于健康信息領域發展的探索階段后期,2010年,健康信息傳播的相關研究迅速增加,成為快速發展的新興主題。在健康信息傳播相關研究中,“傳播”的概念是在“交流”和“共享”的基礎上發展而來。社會水平的不斷發展,人們的健康信息意識逐漸增強,在獲取健康信息后開始與他人進行交流和分享[24],這是健康信息傳播最早的萌芽;之后學科的不斷融合發展,新聞傳播領域的概念與健康信息交流、健康信息共享的概念相融合催生了健康信息傳播的研究。
健康信息傳播在前5個時期屬于平穩增長狀態,到第6時期研究規模迅速擴大,所涉及內容范圍越來越大,其內容進一步豐富,開展了針對健康信息傳播行為等的研究,尤其是技術不斷完善的背景下,其發展越來越快,因此,該研究主題呈現出擴張的特點,是健康信息研究領域熱點內容。該主題將在一定的時間范圍內呈現持續擴張趨勢。
4)波動擴張特征(擴張ExpGro2模型)研究主題內容分析
典型研究主題:患者健康信息。以患者健康信息作為范例介紹具有波動擴張特征的研究主題。患者健康信息的相關研究形成于20世紀70年代,由于健康信息領域最早依賴于生物醫學領域[25],因此,患者的概念一直沿用至今,同時患者也是健康信息領域研究的重點研究對象之一。患者健康信息在發展初期一直呈現平穩發展狀態,但到21世紀初期,相關研究增速放緩甚至出現下降趨勢,直至21世紀10年代前后,相關研究再次快速增長,研究內容和研究規模也逐漸擴大。
患者健康信息前4個時期為平穩增長階段,研究內容逐漸展開;在第5時期和第6時期出現下滑,研究內容趨于穩定甚至呈現減小趨勢;第7時期以后再次進入增長狀態,研究范圍和規模迅速擴大。因此,患者健康信息研究在健康信息領域屬于重要的研究內容,由于社會的不斷發展為患者健康信息不斷注入新的內容,在一段時間內,患者健康信息的研究還將處于穩定增長的發展趨勢。
本文根據模型構建結果,對不同模型類別的健康信息領域研究主題內容進行了分析。在上述研究結果基礎上,本文結合研究主題的聚類結果,如圖4所示,進行健康信息領域研究主題動態演化規律總結歸納分析。

圖4 健康信息領域研究主題聚類結果
分析圖4可知,目前健康信息領域研究主題主要涉及5個方面的內容,分別是健康信息素養、健康信息需求、健康信息行為、健康信息服務以及健康信息系統,因此,健康信息領域研究主題動態演化規律的總結將分別從這5個方面進行具體闡述。
1)由對健康信息的認可到利用再到評價的健康信息素養變化
健康信息素養的相關研究開始于20世紀60~70年代前后,健康信息素養相關內容的研究主題發展演化呈現出如下規律:由公眾對健康信息的認可,到對健康信息的利用,再到對健康信息的評價。20世紀60~70年代,公眾健康意識剛剛覺醒,健康素養萌芽,隨著信息技術的不斷發展,“信息”的概念逐漸深入人心[26],健康素養逐漸演變為健康信息素養,該階段健康信息素養主要體現在對健康信息的認可。公眾逐漸發現健康信息的重要性,了解到健康信息對個人健康管理的必要性,健康信息素養主要體現在公眾對健康信息的了解、接受與認可。20世紀90年代起,健康信息素養的研究范圍進一步增大,對健康信息的需求增多,但由于人們缺乏辨別健康信息真偽的能力,對于提升自身健康信息素養的要求迫切,希望能夠掌握對健康信息的利用,因此,健康信息素養教育的相關研究逐漸開展。
發展至今,健康信息素養已不再僅僅局限于對健康信息的利用,人們逐漸對健康信息以及健康信息服務開展評價。健康信息質量評價包括健康信息評價和健康服務評價,信息評價是指用戶對所獲取信息、事實或資料的評價,而服務評價則一般是指醫療機構所提供的治療方式或服務水平的評價。
2)由專業集中性、單一被動性到多主體性、多層次性的健康信息需求變化
健康信息需求相關內容的研究主題的發展演化呈現出如下規律:健康信息需求由專業集中性、單一被動性到多主體性、多層次性。各個時期的健康信息主體以及健康需求表現的發展變化具體如下:20世紀80年代,基于健康素養的不斷提升,健康需求的概念逐漸形成。隨著學科的不斷融合發展,公眾逐漸表現出對健康信息的需求,相關研究逐漸出現。該階段健康信息使用主體的健康信息需求表現為專業集中性以及單一被動性。20世紀90年代起,隨著健康信息素養的提升,除專業醫護和相關疾病患者之外的普通大眾對健康信息的需求有所提升[27],尤其是部分特殊人群,如老年人、兒童、孕產婦、殘疾人等,這類人群由于特殊的生理性,對健康信息的需求增強;此外,由于健康信息領域已經發展到了一定的程度,已有研究成果的積累,科研人員為實現科學研究的進一步發展對健康信息的需求愈發明顯。該階段健康信息使用主體的健康信息需求表現為專業性與普適性相結合以及主觀與客觀相結合的被動型。
信息技術的進一步發展促使健康信息需求的相關研究有了更新的內容,由于整體健康信息素養的普遍提升,全體公眾對健康信息的需求進一步加強;研究成果的不斷累積促使相關研究快速增加;大眾傳媒、互聯網技術的大發展更加拓寬健康信息的來源。
3)由搜尋性到傳播性再到評價性的健康信息行為演變
健康信息行為相關內容的研究主題發展演化呈現出如下規律:健康信息行為由搜尋性到傳播性再到評價性演化。本文在普遍群體共同擁有的特征視角對各個階段的健康信息行為特點進行總結。20世紀80年代,隨著健康信息素養以及健康信息需求相關研究成果的積累,對于公眾健康信息行為的研究逐漸開展。該階段公眾的健康信息行為以搜尋行為為主,帶有明顯的搜尋特點。健康信息搜尋行為來源于健康信息檢索行為、健康信息收集行為、健康信息采集行為等概念,主要包括搜尋動機、搜尋途徑、影響搜尋的因素等方面。20世紀90年代,由于公眾健康信息素養的提升,普通人群對健康信息也有了需求,健康信息行為除了搜尋性之外,更加具有傳播性。該階段由于信息技術的不斷發展,健康信息搜尋行為的搜尋途徑有了新的內容,也更加促進了健康信息傳播行為的發展。發展至今,因健康信息素養的不斷提升加之互聯網技術的飛速發展,人們不再滿足只是獲取和傳播健康信息,而是更加側重于對健康信息的利用及評價,因此,該階段健康信息行為更加具有評價性。
健康信息搜尋行為以及健康信息傳播行為基于互聯網技術的不斷發展,普通公眾的搜尋途徑由線下逐漸轉變為線上為主兼線下為輔的方式;各類數據庫資源的建設逐漸完善,專業醫護在書籍等紙質資源的基礎上增加了眾多的電子資源;而傳播方式方面,線上健康社區的廣泛建設,使健康信息的傳播更加便捷,更增加了健康求助等新的內容。健康信息海量增加,公眾對健康信息質量的要求開始提升,因此,該階段的健康信息行為更具評價性。
4)“圖書館+醫療機構”到“圖書館+多平臺”的健康信息服務變化
健康信息服務相關內容的研究主題發展演變呈現出如下規律:由“圖書館+醫療機構”提供的文獻知識型健康信息服務向“圖書館+多平臺”提供的數字消息型健康信息服務轉變。20世紀70年代前后,健康信息服務隨著健康信息素養與健康信息需求的不斷發展而逐漸形成。該階段的健康信息服務主要由圖書館和專業醫療機構提供。前期的大部分健康信息需求來自于患者及家屬,因此,大多數由專業醫療機構提供健康信息服務,部分專業醫學圖書館也可以面向專業醫護人員提供提升專業技能的健康信息服務;而到了該階段后期,由于普通公眾的健康信息需求上升,圖書館作為面向社會群體最廣的社會服務機構,自然而然地承擔起了提供健康信息服務的社會職能[28]。20世紀90年代以后,尤其發展至2010年左右,信息技術的快速發展深刻影響著人們的生活方式,加之經濟水平的不斷提升,公眾健康信息需求急速上升,對健康信息的要求不再僅僅是針對相關疾病,更注重養生、保健等信息。醫療衛生機構在此階段依舊是提供專業的醫療服務,而圖書館的健康信息服務職能則大大提升。
發展至今,健康信息服務由單一性的健康醫療服務轉向健康消息服務,健康信息服務的來源與途徑越來越多,所涉及的研究內容也愈加廣泛,尤其是在面向多健康信息利用主體上,更加具有層次性以滿足公眾日益增長的健康信息需求。
5)由框架設計到平臺設計的健康信息系統變化
健康信息系統相關內容的研究主題發展演化呈現出如下規律:由框架設計到平臺設計的健康信息系統變化。20世紀70年代起,健康信息的不斷豐富,促使逐漸開展以管理健康信息為目的的健康信息系統建設。該階段的健康系統建設主要是提出整合醫療資源和部分疾病相關的健康信息的信息管理方式,是一種概念結構。20世紀末21世紀初,信息技術的不斷發展與完善,促使健康信息系統建設由概念轉向實踐,主要涉及系統模式、分析與設計、應用與評價、監控管理、隱私保護等方面[29]。
健康信息系統的建設經歷了由理論研究向實踐建設的轉變,同時,在涵蓋范圍上實現了由單一分散性的各部門、機構向多部門、跨地區的集成性轉變。
為了更好、更深入地分析健康信息領域研究主題動態演化規律,本文從國家戰略政策與法規、社會環境、信息技術和學科交叉融合等方面,對健康信息領域研究主題演化變遷原因進行揭示分析。
1)國家戰略政策與法規引領
健康信息領域研究主題在演化過程中,關鍵演化階段的變遷與國家戰略政策、法規的聯系密不可分。自20世紀50—60年代起,國外發達國家(地區)率先發布與“健康”“醫療保障”“醫療促進”等相關的政策,通過立法的形式將健康管理的概念與內涵進行明確,并推動健康事業、健康產業的快速發展。英國通過《國家健康服務法》確立國家衛生服務保障體系。美國提出要將健康管理納入國家醫療保障計劃,在1971年為健康維護組織提供立法依據,并于1973年正式通過了《健康維護法案》。隨后,德國等發布健康信息政策,建立健康信息管理組織。20世紀80年代左右,亞洲地區逐漸開始在醫療衛生領域進行探索改革,相繼開展全民健康運動,其中,日本為應對老齡化加劇,在全國范圍內開展中老年健康運動,將健康產業與養老產業作為健康事業最為重要的項目。印度的健康事業來源于醫藥產業,此時期印度實現醫藥產業轉型,進一步將制藥、醫療服務等向國際推出,積極開展區域合作。中國啟動醫藥衛生體制改革,針對國內醫療衛生機構、醫藥產業進行改革,促進國內公共衛生事業發展。基于上述政策背景,健康信息領域的發展進入萌芽期,該階段的研究側重于生物醫學領域,研究主題規模和數量逐漸增大。
20世紀90年代后,歐美發達國家(地區)率先擴大本國內健康政策覆蓋范圍,提出將醫療系統、藥品生產、醫療器械生產以及健康服務管理等放于同等地位和水平,對健康服務管理機構等納入統一管理,開展全民健康信息服務。其中,美國集成醫療、健康等為一體的健康信息服務產業,發布健康信息管理政策,加大政府財政支出,實現醫療機構、醫療服務企業、政府部門多方聯動。中國公布《關于深化醫藥衛生體制改革的意見》,全面啟動新一輪醫改,并逐漸探索國內健康事業建設。在此背景下,健康信息領域進入探索階段,圍繞“健康信息”的探索逐漸展開,尤其是基于健康信息服務的研究呈現出大量增長趨勢。
21世紀10年代以后,國外發達國家(地區)基于健康的政策已經趨向于成熟,健康信息管理體系已然成型,處于進一步的修改與完善階段。尤其歐美等國家(地區),已經有了較為完善的國家健康服務體系(National Health Service-system,NHS)。國內于2012年發布《中國的醫療衛生事業》白皮書,對30余年來國內醫療健康事業的發展進行總結回顧,并對未來的發展作出規劃,2016年后發布《“健康中國”2030規劃綱要》《“十三五”衛生與健康規劃》《國務院關于實施健康中國行動的意見》《健康中國行動(2019—2030年)》《健康中國行動組織實施和考核方案》等一系列政策文件,大大促進了國內健康事業的發展。基于上述背景,健康信息領域進入加快發展階段,健康信息服務、健康信息需求以及健康信息素養等的研究內容及規模不斷發展壯大。
2)社會環境因素驅動
社會環境因素涉及范圍較廣,一般而言主要包括經濟、文化、政治和具體社會事件等,本文從以上幾個方面的影響對健康信息領域的發展變化原因進行分析。20世紀50年代,二戰剛剛結束,經濟亟需復蘇,西方資本主義國家(地區)為了戰后經濟恢復,率先發起第三次科技革命。科學技術帶來的經濟效益十分明顯,西方國家(地區)經濟快速復蘇并蓬勃發展,人們生活水平得以改善,現代醫學的發展在西方本就有積累,因此,健康信息領域在歐美發達國家(地區)起源并得到迅速發展壯大。經濟的不斷發展促使在健康信息領域的研究逐漸興起,健康信息領域進入萌芽階段。但此時中華人民共和國剛剛成立,百廢待興,經濟實力與西方發達國家(地區)相差甚遠,國內醫療衛生事業建設尚未得到重視與發展,關于健康信息領域的研究尚未起步。
20世紀末,世界經濟持續穩定發展,物質生活水平得到極大改善,西方發達國家(地區)憑借數十年積累的優勢持續在健康信息領域占據主導地位。由于國外醫療事業發達,對健康信息領域的研究開展較早,已經逐漸形成舉國上下較為完善的健康信息服務體系。由于歐美文化和政治的影響,西方世界人們對健康更加注重,健康信息素養普遍較高,在一定程度上更加促進健康信息服務的進一步完善和發展。改革開放后,中國經濟得到快速發展,人民生活水平也逐漸提升,與國外交流增多,基于經濟與西方文化的影響,人民健康信息素養得到提升,國家開始重視醫療衛生事業發展,尤其在2003年非典過后,國內更加注重公共衛生健康事業的發展,中國關于健康信息領域的研究由此開展并在數年內取得了一定的研究成果。基于上述背景,健康信息領域的研究范圍進一步擴大,領域研究進入探索階段。
2010年后,國外健康信息領域持續穩定發展,國內由于經濟水平的不斷發展,加之更具優勢的特色社會主義制度,關于健康信息領域的研究進入快速發展階段,與西方發達國家(地區)的差距逐漸減小。尤其在2019年末—2020年初新冠肺炎疫情席卷全球的背景下,中國在面臨突發公共衛生事件的應對上,由于政治制度優勢,在迅速遏制疫情、保障人民生命健康安全、穩定經濟發展等方面具有十分明顯的優勢。國內外基于疫情開展的健康信息領域的相關研究主題迅速增加,研究成果和研究主題內容及規模呈現井噴趨勢,并在健康信息領域發展階段掀起一股高潮。健康信息領域的研究在熱點社會事件的驅動下,領域的研究內容與范圍進一步擴大和發展,由此進入了加速發展階段。
3)信息技術推進
20世紀50年代,第三次科技革命率先在西方國家(地區)興起,科技革命帶來的新的技術與工具極大地改變了人們的生活方式和生活習慣,同時對健康信息領域的發展產生了重大影響。尤以第三次科技革命中電子計算機的發展對健康信息領域產生的影響最為顯著。20世紀60—90年代的30余年里,計算機技術數次革新,深刻改變人們健康信息的獲取、利用、傳播及管理。人們健康信息最初的來源是專業醫護的口口相傳,隨著健康信息需求的不斷提升,書籍、報刊等紙質媒介逐漸成為最為普遍的方式,而計算機技術的發展為人們獲取、交流、共享健康信息提供了新的途徑,盡管在該階段網絡獲取、傳播健康信息的方式尚未真正形成,但已有相關研究開始探索其可行性以及必要性。此外,數據庫技術在該階段已有一定程度的發展,人們逐漸掌握基于計算機數據庫對就診患者的信息進行記錄和儲存,是健康信息技術化管理的有效初探。基于上述背景,健康信息領域基于技術的相關研究逐漸開展,領域發展進入萌芽階段。
20世紀末—21世紀初,互聯網技術逐漸興起,加之人們生活水平的提高,健康信息素養逐漸提升,健康信息需求隨之提升,書籍、報刊、雜志等資源已無法滿足普通公眾的健康信息需求,人與人之間的健康信息交流愈發頻繁。互聯網技術經過一定時期的積累,逐漸在歐美發達國家(地區)得到一定的推廣,人們逐漸掌握通過網絡查找相關信息的方法,慢慢形成一種新的獲取方式。與此同時,數據庫技術愈發成熟,醫療衛生機構基于數據庫構建健康信息系統的研究逐漸開展,該系統的建設研究是健康信息管理發展中極為重要的環節,標志著碎片化的個人健康數據逐漸整合成具有連貫性以及延續性的有研究價值和意義的健康信息。技術的進一步發展促使健康信息領域的研究范圍與內容得到進一步拓展與深化,領域發展進入探索發展階段。
2010年后,互聯網科技革命以及移動互聯網時代到來,電子和信息技術普及應用,社交媒體和大眾傳媒發生重大變化。健康信息的獲取可以由網絡搜索、網絡健康社區交流共享、社交媒體賬號發布等多種形式獲取,人們幾乎徹底以網絡電子資源取代紙質資源。隨著移動互聯網的快速發展,個人健康信息管理出現新的方式,部分針對特定用戶群體的APP逐漸興起,針對特定用戶群體特征提供個性化、差異化的健康信息定制,實現特色健康信息服務。基于健康信息平臺建設的健康信息管理系統逐漸取代數據庫健康信息管理系統,電子健康檔案等的快速發展為實現區域衛生信息化提供了有效途徑。在此背景下,在信息技術的推動下,健康信息領域進入加速發展階段。
4)學科交叉融合激發創新
20世紀50年代前后,生物醫學領域的不斷發展促使健康管理的概念逐漸形成,健康信息領域逐漸興起。健康信息領域初始階段以健康意識、健康素養、健康管理、健康產業等相關研究為主。20世紀60—70年代后,學科之間交叉融合不斷加劇,健康信息領域逐漸吸收管理科學的部分內容,“健康信息”的概念逐漸形成,對健康意識等概念進行了細化和完善。另外,傳播學的相關概念與理論也被健康信息領域所吸納,在健康信息交流以及健康信息共享的基礎上形成了健康信息傳播的概念。健康信息領域萌芽階段的相關概念研究揭示圍繞幾個學科領域的探索與融合,從而形成具有健康信息領域特色的研究主題。
20世紀末,系統科學興起并對其他領域產生較大影響,尤其對生物醫學領域,系統科學的理論方法與生物科學相融合,逐漸形成一門新的學科—系統生物科學。系統論的原理及方法同樣對健康信息領域產生一定影響,健康信息管理出現新的研究內容。在系統論視角下,健康信息管理作為一個系統而言,對健康信息的管理過程應當包括健康信息的收集、整理、組織、儲存、利用以及信息安全等方面,因此,關于健康信息管理的研究出現了基于系統視角構建電子健康檔案以及健康信息管理平臺的相關研究。20世紀末是健康信息管理領域的加速發展階段,該階段健康信息管理的相關研究出現小高峰,這與系統科學與健康信息領域的不斷融合有關,在此基礎上,健康信息進入探索階段。
2010年后,健康信息領域的研究內容愈發廣泛,健康信息素養、需求、行為等相關研究,在繼續廣泛借鑒信息科學與傳播學等的基礎上,融合心理學、行為學等學科的相關理論、原理與方法,并以信息技術為基礎,出現健康信息技術等概念。健康信息技術指的是用于醫療保健信息、健康數據以及通信和決策知識的存儲、檢索、共享和應用,并涉及到計算機硬件和軟件的一種信息處理應用,能夠實現對用戶健康素養、需求、行為等進行真實反映和評價。加速發展階段,健康信息領域廣泛借鑒其他學科的技術和方法等,從而形成了本領域比較具有特色的技術方法。
綜上所述,政策、社會環境、技術、學科交叉等,都是對健康信息領域發展變化起到重要作用的影響因素。政策層面,對健康信息領域的發展起到了指導作用;技術層面和學科發展層面,對健康信息領域的發展起到了促進作用;學科融合發展對健康信息領域的發展起到了理論和方法豐富的作用;社會環境因素對健康信息領域起到了完善的作用。健康信息領域至今不過六七十年的歷史,但國內外發展卻大不相同,國內的發展與國外相比至少要落后近20年。20年的發展差距在2010年后的10余年逐漸拉近,一方面是基于國外優秀成果開展研究;另一方面是與國內經濟快速發展以及優越的社會主義制度息息相關。此外,在技術角度,近年來健康信息領域相關研究,國內外都呈現出浮于表面且無法真正落地的現狀,一方面是因為研究人員過于追求科研成果,不注重實際;另一方面是因為隨著技術的發展到了一定程度與水平,概念的發展一般比實踐先行,技術尚未完全成熟便被其他領域廣泛借鑒,自然會導致相關研究無法落地的尷尬局面。因此,在健康信息領域快速發展的階段尚需對相關信息科技加以甄別妥善利用,穩步實現相關實踐研究。
本文結合文獻計量、數據挖掘和可視化,利用科學、嚴謹的數學模型,對健康信息領域的研究主題擴張與收斂時序變化數據進行跟蹤建模,結合模型構建結果總結、歸納健康信息領域研究主題的擴張與收斂時序演變特征。對不同類型的研究主題內容進行了分析,總結歸納了健康信息領域幾十年來研究主題的動態演化規律。研究發現,健康信息領域研究主題的發展演變過程呈現出以下動態演化規律:健康信息素養從對健康信息的認可到利用再到評價的變化趨勢,健康信息需求從專業集中性、單一被動性到多主體性、多層次性的變化趨勢,健康信息行為從搜尋性到傳播性再到評價性的演變趨勢,健康信息服務從“圖書館+醫療機構”到“圖書館+多平臺”的變化趨勢,健康信息系統從框架設計到平臺設計的變化趨勢。本文存在一定的局限和不足,如研究發現的健康信息領域研究主題動態演化規律的準確性、有效性還需要進一步驗證。健康信息領域正處于快速發展階段,其研究主題演變頻繁,本文總結出的規律可能只適用于特定一段時間內,未來一段時間可能規律變得不再適用。在后續的研究中,將嘗試深入挖掘、揭示健康信息領域研究主題演變過程中更加本質的規律性變化。