, ,,,
阿爾茨海默癥(Alzheimer disease,AD)是慢性或進行性大腦結構器質性損害引起的神經系統疾病[1],是一種非傳染性疾病。其特點是起病緩慢或隱匿且不可逆,病程長且病情遷延不愈,多發于老年期且有多種病因。到目前為止,阿爾茨海默癥的病因、發病機理仍然不明,給臨床上進行阿爾茨海默癥的預防及治療帶來了很大的困難[2]。阿爾茨海默癥患者的日常生活必須持續受到他人監護,醫治花費巨大且在較長一段時間內嚴重影響患者及其家庭的正常生活和工作。因此,阿爾茨海默癥是目前國家重點支持研究的一項重大慢性非傳染性疾病。
目前國內外介紹阿爾茨海默癥研究進展的文獻并不多,葛佳佳在2015年主要從阿爾茨海默癥的藥物治療、神經干細胞移植治療等方面對該研究進展展開討論[3],Galimberti D等人在2013年對2012年關于阿爾茨海默癥臨床以及治療方面的新進展進行了總結[4]。其余的多是針對該疾病的某一方面進行回顧,如阿爾茨海默癥的診療研究進展[5]等。以往的研究大多是對某幾類刊物所發表的關于阿爾茨海默癥的文獻進行總結,目前尚未見到國內外有應用同被引聚類分析、共詞聚類分析及其戰略坐標分析阿爾茨海默癥研究演變歷程的報道,因此本文嘗試運用文本挖掘的方法探討阿爾茨海默癥的研究發展脈絡,以期為該研究專業人員和管理決策人員提供參考。
研究表明,同被引次數可用來反映文獻在內容及主題上的相關度[6]。以此為基礎對這些文獻進行的引文聚類分析,可以描述學科發展狀況和動態結構[7]。本文利用SCI數據庫檢索相關文獻,檢索式為:標題:(“Alzheimer Disease”)OR標題:(“Alzheimer′s Disease”),時間限定為2012年至今,文獻類型選擇“article”,共獲得相關文獻9 662篇。將這些論文的文獻信息導入書目信息共現挖掘系統BICOMB[8],統計引文頻次。截取頻次≥150的文獻作為高被引文獻,共72個,同時構建高被引論文-來源文獻矩陣。將該矩陣導入SPSS 19.0分析軟件中進行系統聚類,聚類方法選擇最遠鄰元素,度量標準選擇Ochiai系數,以此繪制同被引聚類分析樹狀圖。根據樹狀圖將這些高被引論文加以歸類,同時結合這些論文的題目和內容,得出各個類別所研究的主題。
研究表明,可根據兩個高頻主題詞在同一篇文獻中同時出現的次數來分析這兩個主題詞之間的密切程度。對全部高頻主題詞兩兩統計的共現次數進行聚類,可以對當前學科研究進行歸類,從而發現當前研究的熱點[9]。
本文利用PubMed數據庫檢索相關文獻,檢索策略為:“Alzheimer Disease”[Majr] NOT Review[ptyp], 時間限定為2012年至今,共檢索出相關文獻11 790篇。將檢索到的文獻導入BICOMB,統計這些文獻中“主要主題詞+副主題詞”字段的頻次,截取頻數≥60的主題詞作為高頻主題詞,共107個,同時生成主要主題詞+副主題詞的詞篇矩陣。將該矩陣導入SPSS 19.0中進行系統聚類,聚類方法選擇組內連接,度量標準選擇Ochiai系數,以此繪制樹狀圖。根據樹狀圖的聚類分析結果對每一類別的高頻主題詞/副主題詞組合的語義關系加以歸類,從而分析總結出該類別所研究的主題,進而得到近5年阿爾茨海默癥研究的熱點。
戰略坐標(Strategic Diagram)由Law等人于1988年提出[10]。戰略坐標是一個二維坐標,它把每一個研究熱點放置在坐標的4個象限中,從而描述各主題的研究發展狀況[11]。根據各篇論文的發表時間,計算每個類別的平均發表時間,以此反映該類別主題的平均年齡,稱為新穎度;根據各篇論文的被引次數,計算每個類別的平均被引次數,以此反映該類受到關注的程度,稱為關注度[12];分別將新穎度和關注度作為X軸和Y軸,以全部高被引論文的平均發表時間和被引次數為原點繪制出引文戰略坐標,以此反映此前對于阿爾茨海默癥的研究歷史。共詞戰略坐標的橫軸表示向心度,縱軸表示密度,坐標的原點則是兩個軸的中位數或平均數。向心度用來衡量不同類別之間主題詞的密切程度,表示一個學科領域和其他學科領域相互影響的程度;密度用來衡量同一類別中各主題詞之間的緊密程度,表示該類維持自己和發展自己的能力[13]。據此原理,通過繪制共詞戰略坐標來表示阿爾茨海默癥研究領域的基本框架,由此分析目前國際上阿爾茨海默癥研究熱點的發展趨勢。
根據被引頻次≥150的引文詞篇矩陣,利用SPSS 19.0做出聚類分析樹狀圖(圖1)。選擇距離24為分類標準,將72篇高被引論文根據聚類分析樹以及引文的題目和內容分為14類。其中高頻引文均為2013年以前發表,因此反映了阿爾茨海默癥2013年以前的研究歷史。根據各類高頻引文的內容,可將阿爾茨海默癥的研究熱點總結為以下方面。

圖1 同被引聚類分析樹圖
第一方面:關于阿爾茨海默癥的診斷,包括第四類、第五類、第十三類。第四類的主要內容是通過特定臨床特征來診斷阿爾茨海默癥以及利用狀態評定量表來評估患者精神狀態,并研究輕微認知損害對確診阿爾茨海默癥的臨床意義;第五類主要研究阿爾茨海默癥的病理生理學診斷標準,包括通過路易小體、額顳骨的小葉退化、血管性病變進行診斷;第十三類則是研究了利用腦脊髓液作為生物標記信號診斷阿爾茨海默癥,并將其用于對阿爾茨海默癥診斷標準的修正。
第二方面:運用不同的方法判斷阿爾茨海默癥患者的疾病嚴重程度,包括第六類。該類主要講述了運用不同的方法判斷阿爾茨海默癥患者的疾病嚴重程度。如可利用神經精神量表區分AD患者行為改變的嚴重性和頻率,利用心理測試、行為評分以及簡單的心理和行為組合簡單評價,利用臨床癡呆評定量表明確AD患者認知功能受損程度。
第三方面:關于阿爾茨海默癥的預防,包括第十二類。該類主要講述了對某些相關的細胞和分子進行研究有助于開發阿爾茨海默癥預防和治療策略。Mattson MP在2004年指出,由于負責信息的存儲和處理的神經細胞的進行性功能障礙和死亡,會導致AD患者失去記憶以及認知能力,甚至他們性格的巨大改變。因此,了解與神經元死亡有關的細胞和分子的改變,可能會有助于制定有效的阿爾茨海默癥預防和治療措施[14]。
第四方面:對阿爾茨海默癥發病機制以及治療方法等方面進行研究,包括第一類、第七類、第九類、第十一類。第一類介紹了利用全基因組關聯研究來分析與阿爾茨海默癥相關基因,主要研究了與阿爾茨海默癥相關的CLU、PICALM、CRI、CD33等基因,并通過Meta分析集中分析了載體蛋白4種等位基因與遲發性阿爾茨海默癥之間的聯系;第七類主要通過比色測定乙酰膽堿酯酶活性研究阿爾茨海默癥的發病機制;第九類則是根據淀粉樣蛋白假說,研究β-淀粉樣蛋白與阿爾茨海默癥發病機制之間的關系以及β-淀粉樣蛋白定向治療劑可否用于治療阿爾茨海默癥;第十一類研究了突觸損失與阿爾茨海默癥發病的相關性研究,以及根據可溶性蛋白聚體可有效抑制海馬長時程增強,提出了阿爾茨海默癥的特異性治療方法。
第五方面:關于阿爾茨海默癥的病理學研究,該方面包括第八類。該類的病理學研究包括通過石蠟切片和AT8免疫反應評估阿爾茨海默癥的神經纖維病變,同時該類也研究了β-淀粉樣蛋白在AD患者和非AD患者是大腦中病理性的擴展是否存在明顯的差異。
第六方面:對降低阿爾茨海默癥的患病風險以及延遲發病進行討論,包括第二類和第三類。第二類主要是通過德爾菲法了解阿爾茨海默癥的全球發病率,以及通過最近對阿爾茨海默癥發病機制、診斷治療的研究討論如何降低患該疾病的風險;第三類則通過研究未來阿爾茨海默癥患者人口增長的趨勢,評估了可延遲阿爾茨海默癥患者發病的干預措施的潛在影響,以此降低患病風險。
第七方面:利用某些模型對阿爾茨海默癥進行研究,包括第十類、第十四類。第十類的研究熱點是轉基因動物模型在阿爾茨海默癥研究中的應用,包括通過轉基因鼠中神經細胞內β-淀粉樣蛋白聚集、神經退行性變和神經元損失現象研究阿爾茨海默癥;第十四類的主要內容是利用靜息狀態網絡和針對動態生物標記的假設性模型研究阿爾茨海默癥。該方面涉及利用這些模型對阿爾茨海默癥的特征研究、診斷、臨床分期及遺傳學研究。
根據前述聚類結果,得到戰略坐標(圖2)。

圖2 阿爾茨海默癥各研究熱點的引文戰略坐標
根據引文戰略坐標圖,從歷史的角度(即發表時間的順序)依照橫軸新穎度從左向右分析整個阿爾茨海默癥相關研究,分析如下。
第六類和第七類即運用不同的方法判定AD患者的疾病嚴重程度以及對于發病機制的研究,發表時間最早(其中文獻最早發表于1961年),并且關注度也比較靠前,包括用神經精神量表、心理測試、行為評分以及臨床癡呆評定表進行評估以及通過乙酰膽堿酯酶活性研究阿爾茨海默癥的發病機制。這充分表明,對于阿爾茨海默癥的疾病嚴重程度的評估以及發病機制的研究,是開展阿爾茨海默癥研究不可或缺的基礎。
關于第四類通過特定臨床特征診斷阿爾茨海默癥以及利用狀態評定量表評估患者精神狀態,并研究輕微認知損害對確診阿爾茨海默癥的臨床意義等研究文獻的平均發表時間是1992年。早在1975年,就有研究人員提出臨床醫生可用“小精神狀態”對患者的精神認知狀態進行分級和評估[15];在2004年則有相關流行病學研究表明輕度認知障礙可在某些條件下加速轉變為癡呆以及阿爾茨海默癥[16]。盡管這類主題研究開始時間比較早,但目前仍是人們最為關注的阿爾茨海默癥的研究方向。
對于阿爾茨海默癥的病理生理學診斷標準(第五類)和病理學研究(第八類)均開始于上世紀90年代初期。隨著對阿爾茨海默癥研究的不斷深入,目前對阿爾茨海默癥的病理學研究關注度較高,對其病理生理學診斷標準的研究關注度相對較低。
目前,阿爾茨海默癥的淀粉樣蛋白級聯假說的相關研究(第九類)受關注程度很高,而且也比較新穎。假說最早由HARDY JA在1992年提出[17],此類包含的3篇文獻均在講述對于阿爾茨海默癥的淀粉樣蛋白級聯假說的相關研究。這個假說是目前阿爾茨海默癥研究的一個焦點話題。20世紀初期的相關研究主要集中在轉基因動物模型在阿爾茨海默癥研究中的應用(第十類)以及阿爾茨海默癥的一些特異性治療方法(第十一類),但是受關注程度不高,還有很大的發展空間。有學者于2004年提出,利用與負責信息存儲和處理的神經細胞進行性功能障礙或死亡有關的分子和細胞變化研究阿爾茨海默癥(第十二類)。這一研究方向比較新,但受關注程度不是很高。
2007年前后比較新穎的課題是分析與阿爾茨海默癥相關的基因(第一類),研究如何降低阿爾茨海默癥的患病風險和延遲發病(第二類、第三類),以及利用腦脊髓液作為生物標記信號診斷阿爾茨海默癥,并將其用于阿爾茨海默癥診斷標準的修正(第十三類)。盡管發表時間比較近,但是目前除了對如何降低阿爾茨海默癥的患病風險及延遲發病的研究外,其他研究課題的被引用次數均較少。
用靜息狀態網絡和針對動態生物標記的假設性模型研究阿爾茨海默癥(第十四類)是目前關于阿爾茨海默癥的相關研究中最為新穎的,平均發表時間為2009年,受關注程度比較高,尤其是對阿爾茨海默癥的診斷及遺傳性的研究。
本文選出現頻次≥60的前107條“主要主題詞+副主題詞”記錄作為高頻主題詞,利用SPSS 19.0對高頻主題詞進行聚類分析,得到共現聚類分析樹圖。選擇距離24為分類標準,將107條高頻主題詞根據聚類分析樹分成九類,分析各類內主題詞之間的寓意關系,共得出目前阿爾茨海默癥研究以下九類熱點。
第一類:研究了利用哌啶類化合物、茚滿類化合物、膽堿酯酶抑制劑、美金剛、腦代謝改善藥和神經保護藥等治療阿爾茨海默癥。如2014年,Gareri P等人針對聯合使用美金剛和膽堿酯酶抑制劑治療阿爾茨海默癥的回顧性研究[18]。
第二類:在阿爾茨海默癥護理中,對病人日常生活活動和心理活動的研究以及對醫療護理者心理負擔的研究。如2014年Conde-Sala JL等人就阿爾茨海默癥護理者的心理變化軌跡以及影響因素進行研究后,認為患者的精神癥狀以及此護理者是否是唯一的護理者等均會對醫療護理者的心理負擔產生重要影響[19];2015年,Votruba KL等人研究了阿爾茨海默癥患者對于自己精神狀態的認知與護理者對其抑郁癥狀的描述之間的關系,探索了兩者分別在預測阿爾茨海默癥病人的情緒和日常生活活動的作用[20]。
第三類:研究了阿爾茨海默癥的遺傳發病機制,包括β-淀粉樣蛋白、載脂蛋白E類、早老素的遺傳學變化,涉及到遺傳易感性和單核苷酸多態性。如2001年Ertekin-Taner N等人在典型遲發型阿爾茨海默癥遺傳家系中進行了β-淀粉樣蛋白的遺傳可能性研究,提出在典型阿爾茨海默癥中可將該蛋白作為連鎖分析識別位點[21]。
第四類:進行了AD患者體內β-淀粉樣蛋白對神經元的毒性及其與年齡的相關性研究,以及可利用正電子發射斷層掃描(PET)成像技術檢測腦內β-淀粉樣蛋白的累積以診斷阿爾茨海默癥。如Sevigny J等人研究將淀粉樣蛋白正電子發射斷層掃描(PET)成像作為篩選工具來鑒定淀粉樣蛋白陽性患者,從而可以進一步診斷阿爾茨海默癥[22]。
第五類:阿爾茨海默癥患者的物質代謝研究,包括淀粉樣前體蛋白分泌酶的代謝,β-淀粉樣蛋白、β-淀粉樣蛋白前體及tau蛋白在腦、神經元、海馬等處的代謝研究。如Takahashi RH等人在2013年發表的一篇文獻表明β-淀粉樣蛋白肽和軸突微管相關蛋白tau蛋白的病理聚集是阿爾茨海默癥的重要標志[23]。
第六類:介紹了一些阿爾茨海默癥的研究方法(包括運用圖像解釋、計算機輔助、模式識別、自動化、磁共振成像等研究阿爾茨海默癥)和阿爾茨海默癥的病理學研究(包括海馬體、神經元,大腦、白質、淀粉樣斑塊的研究,輕度認知障礙和認知障礙的病理學研究)。如Liao W等人使用單變量和多變量來對輕度認知障礙或阿爾海默病患者的腦結構改變進行的協方差分析,顯示皮質厚度在內嗅、顳和扣帶皮質等處下降更顯著[24]。
第七類:研究了阿爾茨海默癥的診斷及對阿爾茨海默癥病因和其治療的費用方面的研究。如Thomann PA等人通過研究,發現可通過檢查是否有區域局限性海馬體萎縮來進行阿爾茲海默癥的早期診斷[25]。
第八類:通過對阿爾茨海默癥患者的血液和腦脊髓液進行研究確定此病的進展情況,具體可通過對腦脊髓液中β-淀粉樣蛋白、多肽碎片、tau蛋白、生物標志物等物質的研究以及對于載脂蛋白E4的基因研究。如Hoglund K等人2008年發表的文獻指出運用免疫印跡分析Abeta水平可用來判斷有輕度認知障礙的患者是否會發展成阿爾茨海默癥,輕度認知障礙能夠發展成阿爾茨海默癥的患者具有載脂蛋白E基因型和比較高的tau和磷酸tau的腦脊髓液水平[26]。
第九類:阿爾茨海默癥的預防控制、治療以及對β-淀粉樣蛋白與阿爾茨海默癥發病的相關性的研究。如Schott JM 等人2006年發表文獻表明β-淀粉樣蛋白是阿爾茨海默癥一個重要的致病因素,β-淀粉樣蛋白免疫治療是治療阿爾茨海默癥的新的突破點,還可以通過抑制β-分泌酶和γ-分泌酶來診治阿爾茨海默癥[27]。
從上述共詞聚類分析得到9個研究熱點類別的戰略坐標見圖3。

圖3 阿爾茨海默癥相關研究高頻主題詞的戰略坐標
結合共詞戰略坐標(圖3)分析阿爾茨海默癥領域的熱點如下。
第一象限包括類別5(阿爾茨海默癥的物質代謝研究)、類別7(阿爾茨海默癥的診斷)、類別9(阿爾茨海默癥的預防控制及治療)。這3類的向心度和密度相對于其他類來說比較高,內部各研究主題之間關系緊密,而外部又與其他類有著密切的聯系,說明這3類的研究趨向成熟,是阿爾茨海默癥研究的核心主題。
第二象限包括類別2(阿爾茨海默癥患者的心理護理)。此類具有較高的密度,但向心度較低,此類與其他類聯系不緊密,但內部的聚集程度很高,具有較高的聚合度,說明該研究已形成了一定的規模。
第三象限包括類別1(應用哌啶類化合物等治療阿爾茨海默癥)、類別3(阿爾茨海默癥的遺傳學發病機制研究)、類別4(應用PET技術檢測腦內β-淀粉樣蛋白的累積以診斷阿爾茨海默癥)、類別8(應用特定物質確定阿爾茨海默癥的發展情況)。這3類的密度和向心度都比較低,說明其內部結構松散,且與其他類之間的聯系不夠緊密,目前的研究尚不成熟,但未來會受到人們更多的重視。
第四象限包括類別6(研究阿爾茨海默癥患者的某些病理改變)。此類密度低,向心度高,說明該研究熱點內部結構比較松散,但與其他類別聯系緊密,在整個阿爾茨海默癥研究領域中表現活躍,研究人員對此有濃厚的興趣和較高的關注度。雖然該研究主題尚不成熟,但具有巨大的潛在發展空間。
“引文戰略坐標”所用數據為高頻引文,均發表于2013年以前,故由此得到的研究主題應該反映阿爾茨海默癥研究領域在此以前的研究歷史;“共詞戰略坐標”所用數據為2012-2016年間發表論文的高頻主題詞,故由此得到的研究主題反映阿爾茨海默癥研究領域2012-2016間的研究現狀。二者在分析各主題發展狀況時可互為補充。
“共詞戰略坐標”是以向心度和密度構成的二維坐標,在圖中一共形成4個區域,用來描述各個主題發展狀況。位于第一象限,說明該區域內的主題趨向成熟,并與其他主題建立了廣泛的聯系;位于第二象限,說明該區域內的主題研究比較集中,但是與其他領域還未建立廣泛的聯系,具有潛在的發展趨勢。一般來說,趨向成熟和具有潛在發展趨勢的主題通常被引次數比較高,這一點在“引文戰略坐標”圖中可以得到印證。如“共詞戰略坐標”中的第7類阿爾茨海默癥的診斷位于第一象限,其平均被引次數為763,居各熱點平均被引次數排序的第一位,反之亦然。
另外,研究阿爾茨海默癥的預防,在“引文戰略坐標”圖中新穎高較高,但關注度較低;在“共詞戰略坐標”圖中位于第一象限外側,說明該主題隨著時間的發展逐漸受到研究人員關注,后期趨向成熟,成為主流研究之一。通過研究阿爾茨海默癥患者的腦脊髓液來確定疾病進展情況,在“引文戰略坐標”圖中新穎高較高,但關注度較低;在“共詞戰略坐標”圖中位于第三象限,說明該主題自身發展較慢,有待于進一步發展以受到研究人員的關注。
本文也存在局限性。高頻主題詞及高頻引文的閾值選取雖然可利用一些固定算法,但往往不切合實際,因此本文中高頻主題詞和高頻引文的閾值是憑經驗確定的。這會直接影響到高頻主題詞及高頻引文的數量,從而影響聚類結果。這也是高頻主題詞以及高頻引文聚類分析固有的局限性。
通過同被引聚類及引文戰略坐標分析,可以得出阿爾茨海默癥的研究熱點、歷史上的典型研究及其戰略發展趨勢。從各類熱點受關注的程度來看,利用特定臨床特征進行阿爾茨海默癥的診斷是目前最受關注的研究熱點,其次是阿爾茨海默癥的淀粉樣蛋白級聯假說的相關研究。
對于阿爾茨海默癥的發病機制等研究,雖然開始時間較早,但目前仍是專家學者比較關注的研究熱點。關于阿爾茨海默癥相關基因的研究、如何降低阿爾茨海默癥的患病風險以及延遲發病等方面,由于研究時間相對較晚,目前受關注程度不高,具有巨大的潛在研究發展空間,今后將日益受到人們的重視。
通過高頻主題詞的共詞聚類及戰略坐標分析,可以得出阿爾茨海默癥的研究熱點及其戰略發展趨勢。從向心度角度來看,當前阿爾茨海默癥研究中比較核心的問題是阿爾茨海默癥的病理學研究,阿爾茨海默癥患者的物質代謝研究,阿爾茨海默癥的診斷以及阿爾茨海默癥的預防控制及治療;從密度角度看,阿爾茨海默癥患者的物質代謝研究,阿爾茨海默癥的病因及治療方法的研究,阿爾茨海默癥患者的心理護理等都是比較成熟的研究主題,而阿爾茨海默癥的病理學研究還不夠成熟。
其余的主題包括阿爾茨海默癥的遺傳學發病機制研究等都距離研究核心比較遠,同時自身的研究的密度也不夠高,說明這些研究還是有待于進一步發展。