999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

醫(yī)學(xué)文獻(xiàn)檢索關(guān)鍵詞多維分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

2017-02-14 07:48:21曾展鵬
關(guān)鍵詞:分析系統(tǒng)

曾展鵬

廣州中醫(yī)藥大學(xué),廣東 廣州 510006

·中醫(yī)藥信息研究·

醫(yī)學(xué)文獻(xiàn)檢索關(guān)鍵詞多維分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

曾展鵬

廣州中醫(yī)藥大學(xué),廣東 廣州 510006

針對臨床醫(yī)學(xué)文獻(xiàn)關(guān)鍵詞包含有證型、病癥、治療等特點(diǎn),設(shè)計(jì)出醫(yī)學(xué)文獻(xiàn)關(guān)鍵詞多維分析系統(tǒng)。該系統(tǒng)以醫(yī)學(xué)文獻(xiàn)檢索關(guān)鍵詞分析為核心,包含文獻(xiàn)信息管理、詞頻分析、多維統(tǒng)計(jì)分析等功能模塊,能有效解決檢索文獻(xiàn)的批量導(dǎo)入、數(shù)據(jù)規(guī)范化、根據(jù)關(guān)鍵詞屬性進(jìn)行多維度統(tǒng)計(jì)分析等問題。并以銀屑病的中醫(yī)藥治療為例,介紹該系統(tǒng)的使用及多維統(tǒng)計(jì)分析應(yīng)用。該系統(tǒng)實(shí)現(xiàn)了在計(jì)算機(jī)輔助下進(jìn)行快捷、方便、準(zhǔn)確的關(guān)鍵詞多維分析,為其他醫(yī)學(xué)領(lǐng)域數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)提供參考。

中醫(yī)藥;文獻(xiàn)檢索;分析系統(tǒng)

隨著計(jì)算機(jī)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,在大數(shù)據(jù)時代背景下,傳統(tǒng)的醫(yī)學(xué)信息檢索模式已經(jīng)不能適應(yīng)快速變化的需求[1]。《2015研究前沿報(bào)告》也明確提出了“科學(xué)研究的世界呈現(xiàn)出蔓延生長,不斷演化的景象。科研管理者和政策制定者需要掌握科研的進(jìn)展和動態(tài),以有限的資源來支持和推進(jìn)科學(xué)進(jìn)步”。“定義一個被稱作研究前沿的專業(yè)領(lǐng)域的辦法,源自于科學(xué)研究之間存在的某種特定的共性。這種共性可能來自于實(shí)驗(yàn)數(shù)據(jù),也可能來自于研究方法,或者概念和假設(shè),并反映在科學(xué)家在論文中引用其他科學(xué)家的工作這個學(xué)術(shù)行為之中”[2]。所以對文獻(xiàn)信息的提取和關(guān)聯(lián)分析至關(guān)重要,它能揭示學(xué)科的發(fā)展,為科研人員指引研究方向。2015年,廣東省中醫(yī)院委托我校圖書館提供有關(guān)“銀屑病研究前沿與熱點(diǎn)”的情報(bào)分析[3]。該項(xiàng)目需要收集大量的期刊文獻(xiàn),并在此基礎(chǔ)上,逐一分析銀屑病癥狀-證型、癥狀-治療、證型-治療之間的關(guān)系以及藥物配伍的關(guān)系。如果采用比較傳統(tǒng)的情報(bào)分析方法,整個過程將耗費(fèi)較長時間。為此,我們開發(fā)了適用于臨床醫(yī)學(xué)文獻(xiàn)自動分析的情報(bào)分析系統(tǒng)。該系統(tǒng)實(shí)現(xiàn)了在計(jì)算機(jī)輔助下進(jìn)行快捷、方便、準(zhǔn)確的關(guān)鍵詞多維分析,并提取相關(guān)知識。

1 系統(tǒng)設(shè)計(jì)

1.1 數(shù)據(jù)庫設(shè)計(jì)

本系統(tǒng)開發(fā)選取了適合大量本地運(yùn)算的 C/S應(yīng)用模式,開發(fā)語言為面向?qū)ο蟮木幊陶Z言 VISUAL BASIC,采用SqlServer2005數(shù)據(jù)庫作為數(shù)據(jù)的組織和存儲對象。主要信息存放在文獻(xiàn)記錄表(WXJL)、關(guān)鍵詞表(GJCB)、同義詞表(TYCB)和詞類屬性表(CLSX)。其中 WXJL保存導(dǎo)入的文獻(xiàn)記錄;GJCB保存從WXJL提取的關(guān)鍵詞信息;TYCB保存關(guān)鍵詞的同義詞,比如:高血壓、高血壓病、血壓高、原發(fā)性高血壓、一級高血壓、早期高血壓等均用高血壓病表示;CLSX用于類比關(guān)鍵詞屬性并對其逐一歸類,比如:血熱型屬于證型,克銀方屬于治療。

1.2 功能設(shè)計(jì)

根據(jù)用戶目前的需求,系統(tǒng)主要有 4個功能模塊。⑴關(guān)鍵詞參數(shù)設(shè)置:主要用于設(shè)定關(guān)鍵詞的TYCB和 CLSX。⑵文獻(xiàn)信息管理:主要是對學(xué)術(shù)論文基礎(chǔ)數(shù)據(jù)的管理,它們是數(shù)據(jù)分析的基礎(chǔ),主要實(shí)現(xiàn)對論文題目、關(guān)鍵詞和年份信息的錄入、編輯、刪除等功能。⑶詞頻分析:計(jì)算不同關(guān)鍵詞在所有選定論文中出現(xiàn)的頻數(shù),對關(guān)鍵詞按頻數(shù)排序并確定高頻關(guān)鍵詞。在此基礎(chǔ)上,生成詞頻統(tǒng)計(jì)表和統(tǒng)計(jì)圖,便于研究者分析該領(lǐng)域的研究重點(diǎn)和熱點(diǎn)。⑷多維分析:多維分析是本系統(tǒng)的核心功能,主要完成同義詞合并、生成多維詞組矩陣、矩陣詞多維分析、數(shù)據(jù)轉(zhuǎn)存等功能。系統(tǒng)的具體功能結(jié)構(gòu)如圖1所示。

圖1 關(guān)鍵詞多維自動檢索系統(tǒng)功能模塊

1.3 統(tǒng)計(jì)分析原理

本系統(tǒng)的核心功能是對關(guān)鍵詞作多維統(tǒng)計(jì)分析,其原理是根據(jù)各種數(shù)據(jù)分類的度量關(guān)系,找出同類性質(zhì)的統(tǒng)計(jì)項(xiàng)之間的聯(lián)系,是對數(shù)據(jù)進(jìn)行維度化分析后的度量聚集統(tǒng)計(jì)。其中維度化是根據(jù)數(shù)據(jù)的特性進(jìn)行分類,并建立多維矩陣。具體實(shí)現(xiàn)方法為:⑴從相關(guān)文獻(xiàn)數(shù)據(jù)庫中提取關(guān)鍵詞或主題詞,通過詞頻分析獲取代表某一學(xué)科研究主題或研究方向的高頻詞;⑵對高頻詞根據(jù)特性進(jìn)行分類,形成各分類集合,分類集合之間相互組合形成多維矩陣;⑶圍繞該多維矩陣進(jìn)行分析,統(tǒng)計(jì)這些詞組在同一篇文章中同時出現(xiàn)的次數(shù)。

多維分析的主要思路:在數(shù)據(jù)集中,若大量記錄在具有特征屬性 A的同時,也頻繁出現(xiàn)了特征屬性B,則稱特征屬性A和B構(gòu)成頻繁模式[4],表示A和 B之間的關(guān)聯(lián)性,而這些模式可以用關(guān)聯(lián)規(guī)則來觀察和分析。

2 系統(tǒng)的程序開發(fā)關(guān)鍵技術(shù)分析與實(shí)現(xiàn)

為了更好地體現(xiàn)關(guān)鍵詞多維分析系統(tǒng)的實(shí)際應(yīng)用效果,本文以“銀屑病研究前沿與熱點(diǎn)”為案例,展示系統(tǒng)的使用及原理。文獻(xiàn)來源數(shù)據(jù)庫為:中國知網(wǎng)(CNKI)、中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(CBM),時間段為 2010-2015年。案例以檢索結(jié)果為分析對象,列舉多維分析系統(tǒng)在詞頻統(tǒng)計(jì)以及同義詞合并的應(yīng)用,并從“證型-治療”2個維度進(jìn)行統(tǒng)計(jì)。其中 CNKI的檢索詞包括:銀屑病、牛皮癬、中醫(yī)藥、中成藥、中藥、中草藥、方劑,檢索途徑為“主題”;CBM檢索策略為:"銀屑病"[全字段:智能]OR"牛皮癬"[全字段:智能]OR"銀屑病"[擴(kuò)展:不加權(quán)]AND中醫(yī)藥OR中成藥OR中藥OR中草藥OR方劑。

2.1 多數(shù)據(jù)源導(dǎo)入

根據(jù)檢索詞,本案例在CBM共獲得1389條記錄,如圖2所示;在CNKI共獲得1566條記錄,如圖 3所示。對獲得數(shù)據(jù)進(jìn)行分解,使文獻(xiàn)轉(zhuǎn)化為計(jì)算機(jī)能夠處理的結(jié)構(gòu)化數(shù)據(jù)單元。然后通過對比查重、字段映射合并,使之規(guī)范、準(zhǔn)確和有序。原始數(shù)據(jù)查重合并后共獲取記錄1863條。該數(shù)據(jù)表是數(shù)據(jù)分析的基本條件,處理后的結(jié)果如圖4所示。

2.2 關(guān)鍵詞規(guī)范化

文獻(xiàn)數(shù)據(jù)結(jié)構(gòu)化處理后可進(jìn)一步提取關(guān)鍵詞信息,并對其規(guī)范化處理。關(guān)鍵詞原始數(shù)據(jù)的不規(guī)范,主要表現(xiàn)為多詞一義,也即是同義詞現(xiàn)象。操作中,首先通過文獻(xiàn)記錄提取所有非重復(fù)關(guān)鍵詞,形成數(shù)據(jù)列表。然后對比同義詞庫逐一進(jìn)行歸并。本案例共計(jì)提取關(guān)鍵詞3987條,通過臨床專家結(jié)合醫(yī)案認(rèn)真討論和分析,篩選出銀屑病證型、治療相關(guān)的同義詞142條,合并后形成標(biāo)準(zhǔn)關(guān)鍵詞30條。如圖5所示。

圖2 CBM套錄數(shù)據(jù)

圖3 CNKI套錄數(shù)據(jù)

2.3 關(guān)鍵詞屬性歸類

在關(guān)鍵詞庫數(shù)據(jù)集的基礎(chǔ)上,利用頻次分析,把頻次較高的關(guān)鍵詞組成高頻詞庫。通過下拉框從癥狀、證型和治療等方面選取相應(yīng)的特征屬性。對新增的特征屬性,點(diǎn)擊添加按鈕增加并保存該分類詞庫。案例中30條標(biāo)準(zhǔn)關(guān)鍵詞按證型和治療2個特征屬性,得到 12條證型記錄,18條治療記錄。如圖6所示。

圖4 原始數(shù)據(jù)規(guī)范化處理

圖5 關(guān)鍵詞規(guī)范化處理

圖6 關(guān)鍵詞屬性

2.4 多維統(tǒng)計(jì)分析

通過12條證型記錄和18條治療記錄2個維度,交互組成12×18的二維矩陣,如圖7所示。統(tǒng)計(jì)分析后,得到共同出現(xiàn)頻率最高的 2個關(guān)鍵詞為“血熱型”與“涼血方”,共計(jì)出現(xiàn) 48次。其次為“血熱型”與“消銀方”共計(jì)出現(xiàn)37次。

圖7 2010-2015年銀屑病“證型-治療”關(guān)鍵詞多維統(tǒng)計(jì)分析矩陣

統(tǒng)計(jì)結(jié)果符合臨床診斷和用藥規(guī)律,同樣統(tǒng)計(jì)方法適用于“癥狀-證型”“癥狀-治療”等其他維度分析。此外,通過查閱我校附院名中醫(yī)治療銀屑病的醫(yī)案發(fā)現(xiàn),銀屑病目前尚無固定分型,但血瘀、血熱、血虛等證型是銀屑病最為常見的證型,其中,血熱型是廣東地區(qū)患病頻率最高的證型。以生地黃、元參、杭芍、茅根、牛蒡子、知母、荊芥、防風(fēng)、升麻、甘草等為主的“涼血方”是治療本地區(qū)血熱型銀屑病最常用、最有效的中醫(yī)處方。所以,銀屑病的純中醫(yī)治療也與本系統(tǒng)的統(tǒng)計(jì)結(jié)果相吻合,從某種程度上來說增加了本系統(tǒng)的可信度。

對醫(yī)學(xué)關(guān)鍵詞進(jìn)行多維度分析,可以幫助我們了解醫(yī)學(xué)領(lǐng)域的研究熱點(diǎn),并推斷其未來研究的發(fā)展方向。對獲得的統(tǒng)計(jì)結(jié)果還可導(dǎo)出轉(zhuǎn)存為Excel、文本文件等格式,以便于利用 SPSS等其他統(tǒng)計(jì)分析軟件做進(jìn)一步分析處理。

3 小結(jié)

隨著醫(yī)學(xué)大數(shù)據(jù)的不斷發(fā)展,用戶對醫(yī)學(xué)情報(bào)服務(wù)的要求也越來越高,關(guān)鍵詞多維自動檢索系統(tǒng)的設(shè)計(jì)為圖書館情報(bào)服務(wù)的開展提供了更多、更便捷的服務(wù)支持。該系統(tǒng)已在圖書館參考咨詢部門應(yīng)用于相關(guān)的文獻(xiàn)統(tǒng)計(jì)分析。實(shí)踐應(yīng)用表明,使用該系統(tǒng)后,統(tǒng)計(jì)分析效率明顯提高,符合用戶檢索統(tǒng)計(jì)要求。同時,通過用戶對該系統(tǒng)的體驗(yàn)和建議,將不斷對該系統(tǒng)進(jìn)行完善及優(yōu)化,提供更人性化、更精確、更快捷的文獻(xiàn)檢索統(tǒng)計(jì)服務(wù)。

本系統(tǒng)在功能和使用上還存在一些不足,需要不斷改進(jìn)和完善。⑴系統(tǒng)中合并同義詞功能是依靠人工判斷方式進(jìn)行的,可考慮增加系統(tǒng)自動提示的輔助建議功能,以更快速度完成合并同義詞工作。⑵如何實(shí)現(xiàn)從詞頻統(tǒng)計(jì)自動獲取高頻關(guān)鍵詞并歸類屬性,以減少人工錄入信息的工作量。⑶關(guān)鍵詞分析擴(kuò)展成從全文自動獲取相關(guān)的關(guān)鍵詞,結(jié)合病案或醫(yī)案實(shí)現(xiàn)自動分析功能[5],從而可以更加全面地考察醫(yī)學(xué)的發(fā)展變化。

[1] 涂新莉,劉波,林偉偉.大數(shù)據(jù)研究綜述[J],計(jì)算機(jī)應(yīng)用研究,2014, 31(6):1612-1616,1623.

[2] 今日報(bào)告網(wǎng).湯森路透&中國科學(xué)院:2015前沿研究[R/OL].[2016-08-28].http://www.imxdata.com/archives/12707.

[3] 盧傳堅(jiān),曾召,謝秀麗,等.1979-2010年尋常型銀屑病文獻(xiàn)證候分布情況分析[J].中醫(yī)雜志,2012,53(11):959-961.

[4] Han J, Kamber M.數(shù)據(jù)挖掘:概念與技術(shù)[M].2版.范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社.2007:146-155.

[5] 袁鋒.基于數(shù)據(jù)挖掘的中醫(yī)醫(yī)案分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].濟(jì)南:山東師范大學(xué),2006.

Design and Implementation of Medical Literature Retrieval Multidimensional Analysis System

ZENG Zhan-peng

(Guangzhou University of Chinese Medicine, Guangzhou Guangdong 510006, China)

A multidimensional analysis system for the key words of medical literature was designed according to the characters of clinical literature, including syndrome, disease and treatment. The system is based on the analysis on medical literature retrieval key words, including document information management, word frequency analysis, multidimensional statistical analysis and other functional modules, which can effectively solve the problem of batch retrieval of imported documents, data standardization, multi-dimensional statistical analysis according to the keyword attribute. Setting the treatment of psoriasis as an example, the use of the system and multi-dimensional statistical analysis application is introduced. The system provides a quick, convenient and accurate multidimensional analysis of the keywords, which can be used as a reference for the design and implementation of other medical data analysis systems.

traditional Chinese medicine; literature retrieval; analytic system

G254.9

A

2095-5707(2017)01-0016-04

曾展鵬.醫(yī)學(xué)文獻(xiàn)檢索關(guān)鍵詞多維分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].中國中醫(yī)藥圖書情報(bào)雜志,2017,41(1):16-19.

10.3969/j.issn.2095-5707.2017.01.004

2016-10-28)

2016-11-04;編輯:魏民)

CALIS全國醫(yī)學(xué)文獻(xiàn)信息中心2016年科研基金項(xiàng)目(CALIS-2016-03-009)

曾展鵬,研究員,研究方向?yàn)閳D書情報(bào)服務(wù)及文獻(xiàn)檢索。E-mail: 641364759@qq.com

猜你喜歡
分析系統(tǒng)
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機(jī)系統(tǒng)
隱蔽失效適航要求符合性驗(yàn)證分析
ZC系列無人機(jī)遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統(tǒng)
半沸制皂系統(tǒng)(下)
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
電力系統(tǒng)及其自動化發(fā)展趨勢分析
中西醫(yī)結(jié)合治療抑郁癥100例分析
主站蜘蛛池模板: 香蕉伊思人视频| 婷婷六月在线| 国产精品吹潮在线观看中文| 亚洲免费毛片| 亚洲中文字幕av无码区| 亚洲精品成人7777在线观看| 国产精品亚洲片在线va| 免费毛片a| 中文字幕av无码不卡免费| 国产专区综合另类日韩一区| 一级毛片不卡片免费观看| 欧美怡红院视频一区二区三区| 华人在线亚洲欧美精品| 欧美v在线| 精品综合久久久久久97超人| 美女裸体18禁网站| 日韩最新中文字幕| 精品国产99久久| 美女一级毛片无遮挡内谢| 久久精品人人做人人爽电影蜜月| 国产高潮流白浆视频| 亚洲精品不卡午夜精品| 亚洲日本在线免费观看| 色天堂无毒不卡| 亚洲日本中文字幕乱码中文| 永久免费AⅤ无码网站在线观看| 中文天堂在线视频| 精品久久综合1区2区3区激情| 中文字幕在线日本| 激情视频综合网| 蜜芽国产尤物av尤物在线看| 国产成人8x视频一区二区| 亚洲国产天堂久久综合| 99资源在线| 日韩AV无码一区| 国产AV无码专区亚洲精品网站| 伊人久久大香线蕉aⅴ色| 国产女人18水真多毛片18精品 | 91久久大香线蕉| 婷婷五月在线| 91极品美女高潮叫床在线观看| 久久久久无码国产精品不卡| 青青草综合网| 久久美女精品| 一本色道久久88亚洲综合| 国产区精品高清在线观看| 久久综合伊人 六十路| 国产精品无码AV中文| 99热这里只有精品免费| 亚洲无码精彩视频在线观看| 国产精品美女自慰喷水| 久久免费成人| 91亚洲国产视频| 白浆免费视频国产精品视频 | 99re经典视频在线| 国产综合日韩另类一区二区| 奇米精品一区二区三区在线观看| 91色在线观看| 国产综合另类小说色区色噜噜| 久久久国产精品无码专区| AV不卡无码免费一区二区三区| 国产a网站| 国产自在线播放| 免费一级毛片在线播放傲雪网| 天天爽免费视频| 欧美午夜视频在线| 亚洲日韩精品无码专区97| 国产区成人精品视频| 国产成人亚洲精品色欲AV| 久久伊人久久亚洲综合| 国产中文一区a级毛片视频| 中文字幕精品一区二区三区视频| 欧美翘臀一区二区三区| 日韩精品一区二区三区中文无码| 美女潮喷出白浆在线观看视频| Jizz国产色系免费| 亚洲愉拍一区二区精品| 日日摸夜夜爽无码| 亚洲一区二区日韩欧美gif| 日韩精品少妇无码受不了| 亚洲一区毛片| 亚洲系列中文字幕一区二区|