999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中醫(yī)藥“知識密集型”數(shù)據(jù)研究思路

2015-09-19 10:06:31于彤李敬華楊碩于琦
中國中醫(yī)藥圖書情報 2015年4期
關鍵詞:中醫(yī)藥大數(shù)據(jù)

于彤 李敬華 楊碩 于琦

摘要:中醫(yī)藥數(shù)據(jù)主要來源于中醫(yī)藥工作者在長期的醫(yī)療實踐和科學研究過程中所產生的知識和經驗的系統(tǒng)總結,其中蘊含著豐富的中醫(yī)藥知識,因此被稱為“知識密集型”數(shù)據(jù)。本文分析中醫(yī)藥“知識密集型”數(shù)據(jù)的內涵和特點,討論中醫(yī)藥“知識密集型”數(shù)據(jù)處理方法學研究的思路。

關鍵詞:中醫(yī)藥;“知識密集型”數(shù)據(jù);大數(shù)據(jù)

中醫(yī)藥科學數(shù)據(jù)建設是中醫(yī)藥信息化事業(yè)中的一項核心工作。中醫(yī)藥行業(yè)的數(shù)據(jù)庫建設起源于20世紀80年代,經過30余年的努力,現(xiàn)已建成了覆蓋中醫(yī)疾病、中藥、方劑、中藥化學成分、古籍、醫(yī)案、針灸等主要學科門類的中醫(yī)藥科學數(shù)據(jù)庫群。這些數(shù)據(jù)資源中蘊含著豐富的中醫(yī)藥知識遺產以及相關科學知識,面向知識百科、知識檢索、知識地圖等知識服務系統(tǒng)提供數(shù)據(jù)支持,為中醫(yī)藥知識傳承、臨床實踐和科學研究做出了重要貢獻。

近年來,隨著各領域數(shù)據(jù)的大量積累,以及數(shù)據(jù)處理分析技術的發(fā)展和創(chuàng)新,人類已經進入了“大數(shù)據(jù)”時代。大數(shù)據(jù)不僅是信息技術的變革,也是生活、工作與思維的變革?!按髷?shù)據(jù)”時代的來臨,為進一步推進中醫(yī)藥科學數(shù)據(jù)建設,提升中醫(yī)藥數(shù)據(jù)的質量和利用價值,發(fā)展基于數(shù)據(jù)的中醫(yī)藥科學研究,提供了重要的機遇。為此,有必要進一步思考中醫(yī)藥數(shù)據(jù)的本質,利用“大數(shù)據(jù)”的最新理念和技術來革新中醫(yī)藥數(shù)據(jù)分析處理方法。

1.中醫(yī)藥“知識密集型”數(shù)據(jù)的內涵

中醫(yī)藥科學數(shù)據(jù)主要包括中醫(yī)經典、醫(yī)案、科技文獻、臨床指南、文獻型數(shù)據(jù)庫以及結構性數(shù)據(jù)庫等,它們都是中醫(yī)藥知識的載體。中醫(yī)藥科學數(shù)據(jù)明顯不同于交易記錄、網站訪問記錄、聊天記錄、衛(wèi)星圖像等數(shù)據(jù)。相比之下,中醫(yī)藥科學數(shù)據(jù)的數(shù)據(jù)量不是很大,但數(shù)據(jù)中蘊含的知識量卻很大,數(shù)據(jù)的“知識密集度”很高。因此,中醫(yī)藥科學數(shù)據(jù)可被稱為“知識密集型”數(shù)據(jù)。

1.1中醫(yī)藥“知識密集型”數(shù)據(jù)的來源分析

中醫(yī)藥數(shù)據(jù)的“知識密集型”特征由中醫(yī)藥數(shù)據(jù)的來源和獲取方式決定。在很多領域,大量的數(shù)據(jù)產生于人類所發(fā)明的觀測工具(如天文望遠鏡、顯微鏡、傳感器等)和信息系統(tǒng)(如電子商務、社交網站等)。在“大數(shù)據(jù)”時代,隨著數(shù)據(jù)傳輸和數(shù)據(jù)存儲能力不斷增強,以及數(shù)據(jù)分析效率不斷提高,人們有能力將各種數(shù)據(jù)實時、動態(tài)地整合在一起以供人類進行數(shù)據(jù)分析和知識發(fā)現(xiàn),顯著增強人類對世界的理解能力。

中醫(yī)藥數(shù)據(jù)主要是知識表達的產物,并非觀測得來的數(shù)據(jù)。中醫(yī)藥數(shù)據(jù)主要來源于中醫(yī)藥工作者在長期的醫(yī)療實踐和科學研究過程中所產生的知識和經驗的系統(tǒng)總結。中醫(yī)藥數(shù)據(jù)也反映中醫(yī)及其所發(fā)明的工具對世界進行觀測的結果,如中醫(yī)對四診的描述、舌象、脈象以及舌診儀和脈診儀觀測的數(shù)據(jù)。但這些觀測結果一般都經過中醫(yī)的認識、理解和解釋后,才形成了中醫(yī)領域常見的數(shù)據(jù)(如中醫(yī)經典、醫(yī)案等)。這種數(shù)據(jù)體現(xiàn)的是經過人類理性加工、處理之后的客觀信息,是客觀信息與中醫(yī)的經驗性知識疊加起來之后形成的。中醫(yī)藥數(shù)據(jù)因其根源于中醫(yī)觀察和實踐而仍保有其客觀性,但主要是人類認知和思維的產物。

1.2中醫(yī)藥文獻資源屬于“知識密集型”數(shù)據(jù)

中醫(yī)藥“知識密集型”數(shù)據(jù)的典型案例是浩如煙海的中醫(yī)藥文獻資源,包括數(shù)字化文獻、紙質文獻以及其他載體上的文獻。中醫(yī)藥文獻是歷代醫(yī)家在臨床診治中的心得體會,是科研學者對實驗結果和科學探索成果的系統(tǒng)總結,是中醫(yī)智慧的集中體現(xiàn)。出于文獻管理、文獻檢索和快速閱覽等目的,已出現(xiàn)了對文獻的元數(shù)據(jù)、摘要和主題內容進行系統(tǒng)管理的文獻性數(shù)據(jù)庫,它們可被視為文獻資源的衍生產品,同樣也屬于“知識密集型”數(shù)據(jù)。

1.3中醫(yī)藥結構型數(shù)據(jù)庫主要屬于“知識密集型”數(shù)據(jù)

中醫(yī)藥領域的另一類重要的數(shù)據(jù)資源是“結構型數(shù)據(jù)庫”。中醫(yī)藥工作者將各種文獻中關于中藥、方劑、中藥化學成分等各方面的知識分別搜集起來,進行系統(tǒng)整理,構建了中藥庫、方劑庫、中藥化學庫、中醫(yī)病案庫等數(shù)據(jù)庫。針對中醫(yī)藥數(shù)據(jù)庫的調研表明,這些數(shù)據(jù)庫的主體內容并非觀測得來的數(shù)據(jù),而是知識表達的產物。例如,中醫(yī)病案庫是對中醫(yī)專家的經驗性知識的總結;中藥庫、方劑庫、中藥化學庫等也都是各領域知識的系統(tǒng)性記載。當然,中醫(yī)藥數(shù)據(jù)中也包括一些“非知識型”數(shù)據(jù),如診斷儀器產生的數(shù)據(jù),信息系統(tǒng)的技術性元數(shù)據(jù)等,但其主體部分仍是“知識密集型”數(shù)據(jù)。

1.4中醫(yī)藥“知識密集型”數(shù)據(jù)的特點

中醫(yī)藥“知識密集型”數(shù)據(jù)具有4個特點。(1)數(shù)據(jù)多為定性,缺少量化表達,不利于現(xiàn)有計算機程序直接處理;(2)非結構化數(shù)據(jù)較多,結構化難度較大,給數(shù)據(jù)分析造成困難;(3)數(shù)據(jù)內容體現(xiàn)人文科學與自然科學的結合,不利于邏輯推理與一般數(shù)據(jù)分析工具的應用;(4)數(shù)據(jù)具有的高維小樣本及個性化特征,需要進行特殊處理。為處理中醫(yī)藥“知識密集型”數(shù)據(jù),不能照搬一般的“大數(shù)據(jù)”方法,需要建立適合中醫(yī)藥領域特點的方法學體系。

2.中醫(yī)藥“知識密集型”數(shù)據(jù)的研究思路

2.1使用語義網技術處理“知識密集型”數(shù)據(jù)

在中醫(yī)藥信息學的研究中,需要提出適合“知識密集型”數(shù)據(jù)的處理方法。中醫(yī)藥數(shù)據(jù)的知識量很大,主要體現(xiàn)在概念之間存在著豐富的語義關系。這些語義關系一起構成了一個復雜的語義網絡。若能利用語義網技術實現(xiàn)“知識密集型”數(shù)據(jù)資源的合理組織,則可在中醫(yī)藥數(shù)據(jù)資源利用中取得突破。

Tim Berners Lee等于2001年提出了語義網(Semantic Web)的理念,認為它將是一部人類與機器都能理解的“數(shù)據(jù)百科全書”,能顯著提升機器對Web數(shù)據(jù)的處理能力。語義網技術發(fā)端于知識表示和推理領域的研究成果,能解決數(shù)據(jù)集成與互聯(lián)問題。它為處理中醫(yī)藥“知識密集型”數(shù)據(jù)并從中發(fā)現(xiàn)新穎知識,提供了理想的技術手段。在21世紀,語義網技術已經取得了長足的發(fā)展,從一個構想演變?yōu)橐惶紫鄬ν暾募夹g體系,如Web本體語言(web ontology language,OWL)等核心技術,語義網上的數(shù)據(jù)也在不斷增長。越來越多的大數(shù)據(jù)應用引入語義技術,通過語義鏈接,給大數(shù)據(jù)系統(tǒng)帶來開放性和互操作性,并能提供基于“知識”的分析。

“大數(shù)據(jù)”的一個核心理念是,當我們把一系列相關的數(shù)據(jù)集聯(lián)系起來進行分析,可能出現(xiàn)一些我們一開始預想不到的發(fā)現(xiàn)。在大規(guī)模數(shù)據(jù)的基礎上可以發(fā)現(xiàn)的知識,是在小規(guī)模數(shù)據(jù)基礎上無法發(fā)現(xiàn)的。將數(shù)據(jù)集成起來所產生的知識及其價值是預先無法預測的。在“大數(shù)據(jù)”時代,我們需要考慮如何將中醫(yī)藥及相關領域的知識密集型數(shù)據(jù)資源整合起來,以輔助中醫(yī)藥工作者開展知識發(fā)現(xiàn)活動。

所以有必要在中醫(yī)藥領域本體的基礎上,建立一套基于語義網的中醫(yī)藥“知識密集型”數(shù)據(jù)處理方法學。其中包括:(1)建立中醫(yī)藥本體體系,為處理“知識密集型”數(shù)據(jù)奠定基礎;(2)基于本體建立中醫(yī)藥學語言系統(tǒng),為數(shù)據(jù)處理提供必要的術語資源;(3)建立基于人機結合的中醫(yī)藥數(shù)據(jù)采集技術及知識獲取方法體系;(4)基于語義網技術,從數(shù)據(jù)中挖掘概念之間顯性或隱性的語義關系。通過這套方法學,能匯集中醫(yī)藥及相關學科的數(shù)據(jù)資源,挖掘數(shù)據(jù)中蘊含的潛在規(guī)律及知識點,發(fā)揮多學科研究成果對中醫(yī)藥發(fā)展的支撐作用。

2.2面向“知識密集型”數(shù)據(jù)的知識發(fā)現(xiàn)

在中醫(yī)藥領域,知識發(fā)現(xiàn)是一個從“知識”到“知識”的知識精煉過程。在海量數(shù)據(jù)中蘊含著知識,而知識發(fā)現(xiàn)過程則將知識(模式和規(guī)則)從數(shù)據(jù)中提取出來。從知識發(fā)現(xiàn)的角度分析,我們以“知識量”為分子,以“數(shù)據(jù)量”為分母,就可以得到數(shù)據(jù)的“知識密集度”。數(shù)據(jù)的“知識密集度”反映了數(shù)據(jù)在知識發(fā)現(xiàn)方面的價值。

傳統(tǒng)上,知識發(fā)現(xiàn)一般針對通過數(shù)據(jù)采集工具自動產生的數(shù)據(jù)。這些數(shù)據(jù)之中的“知識密集度”一般比較低。例如,我們去超市消費所產生的單據(jù),每張單據(jù)本身并不蘊含有價值的知識,但將數(shù)以億計的單據(jù)記錄結合起來進行分析,則可得到有關人類購買行為的模式和規(guī)律。雖然挖出的知識很有價值,但因數(shù)據(jù)總量很大,所以數(shù)據(jù)的“知識密集度”仍然較低。

對于“知識密集型”數(shù)據(jù)而言,數(shù)據(jù)集之間的集成體現(xiàn)出了各種知識甚至知識體系之間的關聯(lián)與融合。在醫(yī)學領域,將不同來源的知識資源關聯(lián)起來進行分析已有很長的歷史。swanson于1986年發(fā)現(xiàn)有的文獻記載了部分雷諾氏病患者血液中有些異常(如血液黏度偏高),又有一些文獻記載了食用魚油能糾正這些異常(降低血液黏度),因而提出“食用魚油會對雷諾氏病患者有益”的科學假設。這類案例表明,將不同專家以及不同領域的知識體系相互融合起來,可能導致新的知識發(fā)現(xiàn)。

2.3從知識融合到知識創(chuàng)新

在中醫(yī)藥領域,知識融合已成為知識創(chuàng)新的一個來源,特別是將中醫(yī)與其他科學知識關聯(lián)起來進行分析,已經產生了一些重要的知識發(fā)現(xiàn)。例如,20世紀70年代,屠呦呦從中醫(yī)經典《肘后備急方》中獲得啟發(fā),發(fā)現(xiàn)了抗瘧的新藥青蒿素。將中醫(yī)藥“知識密集型”數(shù)據(jù)整合起來所構成群體性知識系統(tǒng),體現(xiàn)了中醫(yī)藥工作者的群體性智慧,可能蘊含著大量具有啟發(fā)性的知識。

語義網可將數(shù)據(jù)資源的整合推向極致,也就是實現(xiàn)各種中醫(yī)藥數(shù)據(jù)資源的集成,并與其他學科的數(shù)據(jù)關聯(lián)起來,構建一個全球性的中醫(yī)藥數(shù)據(jù)空間。該空間含有豐富的中醫(yī)藥知識,是實現(xiàn)知識整合的基礎,能支持全球的中醫(yī)藥工作者進行知識發(fā)現(xiàn)研究。一方面,從中醫(yī)藥數(shù)據(jù)中發(fā)現(xiàn)的知識是新穎的,知識發(fā)現(xiàn)的結果也是不可預測的;另一方面,中醫(yī)藥知識獲取和數(shù)據(jù)集成都是非常困難的工作,需要耗費很大的人力成本。因此,開展中醫(yī)藥數(shù)據(jù)集成和挖掘工作,也需要考慮成本和收益如何平衡的問題。

3.小結

中醫(yī)藥工作者從20世紀80年代開始采用數(shù)據(jù)庫技術對中醫(yī)藥知識進行系統(tǒng)梳理和保存,成功研制了大量的科學數(shù)據(jù)庫。但多年來該領域一直沿用傳統(tǒng)的關系型數(shù)據(jù)庫技術,數(shù)據(jù)處理水平并沒有明顯提高。

在“大數(shù)據(jù)”時代,人類所發(fā)明的各種工具在實時地搜集和整合各種數(shù)據(jù)以供人類分析,顯著增強了人類對世界的感知和理解能力?!按髷?shù)據(jù)”時代的來臨,為中醫(yī)藥數(shù)據(jù)建設事業(yè)的發(fā)展提供了重大的發(fā)展機遇。為此,有必要重新思考中醫(yī)藥數(shù)據(jù)的本質,革新中醫(yī)藥數(shù)據(jù)處理方法。中醫(yī)藥數(shù)據(jù)的核心內容是對中醫(yī)藥知識的系統(tǒng)表達。中醫(yī)藥數(shù)據(jù)的生成模式與獲取手段,決定其無法成為傳統(tǒng)意義上的“大數(shù)據(jù)”,而必然是“知識密集型”數(shù)據(jù)?!按髷?shù)據(jù)”時代的中醫(yī)藥信息處理方法和技術體系,應側重于解決中醫(yī)藥知識表示、融合、推理等一系列與“知識”相關的問題,語義網技術可在其中發(fā)揮重要作用。

猜你喜歡
中醫(yī)藥大數(shù)據(jù)
中醫(yī)藥在惡性腫瘤防治中的應用
中醫(yī)藥在治療惡性腫瘤骨轉移中的應用
重視中醫(yī)藥發(fā)展,發(fā)揮中醫(yī)藥作用
兩會聚焦:中醫(yī)藥戰(zhàn)“疫”收獲何種啟示
從《中醫(yī)藥法》看直銷
中醫(yī)藥立法:不是“管”而是“促”
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 国产精品亚洲欧美日韩久久| 伊人无码视屏| 国产人碰人摸人爱免费视频| 亚洲人成网站色7777| 亚洲国产精品日韩欧美一区| 国产精品亚洲专区一区| 亚洲国产精品人久久电影| 国产亚洲精品91| 精品成人一区二区三区电影| 国产精品成人一区二区不卡| 激情无码视频在线看| 亚洲中久无码永久在线观看软件| 国产成人91精品免费网址在线| 青青青国产视频手机| 国产日本欧美在线观看| 青青国产在线| 国产菊爆视频在线观看| 久热中文字幕在线| 色天天综合久久久久综合片| 在线免费亚洲无码视频| 五月激情综合网| 99性视频| 成年人免费国产视频| 免费无码又爽又黄又刺激网站| 国产亚洲美日韩AV中文字幕无码成人| 91在线免费公开视频| 精品国产一二三区| 2021天堂在线亚洲精品专区| 国产人人乐人人爱| 日韩黄色大片免费看| 日本人又色又爽的视频| 99久久精品久久久久久婷婷| 国产福利小视频在线播放观看| 国产福利大秀91| 国产福利小视频在线播放观看| 欧美日韩精品在线播放| 亚洲一道AV无码午夜福利| 欧美国产日韩一区二区三区精品影视 | 9啪在线视频| 波多野结衣一区二区三区四区| 国产aaaaa一级毛片| 精品久久久久久久久久久| 91亚洲影院| 亚洲精品在线影院| 99这里精品| 中国美女**毛片录像在线| 第一区免费在线观看| 久热中文字幕在线| 中文字幕 91| 国产精品女人呻吟在线观看| 欧美日韩久久综合| 亚洲码一区二区三区| 国产成人av一区二区三区| 亚洲国产精品美女| 亚洲国产综合自在线另类| 精品福利视频网| 婷婷五月在线视频| 成人在线不卡| 91无码国产视频| 99视频只有精品| 亚洲国产中文欧美在线人成大黄瓜| 中文毛片无遮挡播放免费| 亚洲国产AV无码综合原创| 91精品人妻一区二区| 88av在线播放| 中文字幕无码制服中字| 综合五月天网| a国产精品| 欧美另类图片视频无弹跳第一页| 欧美日韩国产在线人成app| 国产又粗又猛又爽| 日韩欧美色综合| 久久亚洲AⅤ无码精品午夜麻豆| 婷婷六月综合网| 啊嗯不日本网站| 在线无码av一区二区三区| a欧美在线| 色婷婷亚洲十月十月色天| 伊人久久大香线蕉aⅴ色| 女同国产精品一区二区| 无码综合天天久久综合网| 91成人精品视频|