鄭世超 蕭文科 張藝 陳菊 趙姝婷 楊超 溫川飆



摘要:西南少數民族具有“大分散、小聚居”分布特點;西南少數民族醫藥文獻大多較為零散,缺乏搶救性保護;西南少數民族醫藥存在嚴重的斷代危機;因此,西南少數民族醫藥文獻挖掘整理刻不容緩,使其由分散變為可視化亟待解決。該論文基于大數據時代背景,以數據庫設計、數據挖掘算法設計和GIS可視化顯示為關鍵技術,構建西南少數民族文獻信息平臺.體系,有效促進民族醫藥文獻的保護和傳承,促進民族醫藥數據的深入挖掘,使其規范化、公開化,從而得到最有效利用。
關鍵詞:西南地區;民族醫藥;文獻信息;平臺設計
中圖分類號:R2-03;TP393.09
文獻標識碼:A
文章編號:1009-3044(2020)04-0281-03
收稿日期:2019-12-05
基金項目:國家社會科學基金重大項目(項目編號:16ZDA238)
作者簡介:溫川飆(1970—),男,四川成都人,研究員,碩士,主要從事中醫藥信息化、中醫藥大數據、云健康等研究;鄭世超(1990—),女,山東諸城人,講師,碩士,主要從事中醫藥信息化研究。
The Research on Design of Platform about the Southwest Minority Medical Literature Information
ZHENG Shi-chao,XIAO Wen-ke,ZHANG Yi,CHEN Ju,ZHAO Shu-ting,YANG Chao,WEN Chuan-biao
(Chengdu University of TCM,Chengdu 611137,China)
minorities in southwest China.Based on the background of big data era,this paper takes database design,data mining algorithm design and GIS visualization as the key technologies to design the southwest minority literature information platform.The platform effectively promote the protection and inheritance of ethnic medicine literature,promote the in-depth mining of ethnic medicine data,and make it standardized and open.Finally,the southwest ethnic medicine will get the most effective use.Abstract:The ethnic minorities in Southwest China have the characteristics of "large dispersion and small settlement" ;the medical literature of ethnic minorities in southwest China is mostly scattered and lack of salvage protection;the medicine of ethnic minorities in southwest China has a serious crisis of generation;therefore,it is urgent to excavate,collate and visualize the medical literature of ethnic
Key words:southwest;ethnomedicine;literature information;platform design
西南地區少數民族具有“大分散、小聚居”的分布特點,西南地區少數民族醫藥文獻大多較為零散,缺乏搶救性保護,且有些少數民族無本民族文字或長期與漢族雜居,因此其醫藥理論多以“歌訣、圖畫、漢文雜書”等形式呈現,極為零散,沒有或缺少醫藥專著,多以口頭方式傳授或師徒模式傳承[1-6]。由于近些年民族醫藥人才的缺失,西南地區少數民族醫藥存在嚴重的斷代危機,有些缺乏理論體系及臨床實踐的民族醫藥甚至瀕臨消失[7-8]。因此,西南少數民族醫藥文獻挖掘整理刻不容緩,使其由分散變為可視化亟待解決。該文基于大數據背景,構建西南少數民族文獻信息平臺體系,促進民族醫藥文獻保護和傳承,促進民族醫藥數據的深入挖掘。
1 西南少數民族文獻信息平臺網絡架構
西南少數民族文獻信息平臺網絡架構如圖1,平臺分為內部網絡和外部網絡。內部網絡通過有線局域網進行服務器間的通訊,外部網絡基于Inter網,同時內部網絡通過物理防火墻與外部進行連接,以保證內部網絡的安全。用戶通過使用PC,電腦等終端,在聯網的情況下通過Inter網訪問部署于內網中的應用系統。
2 西南少數民族文獻信息平臺技術架構
西南少數民族文獻信息平臺建設技術采用微服務的架構方式,請求通過CDN服務器進行內容分發,降低網絡擁塞,提高用戶訪問響應速度和命中率;通過Proxy服務器發揮防火墻的作用,保證服務器安全;然后再通過負載均衡服務器來增加平臺吞吐量、加強網絡數據處理能力、提高網絡的靈活性和可用性。業務應用程序按業務歸類放于多臺不同的業務服務器上。不同服務器間的應用程序通過消息隊列進行業務數據交換和通訊,應用服務器中同時使用搜索引擎技術和緩存數據庫技術來減少應用的數據檢索的響應時間,降低數據庫的查詢壓力。將圖片、視頻等文件單獨存放于文件服務器上,提高平臺對文件的存儲能力。西南少數民族文獻信息平臺技術架構拓撲圖如圖2。
3 西南少數民族文獻信息平臺系統構架
民族醫藥文獻數據并不是單一的文本形式,包含結構化數據、半結構化數據和非結構化數據,如歌謠、視頻和錄音等,這與大數據“混雜性”的特點不謀而合。因此,該文擬構建西南少數民族文獻通用性大數據平臺,具備高性能的實時和非實時大數據計算能力,豐富的統計、分析模型,包括西南少數民族醫藥大數據源整合方法(異構數據的整合方法)、Hadoop集群分布式數據技術的應用、Hive非結構化數據存儲和數據生長。
西南少數民族文獻信息平臺系統構架如圖3所示。
4 關鍵技術
4.1 數據庫建設
西南少數民族醫藥文獻信息處理平臺的建立中,數據庫建;設作為整個平臺的核心部分,占時超過50%,信息數據庫的設計應遵循規范化、標準化、擴充性、安全性和實用性等原則。其中,數據庫數據組織包括空間數據和屬性數據兩方面:
1)空間數據是指在一定尺度下,能完整描述西南片區行政區劃底圖
首先對這些底圖進行編輯,拓撲,除去屬性中一些不需要的字段,增加一些字段名稱;再對各空間數據進行配準,建立統一的坐標系統,使它們能很好地配準,保證圖層疊加時,在空間上能很好地形成匹配,從而形成科學、美觀的圖形;然后建立地圖服務,發布于網絡上。
2)屬性數據主要用于描述文獻信息
屬性數據具體指西南少數民族醫藥文獻數據中的文本數據(全文、摘要、數目)和多媒體數據(視頻、音頻、圖片等)。對搜集的屬性數據進行整理、分析、歸類,確定每種數據的屬性字段及值域,構建關系型數據庫。如《中國民族藥詞典》屬性字段可設計為民族名稱、藥品名稱、藥品功效藥品主治、分布區域等;民族醫藥方劑屬性字段為方劑名稱、方劑用法、方劑組方、方劑配伍、方劑療效等。數據庫表設計如圖4所示。
4.2 數據倉庫構建
數據倉庫技術的出現為數據挖掘提供前期數據基礎,在于對多個異構關系數據源有效集成,集成后按照西南少數民族醫藥文獻數據的需求主體進行重組,每一個主體對應一個宏觀的分析領域,并組成相依的數據集市。數據倉庫的構建流程如圖5。
4.3 數據挖掘算法
西南少數民族文獻數據來源豐富,為數據挖掘提供了資源,目前的數據挖掘方法主要有關聯規則、分類、聚類和回歸等,系統選擇weka數據挖掘平臺進行數據挖掘,這其中包括:挖掘過程、數據結果過濾以及模式解釋和評價。挖掘從病種分類到治法的關聯,從治法到方劑的關聯,不同民族之間醫藥數據之間的關系,不同區域之間醫藥數據之間的關系等。深度數據挖掘西南少數民族文獻數據,揭示隱藏在數據中的規律和知識,為臨床.生產、教學、和科研提供幫助。具體的挖掘流程如圖6所示。
4.4 GIS可視化顯示
GIS(地理信息系統)是對地理數據進行采集、儲存、管理、運算、分析、顯示和描述的技術系統,可以向用戶提供位置及周邊環境信息的查詢和分析服務91。近年來GIS在計算機科學、數學、測繪科學、地理學等諸多學科快速發展的拉動下得到迅猛發展[10-13]。與現階段靜態的古籍數字化技術不同,基于GIS的古籍數字化地圖資源共享平臺最大的特點即是其動態性,利用圖表化、可視化、集成化、數字化的表達方式將古籍文獻紙質史料呈現出來,系統具備數據統計、文獻檢索及自動生成地圖等功能,可以通過平臺對其分類、統計,還可以將統計結果通過電子地圖的形式展示出來。
采用GIS技術,將屬性數據庫和空間數據庫結合起來,當用戶需要確定文獻的實際位置過程時,空間數據庫轉換為規定
格式的XML文檔,采用三維形式以小紅點圖標顯示出文獻的地址位置,為了更好地完成定位,系統為可視化顯示提供放大查看、縮小查看、圖像移動、全圖展示、衛星地圖展示等瀏覽基本操作功能。
5 結束語
基于大數據時代背景,西南少數民族醫藥文獻數字化信息共享平臺的建設研究能夠有效促進民族醫藥理論、文化、藥物、診療技術等的保護和傳承,能夠促進民族醫藥數據的深入挖掘,使其規范化、公開化,從而得到最有效利用。同時,也能促.進不同民族醫藥學科之間的交叉對比,以分析其各自的關聯性、差異性,以此促進民族醫藥的發展和創新。
參考文獻:
[1]王學艷.我國少數民族文獻研究的現狀與展望[D].長春:東北師范大學,2006.
[2]魏艦.論西南少數民族文獻的保護與利用[D].成都:西南民族大學,2013.
[3]王幼紅.論貴州民族文獻資源的保護開發和利用[J].貴州民族學院學報:哲學社會科學版,2006(1):121-122.
[4]寶音,龔文龍.民族文獻信息化建設研究[J].內蒙古民族大學學報,2007,13(4):34-37.
[5]于顯中.關于加快民族文獻信息化建設的思考[J].圖書館學刊,2005,27(1):63-64,72.
[6]李靜.關于加強西部地區民族文獻信息化建設的探討[J].西北民族學院學報:哲學社會科學版,2002(3):118-122.
[7]王喜梅.談民族地方特色文獻資源的開發利用[J].圖書館理論與實踐,2009(8):75-76,82.
[8]李小平,沈洋,張川駿,等.西南地區少數民族古籍醫藥文獻數字化建設初探[J].中國中醫藥圖書情報雜志,2017,41(3):39-42.
[9]劉善偉,萬劍華,祝德顯.采用GIS技術的地質實習輔助教學軟件開發[J].實驗技術與管理,2018,35(8):153-156.
[10]姚紀明,劉亞靜,王森.地質調查手機移動GIS設計與實現[J].測繪科學,2015,40(9):134-137,142.
[11]陳曉寧,劉金榜.移動GIS版地理國情外業調繪系統的設計與實現[J].地理空間信息,2016,14(6):7,41-44.
[12]張恬,李軍德,程蒙,等.基于GIS的中藥資源動態監測填報系統的設計與實現[J].中國中藥雜志,2017,42(22):4306-4309.
[13]劉翀.地理信息系統(GIS)技術在工程測量中的實踐[J].工程建設與設計,2018(14):268-269.
[通聯編輯:謝媛媛]