


摘要:目的:探討Access原發(fā)性肝癌數(shù)據(jù)庫的建立方法及其應用價值。方法:選擇本院2020年1月至2024年4月期間確診的原發(fā)性肝癌患者,數(shù)據(jù)來源為醫(yī)院內(nèi)局域網(wǎng)系統(tǒng)中的患者信息數(shù)據(jù),通過Access數(shù)據(jù)庫保存和管理患者的臨床資料,建立原發(fā)性肝癌患者的臨床資料專科數(shù)據(jù)庫。結(jié)果 本院成功創(chuàng)建了原發(fā)性肝癌數(shù)據(jù)庫并應用于臨床診療、教學和科研等工作中。結(jié)論:建立原發(fā)性肝癌數(shù)據(jù)庫并形成肝癌臨床數(shù)據(jù)庫管理系統(tǒng),從而為臨床診療工作和科研工作提供有效數(shù)據(jù)支撐,應用價值較高。
關鍵詞:原發(fā)性肝癌;Access數(shù)據(jù)庫;k均值聚類算法機器;Smith-Waterman算法;應用價值
doi:10.3969/J.ISSN.1672-7274.2024.12.036
中圖分類號:TP 311.13" " " " " " 文獻標志碼:A" " " " " " 文章編碼:1672-7274(2024)12-0-03
Establishment and Application Value Analysis of Access Primary Liver Cancer Database
WANG Haiyong, KONG Chunli, ZHOU Lifen, HONG Huaijiang, WANG Zufei
(Wenzhou Medical University Affiliated Fifth Hospital (Lishui Central Hospital), Lishui 323000, China)
Abstract: Objective: To explore the establishment method and application value of Access primary liver cancer database. Method: Select primary liver cancer patients diagnosed in our hospital between January 2020 and April 2024. The data source is patient information data in the hospital's local area network system. The clinical data of patients is saved and managed through an Access database to establish a specialized database of clinical data for primary liver cancer patients. As a result, our hospital successfully created a primary liver cancer database and applied it in clinical diagnosis and treatment, teaching, and scientific research. Conclusion: Establishing a primary liver cancer database and forming a clinical database management system for liver cancer can provide effective data support for clinical diagnosis and research work, with high application value.
Keywords: primary liver cancer; access database; K-means clustering algorithm machine; smith waterman algorithm; application value
原發(fā)性肝癌是常見的惡性腫瘤,近年來發(fā)病率處于較高水平,是我國居民高發(fā)的惡性腫瘤之一,因此應積極匯總原發(fā)性肝癌數(shù)據(jù),加快肝癌臨床數(shù)據(jù)庫建設,實現(xiàn)臨床數(shù)據(jù)的收集、整理及科學分析,并建立肝癌臨床數(shù)據(jù)庫管理系統(tǒng),這對肝癌疾病基礎研究的發(fā)展、臨床治療水平的提高具有極大的推動作用。我國腫瘤登記數(shù)據(jù)庫建設歷史較長,但是缺少肝癌有針對性的數(shù)據(jù)庫,在信息技術的支持下,對原發(fā)性肝癌數(shù)據(jù)庫開發(fā)研究逐漸深入,正在步入快速的成長期。為此,溫州醫(yī)科大學附屬第五醫(yī)院積極開展了原發(fā)性肝癌數(shù)據(jù)庫創(chuàng)建工作,本文中選擇該院2020年1月至2024年4月期間確診的原發(fā)性肝癌病例,通過自然語言處理技術,對醫(yī)院局域網(wǎng)內(nèi)系統(tǒng)中的病例信息進行分析,并建立學習算法訓練模型,實時進行數(shù)據(jù)采集,通過Access數(shù)據(jù)庫保存數(shù)據(jù),并通過Smith-Waterman算法進行匹配關聯(lián)并存儲至數(shù)據(jù)庫,建立了數(shù)據(jù)庫管理系統(tǒng),旨在為臨床醫(yī)療、科研工作提供回顧性研究數(shù)據(jù)支撐。
1" "資料和方法
1.1 一般資料
選擇該院2020年1月至2024年4月期間確診的原發(fā)性肝癌患者,數(shù)據(jù)來源:醫(yī)院信息系統(tǒng)(HIS)、電子病歷系統(tǒng)(EMR)、實驗室系統(tǒng)(LIS)、影像系統(tǒng)(PACS)、病理系統(tǒng)等醫(yī)院局域網(wǎng)系統(tǒng)中的患者信息數(shù)據(jù),如病案首頁、入院記錄、病程記錄、會診記錄、上級醫(yī)師查房記錄、麻醉記錄、手術記錄、手術護理記錄等,建立原發(fā)性肝癌病理的臨床資料專科數(shù)據(jù)庫[1]。
1.2 方法
1.2.1 采集方法
采用自然語言處理(Natural Language Processing,NLP)技術對發(fā)病特征、治療記錄、病歷信息等進行語義分析,提取病史、癥狀特征、診斷、檢查結(jié)果及治療等關鍵詞,用詞向量將非線性回歸到線性分類,運用k-Means算法的機器學習算法訓練模型,采集肝癌患者信息數(shù)據(jù),并定期自動更新模型訓練樣本、調(diào)整模型參數(shù),自動進行模型訓練學習。建立基于人工智能k-Means算法訓練模型,具體方法如下。
1.2.2 匹配方法
采用Smith-Waterman算法對多來源數(shù)據(jù)中的核心信息進行自動匹配,將待匹配的數(shù)據(jù)進行預處理,處理過程包括對患者信息、發(fā)病特征、治療記錄、病歷信息等進行語義分析,提取病史、癥狀特征、診斷、檢查結(jié)果及治療信息篩選與保留,去除空格與換行符,數(shù)字與字母格式統(tǒng)一改為半角,對數(shù)據(jù)的合理性、有效性進行檢查,去除邏輯不符合要求的數(shù)據(jù)信息[2]。
1.2.3 保存方法
利用Access數(shù)據(jù)庫保存和管理患者的臨床資料,主要信息包括:個人信息、首次入院日期、末次出院日期、醫(yī)師信息、確診日期、肝炎病史、生存時間、實驗室檢查資料、飲食習慣、疾病史、出院科室、病理診斷、就診病程、肝功能分級、B超、肝硬化分型/分期、腫瘤大小與數(shù)目、淋巴結(jié)轉(zhuǎn)移、遠處轉(zhuǎn)移、肝門阻斷情況、手術史、射頻/激光射頻治療史、化療史、中醫(yī)治療史、轉(zhuǎn)歸等;存儲原始數(shù)據(jù)后創(chuàng)建數(shù)據(jù)庫表,并設計查詢檢索指定字段,創(chuàng)建窗體(控件自定義窗體),分組顯示信息,采用縱欄表及圖型等形式設計多個字段報表,并支持查詢結(jié)果自定義導出。
1.3 觀察指標
追蹤觀察肝癌臨床數(shù)據(jù)庫建立情況,觀察其管理系統(tǒng)建立效果,分析其臨床應用價值。
2" "結(jié)果
2.1 肝癌臨床數(shù)據(jù)庫管理系統(tǒng)創(chuàng)建成功
基于ASP技術實現(xiàn)B/S模式肝癌臨床數(shù)據(jù)庫管理系統(tǒng):利用ASP技術實現(xiàn)系統(tǒng)后臺框架和前端框架開發(fā),并采用VS(Visual Studio)進行系統(tǒng)設計、DW(dreamweaver)進行頁面設計,以及采用Access數(shù)據(jù)庫設計,在Window 2008 R2系統(tǒng)中搭建配置IIS(Internet Information Services)環(huán)境,從而實現(xiàn)肝癌臨床數(shù)據(jù)庫管理系統(tǒng)的建立,并實施數(shù)據(jù)集訓練及模型校驗,后臺對匹配結(jié)果進行評審與更正。數(shù)據(jù)庫分層管理系統(tǒng)如下:
(1)數(shù)據(jù)層:采用分布式緩存,針對醫(yī)院信息管理系統(tǒng)(HIS)、電子病歷系統(tǒng)(EMR)、實驗室系統(tǒng)(LIS)、影像系統(tǒng)(PACS)、病理系統(tǒng)等系統(tǒng)數(shù)據(jù)進行自動采集預處理。
(2)技術層:采用人工智能k-Means算法進行大數(shù)據(jù)分析,并進行自動采集處理。
(3)服務層:利用Smith-Waterman算法進行匹配關聯(lián),進行數(shù)據(jù)清洗。
(4)表現(xiàn)層:利用ASP(Active Server Pages)+IIS(Internet Information Services)動態(tài)網(wǎng)頁技術實現(xiàn)Web界面應用服務。
2.2 原發(fā)性肝癌數(shù)據(jù)庫的應用
2.2.1 整理收集資料
Access原發(fā)性肝癌數(shù)據(jù)庫自動錄入患者樣本和臨床數(shù)據(jù),實現(xiàn)了數(shù)據(jù)的實時更新,資料庫可處理、分類各項信息,與手工處理大樣本及數(shù)據(jù)相比,處理效果大幅度提升,同時降低了信息錄入、分類錯誤風險。原發(fā)性肝癌數(shù)據(jù)庫可直接篩選各類相關信息,獲取的臨床資料更為全面,可為臨床工作者和科研工作人員提供所需的臨床資料,與人工篩選相比,篩選速度提升,可發(fā)現(xiàn)更有價值和規(guī)律的臨床信息[3]。
2.2.2 實現(xiàn)臨床資料相關信息的網(wǎng)絡共享
Access原發(fā)性肝癌數(shù)據(jù)庫與醫(yī)療網(wǎng)絡緊密相連,可實時聯(lián)網(wǎng),通過瀏覽器可以查看、編輯、匯報數(shù)據(jù),并快速完成數(shù)據(jù)上傳,設置共享內(nèi)容,可與其他協(xié)作單位共享信息,共同討論臨床資料及有關數(shù)據(jù),實現(xiàn)醫(yī)療協(xié)作單位的多中心、大樣本信息共享。
2.2.3 提供臨床參考信息
原發(fā)性肝癌患者入院后,輸入患者個人信息,可立即查找患者以往診療信息,便于醫(yī)師分析患者病情進展情況。對新入院的原發(fā)性肝癌患者,相關醫(yī)生可參考數(shù)據(jù)庫中的相關病例,分析患者病情,確定治療方案,同時可查閱資料,分析患者潛在的危險因素和并發(fā)癥情況,便于及時采取治療措施,提升患者治療效果,降低不良預后風險[4]。
2.2.4 臨床教學支持
臨床教學中,教師可匯總原發(fā)性肝癌臨床資料,選擇典型病例作為教學資料,結(jié)合患者實際臨床信息講解相關知識點;同時,可將數(shù)據(jù)傳輸至計算機,制作教學課件,并利用多媒體設備進行教學演示,使學生更加直觀地認識原發(fā)性肝癌,更加深入地探索疾病的規(guī)律性,從而提高學生學習效果。
2.2.5 醫(yī)學科研工作支持
Access原發(fā)性肝癌數(shù)據(jù)庫可實現(xiàn)庫內(nèi)信息的綜合分析,可選擇某一類病例或特征進行數(shù)據(jù)匯總分析,并與其他來源的病理數(shù)據(jù)進行對比分析,分析病理具體情況,可有效減少資料獲取、分析難度,剔除少見且分散、重復的病例,避免分析方向異常,提升臨床資料利用率,發(fā)現(xiàn)潛在規(guī)律,縮短臨床科研的周期[5]。
2.2.6 遠期療效及預后追蹤
通過Access原發(fā)性肝癌數(shù)據(jù)庫對患者進行長期追蹤,觀察其治療進展,通過醫(yī)院信息網(wǎng)絡及時更新患者信息,觀察患者術后效果、化療進展、生存時間等信息,實現(xiàn)信息自動化管理,追蹤記錄患者遠期療效與預后。
3" "討論
我國各級醫(yī)療單位積累了的大量肝癌臨床數(shù)據(jù),但是相關數(shù)據(jù)資料較為分散,有針對性數(shù)據(jù)庫需要高效收集、整理和利用數(shù)據(jù)[6]。面對十分龐大且不斷積累的衛(wèi)生大數(shù)據(jù),如何做到合理存儲并高效加以分析利用是一個重大課題。目前,國內(nèi)胸腺瘤數(shù)據(jù)庫、原發(fā)骨腫瘤數(shù)據(jù)庫等一大批專病數(shù)據(jù)庫系統(tǒng)逐步完善,但是還沒有在互聯(lián)網(wǎng)上可以查詢的肝癌臨床數(shù)據(jù)庫[7]。為此,本院積極開展了原發(fā)性肝癌數(shù)據(jù)庫研究,綜合運用人工智能k-Means算法前沿技術對醫(yī)院信息系統(tǒng)(HIS)、電子病歷系統(tǒng)(EMR)、影像系統(tǒng)(PACS)、檢驗系統(tǒng)(LIS)等醫(yī)院局域網(wǎng)內(nèi)系統(tǒng)自動采集患者數(shù)據(jù),并利用Smith-Waterman算法進行匹配關聯(lián),顯著提高采集數(shù)據(jù)歸集工作的效率,并以瀏覽器與服務器溝通(B/S)架構(gòu)在區(qū)域平臺或醫(yī)療機構(gòu)里部署,方便快捷,適宜推廣。原發(fā)性肝癌數(shù)據(jù)庫可應用于臨床診療、教學和科研等工作中,通過該數(shù)據(jù)庫可實現(xiàn)原發(fā)性肝癌資料的快速整理分析,并可實現(xiàn)臨床資料相關信息的網(wǎng)絡共享,提供臨床參考信息,可為臨床教學和科研工作提供相關資料、技術支持,并可追蹤分析患者遠期療效及預后情況[8-9]。
4" "結(jié)束語
綜上所述,通過k-Means聚類算法機器、Smith-Waterman算法,利用ASP(Active Server Pages)、IIS(Internet Information Services)動態(tài)網(wǎng)頁技術和Access數(shù)據(jù)庫建立原發(fā)性肝癌數(shù)據(jù)庫,并形成肝癌臨床數(shù)據(jù)庫管理系統(tǒng),從而為臨床診療工作和科研工作提供有效數(shù)據(jù)支撐,應用價值較高。
參考文獻
[1] 傅毅振,陳敏山.2019年原發(fā)性肝癌治療進展[J].腫瘤綜合治療電子雜志,2020,6(2):86-89.
[2] Bray F, Ferlay J, Soerjomataram I, et al. Global cancer statistics 2018:GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in185 countries[J].CA Cancer JClin,2018,68(6):394-424.
[3] Liu Z, Jiang Y, Yuan H,et al. The trends in incidence of primary liver cancercaused by specific etiologies: Results from the Global Burden of Disease Study2016 and implications for liver cancer prevention[J].JHepatol,2019,70(4):674-83.
[4] Tsurusaki M, Murakami T. Surgical and Locoregional Therapy of HCC: TACE[J].Liver Cancer: 2015;4(3):165-75.
[5] Sun JY, Yin T, Zhang XY, et al. Therapeutic advances for patients withintermediate hepatocellular carcinoma[J].J Cell Physiol:2019;234(8):12116-21.
[6] 王姝.多名代表委員:建議防癌體檢納入醫(yī)保支付范疇[J].現(xiàn)代養(yǎng)生(下半月版),2019(3):6-7.
[7] 袁駿毅,湯欽華,馬群圣.胸腺瘤結(jié)構(gòu)化專病數(shù)據(jù)庫構(gòu)建研究[J].中國醫(yī)療設備,2019,34(2):113-115.
[8] 楊一帆,房居高.大數(shù)據(jù)分析在腫瘤研究中的應用進展[J].國際耳鼻咽喉頭頸外科雜志,2017,41(1):1-4.
[9] 尹國麗.人工智能在數(shù)據(jù)清洗中的應用[J].電子世界,2016(16):43-43,45.