999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

自然語言處理在醫療器械中的應用研究

2020-07-04 03:03:12胡雪嬋韓雪峰
吉林省教育學院學報 2020年6期

胡雪嬋 韓雪峰

摘要:本文在概述自然語言處理的基礎上,簡述了自然語言處理NLP的工作原理:特征提取、特征加工、系統訓練和驗證。總結了自然語言處理在胃腸道內窺鏡檢查報告中的主要特點,指出了結構化的關鍵,進而進行了方案設計。闡述了自然語言處理在醫學影像中的應用,包括患者個體信息分析、群體信息分析、醫學影像流程信息分析。最后,對自然語言處理的未來發展方向進行了展望。

關鍵詞:自然語言處理;MST;醫學影像

自然語言處理(Natural Language Processing,NLP)是指研究人類如何使用自身熟悉的本族語言與計算機進行信息交流,并探索人類自身的語言能力和思維活動的本質。它是人類社會生活進步和發展的產物, 且在社會生活中不斷變化,是極其復雜的符號系統。

近年來,自然語言處理在醫學領域的應用已成該領域的研究熱點之一。醫學數據和文本的處理,是自然語言處理在醫學領域最早的應用方向,如文本分類、信息提取、信息管理、人機交互問答、數據庫建立等。如現在已成熟廣泛應用的UMLS(The Unified Medical Language System)——一體化醫學信息系統,集成了150多種常用醫學術語知識庫,SNOMED ——被廣泛應用的臨床醫學術語知識庫之一,還有MedLEE、MetaMap、cTAKES、MedEx、KnowledgeMap等。隨著技術的不斷發展進步,醫學影像自動處理的研究已取得長足進步,通過初步的影響自動識別、處理、分類等技術,降低人工成本,提高處理效率,進而為醫療決策提供支持,已被各大醫院所廣泛采用。除此之外,如疾病的預測、輔助診斷和預后評估、新藥開發、健康管理等領域,也已經大規模采用了自然語言處理技術。

一、自然語言處理基本內涵及工作原理

(一)自然語言處理的基本內涵

自然語言處理不僅是新一代計算機必須要研究的課題,還是人工智能極為活躍的研究領域,而對自然語言處理所做的定義可基于不同研究立場、領域及角度,由不同領域的專家和學者推定。創建一種計算機模型成為自然語言處理的任務之一,這是從計算機科學,特別是人工智能的觀點得出的結論,因此,通過計算機模型就可以模擬自然語言。

但是模擬出的自然語言的正確性,目前還沒有一個公認的衡量標準。就自然語言處理的發展現狀來看,基于具體的設計系統功能、實用角度,對自然語言處理進行判斷,判斷計算機具備自然語言處理能力的方法是計算機實現了自動文摘、機器翻譯及人機會話等語言信息處理功能。可以這樣說,從一種表達到另一種表達的轉換過程,便是自然語言處理的過程,這一過程的本質可以理解為映射,在進行映射之間的算法設計時,以機器得到相應輸出為目的,從而使每個事件都有相對應的行為執行命令,這個過程構成了自然語言處理系統。

(二)自然語言處理(NLP)的工作原理

自然語言處理的規則和模型全部由NLP從自然語言數據中推導而來,同時將文本朝著結構化的編碼信息進行轉換,以此得以快速分析及查詢,其統計方法、語法、語義及語境等語言學方法都在NLP工作過程中有所涉及。盡管多種NLP在操作、技術、具體目標等過程中表現得各不相同,但多種NLP的工作原理都是類似的,分別是:特征提取、特征加工、系統訓練和驗證。

1.特征提取

特征提取是NLP分割文本、識別單個概念,同時將識別出的概念連同其他醫學概念的關系進行定義,從而使得輸出的數據具有一定的結構式的過程。通常在特征提取時,首先要分割詞匯,然后分析出語義詞匯,最后遵循由大到小的尺度規則進行詞匯分割,具體是將整個影像報告分割為各個段落,然后將其分為詞匯、詞組及句子,最后從詞匯層面的角度,對詞根進行判定,擴充完整縮略語,糾正拼寫錯誤等。

當對詞匯進行語義分析時,需依照從局部到整體的尺度規則,基本可分為概念、詞典及知識體系,概念指的是其中劃分的一些詞匯每個都能具有一定的含義,比如某種疾病等,而像RadLex詞典或者一體化醫學語言系統(UMLS)詞典,基本上由一組相關術語、衍生詞、同義詞或相同含義的概念等構成,這就是詞典的概念特征。而知識體系則涉及本概念對其他概念所起到的限定、修飾作用等,也就是每個概念同其他概念間的相互關系。所以,在特征提取的作用下,自然語言會被分割成結構式概念,且這些概念都會被定義與其他概念之間的關系,以用來進行下面的特征加工。

2.特征加工

在特征加工過程中,首先提取結構化數據,其次判斷其是否包含目標概念,再次由所提取的數據進行推動,最后確定是否可以得出臨床結局。

在基于某種規則對特征進行加工時,一般以下兩種方法可以生成規則,即:①從數據中借助統一或機器學習的方法自動推導、制定規則;②專家制定規則或聯合制定規則,由專家判斷通過機器學習所產生的規則,并加以矯正。總之,不管采取哪種方式對特征進行加工,都需要通過訓練及驗證所設定的規則,并使其得到進一步應用。

3.系統訓練和驗證

一般而言,需要通過訓練及驗證完成特征加工后的系統,而在這種過程中需要將足夠分類的“標準答案”提供給該系統,一般情況下,要將大量的標準數據應用于訓練,同時加以驗證,這時在實際使用中系統便可得到穩定運行。不過需對訓練及驗證的成本加以考慮,而各類學習任務的訓練數據在實際操作中具有一定的差異化。一般表現較好的是文獻報告NLP驗證的結果,不過其中特異度及敏感度在許多系統中均超過90%。通過測試不同時間點、不同應用目的及不同軟件系統,從而未表現出明顯的性能差異。

二、自然語言處理的醫學應用

(一)自然語言處理在醫學報告中的應用

如今的醫療領域受到信息化技術的影響較大,人們更多關注電子病歷的開發及應用。這種新型的電子病歷將結構化病歷或專業表格的處理作為其研究的重要方面之一。其中結構化程度隨著更多的結構化內容及更多病歷覆蓋的內容的出現,逐漸被細化。

比如近些年來,現代臨床醫學得以迅速發展的重要學科之一——胃腸道內窺鏡檢查學,其學科地位得到一定程度地提高,具體表現在三個方面:①胃腸道內窺鏡檢查從過去的輔助檢查變成如今的基礎臨床診斷手段之一;②內窺鏡這一檢查手段已經成為醫學信息系統研究的熱門對象;③電子病歷中不能缺少的一部分是消化科內窺鏡檢查報告。這種報告是極為重要的醫學報告文書,可記錄內窺鏡檢查診斷治療過程,意義非凡。

電子病歷在實現結構化方面走在了前面,亦取得了不小的成就,不過,其中被應用最為廣泛的是結構化表單錄入,這種方式在自然語言表達中,并不能體現出所有的語義信息。而制約電子病歷結構化發展的關鍵性問題是醫學術語的標準化,另外,不同醫生具有不同的病歷描述習慣且病案書寫需語句通順,合乎規范。其實電子病歷在全領域內,還沒有完整應用,它是具有一定培訓基礎的分類標準及體系,不過,在一些小的領域中出現了小范圍的標準。比如MST(Minimal Standard Terminology),它來自歐美地區,是一套比較成熟的檢查術語標準,被廣泛應用于胃腸道消化科內窺鏡檢查,這為消化科內窺鏡檢查報告的結構化提供了一個良好的平臺。所以,面對結構化表單的錄入無法得到大眾認可,甚至在自然語言表達中,尚不能達到所有語義信息的要求的現象時,可通過自然語言處理技術使得消化科內窺鏡檢查報告的結構化得以實現,為了實現報告的標準化及結構化,可基于消化科內窺鏡檢查標準術語,通過分析純文本進行操作。

1.胃腸道內窺鏡檢查報告的主要特點

從事醫療行業,每天都會通過看診為病人診斷病癥,需要書寫大量的診斷報告,這就需要對醫生進行上崗培訓,并盡量統一書寫病例的具體方式。但由于專業背景、個人經歷、用詞習慣等不同,內窺鏡的檢查報告呈現出以下局限:①用語不統一,醫生自由錄入產生的診斷報告的診斷意見和檢查所見,使得報告呈現出個人特點而非遵從統一標準;②查找費時費力。所謂的費時費力主要體現在計算機檢索查詢文本數據時,容易出現統計錯誤及費時情況,而根據醫生的書寫習慣,對于多個檢查項目存在于一句話中時,則需將前后關系作為依據,從而判斷出檢查項目所指;③共享困難。通常純文本不僅無法共享數據,還不能更好地通過計算機進行數據識別及處理;④沒有上下文限制。

2.報告結構化的關鍵

想要進一步規范報告結構,必須使報告中的詞匯具有MST結構,具體可通過如下五個方面開展相應工作:

(1)分詞:為了方便在MST中找到對應的術語,可將報告中的字串轉化成詞串;

(2)分詞調整:切分MST標準術語,將非標準詞匯轉化為標準詞匯;

(3)歸類:為MST術語表進行類型歸類,明確每一類的職責;

(4)定義關系:定義每個語義類型之間的語義關系,并表達MST中隱含的關系;

(5)文本解析:在分詞、歸類和關系定義基礎上,定位每個詞匯,使文本具有MST結構。

3.方案設計

本文基于現在結構化過程中存在的問題以及內窺鏡檢查報告的特點,提出以自然語言處理技術為依據的結構化方法,這種方法促成了既有的較為成熟的自然語言處理技術成果的呈現,從而得出一種自然語言處理結構模型,該模型以內窺鏡檢查報告的特點為依據設計而成。

(1)分詞模塊:分為初步處理和調整兩個小模塊,國內很多軟件已經能夠進行比較精準的原始切分,但常會囿于分詞軟件的局限性,使得分詞結果并不完全適用于醫學領域,所以做完這一步之后,我們需要進一步調整,來識別MST術語,達到非標準MST術語到標準MST術語的轉化。

(2)文本解析模塊:在MST知識庫基礎上,為分詞得到的結果進行逐類型分析,并明確類型之間的語義關系,然后在符合MST標準的前提下,輸出檢查條目結果,找對應編碼。

(3)MST知識庫:借鑒了一體化醫學語言系統UMLS中的關系數據庫模型,其中該知識庫中涵蓋了MST檢查條目的編碼及術語的層次關系、語義類型之間的語義關系定義,MST術語所屬的語義類型定義,MST術語關系庫及MST術語集。

(4)專業詞典:其中涉及的常見、非標準MST詞匯存留在MST標準術語及內鏡檢查報告中,不過它們可以轉化成MST標準術語的詞匯以及詞性。

(5)人工干預模塊:而敘述性檢查報告用語中的靈活性決定于漢語的靈活性,不過在詞典設計中,需通過創建學習引擎,不斷學習及補充處理過程中的系統,然后通過借助自然語言處理技術,使得內窺鏡檢查報告可以結構化,同時分析標準及內窺鏡檢查報告的特點,可謂工程艱巨。

(二)自然語言處理在醫學影像中的應用

醫學影像報告是電子健康病歷(EHR)中包含大量數字信息的重要組成部分。在EHR中出現的影像報告,主要由自由文本形式構成,非機構性數據,對信息的提取和利用產生了不利的影響。另外,在人工提取報告信息的過程中,容易出現難以操作的現象,因此,醫學影像報告信息中的重要工具便是自然語言處理(NLP)技術。根據不同的提取對象,NLP可用于以下實際操作中的信息分析:

1.患者個體信息分析

對個體的影像信息進行有針對性的提示,可以大大減輕醫生的負擔:

(1)提示危重信息:通過NLP將影像報告中所描述的、可能導致嚴重后果的影像征象進行檢查,從而將檢查結果提供給醫生,使其注意對該患者的治療方法。如今可通過NLP檢查出的癥狀包括血栓栓塞性疾病及各類潛在惡性病變、急性肺損傷、肺炎、闌尾炎等。

(2)提示隨訪建議:對于臨床進行后續操作的內容,可在NLP檢出報告中,自動生成隨訪建議,提示后續檢查或治療。

(3)提示可能出現的錯誤:可對報告醫師是否可能為誤讀、誤判或誤操作進行相應提示,使得邏輯矛盾的內容得以明確檢出。

2.患者群體信息分析

提取和分析患者群體影像診斷信息,從而使得患者隊列得到構建,并應用于流行病學研究、行政管理等。

(1)流行病學研究隊列的構建:對大數量患者群體,通過NLP可高效分析其影像報告,從而得出群體的特征性數據。對于流行病學研究患者隊列的構建,可使用傳統方法,通過投入人力及時間的成本對合適病例進行篩選,此外,流行病學研究效率可借助NLP進行提高,從而為循證影像醫學研究提供幫助。

(2)對社區群體的公共衛生情況進行監控:采用NLP對區域健康情況進行評估。為了對公共健康水平進行監控,并展開決策分析,可通過從圖像中提取的群體NLP特征值和其他結構化電子病歷數據實現。

3.醫學影像流程信息分析

改進及評價醫學影像報告質量,可通過提取及分析醫學影像流程信息實現,具體如下:

(1)報告質量評價和報告規范的建立:NLP可自動分析大量影像數據及反映其日常的影像科日常工作運行情況;對影像報告進行判斷,從而得出是否符合相關指南或診斷規則的結論;對醫學影像學的流程和質量指標進行識別。如今看來,評價報告的完整性和規范性可由NLP系統實現,同時推出報告信息能否用于對疾病的診斷、能否給出正確合理的治療建議及是否及時進行危急情況的預警。而借助NLP結果,可引導報告規范的建立。

(2)醫師個人表現評價和改進建議:針對醫師完成報告而進行行為評價,這是NLP的一個作用,同時它對醫師的個人質量評價進行診斷。

(3)影像檢查全流程的改進:通過NLP分析各類影像的綜合信息,關聯全面的臨床信息及報告中的檢查結果和建議等,比如申請醫師及患者類型(住院或門診)、性別、申請科室、檢查適應證、疾病種類、患者年齡等。經過分析及驗證大規模的數據,可得到預測模型,從而得出臨床決策支持系統(CDSS),使其適用于本地情況,該系統可應用于計算機醫囑系統(CPOE)中,從而高質量、高效率及標準化管理影像檢查申請、臨床應用及結束的全過程。

三、結語

自然語言處理技術日新月異,其在醫療器械研究領域的進駐,不僅改變了醫學工作者的工作模式,更有價值的是開啟了從源頭“根治”醫療原始數據的新時代,進而使早期的精確識別向如今的模糊識別發展,在此基礎上,醫療數據信息在錄入后的自動導出和分類展示,基于人機交互的問診系統開發、臨床評分等,都使自然語言處理技術在醫學領域的地位越來越重要。隨著技術的不斷完善,系統經過對醫學數據的深度學習之后,也必將推動NLP在醫學領域中的應用方向,從現在的輔助“展示”階段、代替處理階段至將來的“發現”并進行“預警”階段,這也是醫療領域發展的重大變革。

[參考文獻]

[1] 蘭欣,衛榮,蔡宏偉等.機器學習算法在醫療領域中的應用[J].醫療衛生裝備,2019(03).

[2] 舒堅,周才英,劉琳嵐.對象角色建模方法在ERP系統中的應用[J].微計算機信息,2006(09).

[3] 馬帥,王霄英.自然語言處理在醫學影像中的應用[J].放射學實踐,2016(12).

[4] 胡雪嬋,韓雪峰等.醫療器械漢語語料庫的建立和初步設計——基于一體化醫學語言系統和語義網絡的思考[J].中阿科技論壇,2018(06).

[5] 胡雪嬋,韓雪峰等.用于醫療技術傳播的語言研究現狀與展望[J].吉林廣播電視大學學報,2019(03).

[責任編輯:周海秋]

主站蜘蛛池模板: 日韩精品一区二区三区视频免费看| 女人18毛片水真多国产| 亚洲an第二区国产精品| 成人无码区免费视频网站蜜臀| 欧美在线伊人| 亚洲一区二区日韩欧美gif| 91麻豆国产精品91久久久| 精品無碼一區在線觀看 | 亚洲欧美在线看片AI| 亚洲色图欧美视频| 欧美亚洲日韩中文| 国产精品自在在线午夜区app| 亚洲成人播放| 久久久久青草线综合超碰| 亚洲中文字幕23页在线| 免费毛片在线| 欧美激情二区三区| 呦女亚洲一区精品| AV熟女乱| 色一情一乱一伦一区二区三区小说 | 三上悠亚一区二区| 免费高清自慰一区二区三区| 亚洲第七页| 国产小视频a在线观看| 毛片a级毛片免费观看免下载| 久久亚洲欧美综合| 嫩草在线视频| 在线精品亚洲一区二区古装| 黄色成年视频| 亚洲最新在线| 色综合中文字幕| 亚洲色图欧美在线| 久久国产香蕉| 中文字幕在线视频免费| 日韩国产黄色网站| 亚洲成av人无码综合在线观看| 69免费在线视频| jizz亚洲高清在线观看| 免费又黄又爽又猛大片午夜| 精品国产一区二区三区在线观看| 三上悠亚精品二区在线观看| 久久亚洲国产一区二区| 88av在线播放| 国产麻豆va精品视频| 黑人巨大精品欧美一区二区区| 日韩不卡高清视频| 欧美日本二区| 免费无码AV片在线观看国产| 亚洲第一中文字幕| 欧美精品1区2区| 国产99热| 激情网址在线观看| 国产精品欧美在线观看| 19国产精品麻豆免费观看| 国产精品va免费视频| 国产在线精品香蕉麻豆| 多人乱p欧美在线观看| 国产小视频在线高清播放 | 2021国产v亚洲v天堂无码| av在线无码浏览| 最新日韩AV网址在线观看| 亚洲天堂色色人体| 91精品啪在线观看国产60岁| 香蕉久久国产超碰青草| 欧美日韩国产成人高清视频| 国产午夜福利在线小视频| 亚洲欧洲自拍拍偷午夜色无码| 国产丰满成熟女性性满足视频| 5555国产在线观看| 欧美伊人色综合久久天天| 日韩无码一二三区| 97se综合| a级毛片免费播放| 国产人人乐人人爱| 国产香蕉国产精品偷在线观看 | 一区二区三区在线不卡免费| 99伊人精品| 中文字幕啪啪| 欧美另类第一页| 亚洲人成高清| 香蕉综合在线视频91| 一级高清毛片免费a级高清毛片|