于佳,祝麗娜,李絢璇,王冬梅青島海慈醫療集團功能檢查科,山東青島 266033
統計分析在甲狀腺超聲診斷數字化管理系統中的應用
于佳,祝麗娜,李絢璇,王冬梅
青島海慈醫療集團功能檢查科,山東青島266033
近年來,隨著超聲數字化水平、存儲技術、計算機技術等關聯技術的發展,許多醫院開始著手構建超聲診斷數字化管理系統,以輔助疾病管理。甲狀腺疾病是臨床常見病,超聲是甲狀腺疾病篩查、診斷、療效評估等重要技術,獲取信息十分豐富,這些數據具有較大挖掘價值,在甲狀腺疾病超聲智能診斷、流行病學分析、病因與發病機制等研究中具有較高的價值。統計分析在甲狀腺超聲診斷數字化管理系統中發揮關鍵作用,可供選擇的數據挖掘方法包括關聯規則、集對分析、粗糙集理論、聚類分析等,可供選擇的統計學方法包括Logistic回歸分析、因子分析與主成分分析、典型相關分析、結構方程模型、線性混合模型、最大似然判別,目前我國醫學統計學仍處于較低水平,數據挖掘利用水平遠遠不足,衛生工作者應努力掌握更加專業的統計學理論、方法,提高自身統計應用水平。
甲狀腺疾病;統計學分析;超聲診斷數字化管理系統
[Abstract]In recent years,with the development of ultrasound digital level,storage technology,computer technology and other correlation technology,many hospitals begin to build ultrasound diagnosis digital management system in order to assist disease management,the thyroid disease is the common disease in clinic,and the ultrasound is the important technology of screening,diagnosis and curative effect evaluation of thyroid disease,and it can obtain rich information,and the data are of biggermining value and are of higher value in intelligent diagnosis of thyroid ultrasound,analysis of epidemiology and research of pathogeny and pathogenesis,and the statistical analysis is vital to the thyroid ultrasound diagnosis digital management system,the available datamining methods include correlation rule,setpair analysis,rough set theory and cluster analysis,the available statistical methods include Logistic regression analysis,factor analysis,principal component analysis,canonical correlation analysis,structural equation model,linear mixed model and maximum likelihood discriminant.At present,the medical statistics of our country is still at a lower level,the datamining use level remains far from adequate,and the health workers should make an effort to master more specified statistical theory and method and improve their own math application level.
[Key words]Thyroid disease;Statistical analysis;Ultrasound diagnosis digital management system
甲狀腺疾病是臨床常見病,發病率高達4%,其中絕大多數都需要經超聲診斷。近年來,甲狀腺癌、甲狀腺腫發病率逐年上升。超聲醫學是物理學、醫學與電子工程技術相結合的一門學科,在甲狀腺等疾病診斷中具有重要價值,定性診斷甲狀腺良惡性疾病符合率約為80%~90%,近年來彈性超聲、高頻超聲等技術的應用,極大地提高超聲診斷效用,在甲狀腺疾病篩查、診斷中的價值無可替代[1]。邁入21世紀,數字化、信息與計算機飛速發展,并在醫院信息管理領域得到廣泛的應用。超聲診斷數字化信息十分龐大,信息管理需求加強,超聲診斷數字化管理系統便是在這種背景下孕育而生,在流行病學管理、超聲智能診斷等領域發揮關鍵作用,給臨床工作帶來巨大的便利,但遺憾的是許多醫學工作者統計學分析能力欠佳,導致發表的文獻錯用誤用統計學方法等許多問題[2]。數據挖掘是超聲診斷數字化管理系統運用的基本工作,其中大量應用醫學統計分析,該研究就此進行概述,總結統計學分析在甲狀腺超聲診斷數字化管理系統中的應用價值與方法。
超聲診斷甲狀腺疾病數字信息十分龐大,特別是近年來超聲診斷技術飛速發展,不僅二維超聲、彩色多普勒超聲等常規超聲技術不斷發展進步,彈性顯像、高頻超聲等技術也得到廣泛應用,圖像由二維圖像向三維、四維圖像轉變,這些技術也都已應用于甲狀腺疾病診斷。鑒于甲狀腺疾病高發,醫院甲狀腺超聲診斷信息十分驚人。甲狀腺超聲診斷基本信息包括:①形態學信息結節形態、邊界、包膜、縱橫比、邊緣光滑程度等,部分醫院利用計算機輔助診斷系統中還可能有圓形度、平均方向數、歸一化徑向長度標準差、粗糙度等信息;②衰減信息特征,后部回聲是超聲診斷甲狀腺結節的重要依據,衰減系數是超聲診斷基本的信息;③紋理特征信息,根據數據計算方式,數據的形式、內容繁多;④其他信息,如血流流速、頻譜等信息,組織彈性應變值等。
2.1統計分析在數據挖掘中的應用
甲狀腺超聲診斷信息龐大,呈現多模式特征,一定程度上增加了數據挖掘難度,部分信息體現出的客觀不完整、描述疾病主觀不確切,進一步增加了信息的復雜性。數據挖掘的意義在于從數據中發現有意義的知識,以總結甲狀腺超聲特征信息,或用于預測未來趨勢,進行前瞻性的決策。不同醫院超聲診斷數字化管理系統收集信息受醫院需求、設計者設計思路影響,統計學處理的軟件以SPSS系列為主,目前可供應用的數據挖掘方法包括關聯規則、集對分析、粗糙集理論、聚類分析等。
2.1.1關聯規則 關聯規則是最常用的研究方法,側重于數據中不同領域的關系研究,滿足給定條件下的多個域間的依賴關系,如甲狀腺腫疾病形態學信息之間的關系,根據一個事物中某些數據項可以導出另一些數據項。在甲狀腺超聲診斷中,大量出現的形態學、組織學、物理學相關信息十分復雜,關聯規則可找出相關聯的各個數據,但某個信息總是同時出現時,可以找出某種疾病的規律,甚至是疾病發生進展規律[3]。當然,關聯規則可能并不能反映臨床實際情況,兩組信息存在關聯但并不代表這種關聯具有臨床意義。
2.1.2集對分析與粗糙理論 不確定性是自然界與人類社會普遍存在的一種客觀現象,對于超聲診斷更是如此,超聲診斷并不是診斷“金標準”,不可避免存在誤漏診。集對分析可作為統一處理模糊、隨機、中介和信息不完全所致的不確定性。其對不確定性的處理思路簡要概括可分為“客觀承認、系統描述、定量刻畫、具體分析”,借助對系統中不確定性與確定性相互關系,以及一定條件下相互轉化的過程描述,處理不確定性在具體條件下的取值規律。如針對甲狀腺彈性應變值,受掃查切面、儀器性能等因素影響,取均值也不能保證完整真實可靠,某些超聲主觀評價結果較模糊或不一致。集對分析職能在系統層次上,可與解決精確問題方法相結合,揚長避短。粗糙集理論為研究不精確數據分析、推理、挖掘數據間的關系,發現潛在的關聯性提供了行之有效的工具,將其引入到超聲診斷,可為智能化診斷提供一種方法,通過以患者一般情況、癥狀、超聲信息,建立信息表,采用差別矩陣法等獲得上下近似集,抽取確定規則、可能規則,以輔助診斷,避免可臨床醫師主觀性、片面性[4]。
2.1.3聚類分析 聚類分析是超聲診斷系統信息管理最常用的數據挖掘策略,通過分析變量之間的線性關系,按照相似程度進行歸類,將具有共線性關系的變量聚類分析到一類,從而達到降維目的。聚類分析應用于甲狀腺超聲診斷信息,有助于尋找某一個給定條件下,具有共性特征的超聲信息特征,如惡性甲狀腺腫瘤超聲特征群。
2.2統計方法
2.2.1Logistic回歸分析Logistic回歸分析可分為非條件與有條件兩種,前者適用于隊列研究、成組病例對照組資料分析,后者適用于配比設計病例對照組研究資料分析[5]。甲狀腺超聲診斷信息十分龐大,其中可供對照研究的信息包括性別組、年齡組、良惡性組等,通過進行對照、隊列研究,利用標準偏回歸分析絕對值可了解各自變量對甲狀腺疾病的影響。通過大量的回顧性分析超聲診斷信息,可采用判別分析、回歸分析建立超聲診斷信息與“病種”之間的判別函數,以達到篩查、診斷目的。Logistic逐步歸因分析考慮每一個變量與診斷樹每一個樹杈對“病種”的貢獻,符合臨床邏輯思維過程,更接近臨床實際。
2.2.2因子分析與主成分分析 因子分析是對多個指標變量,用少數幾個潛在指標的線性組合表示,綜合反映全部變量的大部分信息,雖然這些變量原始變量少,但包含的信息量可占原始信息的85%以上,且這些新變量可信度仍較高,而且這些新變量彼此之間并不相干,可消除多重共線性[6]。R型因子分析是指指標變量做的因子分析,對觀測的個案所做的因子分析叫做Q型因子分析,兩者結合得到對應分析,可同時揭示觀測對象、指標變量兩方面的結果。通過隨機調查足夠足量的甲狀腺超聲診斷信息,利用SPSS軟件建立數據模型,進行實性因子分析(CFA),結果經2-n因子分析,其中某n個因子分析可與臨床實際(甲狀腺主要病種)相符,根據結果排序,以標準回歸系數作為疾病的界值,可劃分不同甲狀腺疾病超聲診斷信息群。
2.2.3典型相關分析 典型相關分析是研究兩組變量相關關系的一種多元統計方法,應用于甲狀腺超聲診斷信息處理,可揭示病種實質,通過希望了解的病種與客觀指標的相關關系,利用典型相關分析,可將病種作為一組變量,某一個超聲診斷信息作為一組變量,分析疾病信息與超聲診斷信息相關性,了解推測客觀指標變化情況。
2.2.4結構方程模型 甲狀腺惡性特征并非一個可以準確的、直接測量的變量,這種變量可稱為潛變量,通過對縱橫比等外顯指標,間接測量這些潛變量,結構方程模型可分析潛變量復雜關系,用來尋找各種疾病相應的主要超聲診斷信息[7]。
2.2.5線性混合模型線性模型主要包括線性回歸模型、方差分析模型、協方差分析模型、方差分量模型等。方差分量模型不同于其他固定效應模型,其中含有部分效應為隨機變量。混合模型的一種表示形式為:Y=Xβ+ Zu+e,Y是n×1的觀測向量,β為p×1的非隨機未知參數向量,成為固定效應,X、Z分別為n×p和n×q已知的設計矩陣,u和e分別為q×1、n×1隨機向量,u為隨機效應,e為通常意義上的誤差。通過隨機抽取甲狀腺超聲診斷信息,所有信息并非這些個體本身的特征,而是整個甲狀腺超聲診斷綜合體特征,將單個甲狀腺超聲診斷信息產生的個體效應看作隨機而引入模型,可提高模型的精度。線性混合模型在超聲輔助診斷、目標預測中具有較高的價值,如以某一個時間段發病人數作為Y,既往任何一種甲狀腺疾病、不同時間段診斷人數作為自變量,可構建線性混合模型,以預測未來某一個時間段就診人數值域。
2.2.6最大似然判別 最大似然判別法最好用于計數資料的判別分析,用于甲狀腺超聲診斷數字化信息處理,基本原理是,計算某一種甲狀腺疾病各相關超聲計量信息的條件概率,再將條件概率轉化為指數值,按照相對指數值大小對相關因素進行賦分,其與因素回歸分析主要差別在于因變量不是定量的。在獲得新的一組自變量(超聲診斷客觀信息)后,依據方程組計算概率值,判斷該組數據來自于哪一個類別的概率最大,從而判斷該組數據來自于哪一類。最大似然判別特別適用于病例樣本較大的數據,得出的數據頻率較穩定,作為目標指標評價指標要多,則判斷而定準確率越高。最大似然判別法可與計量學中概率換算法進行結合。
統計研究是衛生領域作用工作內容,有報告顯示全世界約80%的數字信息是醫學信息。我國人口眾多,醫學信息十分龐大,一方面為開展醫學統計學工作提供了更豐富的材料;另一方面對統計工作者業務能力提出了更高的要求[8]。醫學統計在公共衛生、臨床等領域發揮重要作用,衛生工作者應努力提升自身的統計學知識水平,以提升挖掘數據、處理數據,提升自身科研能力。
[1]詹維偉.甲狀腺結節的超聲診斷進展[J].中華醫學超聲雜志,2011,8(6):1170-1179.
[2]何慶勇.臨床論著中常見統計學錯誤辨析[J].中國中醫基礎醫學雜志,2011,15(7):552-553.
[3]王華,胡學鋼.基于關聯規則的數據挖掘在臨床上的應用[J].安徽大學學報:自然科學版,2006(30):21-25.
[4]張文修,吳偉志.粗糙集理論與方法[M].北京:科學出版社,2003:22-23.
[5]王濟川,郭志剛.Logistic回歸模型—方法與應用[M].北京:高等教育出版社,2001:9.
[6]王芳.主成分分析與因子分析的異同比較及應用[J].統計教育,2003(5):14.
[7]侯杰泰,溫忠麟,成子娟.結構方程模型及其應用[M].北京:教育科學出版社,2004:13-14.
[8]趙耐青.醫學統計學[M].高等教育出版社,2004:1.
Application of Statistical Analysis in the Thyroid Ultrasound Diagnosis Digital Management System
YU Jia,ZHU Li-na,LI Xuan-xuan,WANG Dong-mei
Functional Inspection Department,Qingdao Haici Medical Group,Qingdao,Shandong Province,266033 China
R73
A
1672-5654(2016)05(a)-0178-03
于佳(1982.1-),女,山東青島人,本科,住院醫師,主要從事超聲診斷方面的工作。
王冬梅(1983.12-),女,山東青島人,本科,住院醫師,主要研究方向:超聲診斷,E-mail:wangdongmei1108@163.com。
2016-02-04)