雷義洋,申玉姝,王亞輝,趙虎
(1.中山大學(xué)中山醫(yī)學(xué)院法醫(yī)學(xué)系,廣東 廣州 510080;2.上海大學(xué)材料科學(xué)與工程學(xué)院高分子材料系,上海 200444;3.司法鑒定科學(xué)研究院 上海市法醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室 上海市司法鑒定專業(yè)技術(shù)服務(wù)平臺(tái),上海200063)
根據(jù)骨骼隨生長(zhǎng)周期呈現(xiàn)連續(xù)性與階段性的放射影像學(xué)特征推斷個(gè)體生物學(xué)年齡的過程稱為骨齡評(píng)估。法醫(yī)學(xué)骨齡研究具有重要的法律意義,對(duì)于判斷案件性質(zhì)及司法審判定罪量刑起著決定性作用。目前骨齡評(píng)估的主要方法有圖譜法(如GP圖譜法[1])、計(jì)分法(如TW計(jì)分法[2])、計(jì)數(shù)法等,但我國尚無統(tǒng)一的骨齡評(píng)估方法或標(biāo)準(zhǔn)。然而,傳統(tǒng)的人工評(píng)估方法識(shí)別效率有限,且容易受閱片者主觀性影響。因此,尋求便捷、科學(xué)的骨齡評(píng)估方法成為法醫(yī)學(xué)領(lǐng)域的重點(diǎn)問題之一。隨著支持向量機(jī)(support vector machine,SVM)廣泛應(yīng)用于機(jī)器學(xué)習(xí)、模式識(shí)別、模式分類等各個(gè)領(lǐng)域,本課題組提出了基于SVM骨骺發(fā)育的圖像模式識(shí)別方法[3]。SVM是VAPNIK[4]于1995年提出的一種用于模式分類和非線性回歸的統(tǒng)計(jì)學(xué)習(xí)理論,其基本思想是建立一個(gè)分類超平面作為決策曲面,使正例與反例的間隔離邊緣最大化,并轉(zhuǎn)化為一個(gè)凸二次規(guī)劃問題來求解。其優(yōu)勢(shì)在于解決線性不可分問題,通過引入核函數(shù)將低維度的特征空間映射到高維上使之線性可分[5]。SVM遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,在處理二分類問題上擁有良好的泛化能力、通用性及魯棒性,在解決小樣本、非線性和高維等問題時(shí)優(yōu)勢(shì)明顯,在數(shù)據(jù)挖掘、圖像處理、氣象預(yù)測(cè)等領(lǐng)域獲得了良好的應(yīng)用效果[6-7]。
本研究通過方向梯度直方圖(histogram of oriented gradient,HOG)與局部二值模式(local binary patterns,LBP)對(duì)新疆維吾爾族青少年膝關(guān)節(jié)數(shù)字化DR攝片圖像進(jìn)行特征提取,運(yùn)用主成分分析(principal component analysis,PCA)進(jìn)行特征降維,既保留原始指標(biāo)的主要信息,又避免冗余信息造成模型過擬合。基于降維后的特征數(shù)據(jù)建立膝關(guān)節(jié)骨齡的支持向量回歸(support vector regression,SVR)預(yù)報(bào)模型,并用獨(dú)立測(cè)試集檢驗(yàn)?zāi)P偷姆夯芰Γ骄吭摲椒ǖ臏?zhǔn)確性。
本研究從新疆維吾爾自治區(qū)人民醫(yī)院放射科影像數(shù)據(jù)庫中,選取自2014年8月—2016年12月拍攝的維吾爾族12.0~<19.0歲青少年膝關(guān)節(jié)DR攝片圖像。入選的攝片個(gè)體均身體健康,營(yíng)養(yǎng)狀況良好,無其他影響骨骼發(fā)育的疾病,且無外傷史。其中男性275例,女性225例。攝片時(shí)所對(duì)應(yīng)的生活年齡信息均源于其居民身份證或戶籍資料。
經(jīng)裁剪去除攝片號(hào)、姓名、拍攝日期等無關(guān)信息,保留股骨內(nèi)上髁上端2~3cm、脛骨粗隆下端2~3cm、腓骨頸下端2~3 cm。在上述男、女性青少年膝關(guān)節(jié)DR攝片圖像中基于年齡段采用隨機(jī)分層抽樣法選取約80%的樣本(男性215例,女性180例)作為訓(xùn)練集,用于模型訓(xùn)練、參數(shù)選擇。剩余的樣本(男性60例、女性45例)作為獨(dú)立測(cè)試集,用于評(píng)估模型的泛化能力。樣本分布情況見表1。
本研究符合醫(yī)學(xué)倫理學(xué)有關(guān)條款規(guī)定。

表1 訓(xùn)練集與測(cè)試集年齡分布 (例)
1.2.1 圖像特征提取
1.2.1.1 HOG特征提取
HOG特征是模式識(shí)別與計(jì)算機(jī)視覺領(lǐng)域常用于描述圖像局部紋理特征的一種常用的特征描述子[8]。其基本思想為圖像局部區(qū)域的灰度值梯度和邊緣方向可反映出圖像特征,將圖像以像素點(diǎn)為單位分為若干個(gè)大小相同的單元格,稱為元胞(cell),計(jì)算出元胞內(nèi)6×6像素點(diǎn)的灰度值梯度信息(大小與方向),并以直方圖的形式呈現(xiàn)。然后將相連的2×2個(gè)元胞組成大的連接區(qū)域,稱為block,每個(gè)block包含了元胞的梯度特征,并以非重疊(non-overlap)的形式合并元胞區(qū)域,構(gòu)建每個(gè)block區(qū)域的梯度直方圖,構(gòu)成膝關(guān)節(jié)圖像的HOG特征。如圖1所示。

圖1 膝關(guān)節(jié)HOG特征算子示例
1.2.1.2 LBP特征提取
LBP特征是描述圖像局部紋理的特征算子,具有旋轉(zhuǎn)不變形與灰度不變形等優(yōu)點(diǎn)[9]。該算法的中心思想是在3×3像素的正方形區(qū)域內(nèi),將中心像素點(diǎn)的灰度值設(shè)為閾值,鄰域內(nèi)的像素灰度值與中心閾值相比較,若中心閾值大于鄰域8個(gè)像素點(diǎn)灰度值,則該像素點(diǎn)位置被標(biāo)記為0,反之則標(biāo)記為1,得出一組二進(jìn)制碼表示圖像局部信息。將二進(jìn)制數(shù)轉(zhuǎn)化為十進(jìn)制數(shù),則該3×3像素區(qū)域可用LBP值反映。演算方法如圖2所示。

圖2 膝關(guān)節(jié)LBP特征算子示例
1.2.2 基于PCA法特征降維
PCA也稱為卡爾胡寧-勒夫變換,統(tǒng)計(jì)學(xué)上PCA的定義為用幾個(gè)較少的綜合指標(biāo)來代替原來較多的指標(biāo),而這些較少的綜合指標(biāo)既能盡可能多地反映原來較多指標(biāo)的有用信息,且相互之間又是無關(guān)的[10]。PCA是一種用于探索高維數(shù)據(jù)結(jié)構(gòu)的技術(shù),通過把具有相關(guān)性的高維變量合成線性無關(guān)的低維變量,新的低維數(shù)據(jù)集會(huì)盡可能地保留原始數(shù)據(jù)的變量,通常用于高維數(shù)據(jù)集的探索與可視化。設(shè)有m條n維數(shù)據(jù),PCA算法的基本步驟為:(1)將原始數(shù)據(jù)按列組成n行m列矩陣X;(2)將X的每一行(代表一個(gè)屬性字段)進(jìn)行零均值化,即減去這一行的均值;(3)求出協(xié)方差矩陣;(4)求出協(xié)方差矩陣的特征值及對(duì)應(yīng)的特征向量;(5)將特征向量按對(duì)應(yīng)特征值大小從上到下按行排列成矩陣,取前k行組成矩陣,即為降維到k維后的數(shù)據(jù)。
本研究為了解決圖像特征冗余帶來的數(shù)據(jù)量過大的問題以及對(duì)模型訓(xùn)練產(chǎn)生影響的噪聲信息,運(yùn)用PCA法對(duì)特征進(jìn)行降維,分別對(duì)訓(xùn)練集男、女性膝關(guān)節(jié)影像提取的HOG特征、LBP特征進(jìn)行分析,選擇HOG特征經(jīng)PCA降維后的前59個(gè)主成分和LBP特征經(jīng)PCA降維后的6個(gè)主成分,共65個(gè)主成分,把降維后的新數(shù)據(jù)作為SVM回歸模型的數(shù)據(jù)輸入。
1.2.3 構(gòu)建SVM回歸模型
通過SVM引入核函數(shù)對(duì)二維空間不可分的數(shù)據(jù)進(jìn)行超平面劃分,將給定的低維空間轉(zhuǎn)化為更高維空間,使得數(shù)據(jù)在新空間是可分離的。在訓(xùn)練階段將提取好的特征向量和該向量對(duì)應(yīng)的已知類別輸入SVM中,通過建立訓(xùn)練數(shù)并解多元不等式方程組,而多元不等式方程組的解則成為支持向量。對(duì)于一組特定的支持向量以及其對(duì)應(yīng)的類別形成一個(gè)SVM模型,SVM算法實(shí)際為凸二次規(guī)劃問題,尋找局部最優(yōu)解代替全局最優(yōu)解,以此來避免模型過擬合、欠擬合與局部極小點(diǎn)問題[4,11]。
基于分類問題或回歸問題的SVM分別成為支持向量分類(support vector classification,SVC)和SVR。考慮到骨齡評(píng)估實(shí)際情況,對(duì)年齡的預(yù)測(cè)是一個(gè)回歸問題,故本研究采用SVR進(jìn)行年齡回歸輸出。SVR基本思想為利用線性函數(shù)對(duì)樣本進(jìn)行擬合,對(duì)非線性問題通過引入核函數(shù)代替目標(biāo)函數(shù)將樣本映射到高維特征空間Hilbert得到回歸函數(shù)[12]。
首先將有限的n位作為輸入樣本,引入最小化風(fēng)險(xiǎn)函數(shù):


式(2)中,C為設(shè)定的懲罰因子,懲罰因子是學(xué)習(xí)模型在學(xué)習(xí)過程中對(duì)誤差的一種度量,一般在模型學(xué)習(xí)前已經(jīng)選定。
損失函數(shù)[13]是學(xué)習(xí)模型在學(xué)習(xí)過程中對(duì)誤差的一種度量,不同的學(xué)習(xí)問題對(duì)應(yīng)的損失函數(shù)一般也不同,同一學(xué)習(xí)問題選取不同的損失函數(shù)得到的模型也不一樣。本模型采用ε不敏感損失函數(shù),可避免將有限的數(shù)據(jù)樣本擬合進(jìn)數(shù)學(xué)模型產(chǎn)生過擬合現(xiàn)象[14]。ε為訓(xùn)練集真實(shí)年齡與預(yù)報(bào)年齡的差值,即假設(shè)所有訓(xùn)練數(shù)據(jù)以精度ε作為約束條件擬合為式(3):

最后,建立Lagrange函數(shù)[15]求解原問題的對(duì)偶問題,得到最終的最優(yōu)超平面回歸函數(shù)。引入滿足Mercer定理的函數(shù)作為核函數(shù),在低維空間映射到高維特征空間實(shí)現(xiàn)線性可分,避免“維數(shù)災(zāi)難”,減少計(jì)算量,本模型選擇對(duì)非線性系統(tǒng)擬合程度好的高斯徑向基核函數(shù)[16](Guassian radial basis kernel function,RBF)。同時(shí),本研究根據(jù)均方根誤差(root mean square error,RMSE)優(yōu)化SVR模型參數(shù)。
1.2.4K折交叉驗(yàn)證
K折交叉驗(yàn)證用于優(yōu)化模型得到最優(yōu)參數(shù),有效避免過擬合及欠擬合狀態(tài)發(fā)生,評(píng)估模型訓(xùn)練效果。其基本原理是將訓(xùn)練集數(shù)據(jù)均分為K個(gè)子集,將單一子集作為驗(yàn)證集,其余K-1個(gè)子集數(shù)據(jù)作為訓(xùn)練集,共計(jì)得到K個(gè)模型。其優(yōu)勢(shì)在于重復(fù)利用每個(gè)子集進(jìn)行循環(huán)訓(xùn)練與驗(yàn)證,通常K取值為5或10。本實(shí)驗(yàn)采用5折交叉驗(yàn)證,即5個(gè)子集中4個(gè)子集作為模型輸入樣本,留下1個(gè)子集作為驗(yàn)證集,依次循環(huán)驗(yàn)證5次。
本研究利用MATLAB? R2013b(8.2)軟件編程,添加LIBSVM工具包[17]。計(jì)算真實(shí)年齡與預(yù)報(bào)年齡間的平均絕對(duì)誤差(mean absolute error,MAE)與RMSE,MAE與RMSE均用于衡量預(yù)報(bào)年齡與真實(shí)年齡之間的偏差,反映模型泛化能力。分別計(jì)算出訓(xùn)練集、5折交叉驗(yàn)證及獨(dú)立測(cè)試集的預(yù)報(bào)年齡與真實(shí)年齡差值在±0.8歲與±1.0歲的準(zhǔn)確率。
在SVR模型中,訓(xùn)練集、5折交叉驗(yàn)證以及獨(dú)立測(cè)試集均以預(yù)報(bào)年齡與真實(shí)年齡誤差范圍在±0.8歲及±1.0歲的準(zhǔn)確率、MAE、RMSE作為檢驗(yàn)?zāi)P托阅艿慕y(tǒng)計(jì)量。結(jié)果顯示:訓(xùn)練集男、女性年齡誤差范圍在±0.8歲及±1.0歲的準(zhǔn)確率均為100%。5折交叉驗(yàn)證平均準(zhǔn)確率:男性年齡誤差范圍在±0.8歲及±1.0歲的準(zhǔn)確率分別為80.40%和89.70%,MAE為0.551歲,RMSE為0.669歲;女性年齡誤差范圍在±0.8歲及±1.0歲的準(zhǔn)確率分別為71.86%和87.74%,MAE為0.561歲,RMSE為0.657歲。結(jié)果見表2~3。

表2 男性膝關(guān)節(jié)圖像骨齡評(píng)估SVR模型訓(xùn)練集與交叉驗(yàn)證結(jié)果

表3 女性膝關(guān)節(jié)圖像骨齡評(píng)估SVR模型訓(xùn)練集與交叉驗(yàn)證準(zhǔn)確率
通過訓(xùn)練集與交叉驗(yàn)證得到最優(yōu)模型后,利用60例男性與45例女性獨(dú)立測(cè)試樣本檢驗(yàn)SVR模型的泛化能力,結(jié)果顯示:男性獨(dú)立測(cè)試集年齡誤差范圍在±0.8歲及±1.0歲的預(yù)報(bào)準(zhǔn)確率分別為80.67%和89.33%,MAE、RMSE分別為0.486歲、0.606歲;女性獨(dú)立測(cè)試集年齡誤差范圍在±0.8歲及±1.0歲的預(yù)報(bào)準(zhǔn)確率分別為80.19%和90.45%,MAE、RMSE分別為0.485歲、0.590歲。結(jié)果見表4。

表4 男、女膝關(guān)節(jié)圖像骨齡評(píng)估SVR模型獨(dú)立測(cè)試集檢驗(yàn)結(jié)果
骨骼發(fā)育受種族、地區(qū)、營(yíng)養(yǎng)、發(fā)育諸多因素影響,且存在性別差異。目前我國骨齡鑒定的主要方法為圖譜法和計(jì)分法,兩種方法基于人工讀片結(jié)果進(jìn)行推論,易受鑒定人水平和經(jīng)驗(yàn)影響,具有主觀性。在司法審判中,骨齡鑒定判斷刑事責(zé)任關(guān)鍵年齡14.0、16.0、18.0周歲對(duì)于判斷案件性質(zhì)及定罪量刑尤為關(guān)鍵。2002年2月21日,最高人民檢察院[18]曾在批復(fù)中規(guī)定,法醫(yī)學(xué)骨齡鑒定意見在犯罪嫌疑人年齡不明時(shí)可以作為判斷作案時(shí)年齡的證據(jù)使用,在司法審判實(shí)踐中對(duì)判斷案件性質(zhì)、定罪量刑起著重要作用。由于國內(nèi)針對(duì)骨齡鑒定的研究集中于漢族青少年,研究資料樣本量小,缺乏代表性,有必要針對(duì)少數(shù)民族進(jìn)行專門的研究,以此提供基礎(chǔ)資料和數(shù)據(jù),提高骨齡鑒定的準(zhǔn)確性。
根據(jù)骨骺的影像學(xué)特征推斷年齡已被廣泛認(rèn)可與運(yùn)用,目前主要的方法有計(jì)數(shù)法、圖譜法、計(jì)分法等,其中最受國內(nèi)學(xué)者接受與認(rèn)可的有Greulich-Pyle圖譜法與Tanner-Whitehouse計(jì)分法。圖譜法即創(chuàng)建標(biāo)準(zhǔn)圖譜與待測(cè)片進(jìn)行比較,以與標(biāo)準(zhǔn)片最對(duì)應(yīng)的骨齡值作為被檢者骨齡,該方法簡(jiǎn)單易行,使用廣泛,但誤差較大,主觀性強(qiáng)。計(jì)分法是將手腕關(guān)節(jié)影像按骨發(fā)育不同階段分期或分級(jí)并賦予相應(yīng)分值,計(jì)算不同部位骨發(fā)育分值的總分并與標(biāo)準(zhǔn)分值比較得出評(píng)估年齡,此方法的重復(fù)性與可比性較好。隨著計(jì)算機(jī)視覺技術(shù)與骨齡評(píng)估相結(jié)合發(fā)展,國內(nèi)外學(xué)者致力于研究計(jì)算機(jī)自動(dòng)化骨齡評(píng)價(jià)系統(tǒng),例如丹麥Visiana公司開發(fā)的一款骨齡評(píng)估軟件BoneXpert[19],以丹麥高加索兒童為樣本研制,現(xiàn)已在歐洲多個(gè)國家進(jìn)行臨床應(yīng)用,使用時(shí)只需將X線片導(dǎo)入該系統(tǒng)便可得出骨齡評(píng)估結(jié)果,該方法誤差較小,診斷迅捷。羅家燕等[20]利用14塊手腕骨搭建了與骨成熟標(biāo)準(zhǔn)圖譜比對(duì)的計(jì)算機(jī)兒童骨齡評(píng)估輔助系統(tǒng),實(shí)現(xiàn)了簡(jiǎn)單快速的骨齡定量評(píng)估。骨齡評(píng)估計(jì)算機(jī)輔助系統(tǒng)雖降低了主觀因素的影響,增加了閱片效率,其本質(zhì)為基于傳統(tǒng)圖譜法或計(jì)分法所建立的標(biāo)準(zhǔn)數(shù)據(jù)庫進(jìn)行比較,自動(dòng)得出骨骺指標(biāo)等級(jí)得分,難以消除方法本身帶來的偏差。近年來,國內(nèi)外學(xué)者嘗試運(yùn)用數(shù)學(xué)統(tǒng)計(jì)理論推斷年齡,根據(jù)骨骺形態(tài)學(xué)變化和規(guī)律,制定形態(tài)變化評(píng)分等級(jí),采用多元逐步回歸方法得出回歸方程推算年齡。ZHANG等[21]運(yùn)用髂骨和坐骨結(jié)節(jié)擬合多元回歸、直線回歸、對(duì)數(shù)回歸等數(shù)學(xué)模型,比較得出多元回歸方程具有較高的決定系數(shù)(R2),與傳統(tǒng)方法相比,效率與準(zhǔn)確度均有所提升。
隨著SVM在圖像模式識(shí)別領(lǐng)域的成功應(yīng)用,本課題組嘗試將這種統(tǒng)計(jì)學(xué)習(xí)理論運(yùn)用于骨骺的影像學(xué)圖像中。SVM本身是針對(duì)經(jīng)典的二分類問題提出的,依據(jù)Vapnik-Chervonenkis理論與結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,使離超立體最接近的元素到超平面的間隔最大,建立最好的分類超平面,從而來提高學(xué)習(xí)分類機(jī)器的泛化處理能力。該方法在解決高維小樣本數(shù)據(jù)的分類與回歸問題上展示出了獨(dú)特優(yōu)勢(shì),在圖像處理領(lǐng)域具有良好的應(yīng)用前景。由于骨齡評(píng)估所需DR攝片為黑白灰度圖像,基于圖像的HOG算子能夠很好地描述骨骺發(fā)育變化帶來的邊緣特征,具有幾何和光學(xué)不變性,已廣泛應(yīng)用于計(jì)算機(jī)視覺其他領(lǐng)域,如目標(biāo)識(shí)別、圖像檢索等,而LBP算子對(duì)于此類圖形具有旋轉(zhuǎn)不變性與灰度不變性,能夠有效表達(dá)圖像紋理局部特征[22]。PCA主要利用降維的思想以較少個(gè)數(shù)的主成分反映原始指標(biāo)的主要信息,起源于通信與系統(tǒng)理論的K-L散度。本研究在提取HOG特征與LBP特征時(shí),發(fā)現(xiàn)同時(shí)提取2個(gè)特征可達(dá)到上萬數(shù)量級(jí),通過PCA進(jìn)行特征降維,保留描述對(duì)象最顯著的特征,可避免因特征提取過多造成模型計(jì)算量大而引起的過擬合問題[23]。
本課題組前期研究中應(yīng)用SVM分類算法(SVC)對(duì)尺橈骨遠(yuǎn)端骨骺發(fā)育分級(jí)建立分類模型,將尺橈骨遠(yuǎn)端骨骺發(fā)育分為5個(gè)等級(jí),對(duì)每一等級(jí)28例訓(xùn)練樣本進(jìn)行建模,在每一等級(jí)7例共計(jì)35例獨(dú)立測(cè)試集上驗(yàn)證每一等級(jí)準(zhǔn)確率,預(yù)報(bào)分級(jí)準(zhǔn)確率均達(dá)到了80%以上[24]。本研究應(yīng)用SVR建立骨齡評(píng)估回歸算法模型,結(jié)果表明,本研究提出的基于HOG算子與LBP算子提取骨骺發(fā)育圖像特征,PCA法對(duì)選取的特征降維,SVR建立預(yù)報(bào)模型相結(jié)合的算法對(duì)于小數(shù)據(jù)集骨齡評(píng)估效果較好,在男性獨(dú)立測(cè)試集誤差±0.8歲與±1.0歲分別有80.67%與89.33%的預(yù)報(bào)準(zhǔn)確率,在女性獨(dú)立測(cè)試集誤差±0.8歲與±1.0歲分別有80.19%與90.45%的預(yù)報(bào)準(zhǔn)確率。可見,提取膝關(guān)節(jié)DR圖像HOG與LBP特征經(jīng)PCA降維后采用SVR法在骨齡預(yù)報(bào)性能上有一定的提升。此外,本研究利用SVM將骨齡預(yù)報(bào)引入回歸算法,構(gòu)建的算法模型最終回歸的是預(yù)報(bào)年齡,將該預(yù)報(bào)年齡與真實(shí)年齡相比,改進(jìn)了原骨骺發(fā)育分級(jí)算法,更加符合骨齡評(píng)估的實(shí)際應(yīng)用,有效避免人工評(píng)估骨骺發(fā)育分級(jí)帶來的主觀性誤差,提高了評(píng)估的準(zhǔn)確性。本課題組在新疆維吾爾自治區(qū)人民醫(yī)院采集樣本時(shí)注意到,該醫(yī)院放射科數(shù)據(jù)庫本身即存在膝關(guān)節(jié)攝片年齡分布極不均衡現(xiàn)象,主要表現(xiàn)在12.0~13.0歲、>18.0~<19.0歲年齡組膝關(guān)節(jié)DR攝片數(shù)量有限。年齡段分布不均衡可造成模型對(duì)于樣本數(shù)量多的類別具有一定的傾向性,在樣本數(shù)量較少的部分預(yù)報(bào)性能較弱,忽略了不平衡數(shù)據(jù)對(duì)于模型預(yù)報(bào)性能的影響,需做進(jìn)一步的改進(jìn)研究。
如今,深度學(xué)習(xí)[25]在計(jì)算機(jī)視覺領(lǐng)域方興未艾,因其在圖像識(shí)別領(lǐng)域具有優(yōu)越的特征提取性能,被評(píng)為2017年度十大科技突破之首。胡婷鴻等[26]將深度學(xué)習(xí)方法結(jié)合手腕關(guān)節(jié)影像,運(yùn)用472張樣本建立卷積神經(jīng)網(wǎng)絡(luò)回歸模型,誤差范圍在±1.0歲時(shí)男性樣本與女性樣本的準(zhǔn)確率為81.4%、80.5%。2018年,北美放射學(xué)會(huì)(the Radiological Society of North America,RSNA)舉辦兒童骨齡機(jī)器學(xué)習(xí)競(jìng)賽(Pediatric Bone Age Machine Learning Challenge),旨在探索兒童手腕關(guān)節(jié)X線片預(yù)測(cè)骨齡深度學(xué)習(xí)算法。通過收集12 611張兒童手腕關(guān)節(jié)影像作為訓(xùn)練集,1 425張手腕關(guān)節(jié)X線片作為驗(yàn)證集,利用200張影像作為獨(dú)立測(cè)試集,其競(jìng)賽第一名預(yù)報(bào)年齡與真實(shí)年齡間MAE為5.796個(gè)月[27]。但深度學(xué)習(xí)依賴“大數(shù)據(jù)、大計(jì)算、高性能”,對(duì)于性能良好的深度學(xué)習(xí)模型常常基于上萬的輸入樣本量,且算法實(shí)現(xiàn)復(fù)雜。相較于深度學(xué)習(xí),SVM的算法容易實(shí)現(xiàn),且在小樣本數(shù)據(jù)上具有良好的學(xué)習(xí)能力及泛化能力,在計(jì)算機(jī)視覺領(lǐng)域具有不可或缺的應(yīng)用價(jià)值。因此,SVM骨齡預(yù)報(bào)結(jié)果相較于深度學(xué)習(xí)評(píng)估方法,其對(duì)骨齡評(píng)估的新方向探索仍然具有重要的意義。
綜上所述,本研究基于膝關(guān)節(jié)DR數(shù)字化影像運(yùn)用PCA與SVM方法建立骨齡推斷的回歸算法模型,模型預(yù)報(bào)年齡與真實(shí)年齡相比誤差范圍在±0.8歲、±1.0歲內(nèi)具有較高的準(zhǔn)確率。此方法與傳統(tǒng)人工閱片的方式相比較,減少了因骨骼發(fā)育存在個(gè)體、地區(qū)、民族差異帶來的誤差,未來采用此方法對(duì)一定地區(qū)、民族的樣本建立模型,可為骨齡的司法鑒定實(shí)踐提供參考。