廣西壯族自治區婦幼保健院 放射科,廣西 南寧 530000
骨齡即骨骼年齡,它是人體生物年齡的重要組成,是以骨骼的發育變化測定出體格發育年齡。評價生物年齡還有其他的方法,如身高、年齡、牙齡、第二性征等,但骨齡是最為準確的方法。臨床上評估骨齡以左手及腕關節作為最常見的評測部位,應用的方法主要包括圖譜法、計分法等,如今隨著計算機技術的發展和圖像識別技術的進步,人工智能(Artificial Intelligence,AI)在醫學影像中的應用得到了飛速發展[1],也開始應用于骨齡的評估。傳統骨齡評估方法分別存在精確度低、耗時長、易受評估者水平的影響等問題,且傳統骨齡評估方法存在著X線輻射危害的風險,雖然新型方法中超聲、磁共振檢查不存在輻射危害,但因為部分設備價格昂貴、檢查耗時長,且仍缺少國際統一評估標準,故目前仍以X線平片作為骨齡評估的主要手段。目前我國各地區的骨齡評估方法參差不齊,總體上看骨齡評估呈現出智能化的趨勢,以人工結合計算機輔助軟件骨齡評估、AI全自動化骨齡評估為主要發展方向進行不斷優化。而隨著AI的發展,已經出現快速且精確的骨齡自動化識別技術。本文主要總結各種骨齡評估方法的發展趨勢以及各自的優缺點,以便我們不斷完善相關方法。
傳統的骨齡評估方法目前主要是拍攝左手及腕關節X線平片,觀察相應的腕部諸骨骨化中心、左手掌指骨骨化中心的個數、形態來評估骨齡,且左手X線平片分割骨骼部分具有較高的精度[2],相較于其他部位拍片,兒童手腕部數字化X線攝影操作簡便,配合做好防護,能將X線潛在的輻射危害降到最低,達到放射防護最優化[3]。骨齡的具體評估方法主要有計數法、圖譜法和計分法等。
計數法是最早的骨齡評估方法,通過計算骨化中心數和骨骺融合數,并與相應的標準數量進行比較,最后得到相應骨齡,可以歸納為腕部骨化中心的個數大致等于年齡加一。在1938年Vogt等[4]發表了計數法的相關方法,在1967年Garn等[5]提出了骨化中心出現的順序進行骨齡評估。在國內,1959年由劉惠芳等[6]提出了骨齡計數法的應用,在1980年趙融等[7]提出了左手腕骨齡標準表,經過不斷完善并最終形成中國標準。通過計算骨化中心和骨骺融合的個數來評估骨齡,方法簡單,無需特別訓練即可掌握使用,但腕部骨化中心完全成熟的年齡較早,通常10歲后腕部骨化中心均完全出現,其適用年齡范圍窄,僅能用于學齡前兒童,而且誤差大,不精確,現在已基本棄用。
圖譜法是指將被檢者的手腕部X線片與標準骨齡圖譜對照,以最相像的標準圖譜的骨齡作為被檢者的骨齡。早在上個世紀五十年代,即有學者通過回顧分析骨齡圖譜資料,并出版了《手腕骨發育X線圖譜》,即G-P圖譜[8],之后又不斷進行了修訂,因實用性強,目前仍在沿用。此后,國內學者劉寶林等[9]提出了嬰幼兒及學齡兒童的骨齡研究,并制成相應年齡段的骨齡圖譜。而徐濟達等[10]依據南京兒童、青少年的骨齡制訂了手腕部骨齡圖譜。隨之,張紹巖等[11]在2015年依據手腕部骨成熟度分值制訂了手腕骨發育X線圖譜,并出版了相關骨齡標準圖譜的書籍。用圖譜法評估骨齡,直觀簡便,評估結果相對準確,覆蓋年齡段廣,同時可以了解各骨發育的不平衡性,但主觀性較強,往往在實際工作中,不會有待檢片與標準圖譜片的所有骨頭完全一致,所以評測時過于依賴評測者經驗,無法精確統一。
計分法是指將左手腕部諸骨骨化中心根據發育形態進行分期,并針對每個分期賦予相應分值,將諸骨骨化中心對應分值相加得出分值總和,該分值總和對照骨成熟度得分的中位數曲線,最終得出其骨齡。根據英國和西歐兒童生長發育的縱向研究,Tanner等[12]提出了一套較完整的TW1骨齡評分法,數年后修訂為TW2法,在國際上得到了廣泛應用,而TW3法以R骨發育分代替了R骨齡作為預測因素,可以通用于全人類,不受到年代、人群、社會經濟水平等因素的影響。在TW2法的基礎上,利用縱向生長研究材料,Tanner等[13]提出了適用于正常兒童預測成年身高的一系列回歸公式,稱為TW Mark Ⅰ法,可以根據兒童身高、骨齡等預測成年身高。而后在TW Mark Ⅰ法的基礎上增加更多的預測因素以及刪除了父母身高的因素,使其更適合于正常、過高、過矮及發育遲緩的兒童,稱為TW Mark Ⅱ法。
國內學者李果珍等[14]提出并制訂了“中國人骨齡百分計數法”,其與TW2法在原理上相似,樣本來源于北京地區兒童,選取手腕部骨10個,根據諸骨發育的X線征象進行分期,諸骨從開始發育到成熟期平均年數的總和為100分,通過計算諸骨骨齡發育指數的總分得出相應骨齡,但該方法參評骨數量較少,樣本距今時間較久。之后,葉義言等[15]在TW系列的基礎上,提出了中國兒童骨齡評分法,即“葉氏骨齡評分法”,也被稱為TW-C法,其對骨齡的理論基礎、評分方法及實際應用等方面作了較為全面的總結。在同一時期,張紹巖等[16]在TW2法的基礎上對中國6個城市的兒童樣本進行研究,制訂了中國人骨發育評價標準——CHN法,使手腕部骨發育研究由定性轉向定量,成為適合我國骨齡評價的標準并得到國家體委認可。中國人手腕骨發育標準修訂研究組在2005年重新給中國5個城市的兒童采樣,再次總結了骨齡在臨床醫學、法醫學及運動醫學等領域的應用,讓RUS-CHN法在TW3-RUS的基礎上增添了新的成熟度分級,主要涉及尺橈骨融合分級,使得評分標準更加細致[17]。
計分法的優點在于將骨發育過程量化和標準化,量化后的骨發育評分系統成為一種生物尺,而骨發育分變成一種測量單位,類似毫米、千克等計量單位,不依附年齡,不受人群、時代等因素影響,經過標準化得到的骨發育分百分位和骨發育分轉化成為標準的骨齡,該標準骨齡根據不同的人群、時代有所變化,在評測骨齡時,精確度高,能達到0.1歲,但計分法指標多、參數多,而且不同人群的標準骨齡有所偏差,評測時相對繁瑣且耗時,人工測算需經過嚴格訓練才能保證準確性。
將計分法和圖譜法相互結合的評測方法,制定適用于我國兒童少年的骨齡評測標準,在2009年提出了新的結合法,被命名為RC圖譜法[18],其制訂的過程首先是簡化RUS-CHN計分法相應掌指骨的發育等級,再參照TW3法與“分類特征計分算法”得出簡化后的骨發育等級的分值、成熟度分值的百分位數曲線,之后根據骨發育等級的定義來選擇相應掌指骨的標準圖譜。該方法雖然擁有了圖譜法的簡便直觀,以及計分法的精確,但它評測骨齡的范圍相對偏窄,多用于13~18歲青春期后期骨齡的評測。
隨著超聲檢查技術的不斷發展,超聲檢查在骨關節領域中的應用也不斷深入,近年來在骨齡評估上也有一定的突破。超聲評測骨齡的方法目前存在多種,包括通過測量股骨頭軟骨(Femoral Head Cartilage,FHC)厚度、采用左手腕部G-P圖譜超聲版、測定左手腕部聲速變化等完成骨齡評測。通過超聲測量FHC厚度與傳統骨齡評測方法進行對比,可以判斷骨齡與實際年齡的差異,但該方法敏感度較低。2003年有學者提出采用G-P圖譜超聲版進行0~6歲兒童的骨齡評測,并對比了傳統左手X線骨齡評估方法,兩者誤差小于0.5歲[19]。之后兩年又有人應用以色列陽光公司研制的BonAge超聲骨齡檢測儀評測兒童骨齡,該儀器基于定量超聲的原理,通過測量超聲在橈、尺骨遠端骨骺的傳播速度等數據來評估骨齡,適用于5~18歲兒童的骨齡評測,可作為診斷及監測發育異常的輔助工具[20]。近年,Rachmiel等[21]通過SonicBone定量超聲裝置與傳統X線方法比較,結果顯示兩者骨齡評估沒有明顯的偏差。同時,Utczas等[22]建議將超聲骨齡評估用于流行病學調查中,因為其篩查異常骨發育有合適的敏感性。在國內,BonAge超聲骨齡檢測儀和X線片骨齡評測的對比分析結果顯示BonAge超聲進行骨齡評測可以降低人為誤差、加快評測速度、提高骨齡評測的穩定性及可靠性,但兩種方法之間仍無法完全替代[23-24]。超聲評估骨齡優點在于其無輻射、無創傷,對比傳統方法有一定的穩定性和可靠性,不足在于其目前仍處于探索階段,國際上缺乏統一的標準,檢查過程依賴超聲醫師的操作手法及特殊的儀器,需不斷深入研究,才能完全推廣。
雙能X射線吸收(Dual-energy X-ray Absorptiometry,DXA)的裝置稱為雙能X線骨密度儀,采用能量減影的方法清除軟組織對骨密度測量的影響,從而得到用于骨齡評估的圖像。原理是高低不等的兩種X線在穿透人體時,在軟組織上差異相對骨組織小,利用專業的檢測探頭采集信號并后處理,即可得到骨密度圖像。研究表明基于DXA的骨齡評估法與傳統骨齡評估法所得結果基本相符,而且DXA與傳統X線骨齡評估的結果相似[25-26]。2016年Hoyer-kuhn等[27]比較了DXA掃描與常規X線在兒童脊柱形態測定、骨齡測定中的應用,也得出兩種方法之間有較高的一致性。DXA掃描的優點主要是該方法比傳統的X線檢查射線劑量低,但不足在于DXA掃描耗時較長,檢查設備成本高。
相對于傳統X線圖像,磁共振成像(Magnetic Resonance Imaging,MRI)可以很好的顯示骨骺軟骨和骺板軟骨的信號,可以觀察到二次骨化中心隨著年齡增長的細節變化,而且MRI無電離輻射,顯示骨骺軟骨、軟組織分辨率高,這是MRI評測骨齡的先天優勢。Terada等[28]提出了專為兒童手腕部優化的MRI技術,利用磁共振圖像及其三維分割技術顯示了手腕部諸骨的詳細骨骼特征,在Tanner Whitehouse Japan系統的基礎上對不同年齡段的兒童的骨齡進行了評估,結果顯示MRI評估骨齡有效且可靠。已有研究證明觀察手腕部諸骨的軟骨形態變化、骨化進展及完全骨化的不同階段評測骨齡可行[29]。而且,MRI檢查膝關節骨骺骨干融合的5階段分類法可應用于法醫年齡評估[30]。在國內,郎巖[31]應用MRI檢查觀察腕骨的形態、骨骺的覆蓋情況及關節軟骨的變化范圍等信息,證實了MRI骨齡橫向評估有較高可行性和準確性。MRI評估骨齡的優勢在于無電離輻射,比傳統方法更好地顯示骨骺軟骨的成熟情況,但MRI的不足在于設備價格昂貴、檢查費用高、檢查時間長,且檢查存在禁忌癥。
采用計算機輔助診斷技術自動化識別手腕部各骨發育期對應的X線圖像,信息化處理后得出相應的骨齡。其首先要建立手腕部骨各個發育期圖像的數字化標準,再應用圖像識別技術對X線圖像進行數據分析,接著將得到的數據與標準數據庫進行匹配,最終實現自動化的骨齡評估法。1970年開始出現計算機代替人工讀片和分析,及至1990年,計算機圖像識別技術、數字化信息技術以及網絡技術的不斷發展,人工智能評估法取得了突破。1994年已可利用原有的研究資料選出標準的X線圖譜,與計算機專業人士一起配合,制作出計算機輔助骨齡評分[32]。進入21世紀,開始出現通過骨骼形狀和紋理信息實現自動骨齡評估的方法,例如運用圖像處理技術設計出全自動評估骨齡系統、提出BoneXpert自動測定骨齡法、制定了有識別力的字典學習算法、提出自動評測骨齡的深度學習方法[33-36]。及至2019年,Bui等[37]將TW3法和基于感興趣區域提取的深度卷積網絡相結合,進行區域檢測和分類,提高了骨齡評估的準確性。
在國內,先是基于TW2法的原理上設計骨齡X片自動識別系統,研制出計算機半輔助評定骨齡方法,接著將CHN法計算機化,提高了骨齡評估的速度及準確性,然后通過提取手部X線圖像的骨骺特征作為骨齡特征參數,運用支持向量機方法進行骨齡識別,其具有可視化、全自動化評估的特點[38-40]。近年來,基于脈沖耦合神經網絡的自動X線圖像分割方法解決了手腕圖像分割問題并用于骨齡自動評價系統研究中,還有學者依據中華05骨齡標準設計了橈骨骨齡等級計算機評定系統[41-42]。
人工智能評估法可以不受人為閱片主觀性的影響,精確且快速地評測骨齡,可精確至0.1歲,通常評測過程僅需數秒便可完成,通過深度學習,可以提高骨齡評估準確率,有多位學者報道,其與人工評測誤差均在0.5歲左右[43-44]。AI評估法有一定的數據依賴性,數據量越大,人工智能骨齡評估越接近醫師骨齡讀數,不同的人工智能模型會存在不同差異[45]。人工智能評估法的不足在于其研發應用成本偏高,依賴于軟件技術,評測時易受到X線攝片質量的影響[46],深度學習的圖譜庫亦會受到地域人群差異的影響,待檢骨的形態超出標準定義的界限時評測會產生偏差,如病態手骨齡的評測,需要專業醫師的復核才能保證骨齡評測報告的可靠性。
回顧骨齡評估方法的發展歷程,從計數法、圖譜法、計分法,發展到人工智能評估法以及新型評估方法的出現,實際上是將量化從粗糙評估進階為精細評估的過程,評估的精確度及速度均不斷提升,不過骨發育本身是一個連續不斷的過程,因為計分法的出現被人為地劃分為斷續的節點,故無論如何均會出現略微的偏差,人工智能評估法的出現雖然可以較好的改善這一偏差[47],但研發費用及軟件成本高,圖像質量要求嚴格,并不利于基層醫院的全面推廣,且目前仍處在發展的早期階段[48],仍需要人工智能深度學習以及全國各地大樣本的標準數據庫。新型骨齡評估方法中超聲和磁共振檢查沒有X線的輻射風險,但部分設備成本高,操作難度大,檢查過程長,造成兒童配合度差,而且要依賴于評測醫師的技術水平,研究及推廣進程緩慢。X線平片骨齡評估方法具有操作簡便、檢查時間短、檢查費用低的特點,目前依舊被作為最準確且公認的評估方法。另外,計數法因適用范圍窄、誤差大,提議將其棄用;圖譜法直觀簡便,但精確度不高,建議僅用于快速篩查時使用;計分法、計分與圖譜結合法均能精確地進行骨齡評估,雖然存在測算耗時偏長,但是在計算機輔助軟件的幫助下,可以相應地加快測算速度。目前主要問題是我國尚無全國統一的計分法,大部分方法均是參考于TW系列計分法,由于骨骼發育存在地域、種族等眾多因素的影響,所以未來只有建立多種族、多地域、大范圍的標準樣本數據庫,才可能真正完善屬于我國的統一標準。骨齡評估的準確性直接影響到兒童生長發育研究、內分泌遺傳代謝性疾病、兒童保健與臨床治療等,在選用方法時,應該合理地選擇,規避缺點、發揮所長,在我國有相對統一的計分法標準的情況下,可以進一步優化人工結合計算機輔助軟件骨齡評估、人工智能全自動化骨齡評估這些依靠計算機科學的評估方法,盡可能地提高評估速度與精確度,為兒童健康成長提供最有利的幫助。