Subscribe to RSS
DOI: 10.1055/a-2203-2997
Applicability and robustness of an artificial intelligence-based assessment for Greulich and Pyle bone age in a German cohort
Anwendbarkeit und Robustheit einer auf künstlicher Intelligenz basierenden Analyse des Knochenalters nach Greulich und Pyle in einer deutschen KohorteAbstract
Purpose The determination of bone age (BA) based on the hand and wrist, using the 70-year-old Greulich and Pyle (G&P) atlas, remains a widely employed practice in various institutions today. However, a more recent approach utilizing artificial intelligence (AI) enables automated BA estimation based on the G&P atlas. Nevertheless, AI-based methods encounter limitations when dealing with images that deviate from the standard hand and wrist projections. Generally, the extent to which BA, as determined by the G&P atlas, corresponds to the chronological age (CA) of a contemporary German population remains a subject of continued discourse. This study aims to address two main objectives. Firstly, it seeks to investigate whether the G&P atlas, as applied by the AI software, is still relevant for healthy children in Germany today. Secondly, the study aims to assess the performance of the AI software in handling non-strict posterior-anterior (p. a.) projections of the hand and wrist.
Materials and Methods The AI software retrospectively estimated the BA in children who had undergone radiographs of a single hand using posterior-anterior and oblique planes. The primary purpose was to rule out any osseous injuries. The prediction error of BA in relation to CA was calculated for each plane and between the two planes.
Results A total of 1253 patients (aged 3 to 16 years, median age 10.8 years, 55.7 % male) were included in the study. The average error of BA in posterior-anterior projections compared to CA was 3.0 (± 13.7) months for boys and 1.7 (± 13.7) months for girls. Interestingly, the deviation from CA tended to be even slightly lower in oblique projections than in posterior-anterior projections. The mean error in the posterior-anterior projection plane was 2.5 (± 13.7) months, while in the oblique plane it was 1.8 (± 13.9) months (p = 0.01).
Conclusion The AI software for BA generally corresponds to the age of the contemporary German population under study, although there is a noticeable prediction error, particularly in younger children. Notably, the software demonstrates robust performance in oblique projections.
Key Points
-
Bone age, as determined by artificial intelligence, aligns with the chronological age of the contemporary German cohort under study.
-
As determined by artificial intelligence, bone age is remarkably robust, even when utilizing oblique X-ray projections.
Citation Format
-
Pape J, Hirsch F, Deffaa O et al. Applicability and robustness of an artificial intelligence-based assessment for Greulich and Pyle bone age in a German cohort. Fortschr Röntgenstr 2024; 196: 600 – 606
Zusammenfassung
Ziel Die Bestimmung des Knochenalters (BA) anhand der Hand und des Handgelenks unter Verwendung des 70 Jahre alten Atlas von Greulich und Pyle (G&P) ist auch heute noch eine weit verbreitete Praxis in verschiedenen Einrichtungen. Ein neuerer Ansatz, basierend auf dem Einsatz künstlicher Intelligenz (KI), ermöglicht eine automatische BA-Schätzung auf der Grundlage des G&P-Atlas. Allerdings stoßen KI-basierte Methoden an ihre Grenzen, wenn es um Bilder geht, die von den Standardprojektionen der Hand und des Handgelenks abweichen. Nach wie vor ist umstritten, inwieweit das mit dem G&P-Atlas ermittelte BA dem chronologischen Alter (CA) der heutigen deutschen Bevölkerung entspricht. Mit dieser Studie werden zwei Hauptziele verfolgt. Erstens soll untersucht werden, ob der G&P-Atlas, wie er von der KI-Software angewendet wird, für gesunde Kinder in Deutschland heute noch relevant ist. Zweitens zielt die Studie darauf ab, die Leistung der KI-Software bei der Handhabung nicht-strikter posterior-anteriorer (p. a.) Projektionen der Hand und des Handgelenks zu bewerten.
Materialien und Methoden Die AI-Software schätzte retrospektiv die BA bei Kindern, die sich Röntgenaufnahmen einer einzelnen Hand unter Verwendung von posterior-anterioren und schrägen Ebenen unterzogen hatten. Der Hauptzweck bestand darin, knöcherne Verletzungen auszuschließen. Der Vorhersagefehler des BA im Verhältnis zum CA wurde für jede Ebene und zwischen den beiden Ebenen berechnet.
Ergebnisse Insgesamt wurden 1253 Patienten (im Alter von 3 bis 16 Jahren, medianes Alter 10,8 Jahre, 55,7 % männlich) in die Studie aufgenommen. Die durchschnittliche Abweichung des BA in posterior-anterioren Projektionen im Vergleich zum CA betrug bei Jungen 3,0 (± 13,7) Monate und 1,7 (± 13,7) Monate bei Mädchen. Interessanterweise war die Abweichung des BA vom CA in den schrägen Projektionen tendenziell etwas geringer als in den posterior-anterioren Projektionen. Der mittlere Fehler in der posterior-anterioren Projektionsebene betrug 2,5 (± 13,7) Monate, während er in der schrägen Ebene bei 1,8 (± 13,9) Monaten lag (p = 0,01).
Schlussfolgerung Das mittels KI-Software ermittelte BA entspricht im Allgemeinen dem Alter der deutschen Untersuchungspopulation, obwohl es einen merklichen Vorhersagefehler gibt, insbesondere bei jüngeren Kindern. Insbesondere bei schrägen Projektionen zeigt die Software eine robuste Leistung.
Kernaussagen
-
Das von der künstlichen Intelligenz ermittelte Knochenalter stimmt mit dem chronologischen Alter der untersuchten deutschen Alterskohorte überein.
-
Das durch künstliche Intelligenz ermittelte Knochenalter ist bemerkenswert stabil, auch bei der Verwendung schräger Röntgenprojektionen.
Publication History
Received: 09 June 2023
Accepted: 04 October 2023
Article published online:
08 December 2023
© 2023. Thieme. All rights reserved.
Georg Thieme Verlag KG
Rüdigerstraße 14, 70469 Stuttgart, Germany
-
References
- 1 Satoh M. Bone age: assessment methods and clinical applications. Clin Pediatr Endocrinol 2015; 24: 143-152 DOI: 10.1297/cpe.24.143.
- 2 Alshamrani K, Messina F, Offiah AC. Is the Greulich and Pyle atlas applicable to all ethnicities? A systematic review and meta-analysis. Eur Radiol 2019; 29: 2910-2923 DOI: 10.1007/s00330-018-5792-5.
- 3 Manzoor Mughal A, Hassan N, Ahmed A. Bone Age Assessment Methods: A Critical Review. Pak J Med Sci 2014; 30: 211-215 DOI: 10.12669/pjms.301.4295.
- 4 Greulich and Pyle. Radiographic Atlas of Skelettal Development of the Hand and Wrist. Am J Med Sci 1959; 238 (03) 393 DOI: 10.1097/00000441-195909000-00030.
- 5 Breen MA, Tsai A, Stamm A. et al. Bone age assessment practices in infants and older children among Society for Pediatric Radiology members. Pediatr Radiol 2016; 46: 1269-1274 DOI: 10.1007/s00247-016-3618-7.
- 6 Bull RK, Edwards PD, Kemp PM. et al. Bone age assessment: a large scale comparison of the Greulich and Pyle, and Tanner and Whitehouse (TW2) methods. Arch Dis Child 1999; 81: 172-173 DOI: 10.1136/adc.81.2.172.
- 7 King DG, Steventon DM, O’Sullivan MP. et al. Reproducibility of bone ages when performed by radiology registrars: an audit of Tanner and Whitehouse II versus Greulich and Pyle methods. Br J Radiol 1994; 67: 848-851 DOI: 10.1259/0007-1285-67-801-848.
- 8 Boeyer ME, Sherwood RJ, Deroche CB. et al. Early Maturity as the New Normal: A Century-long Study of Bone Age. Clin Orthop Relat Res 2018; 476: 2112-2122 DOI: 10.1097/CORR.0000000000000446.
- 9 Dahlberg PS, Mosdøl A, Ding Y. et al. A systematic review of the agreement between chronological age and skeletal age based on the Greulich and Pyle atlas. Eur Radiol 2019; 29: 2936-2948 DOI: 10.1007/s00330-018-5718-2.
- 10 Hwang J, Yoon HM, Hwang J-Y. et al. Re-Assessment of Applicability of Greulich and Pyle-Based Bone Age to Korean Children Using Manual and Deep Learning-Based Automated Method. Yonsei Med J 2022; 63: 683-691 DOI: 10.3349/ymj.2022.63.7.683.
- 11 Kim JR, Lee YS, Yu J. Assessment of bone age in prepubertal healthy Korean children: comparison among the Korean standard bone age chart, Greulich-Pyle method, and Tanner-Whitehouse method. Korean J Radiol 2015; 16: 201-205 DOI: 10.3348/kjr.2015.16.1.201.
- 12 Ontell FK, Ivanovic M, Ablin DS. et al. Bone age in children of diverse ethnicity. Am J Roentgenol 1996; 167: 1395-1398 DOI: 10.2214/ajr.167.6.8956565.
- 13 Thodberg HH, Kreiborg S, Juul A. et al. The BoneXpert method for automated determination of skeletal maturity. IEEE Trans Med Imaging 2009; 28: 52-66 DOI: 10.1109/TMI.2008.926067.
- 14 Booz C, Yel I, Wichmann JL. et al. Artificial intelligence in bone age assessment: accuracy and efficiency of a novel fully automated algorithm compared to the Greulich-Pyle method. Eur Radiol Exp 2020; 4: 6 DOI: 10.1186/s41747-019-0139-9.
- 15 Thodberg HH, Thodberg B, Ahlkvist J. et al. Autonomous artificial intelligence in pediatric radiology: the use and perception of BoneXpert for bone age assessment. Pediatr Radiol 2022; 52: 1338-1346 DOI: 10.1007/s00247-022-05295-w.
- 16 Martin DD, Calder AD, Ranke MB. et al. Accuracy and self-validation of automated bone age determination. Sci Rep 2022; 12 DOI: 10.1038/s41598-022-10292-y.
- 17 Thodberg HH. Clinical review: An automated method for determination of bone age. J Clin Endocrinol Metab 2009; 94: 2239-2244 DOI: 10.1210/jc.2008-2474.
- 18 DiFranco M, Chung TS, Mintz A. et al. Automated Bone Age Assessment Across Multi-site U.S. Study: Agreement between AI and Expert Readers. Semin Musculoskelet Radiol 2022; 26: A117 DOI: 10.1055/s-0042-1750637.
- 19 Offiah AC. Current and emerging artificial intelligence applications for pediatric musculoskeletal radiology. Pediatr Radiol 2022; 52: 2149-2158 DOI: 10.1007/s00247-021-05130-8.
- 20 Calfee RP, Sutter M, Steffen JA. et al. Skeletal and chronological ages in American adolescents: current findings in skeletal maturation. J Child Orthop 2010; 4: 467-470 DOI: 10.1007/s11832-010-0289-z.
- 21 Hackman L, Black S. The reliability of the Greulich and Pyle atlas when applied to a modern Scottish population. J Forensic Sci 2013; 58: 114-119 DOI: 10.1111/j.1556-4029.2012.02294.x.
- 22 Himes JH. An early hand-wrist atlas and its implications for secular change in bone age. Ann Hum Biol 1984; 11: 71-75 DOI: 10.1080/03014468400006911.
- 23 Schmidt S, Koch B, Schulz R. et al. Comparative analysis of the applicability of the skeletal age determination methods of Greulich-Pyle and Thiemann-Nitz for forensic age estimation in living subjects. Int J Legal Med 2007; 121: 293-296 DOI: 10.1007/s00414-007-0165-7.
- 24 Gong P, Yin Z, Wang Y. et al. Towards Robust Bone Age Assessment: Rethinking Label Noise and Ambiguity. In: Martel AL, Abolmaesumi P, Stoyanov D. et al. Hrsg. Medical Image Computing and Computer Assisted Intervention – MICCAI 2020. Cham: Springer International Publishing; 2020: 621-630 DOI: 10.1007/978-3-030-59725-2_60
- 25 Mansourvar M, Ismail MA, Raj RG. et al. The applicability of Greulich and Pyle atlas to assess skeletal age for four ethnic groups. J Forensic Leg Med 2014; 22: 26-29 DOI: 10.1016/j.jflm.2013.11.011.
- 26 Zhang A, Sayre JW, Vachon L. et al. Racial Differences in Growth Patterns of Children Assessed on the Basis of Bone Age1. Radiology 2009; 250: 228-235 DOI: 10.1148/radiol.2493080468.
- 27 Schmeling A, Schulz R, Danner B. et al. The impact of economic progress and modernization in medicine on the ossification of hand and wrist. Int J Legal Med 2006; 120: 121-126 DOI: 10.1007/s00414-005-0007-4.
- 28 Yi PH, Arun A, Hafezi-Nejad N. et al. Can AI distinguish a bone radiograph from photos of flowers or cars? Evaluation of bone age deep learning model on inappropriate data inputs. Skeletal radiology 2021; 1-6 DOI: 10.1007/s00256-021-03880-y.
- 29 Reyes M, Meier R, Pereira S. et al. On the Interpretability of Artificial Intelligence in Radiology: Challenges and Opportunities. Radiol Artif Intell 2020; 2: e190043 DOI: 10.1148/ryai.2020190043.