Osteologie 2025; 34(04): 250-255
DOI: 10.1055/a-2697-4943
Originalarbeit

Leitliniengerechte Osteoporoseversorgung durch LLMs? Ein Scoping Review zum Potenzial generativer KI

Can LLMs Bridge the Guideline Gap? A Scoping Review on Generative AI in Osteoporosis Management

Autoren

  • Sebastian Kuhn

    Insitut für Digitale Medizin, Philipps-Universität Marburg, Marburg, Germany
  • Johannes Knitza

    Insitut für Digitale Medizin, Philipps-Universität Marburg, Marburg, Germany

Zusammenfassung

Hintergrund

Die leitliniengerechte Versorgung von Osteoporosepatient:innen wird im klinischen Alltag durch Komplexität und begrenzte Ressourcen häufig erschwert. Large Language Models (LLMs) wie ChatGPT könnten als digitale Entscheidungshilfe dienen.

Ziel

Dieser Scoping Review untersucht den aktuellen Forschungsstand zum Einsatz von LLMs bei der leitlinienbasierten Diagnostik, Therapieentscheidung und Kommunikation in der Osteoporoseversorgung.

Methodik

Die systematische Medline Literaturrecherche erfolgte im Juni 2025 und folgte dem PRISMA-ScR-Framework. Eingeschlossen wurden Originalstudien mit empirischen Daten zum Einsatz von LLMs in der Osteoporoseversorgung. Zwei Reviewer führten Selektion, Datenextraktion und Qualitätsprüfung durch.

Ergebnisse

Insgesamt wurden acht zwischen 2023 und 2025 publizierte Studien eingeschlossen. Untersucht wurden ChatGPT (verschiedene Versionen von 3.5 und 4), Gemini/Bard und BingAI. Anwendungsszenarien umfassten Patient:innenaufklärung, Wissenstests sowie klinische Fallbeurteilungen. ChatGPT-4 zeigte durchgehend die höchste Leitlinienkonformität, teils vergleichbar mit ärztlicher Expertise. Schwächen lagen unter anderem in veralteten Informationen, mangelnder Erklärbarkeit und Datenschutzbedenken.

Schlussfolgerung

LLMs sind ein vielversprechendes Instrument zur Unterstützung der Osteoporosebehandlung. Es fehlen jedoch noch robuste, qualitativ hochwertige klinische Studien zur Bewertung ihrer Wirksamkeit in der Praxis, die dringend benötigt werden. Zum jetzigen Zeitpunkt sollten LLMs als wertvolle Ergänzung zur klinischen Praxis betrachtet werden, aber ihre Ergebnisse müssen kritisch bewertet werden, bevor sie zur Entscheidungsfindung herangezogen werden.

Abstract

Background

Guideline-adherent osteoporosis care is often hindered by complexity and limited resources. Large Language Models (LLMs), such as ChatGPT, may serve as digital decision-support tools. Objective: This scoping review explores current evidence on the use of LLMs for diagnosis, treatment decision-making, and communication in osteoporosis care.

Methods

A systematic Medline search was conducted in June 2025. Eligible studies reported empirical data on LLMs applied to osteoporosis. Two reviewers independently screened, extracted, and assessed studies. The review followed the PRISMA-ScR framework.

Results

Eight studies, published between 2023 and 2025 were included. All studies assessed ChatGPT (various versions of 3.5 and 4); and some also evaluated Gemini/Bard or BingAI. Use cases involved patient education, guideline-based knowledge testing, and clinical decision-making. ChatGPT-4 consistently showed the highest guideline adherence (accuracy up to 91%), in some cases comparable to physician expertise. Limitations included outdated content, lack of explainability, and data privacy concerns.

Conclusion

LLMs show promise as supportive tools in osteoporosis care. However, robust, high-quality clinical trials assessing their effectiveness in real-world settings are still lacking and urgently needed. At this stage, LLMs should be considered valuable adjuncts to clinical practice, but their output must be critically assessed before use in decision-making.



Publikationsverlauf

Eingereicht: 25. Juli 2025

Angenommen: 30. August 2025

Artikel online veröffentlicht:
14. November 2025

© 2025. Thieme. All rights reserved.

Georg Thieme Verlag KG
Oswald-Hesse-Straße 50, 70469 Stuttgart, Germany