RSS-Feed abonnieren
DOI: 10.1055/a-2721-9672
Künstliche Intelligenz in der Plastischen Chirurgie: Postoperative Dokumentation durch Large Language Models
Large Language Models Artificial Intelligence in Plastic Surgery: Postoperative Documentation Using Large Language ModelsAutoren
Zusammenfassung
Hintergrund
Sprachbasierte KI-Modelle bieten neue Möglichkeiten zur Optimierung klinischer Prozesse. Die postoperative Dokumentation in der Chirurgie – insbesondere die Kodierung und Festlegung des postoperativen Prozederes – stellen dabei ein potenzielles Anwendungsfeld dar. Ziel dieser Studie war die Evaluation der Leistungsfähigkeit eines KI-Modells bei der automatisierten Erstellung dieser Dokumentation.
Material und Methoden
Vier standardisierte Operationsberichte häufig durchgeführter handchirurgisch bzw. plastisch-chirurgischer Eingriffe wurden ChatGPT o3 zur Kodierung der Prozeduren sowie zur Formulierung eines postoperativen Prozederes vorgelegt. Die Kodierung wurde anhand der Korrektheit und Vollständigkeit beurteilt. Das postoperative Prozedere wurde von drei Fachärzten für Plastische und Ästhetische Chirurgie anhand der Kriterien Korrektheit, Vollständigkeit und Gesamtbewertung auf einer Likert-Skala von 1 (sehr schlecht) bis 10 (sehr gut) bewertet. Zusätzlich wurde der Zeitaufwand in Sekunden erfasst.
Ergebnisse
Das KI-Modell erreichte eine durchschnittliche Kodierkorrektheit von 92,86±14,29% und eine Vollständigkeit von 90,28±11,45%. Die Bewertung des postoperativen Prozederes ergab eine durchschnittliche Vollständigkeit von 7,33±2,10, Korrektheit von 8,66±0,98 und eine Gesamtbewertung von 7,83±1,53. Die mittlere Bearbeitungsdauer betrug 143,75±46,61 Sekunden für die Kodierung und 24,25±11,35 Sekunden für die Erstellung des postoperativen Prozederes.
Schlussfolgerung
KI-Modelle zeigen vielversprechende Ergebnisse in der automatisierten postoperativen Dokumentation handchirurgischer und plastisch-chirurgischer Eingriffe. Insbesondere bei standardisierten Eingriffen kann das Modell durch hohe Genauigkeit, klinisch relevante Empfehlungen und schnelle Bearbeitung überzeugen. Eine fachliche Kontrolle ist jedoch weiterhin immer erforderlich.
Abstract
Background
Language-based artificial intelligence (AI) models offer novel opportunities for optimising clinical workflows. One promising application lies in the automation of postoperative documentation in hand and plastic surgery – specifically, procedural coding and the formulation of postoperative care plans. This study aimed to evaluate the performance of AI models in generating postoperative documentation for hand surgery and plastic surgery procedures.
Methods
Four standardised operative reports representing common plastic surgical interventions were submitted to ChatGPT o3. The model was prompted to generate procedural codes and to propose appropriate postoperative care recommendations. Coding output was evaluated for accuracy and completeness, while postoperative plans were assessed by three board-certified plastic surgeons using predefined criteria – correctness, completeness, and overall quality – on a 10-point Likert scale (1=very poor, 10=excellent). The time to task completion was recorded in seconds.
Results
The AI model achieved a mean coding accuracy of 92.86±14.29% and a completeness score of 90.28±11.45%. Postoperative care recommendations received mean ratings of 7.33±2.10 for completeness, 8.66±0.98 for correctness, and 7.83±1.53 for overall quality. The mean time required for procedural coding was 143.75±46.61 seconds, while postoperative planning required 24.25±11.35.
Conclusion
AI models demonstrate promising results in automating postoperative documentation within the field of hand and plastic surgery. Their high coding accuracy, clinically relevant recommendations, and rapid processing make them particularly effective for standardised procedures. Nevertheless, expert review remains essential.
Publikationsverlauf
Eingereicht: 01. Juli 2025
Angenommen: 27. September 2025
Artikel online veröffentlicht:
19. November 2025
© 2025. Thieme. All rights reserved.
Georg Thieme Verlag KG
Oswald-Hesse-Straße 50, 70469 Stuttgart, Germany
-
Literatur
- 1 Rakauskas TR, Da Costa A, Moriconi C. et al. Evaluation of Chat Generative Pre-trained Transformer and Microsoft Copilot Performance on the American Society of Surgery of the Hand Self-Assessment Examinations. J Hand Surg Glob Online 2025; 7: 23-28
- 2 Vallurupalli M, Shah ND, Vyas RM. Optimizing Readability of Patient-Facing Hand Surgery Education Materials Using Chat Generative Pretrained Transformer (ChatGPT) 3.5. J Hand Surg Am 2024; 49: 986-991
- 3 Abdelhady AM, Davis CR. Plastic Surgery and Artificial Intelligence: How ChatGPT Improved Operation Note Accuracy, Time, and Education. Mayo Clin Proc Digit Health 2023; 1: 299-308
- 4 Ammo T, Guillaume VGJ, Hofmann UK. et al. Evaluating ChatGPT-4o as a decision support tool in multidisciplinary sarcoma tumor boards: heterogeneous performance across various specialties. Front Oncol 2024; 14: 1526288
- 5 Bundesinstitut für Arzneimittel und Medizinprodukte (BfArM). ICD-10-GM Version 2025. Im Internet: www.klassifikationen.bfarm.de/icd-10-gm/kode-suche/htmlgm2025/index.htm Stand: 13.09.2024.
- 6 Bundesinstitut für Arzneimittel und Medizinprodukte (BfArM). OPS Version 2025. Im Internet: www.klassifikationen.bfarm.de/ops/kode-suche/htmlops2025/index.htm Stand: 18.10.2024.
- 7 Giray L. Prompt Engineering with ChatGPT: A Guide for Academic Writers. Ann Biomed Eng 2023; 51: 2629-2633
- 8 Langmajer M. OpenAI’s President Explains Secret to Writing Perfect AI Prompts (27.02.2025). Im Internet www.felloai.com/2025/02/openais-president-greg-brockman-reveals-how-to-write-the-perfect-prompt Stand: 25.04.2025.
- 9 Berry CE, Fazilat AZ, Lavin C. et al. Both Patients and Plastic Surgeons Prefer Artificial Intelligence-Generated Microsurgical Information. J Reconstr Microsurg 2024; 40: 657-664
- 10 Li W, Chen J, Chen F. et al. Exploring the Potential of ChatGPT-4 in Responding to Common Questions About Abdominoplasty: An AI-Based Case Study of a Plastic Surgery Consultation. Aesthetic Plast Surg 2024; 48: 1571-1583
- 11 Leypold T, Lingens LF, Beier JP. et al. Integrating AI in Lipedema Management: Assessing the Efficacy of GPT-4 as a Consultation Assistant. Life (Basel) 2024; 14
- 12 Gomez-Cabello CA, Borna S, Pressman SM. et al. Large Language Models for Intraoperative Decision Support in Plastic Surgery: A Comparison between ChatGPT-4 and Gemini. Medicina (Kaunas) 2024; 60: 957
- 13 Bedi S, Liu Y, Orr-Ewing L. et al. Testing and Evaluation of Health Care Applications of Large Language Models: A Systematic Review. JAMA 2025; 333: 319-328
- 14 BfArM. Operationen- und Prozedurenschlüssel Version 2025. In; 18.10.2024
- 15 Knoedler S, Hoch CC, Huelsboemer L. et al. Postoperative free flap monitoring in reconstructive surgery-man or machine?. Front Surg 2023; 10: 1130566
- 16 Kohlert S, Quimby AE, Saman M. et al. Postoperative Free-Flap Monitoring Techniques. Semin Plast Surg 2019; 33: 13-16
- 17 Mija D, Kehlet H, Rosero EB. et al. Evaluating the role of ChatGPT in perioperative pain management versus procedure-specific postoperative pain management (PROSPECT) recommendations. Br J Anaesth 2024; 133: 1318-1320
- 18 Zhang A, Li CXR, Piper M. et al. ChatGPT for improving postoperative instructions in multiple fields of plastic surgery. J Plast Reconstr Aesthet Surg 2024; 99: 201-208
- 19 Ayoub NF, Lee YJ, Grimm D. et al. Comparison Between ChatGPT and Google Search as Sources of Postoperative Patient Instructions. JAMA Otolaryngol Head Neck Surg 2023; 149: 556-558
- 20 Finlayson D. KI bei der Erfassung und Abrechnung von DRG: Nutzen für Krankenhäuser (25.08.2023). Im Internet: www.krankenhaus-it.de/item.2705/ki-bei-der-erfassung-und-abrechnung-von-drg-nutzen-fuer-krankenhaeuser.html Stand: 27.04.2025.
