Summary
Many clinical data are in natural language form (diagnoses, therapies, etc.). There is great interest in making these data retrievable to form samples of patients for scientific investigations (statistical analyses, courses of diseases, etc.). To perform this task, “medical natural language data” have to be prepared and stored in a retrieval-oriented database. In this paper, the advantages of processing textual data are shown in contrast to coding. Accordingly, in our system WAREL medical thesauri (like ICD 9 or SNOMED) are not used for codification; they are taken as a knowledge base during the retrieval and for testing the quality of the data during documentation. The fundamental methods (computerized textual analysis and different algorithms for comparing texts) are explained in detail, and their realization within the system WAREL is illustrated (WAREL stands for Wiener Allgemeines Relationenschema).
Viele klinische Daten - wie Diagnosen und Therapien - liegen in umgangssprachlicher Form vor. Für wissenschaftliche Analysen ist es oft wesentlich, diese Daten auszuwerten. Um medizinische Textdaten EDV-mäßig abrufbar zu machen, müssen diese - entsprechend aufbereitet - in einer auswertungsorientierten Datenbank gespeichert werden. In diesem Artikel werden zunächst die Vorteile der Verarbeitung von Textdaten gegenüber der sonst üblichen Vercodung dargestellt. Dementsprechend werden im System WAREL die medizinischen Thesauren (wie ICD 9 oder SNOMED) nicht zum Vercoden, sondern als Wissensbasen bei der Auswertung und zur Datenüberprüfung während der Dokumentation eingesetzt. Die dazu notwendigen Methoden (“computermäßige Textanalyse” und unterschiedliche Algorithmen zum Vergleich von Texten) werden an Hand des Systems WAREL ausführlich erläutert. (WAREL bedeutet Wiener Allgemeines Relationenschema)
Key-Words:
Computerized Textual Analysis - Medical Thesauri - Knowledge Bases - System WAREL
Schlüssel-Wörter:
Automatisierte Textanalyse - medizinische Thesauren - Wissensbasen - System WAREL