Summary
Many clinical data are in natural language form (diagnoses, therapies, etc.). There
is great interest in making these data retrievable to form samples of patients for
scientific investigations (statistical analyses, courses of diseases, etc.). To perform
this task, “medical natural language data” have to be prepared and stored in a retrieval-oriented
database. In this paper, the advantages of processing textual data are shown in contrast
to coding. Accordingly, in our system WAREL medical thesauri (like ICD 9 or SNOMED)
are not used for codification; they are taken as a knowledge base during the retrieval
and for testing the quality of the data during documentation. The fundamental methods
(computerized textual analysis and different algorithms for comparing texts) are explained
in detail, and their realization within the system WAREL is illustrated (WAREL stands
for Wiener Allgemeines Relationenschema).
Viele klinische Daten - wie Diagnosen und Therapien - liegen in umgangssprachlicher
Form vor. Für wissenschaftliche Analysen ist es oft wesentlich, diese Daten auszuwerten.
Um medizinische Textdaten EDV-mäßig abrufbar zu machen, müssen diese - entsprechend
aufbereitet - in einer auswertungsorientierten Datenbank gespeichert werden. In diesem
Artikel werden zunächst die Vorteile der Verarbeitung von Textdaten gegenüber der
sonst üblichen Vercodung dargestellt. Dementsprechend werden im System WAREL die medizinischen
Thesauren (wie ICD 9 oder SNOMED) nicht zum Vercoden, sondern als Wissensbasen bei
der Auswertung und zur Datenüberprüfung während der Dokumentation eingesetzt. Die
dazu notwendigen Methoden (“computermäßige Textanalyse” und unterschiedliche Algorithmen
zum Vergleich von Texten) werden an Hand des Systems WAREL ausführlich erläutert.
(WAREL bedeutet Wiener Allgemeines Relationenschema)
Key-Words:
Computerized Textual Analysis - Medical Thesauri - Knowledge Bases - System WAREL
Schlüssel-Wörter:
Automatisierte Textanalyse - medizinische Thesauren - Wissensbasen - System WAREL