Methods Inf Med 1988; 27(02): 67-72
DOI: 10.1055/s-0038-1635521
Original Article
Schattauer GmbH

Processing Medical Natural Language Data by the System WAREL

Verarbeitung natürlichsprachlicher medizinischer Daten im System WAREL

Authors

  • W. Dorda

    1   (From the Department of Medical Computer Science (Head: Prof. Dr. G. Grabner), University of Vienna, Austria)
  • B. Haidl

    1   (From the Department of Medical Computer Science (Head: Prof. Dr. G. Grabner), University of Vienna, Austria)
  • P. Sachs

    1   (From the Department of Medical Computer Science (Head: Prof. Dr. G. Grabner), University of Vienna, Austria)
Further Information

Publication History

Publication Date:
17 February 2018 (online)

Preview

Summary

Many clinical data are in natural language form (diagnoses, therapies, etc.). There is great interest in making these data retrievable to form samples of patients for scientific investigations (statistical analyses, courses of diseases, etc.). To perform this task, “medical natural language data” have to be prepared and stored in a retrieval-oriented database. In this paper, the advantages of processing textual data are shown in contrast to coding. Accordingly, in our system WAREL medical thesauri (like ICD 9 or SNOMED) are not used for codification; they are taken as a knowledge base during the retrieval and for testing the quality of the data during documentation. The fundamental methods (computerized textual analysis and different algorithms for comparing texts) are explained in detail, and their realization within the system WAREL is illustrated (WAREL stands for Wiener Allgemeines Relationenschema).

Viele klinische Daten - wie Diagnosen und Therapien - liegen in umgangssprachlicher Form vor. Für wissenschaftliche Analysen ist es oft wesentlich, diese Daten auszuwerten. Um medizinische Textdaten EDV-mäßig abrufbar zu machen, müssen diese - entsprechend aufbereitet - in einer auswertungsorientierten Datenbank gespeichert werden. In diesem Artikel werden zunächst die Vorteile der Verarbeitung von Textdaten gegenüber der sonst üblichen Vercodung dargestellt. Dementsprechend werden im System WAREL die medizinischen Thesauren (wie ICD 9 oder SNOMED) nicht zum Vercoden, sondern als Wissensbasen bei der Auswertung und zur Datenüberprüfung während der Dokumentation eingesetzt. Die dazu notwendigen Methoden (“computermäßige Textanalyse” und unterschiedliche Algorithmen zum Vergleich von Texten) werden an Hand des Systems WAREL ausführlich erläutert. (WAREL bedeutet Wiener Allgemeines Relationenschema)