Methods Inf Med 1988; 27(02): 67-72
DOI: 10.1055/s-0038-1635521
Original Article
Schattauer GmbH

Processing Medical Natural Language Data by the System WAREL

Verarbeitung natürlichsprachlicher medizinischer Daten im System WAREL
W. Dorda
1   (From the Department of Medical Computer Science (Head: Prof. Dr. G. Grabner), University of Vienna, Austria)
,
B. Haidl
1   (From the Department of Medical Computer Science (Head: Prof. Dr. G. Grabner), University of Vienna, Austria)
,
P. Sachs
1   (From the Department of Medical Computer Science (Head: Prof. Dr. G. Grabner), University of Vienna, Austria)
› Author Affiliations
Further Information

Publication History

Publication Date:
17 February 2018 (online)

Summary

Many clinical data are in natural language form (diagnoses, therapies, etc.). There is great interest in making these data retrievable to form samples of patients for scientific investigations (statistical analyses, courses of diseases, etc.). To perform this task, “medical natural language data” have to be prepared and stored in a retrieval-oriented database. In this paper, the advantages of processing textual data are shown in contrast to coding. Accordingly, in our system WAREL medical thesauri (like ICD 9 or SNOMED) are not used for codification; they are taken as a knowledge base during the retrieval and for testing the quality of the data during documentation. The fundamental methods (computerized textual analysis and different algorithms for comparing texts) are explained in detail, and their realization within the system WAREL is illustrated (WAREL stands for Wiener Allgemeines Relationenschema).

Viele klinische Daten - wie Diagnosen und Therapien - liegen in umgangssprachlicher Form vor. Für wissenschaftliche Analysen ist es oft wesentlich, diese Daten auszuwerten. Um medizinische Textdaten EDV-mäßig abrufbar zu machen, müssen diese - entsprechend aufbereitet - in einer auswertungsorientierten Datenbank gespeichert werden. In diesem Artikel werden zunächst die Vorteile der Verarbeitung von Textdaten gegenüber der sonst üblichen Vercodung dargestellt. Dementsprechend werden im System WAREL die medizinischen Thesauren (wie ICD 9 oder SNOMED) nicht zum Vercoden, sondern als Wissensbasen bei der Auswertung und zur Datenüberprüfung während der Dokumentation eingesetzt. Die dazu notwendigen Methoden (“computermäßige Textanalyse” und unterschiedliche Algorithmen zum Vergleich von Texten) werden an Hand des Systems WAREL ausführlich erläutert. (WAREL bedeutet Wiener Allgemeines Relationenschema)

 
  • REFERENCES

  • 1 Baumann R. P, Ruedi B. Encoding of clinical diagnosis by ICD and SNOMED – A comparative trial. In Salamon R, Blum B, Jørgensen M. (Eds) MEDINFO 86. Amsterdam: North-Holland; 1986: 862-864.
  • 2 Baumann R. P. Construction of a (semi-) automated SNOMED-ICD code linkage. In Roger F. H, Grönroos P, Tervo-Pallikka R, O’Moore R. (Eds) Medical Informatics Europe 85. Lecture Notes in Medical Informatics, Vol.25 Berlin: Springer; 1985: 201-205.
  • 3 Benson D. A, Goldstein C. M, Fitzpatrick L. et al. Developing tools for online medical reference works. In Salamon R, Blum B, Jørgensen M. (Eds) MEDINFO 86. Amsterdam: North-Holland; 1986: 558-560.
  • 4 Blair D, Maron M. An evaluation of retrieval effectiveness for a full-text document-retrieval system. Commun. ACM 1985; 28: 289-299.
  • 5 Buchberger E, Heinz W, Matiasek J. et al. Datenbank DIALOG – Ein deutschsprachiges DB-Interface. In Pernul G, Tjoa A. (Eds) Berichte aus Informatikforschungsinstitutionen. Wien: Oldenbourg; 1987: S.419-426.
  • 6 Collen M. F. Online full-text medical literature retrieval. In Salamon R, Blum B, Jørgensen M. (Eds) MEDINFO 86. Amsterdam: North-Holland; 1986: 553-557.
  • 7 Coté R. (Ed.) SNOMED – Systematized Nomenclature of Medicine. .2 Vols. Skokie, Ill: College of American Pathologists; 1984
  • 8 Coté R. A, Protti D. J, Scherrer J. R. (Ed.) Role of Informatics in Health Data Coding and Classification Systems. Amsterdam: North-Holland; 1985
  • 9 Dorda W, Laminger B, Reichertzeder C, Sachs P. Computereinsatz zur Analyse Medizinischer Daten – die Auswertungssysteme WAMAS und WAMA-STAT. In Grabner G. (Hrsg.) WAMIS – Wiener Allgemeines Medizinisches Infor- mations-System. Berlin: Springer; 1985: S.251-291.
  • 10 ICD/9: Handbuch der Internationalen Klassifikation der Krankheiten, Verletzungen und Todesursachen (ICD) 1979. 9. Revision. Wuppertal: Deutscher Consulting Verlag; 1979
  • 11 Laminger B, Sachs P, Dorda W. A documentation and retrieval system for medical natural language data. In Serio A, O’Moore R, Tardine A, Roger F. H. (Eds.) Medical Informatics Europe 87. Roma: 1987: 552-557.
  • 12 Moore G. W, Polacsek R, Casanova M. et al. Multilingual respelling rules for an English medical word list. In Salamon R, Blum B, Jørgensen M. (Eds.) MEDINFO 86. Amsterdam: North-Holland; 1986: 1106-1110.
  • 13 Rada R, Lu E, Eng J, Brylawski B. Augmentation and evaluation of a medical classification structure through mor-phosemantic analysis. In Salamon R, Blum B, Jørgensen M. (Eds.) MEDINFO 86. Amsterdam: North-Holland; 1986: 1096-1100.
  • 14 Sager N, Friedman C, Lyman M. S. The analysis and processing of clinical narrative. In Salamon R, Blum B, Jørgensen M. (Eds.) MEDINFO 86. Amsterdam: North-Holland; 1986: 1101-1105.
  • 15 Wingert F. Medizinische Informatik. Stuttgart: Teubner; 1979
  • 16 Wingert F. SNOMED – Systematisierte Nomenklatur der Medizin. Berlin: Springer; 1984
  • 17 Wingert F. SNOMED-Manual. Berlin: Springer; 1984
  • 18 Wingert F. Automated indexing based on SNOMED. Meth. Inform. Med 1985; 24: 27-34.
  • 19 Wingert F. Morphologic analysis of compound words. Meth. Inform. Med 1985; 24: 155-162.
  • 20 Wingert E. Automated indexing based on SNOMED. In Salamon R, Blum B, Jørgensen M. (Eds.) MEDINFO 86. Amsterdam: North-Holland; 1986: 1149
  • 21 Wolf W, Dorda W, Sachs P, Graber E. WAMAS: Online evaluation of a medical data-base under consideration of time-relations. In Bégon F. (Ed.) AWAMIS – Annals of the World Association for Medical Informatics. Poitiers: University Press; 1981: 231-235.
  • 22 Zsolnai S, Trost H, Buchberger E. Eine intelligente Schnittstelle zur Erweiterung des morphologischen und syntaktisch/semantischen Lexikons eines natürlichsprachlichen Dialogsystems. In Pernul G, Tjoa A. (Eds.) Berichte aus Informationsforschungsinstitutionen. Wien: Oldenbourg; 1987: S.407-417.