Methods Inf Med 1984; 23(04): 195-203
DOI: 10.1055/s-0038-1635347
Original Article
Schattauer GmbH

The Use of Morphosemantic Regularities in the Medical Vocabulary for Automatic Lexical Coding

Die Verwendung von morphosemantischen Gesetzmäßigkeiten im medizinischen Vokabularium für automatische lexikalische Kodierung
Susanne Wolff
1   (From the Linguistic String Project, New York University)
› Institutsangaben
Weitere Informationen

Publikationsverlauf

Publikationsdatum:
20. Februar 2018 (online)

Preview

Summary

The Neo-Latin portion of medical vocabulary exhibits morphosemantic regularities that make it possible to determine both English syntactic subclasses and medical semantic subclasses from formal properties of these lexical items alone. This paper describes an experimental program for the automatic creation of dictionary entries that exploits the formal regularities to obtain dictionary entries sufficient for computerized medical text analysis as presently carried out by the New York University Linguistic String Project (LSP) system. Although automatic dictionary preparation does not supersede manual classification, the program takes a considerable burden off the dictionary worker’s shoulders and speeds the costly preprocessing stages of computerized text analysis.

Der neo-lateinische Teil des medizinischen Vokabulars zeigt morphosemantische Gesetzmäßigkeiten, die es ermöglichen, sowohl englische syntaktische Untergruppen als auch medizinische semantische Untergruppen lediglich aufgrund der formalen Eigenschaften dieser lexikalischen Sachverhalte zu bestimmen.

In dieser Arbeit wird ein experimentelles Programm zur automatischen Herstellung von Wörterbucheintragungen beschrieben, welches die formalen Gesetzmäßigkeiten ausnutzt, um Wörterbucheintragungen zu erhalten, die für die automatisierte medizinische Textanalyse, wie sie derzeit durch das Linguistic String Project (LSP)-System der New York University durchgeführt wird, ausreichen. Obwohl die automatische Vorbereitung von Wörterbüchern die manuelle Klassifikation nicht ersetzt, entlastet das Programm die an einem Wörterbuch Arbeitenden erheblich und beschleunigt die teuren Vorstadien der automatisierten Textanalyse.