Methods Inf Med 1981; 20(01): 38-46
DOI: 10.1055/s-0038-1635288
Original Article
Schattauer GmbH

An Experiment in English—Spanish Automated Translation of Medical Language Data

EIN VERSUCH ENGLISCH—SPANISCHER COMPUTERÜBERSETZUNG MEDIZINISCHER TERMINOLOGIE
Isabel Garcia-Hidalgo
1   From the Division of Computer Research and Technology, National Institutes of Health, Bethesda/Md.
,
G. Dunham
1   From the Division of Computer Research and Technology, National Institutes of Health, Bethesda/Md.
› Author Affiliations
Further Information

Publication History

Publication Date:
14 February 2018 (online)

An English to Spanish translation procedure and its associated dictionaries were developed and implemented for the 1,426 terms of the morphology section of the International Classification of Diseases for Oncology. Morphological substitutions and respefling rules permit translation of most of the ICD—O vocabulary composed of Latin and Greek derived terms, which are cognate in the source and target languages, without the construction of a large word lexicon.

A fairly simple classification of words which could be implemented by recognition of terminal morphemes, and which classifies them both syntactically and semantically served as an adequate basis for translation, and sheds some light on the linguistic structure of this type of complex noun phrase seen universally in medical writings and communications. A set of 17 reduction-transformation rules based on the word classification provide syntactic control of the translation process.

Ein englisch—spanisches Übersetzungsverfahren mit den dazugehörigen Wörterbüchern wurde entwickelt und für die 1.426 Begriffe im Abschnitt »Morphologie« der International Classification of Diseases for Oncology (ICD—O) implementiert. Morphologische Substitutionen und orthographische Regeln ermöglichen auch ohne den Aufbau eines großen Wörterlexikons die Übersetzung des größten Teils des ICD—O-Vokabulars, zusammengesetzt aus aus dem Lateinischen und Griechischen abgeleiteten Begriffen, die in Ausgangssprache und Zielsprache artverwandt sind.

Eine ziemlich einfache Klassifikation von Wörtern, die durch Erkennung der Endungsmorpheme implementiert werden konnte und die diese sowohl syntaktisch als auch semantisch klassifiziert, diente als geeignete Grundlage für die Übersetzung und erhellt die linguistische Struktur solcher komplexer Ausdrücke in Substantivform, wie man sie in medizinischen Schriften und Mitteilungen im allgemeinen findet. Ein Satz von 17 Übersetzungsregeln auf der Grundlage der Wortklassifikation bietet eine syntaktische Kontrolle des Übersetzungsverfahrens.

 
  • References

  • 1 Bruderer H. E. Handbuch der maschinellen und maschinenunterstützten Sprachübersetzung: Automatische Übersetzung natürlicher Sprachen und mehrsprachige Terminologiedatenbanken. Verlag Dokumentation Saur KG; Munich: 1978
  • 2 CIE—O: Clasificación Internacional de Enfermedades para Oncología, primera edición 1977, publicación científica no. 345, Organización Panamericana de la Salud, Oficina Sanitaria Panamericana, Oficina Regional de la Organización Mundial De La Salud, 525 Twenty Third St. N.W., Washington D.C.
  • 3 CODERM: A computer version of the SNODERM Handbook, abstracted from SNODERM (Courtesy of Crawford S. Brown M.D. and William C. White).;
  • 4 Diccionario Medicobiológico: UNIVERSITY, Centro Regional de Ayuda Técnica Editorial Interamericana S.A.; Mexico City: 1966
  • 5 Hutchins W. J. Progress in Documentation: Machine Translation and Machine-Aided Translation. J. Doc 1978; 34: 119-159.
  • 6 ICD: International Classification of Diseases; World Health Organization: (ICD-9-CM) International Classification of Diseases, 9th Revision, Clinical Modification, Commission on Professional and Hospital Activities, Ann Arbor, Michigan 1978
  • 7 ICD—O: International Classification of Diseases for Oncology, first edition 1976. World Health Organization; Geneva, Switzerland.:
  • 8 Pacak M, Cousineau L, White W. The Segmentation Approach to Dictionary Construction, J. Clin. Comp 1972; 2: 37-43.
  • 9 Pacak M. G, Dunham G. S. Automated Morphosemantic Analysis of Compound Word Forms in Medical Language, Internal Report . 1974
  • 10 SNODERM: Systematized Nomenclature of Dermatology, (Brown, C. S. ed.). American Academy of Dermatology and College of American Pathologists.