Subscribe to RSS
DOI: 10.1055/s-0038-1636142
Indexed Text-Analysis[*]
Indizierte KlartextanalysePublication History
Publication Date:
10 February 2018 (online)

General conditions for medical text analysis are discussed. By means of formal description the errors which occur during manual codification with the over-cross method are analysed by distribution in different classes of diagnoses. It is pointed out that the largest error arises through incorrect correlation of the diagnoses in the summary of findings with those of the thesaurus and that, furthermore, a thesaurus of 4,500 medical terms is not sufficient for documentation in pathology. The entropy losses were only slightly larger than the losses of diagnoses calculated by percentage. The distribution of the classes of diagnoses follows a general statistical theory. In the over-cross method a loss of information Iμ = 1.532 in a total entropy of HD = 5.789 must be reckoned with as shown in an example.
Es werden allgemeine Bedingungen für die Klartextanalyse aufgestellt. Anhand einer formalen Darstellung werden durch Einteilung in verschiedene Diagnosengruppen die Fehler analysiert, die bei der manuellen Codierung durch das Over-cross-Yerfahren auftreten. Es zeigt sich, daß der größte Fehler durch falsches Zuordnen der Diagnosen des Arztbriefes zu denen des Thesaurus entsteht und daß ferner ein Thesaurus von 4500 medizinischen Begriffen für die Dokumentation in der Pathologie nicht ausreichend ist. Die Entropieverluste waren nur geringgradig größer als die prozentualen Diagnosenverluste. Die Diagnosengruppen verteilen sieh entsprechend einer allgemeinen statistischen Theorie. Wie ein Beispiel zeigt, muß beim Over-cross-Verfahren mit einem Informationsverlust Iμ = 1,532 bei einer Gesamtentropie HD = 5,789 gerechnet werden.
* This study was partly supported by funds from the Deutsche Forschungsgemeinschaft (Special Research Project No. 90).
-
References
- 1 Becker H, Breitenlohner H, Lang Chr, Schwarz F. Computer in der Pathologie: Methodik und Erfahrungen nach Auswertung von 27 000 Sektionsprotokollen. Meth. Inform. Med S 1969; 60-67.
- 2 Good I. J, Card W. J. The Diagnostic Process with Special Reference to Errors. Meth. Inform. Med 10 1971; 176-188.
- 3 Höpker W-W. Vergleichskriterien unterschiedlicher Klassifikationssysteme. Meth. Inform. Med 11 1972; 144-151.
- 4 Höpker W-W, Jacob W, Kayser K. Thesaurus und Informationssystem. Med. Techn 93 1973; 67-71.
- 5 Immich H. Probleme und Prinzipien der Diagnosen-Klassifikation. Meth. Inform. Med 04 1965; 68-71.
- 6 Immich H. Bemerkungen zum Klinischen Diagnosenschlüssel. Meth. Inform. Med 05 1966; 140-142.
- 7 International Statistical Classification of Diseases, Injuries, and Causes of Death. Vol. 1, 2. Geneva: World Health Organisation; 1968
- 8 Jacob W. Ein neues Prinzip der halbautomatischen Verschlüsselung in der medizinischen Dokumentation – das sog. ‘over-cross’-Verfahren. Klin. Wschr 43 1965; 796-797.
- 9 Jesdinsky J. Diagnose-Modelle in der Medizin. Meth. Inform. Med 11 1972; 48-59.
- 10 Kayser K, Höpker W-W. Formal Consideration on Text Analysis in Anatomie Pathology. Meth. Inform. Med 12 1973; 143-146.
- 11 Koller S. Systematik der statistischen Schlußfehler. Meth. Inform. Med 03 1964; 113-117.
- 12 Koller S, Michaelis J, Scheidt E. Untersuchungen an einem diagnostischen Simulationsmodell. Meth. Inform. Med 11 1972; 213-227.
- 13 Meyer-Eppler W. Grundlagen und Anwendung der Informationstheorie. Berlin, Heidelberg. New York: Springer; 1961
- 14 Peters J. Einführung in die allgemeine Informationstheorie. Berlin, Heidelberg. New York: Springer; 1967
- 15 Systematized Nomenclature of Pathology. American Cancer Society. 1969
- 16 Volz H. Eine mögliche Ordnung aller Informationsprozesse. EIK 07 1971; 447-456.
- 17 Voss K. Statistische Theorie komplexer Systeme 1. Allgemeine Probleme der Struktur komplexer Systeme. EIK 05 1969; 239-254.
- 18 Voss K. Statistische Theorie komplexer Systeme 11. Häufigkeitsverteilung von Untersystemen, EIK 05 1969; 319-330.
- 19 Wagner G. Bedeutung und Verläßlichkeit des Nullbefundes in der Medizin. Meth. Inform. Med 05 1966; 40-44.
- 20 Wagner G. Notwendigkeiten und Möglichkeiten einer Fehlerkontrolle klinischer Daten. Arch. klin. exper. Derm 237 1970; 404-407.
- 21 Wong R. L, Gaynon P. An Automated Parsing Routine for Diagnostic Statements of Surgical Pathology Reports. Meth. Inform. Med 10 1971; 168-175.