With the objective of providing easier access to pathology specimens, slides and kodachromes
with linkage to x-ray and the remainder of the patient’s medical records, an automated
natural language parsing routine, based on dictionary look-up, was written for Surgical
Pathology document-pairs, each consisting of a Request for Examination (authored by
clinicians) and its corresponding report (authored by pathologists). These documents
were input to the system in free-text English without manual editing or coding.
Two types of indices were prepared. The first was an »inverted« file, available for
on-line retrieval, for display of the content of the document-pairs, frequency counts
of cases or listing of cases in table format. Retrievable items are patient’s and
specimen’s identification data, date of operation, name of clinician and pathologist,
etc. The English content of the operative procedure, clinical findings and pathologic
diagnoses can be retrieved through logical combination of key words. The second type
of index was a catalog. Three catalog files — »operation«, »clinical«, and »pathology«
— were prepared by alphabetization of lines formed by the rotation of phrases, headed
by keywords. These keywords were automatically selected and standardized by the parsing
routine and the phrases were extracted from each sentence of each input document.
Over 2,500 document-pairs have been entered and are currently being utilized for purpose
of medical education.
Im Bestreben, einen besseren Zugriff zu pathologischem Untersuchungsmaterial, zu Diapositiven
und Kodachromes zugleich mit verknüpfenden Hinweisen auf Röntgenaufnahmen und die
übrige Krankengeschichte des Patienten zu ermöglichen, wurde eine automatisierte linguistische
Klartextanalyse-Routine auf der Grundlage des Nachschlagens im Wörterbuch für Formblätter
für bioptische Untersuchungen geschrieben. Bei den erwähnten Formblättern handelt
es sich um ein Auftrags-Formblatt zur Durchführung einer Untersuchung (geschrieben
vom Kliniker) und den entsprechenden Bericht des Pathologen. Diese Dokumente wurden
in Klartext, d. h. ohne manuelle Überarbeitung oder Kodierung, in das System eingegeben.
Zwei Arten von Indexen wurden erstellt: zunächst ein »inverted file« für das On-line-Retrieval,
für die Wiedergabe des Inhalts der beiden Formblätter und für Häufigkeitszählungen
von Fällen oder Fallauflistungen in Tabellenformat. Suchmerkmale sind dabei die Identifikationsdaten
von Patienten und Operationsmaterial, das Datum der Operation, der Name des Klinikers
bzw. des Pathologen usw. Die Art des operativen Eingriffs, des klinischen Befundes
und der pathologischen Diagnosen können durch logische Kombination von Schlüsselwörtern
aufgefunden werden.
Der zweite Index-Typ waren Kataloge. Drei Kataloge, nämlich »Operation«, »Klinik«
und »Pathologie« wurden im KWIC-Index-Verfahren mittels Rotation der Schlagwörter
hergestellt. Diese Schlagwörter wurden automatisch ausgezogen und durch die linguistische
Analyse standardisiert. Die entsprechenden Satzteile wurden aus jedem Satz jedes eingegebenen
Dokuments herausgezogen. Mehr als 2500 Formblattpaare wurden verarbeitet und werden
zur Zeit für Zwecke der medizinischen Ausbildung benutzt.
Key-words
Surgical Pathology - Slide and Kodachrome Library - Natural Language - Automated Parsing
- Catalogs and On-line Display - Medical Education
Schlüssel-Wörter
Biopsiematerial - Sammlung von Dias und Kodachromes - Klartextverarbeitung - Automatisierte
linguistische Analyse - Kataloge und On-line-Wiedergabe - Medizinische Ausbildung