Methods Inf Med 1975; 14(01): 7-13
DOI: 10.1055/s-0038-1635690
paper
Schattauer GmbH

Identification and Retrieval of Personal Records from a Statistical Data Bank

Herausfinden von Dossiers aus Statistischen Datenbanken
J. Schlörer
1   Department of Medical Statistics, Documentation and Data Processing, University of Ulm
› Author Affiliations
Further Information

Publication History

Publication Date:
14 February 2018 (online)

Preview

From a statistical data bank containing anonymous but individual records which may be evaluated by dialogue—e.g., by entering logical conditions which the system answers by returning absolute frequencies—personal records may often be retrieved. First a user has to identify the record in question, using previous knowledge. An experiment with authentic data is described providing some information on the amount of preknowledge needed for identification. Once identified, parts or the whole of a record may be retrieved by various techniques. The efficiency of a technique already known is studied. A new technique permitting retrieval of complete personal records is described, which is resistant to conventional output restrictions. It becomes feasible as soon as AND plus at least one of the logical operations NOT and OR are available. Some possible countermeasures are discussed.

Enthalten statistische Datenbanken zwar anonyme, aber nach Einzelpersonen gespeicherte Daten, und erlauben sie eine Dialogauswertung — etwa Eingabe logischer Bedingungen, die mit der Arisgabe absoluter Häufigkeiten beantwortet werden —, dann ist oft das Herausziehen personenbezogener Information möglich. Der Benutzer muß zunächst mit Hilfe von Vorwissen den Datensatz der gesuchten Person identifizieren. Dazu wird ein Versuch mit authentischen Daten beschrieben, der Anhaltspunkte für den zur Identifikation nötigen Umfang an Vorwissen liefert. Nach gelungener Identifikation kann der Inhalt des identifizierten Datensatzes mittels verschiedener Techniken teilweise oder ganz festgestellt werden. Die Leistungsfähigkeit einer bereits bekannten Technik wird näher untersucht. Ein neues Verfahren zum lückenlosen Herausziehen identifizierter Datensätze wird beschrieben; das gegen herkömmliche Ausgabesperren unempfindlich ist. Es wird durchführbar, sobald neben logischem UND wenigstens eine der Operationen NICHT oder ODER verfügbar ist. Einige mögliche Schutzmaßnahmen werden diskutiert.