Gesundheitsökonomie & Qualitätsmanagement 2020; 25(06): 297-304
DOI: 10.1055/a-1167-5927
Originalarbeit

Regularisierte regressionsanalytische Verfahren für hochdimensionale Daten: ein neuer Ansatz in der Krankheitskostenrechnung des Statistischen Bundesamts zu ärztlichen Leistungen und Arzneiverordnungen

Regularized regression for high-dimensional data: a new approach for cost of illness calculation of medical services and medicine prescriptions within the range of statistical machine learning
J. Heuer
1  Zentralinstitut für die kassenärztliche Versorgung, Berlin, Deutschland
,
M.-L. Rosenbusch
1  Zentralinstitut für die kassenärztliche Versorgung, Berlin, Deutschland
,
E. Steiger
1  Zentralinstitut für die kassenärztliche Versorgung, Berlin, Deutschland
,
M. Erhart
2  Alice-Salomon-Hochschule, Berlin, Deutschland
› Author Affiliations

Zusammenfassung

Hintergrund und Zielsetzung Im Rahmen seiner Krankheitskostenrechnung hat das Statistische Bundesamt (Destatis) vom Zentralinstitut für die kassenärztliche Versorgung (Zi) berechnete Kosten in Arztpraxen erhalten. Das Zi hat hierfür einen neuen statistischen Ansatz entwickelt, dessen Ergebnisse in dieser Arbeit mit den Befunden der bisherigen Methode verglichen werden.

Methode Die Kosten werden erstmalig mit einem Regressionsmodell geschätzt. Aufgrund der hohen Anzahl teilweise kollinearer Prädiktoren wird die Ridge-Regression angewendet, die darüber hinaus die Varianz der Schätzung reduziert und zu den Verfahren des maschinellen statistischen Lernens gezählt werden kann.

Ergebnisse Die Verteilung der Kosten in Arztpraxen des Jahres 2008 und der Verordnungskosten in Apotheken des Jahres 2009 nach dem Ridge-Regressionsmodell folgt annähernd der Kostenverteilung gemäß den nach der bisherigen Methode berechneten und publizierten Ergebnissen, weicht jedoch für bestimmte Erkrankungsgruppen erkennbar ab. Die höchsten direkten Behandlungs- bzw. Verordnungskosten werden für Nierenversagen bzw. HIV-Erkrankungen ermittelt.

Schlussfolgerung Die durchgeführten Analysen resultieren in plausiblen Ergebnissen und zeigen die Möglichkeiten, regularisierte Regressionsverfahren für die Analyse hochdimensionaler Versorgungsdaten Gewinn bringend einzusetzen.

Summary

Aim Zi provided the Federal Statistical Office (Destatis) with results of cost of illness, calculated from the costs of ambulatory care. Therefore, Zi has developed a new statistic approach, whose results are compared with the findings of the former methodical calculation in this paper.

Method First, costs per disease group are estimated with a regression model. Due to the great number and partly collinear predictors ridge regression has been used to reduce the variance of estimates. It ranks among the methods of statistical machine learning.

Results Using the ridge-regression model, the distribution of costs of ambulatory physician services in 2008 and costs of medical prescriptions in pharmacies in 2009, roughly follows the published cost allocation, calculated with the usual method, but varies visibly in certain illness groups. The highest direct costs for treatment and prescription were detected for kidney failure and HIV infection, respectively.

Conclusion The performed analyses show plausible results and demonstrate the benefits of using regularized regression procedures for the analysis of high-dimensional claims data.



Publication History

Publication Date:
29 July 2020 (online)

© Georg Thieme Verlag KG
Stuttgart · New York