Dokument: Comparison of different propensity score methods for estimating treatment effects in non-randomized studies with survival data.
Titel: | Comparison of different propensity score methods for estimating treatment effects in non-randomized studies with survival data. | |||||||
Weiterer Titel: | Vergleich verschiedener Propensity Score-Methoden zur Schätzung der Behandlungseffekte in nicht-randomisierten Studien mit Überlebensdaten. | |||||||
URL für Lesezeichen: | https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=69418 | |||||||
URN (NBN): | urn:nbn:de:hbz:061-20250627-163245-8 | |||||||
Kollektion: | Dissertationen | |||||||
Sprache: | Englisch | |||||||
Dokumententyp: | Wissenschaftliche Abschlussarbeiten » Dissertation | |||||||
Medientyp: | Text | |||||||
Autor: | Filla, Tim [Autor] | |||||||
Dateien: |
| |||||||
Beitragende: | Prof. Dr. Kuß, Oliver [Gutachter] Prof. Dr. Schwender, Holger [Gutachter] | |||||||
Stichwörter: | Propsensity score, observational studies, overlap weights | |||||||
Dokumententyp (erweitert): | Dissertation | |||||||
Dewey Dezimal-Klassifikation: | 600 Technik, Medizin, angewandte Wissenschaften » 610 Medizin und Gesundheit | |||||||
Beschreibungen: | Beobachtungsstudien werden häufig in der Public Health Forschung eingesetzt, da die
Durchführung von randomisierten Studien aus ethischen oder finanziellen Gründen schwierig ist. Die Analyse von Beobachtungsdaten ist jedoch im Vergleich zu randomisierten Studien mit größeren Herausforderungen verbunden, insbesondere im Hinblick auf das Risiko einer Verzerrung durch Störfaktoren. In den letzten Jahrzehnten wurden viele Methoden für die Analyse von Beobachtungsdaten entwickelt. Eine davon ist die Propensity Score (PS) Methode. Zahlreiche Methoden, die den PS verwenden, wurden in den letzten zehn Jahren entwickelt. Dies erschwert für die Forschenden die Wahl der besten Methode. Simulationsstudien können Aufschluss darüber geben, welche Methoden in bestimmten Situationen am besten funktionieren. Es mangelt jedoch an Simulationsstudien zur Verwendung von PS Methoden in Szenarien mit Überlebensdaten, die häufig verwendet werden. Das übergeordnete Ziel dieser Arbeit ist es, diese Lücke zu schließen und den Anwendenden in der Public Health Forschung eine klare Anleitung für die Wahl der PS Methode zu geben. Zu diesem Zweck wurde eine detaillierte Simulationsstudie mit Simulationseinstellungen durchgeführt, die durch Informationen aus veröffentlichten PS Analysen motiviert wurden, welche durch eine systematische Suche in „PubMed“ gefunden wurden. Darüber hinaus wurde eine neue PS Methode, die verallgemeinerte Methode der Momente-Matching- Gewichte (GMMW), zusammen mit einem korrigierten Varianzschätzer, der für eine angemessene Berechnung des Konfidenzintervalls erforderlich ist, vorgeschlagen. Die Ergebnisse der Simulationsstudie zeigten, dass alle Methoden (overlap weights (OW), matching weights (MW) und GMMW) zur Schätzung des durchschnittlichen Behandlungseffekts in der Überlappungspopulation (ATO) in fast allen Fällen die besten Ergebnisse und den kleinsten Standardfehler des Schätzers lieferten. Ein Vergleich der Methoden ergab ähnliche Ergebnisse hinsichtlich der Verzerrung und des Standardfehlers des Schätzers. Bei allen Methoden zur Schätzung des durchschnittlichen Behandlungseffekts (ATE) und des durchschnittlichen Behandlungseffekts der Behandelten (ATT) erwies sich die Entropieausgleichsmethode (EB) als die beste Methode. Darüber hinaus ist die Leistung der Standardmethode inverse Wahrscheinlichkeitsgewichtung (IPTW) bei der Schätzung des ATEs schlecht, bei der Schätzung des ATTs jedoch recht gut (und ähnlich wie die EB). Was die Leistung des robusten Standardfehlers betrifft, so kam es in allen Simulationseinstellungen zu einer Überschätzung der wahren Varianz und damit zu einer Überdeckung des 95%- Konfidenzintervalls. Der selbst entwickelte neue Varianzschätzer führte zu einer verbesserten Abdeckung des 95%-Konfidenzintervalls für alle Methoden. Zusammenfassend lässt sich sagen, dass wir den Forschenden im Bereich Public Health vorschlagen, in ihren Auswertungen, EB für den Zielschätzer ATE, EB oder CBPSJ für den Zielschätzer ATT und OW, MW und GMMW für den Zielschätzer ATO zu verwenden. Für die Varianzschätzung des Effektschätzers sollte bei allen Methoden die Verwendung des neu vorgeschlagenen korrigierten robusten Varianzschätzers gegenüber dem robusten Varianzschätzer bevorzugt werden.Observational studies are frequently used in public health research, due to ethical or financial complications for conducting randomized trials. However, observational data analysis come with increased challenges in comparison to randomized trials especially regarding the risk of confounding bias. In the last decades, many methods have been developed for the analysis of observational data. One of these are the propensity score (PS) methods. In the last decade many methods using the PS have been developed, which complicates the choice of the best method for the applied researcher. Simulation studies can provide a guidance on which methods perform best in specific settings. However, there is a lack of simulation studies regarding PS usage in scenarios with survival outcome, which is frequently used. The overarching aim of this study is to fill this gap, and provide clear guidance for the applied public health researcher regarding the best choice of PS method. Therefore, a detailed simulation study was conducted with simulation settings motivated by information extracted from published PS analyses found by systematic research on ‘PubMed’. In addition, a new PS method, the generalized method of moment matching weight (GMMW), was also proposed along with a corrected variance estimator, which is necessary for an appropriate calculation of the confidence interval. The results of the simulation study showed that all methods (overlap weights (OW), matching weights (MW) and GMMW) estimating the average treatment effect in the overlap population (ATO) performed best with unbiased results in almost all settings and the smallest standard error of the estimator. Comparing the methods, similar performances were found regarding bias and standard error of the estimator. Across all methods estimating the average treatment effect (ATE) and average treatment effect of the treated (ATT), entropy balancing (EB) was found to perform best. Further, the performance of the standard method inverse probability weighting (IPTW) is poor for estimating the ATE but reasonably well (and similar to EB) for the ATT. Regarding the performances of the robust standard error, an overestimation of the true variance and thus, an over-coverage of the 95% confidence interval occurred in all simulation settings. The self-developed new variance estimator resulted in improved coverage of the 95% confidence interval for all methods. In conclusion, for the applied public health researcher, we propose to use EB for target estimand ATE, EB or CBPSJ for target estimand ATT and OW, MW and GMMW for target estimand ATO. For the variance estimation of the effect estimator, the usage of the corrected robust variance estimator should be preferred over the robust variance estimator for all methods. | |||||||
Lizenz: | ![]() Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz | |||||||
Fachbereich / Einrichtung: | Medizinische Fakultät » Institute » Institut für Statistik in der Medizin | |||||||
Dokument erstellt am: | 27.06.2025 | |||||||
Dateien geändert am: | 27.06.2025 | |||||||
Promotionsantrag am: | 30.09.2024 | |||||||
Datum der Promotion: | 20.02.2025 |