Dokument: Comparison of different propensity score methods for estimating treatment effects in non-randomized studies with survival data.

Titel:Comparison of different propensity score methods for estimating treatment effects in non-randomized studies with survival data.
Weiterer Titel:Vergleich verschiedener Propensity Score-Methoden zur Schätzung der Behandlungseffekte in nicht-randomisierten Studien mit Überlebensdaten.
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=69418
URN (NBN):urn:nbn:de:hbz:061-20250627-163245-8
Kollektion:Dissertationen
Sprache:Englisch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor: Filla, Tim [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]433,4 KB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 20.04.2025 / geändert 20.04.2025
Beitragende:Prof. Dr. Kuß, Oliver [Gutachter]
Prof. Dr. Schwender, Holger [Gutachter]
Stichwörter:Propsensity score, observational studies, overlap weights
Dokumententyp (erweitert):Dissertation
Dewey Dezimal-Klassifikation:600 Technik, Medizin, angewandte Wissenschaften » 610 Medizin und Gesundheit
Beschreibungen:Beobachtungsstudien werden häufig in der Public Health Forschung eingesetzt, da die
Durchführung von randomisierten Studien aus ethischen oder finanziellen Gründen schwierig
ist. Die Analyse von Beobachtungsdaten ist jedoch im Vergleich zu randomisierten Studien mit
größeren Herausforderungen verbunden, insbesondere im Hinblick auf das Risiko einer
Verzerrung durch Störfaktoren. In den letzten Jahrzehnten wurden viele Methoden für die
Analyse von Beobachtungsdaten entwickelt. Eine davon ist die Propensity Score (PS) Methode.
Zahlreiche Methoden, die den PS verwenden, wurden in den letzten zehn Jahren entwickelt.
Dies erschwert für die Forschenden die Wahl der besten Methode. Simulationsstudien können
Aufschluss darüber geben, welche Methoden in bestimmten Situationen am besten
funktionieren. Es mangelt jedoch an Simulationsstudien zur Verwendung von PS Methoden in
Szenarien mit Überlebensdaten, die häufig verwendet werden.
Das übergeordnete Ziel dieser Arbeit ist es, diese Lücke zu schließen und den Anwendenden
in der Public Health Forschung eine klare Anleitung für die Wahl der PS Methode zu geben. Zu
diesem Zweck wurde eine detaillierte Simulationsstudie mit Simulationseinstellungen
durchgeführt, die durch Informationen aus veröffentlichten PS Analysen motiviert wurden,
welche durch eine systematische Suche in „PubMed“ gefunden wurden. Darüber hinaus
wurde eine neue PS Methode, die verallgemeinerte Methode der Momente-Matching-
Gewichte (GMMW), zusammen mit einem korrigierten Varianzschätzer, der für eine
angemessene Berechnung des Konfidenzintervalls erforderlich ist, vorgeschlagen.
Die Ergebnisse der Simulationsstudie zeigten, dass alle Methoden (overlap weights (OW),
matching weights (MW) und GMMW) zur Schätzung des durchschnittlichen Behandlungseffekts
in der Überlappungspopulation (ATO) in fast allen Fällen die besten Ergebnisse und
den kleinsten Standardfehler des Schätzers lieferten. Ein Vergleich der Methoden ergab
ähnliche Ergebnisse hinsichtlich der Verzerrung und des Standardfehlers des Schätzers. Bei
allen Methoden zur Schätzung des durchschnittlichen Behandlungseffekts (ATE) und des
durchschnittlichen Behandlungseffekts der Behandelten (ATT) erwies sich die Entropieausgleichsmethode
(EB) als die beste Methode. Darüber hinaus ist die Leistung der
Standardmethode inverse Wahrscheinlichkeitsgewichtung (IPTW) bei der Schätzung des ATEs
schlecht, bei der Schätzung des ATTs jedoch recht gut (und ähnlich wie die EB). Was die
Leistung des robusten Standardfehlers betrifft, so kam es in allen Simulationseinstellungen zu
einer Überschätzung der wahren Varianz und damit zu einer Überdeckung des 95%-
Konfidenzintervalls. Der selbst entwickelte neue Varianzschätzer führte zu einer verbesserten
Abdeckung des 95%-Konfidenzintervalls für alle Methoden.
Zusammenfassend lässt sich sagen, dass wir den Forschenden im Bereich Public Health
vorschlagen, in ihren Auswertungen, EB für den Zielschätzer ATE, EB oder CBPSJ für den
Zielschätzer ATT und OW, MW und GMMW für den Zielschätzer ATO zu verwenden. Für die
Varianzschätzung des Effektschätzers sollte bei allen Methoden die Verwendung des neu
vorgeschlagenen korrigierten robusten Varianzschätzers gegenüber dem robusten Varianzschätzer
bevorzugt werden.

Observational studies are frequently used in public health research, due to ethical or financial
complications for conducting randomized trials. However, observational data analysis come
with increased challenges in comparison to randomized trials especially regarding the risk of
confounding bias. In the last decades, many methods have been developed for the analysis of
observational data. One of these are the propensity score (PS) methods. In the last decade
many methods using the PS have been developed, which complicates the choice of the best
method for the applied researcher. Simulation studies can provide a guidance on which
methods perform best in specific settings. However, there is a lack of simulation studies
regarding PS usage in scenarios with survival outcome, which is frequently used.
The overarching aim of this study is to fill this gap, and provide clear guidance for the applied
public health researcher regarding the best choice of PS method. Therefore, a detailed
simulation study was conducted with simulation settings motivated by information extracted
from published PS analyses found by systematic research on ‘PubMed’. In addition, a new PS
method, the generalized method of moment matching weight (GMMW), was also proposed
along with a corrected variance estimator, which is necessary for an appropriate calculation
of the confidence interval.
The results of the simulation study showed that all methods (overlap weights (OW), matching
weights (MW) and GMMW) estimating the average treatment effect in the overlap population
(ATO) performed best with unbiased results in almost all settings and the smallest standard
error of the estimator. Comparing the methods, similar performances were found regarding
bias and standard error of the estimator. Across all methods estimating the average treatment
effect (ATE) and average treatment effect of the treated (ATT), entropy balancing (EB) was
found to perform best. Further, the performance of the standard method inverse probability
weighting (IPTW) is poor for estimating the ATE but reasonably well (and similar to EB) for the
ATT. Regarding the performances of the robust standard error, an overestimation of the true
variance and thus, an over-coverage of the 95% confidence interval occurred in all simulation
settings. The self-developed new variance estimator resulted in improved coverage of the 95%
confidence interval for all methods.
In conclusion, for the applied public health researcher, we propose to use EB for target
estimand ATE, EB or CBPSJ for target estimand ATT and OW, MW and GMMW for target
estimand ATO. For the variance estimation of the effect estimator, the usage of the corrected
robust variance estimator should be preferred over the robust variance estimator for all
methods.
Lizenz:Creative Commons Lizenzvertrag
Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz
Fachbereich / Einrichtung:Medizinische Fakultät » Institute » Institut für Statistik in der Medizin
Dokument erstellt am:27.06.2025
Dateien geändert am:27.06.2025
Promotionsantrag am:30.09.2024
Datum der Promotion:20.02.2025
english
Benutzer
Status: Gast
Aktionen