Dokument: The power of tests for signal detection in high-dimensional data

Titel:The power of tests for signal detection in high-dimensional data
Weiterer Titel:Die Güte von Signalerkennungstests in hochdimensionalen Daten
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=42808
URN (NBN):urn:nbn:de:hbz:061-20170706-105046-7
Kollektion:Dissertationen
Sprache:Englisch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor: Ditzhaus, Marc [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]1000 KB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 06.07.2017 / geändert 06.07.2017
Beitragende:Prof. Dr. Janssen, Arnold [Gutachter]
Prof. Dr. Pauly, Markus [Gutachter]
Prof. Dr. Reiß, Markus [Gutachter]
Dewey Dezimal-Klassifikation:500 Naturwissenschaften und Mathematik » 510 Mathematik
Beschreibungen:In this thesis, we are interested in the testing problem, whether there are rare and weak signals (alternative) or no signals (null) within white noise background. To be more specific, we study the asymptotic behavior of the log-likelihood ratio test (LLRT) and Tukey's higher criticism (HC) modified by Donoho and Jin (2004) when the number of observations $n$ tends to infinity. First results were shown by Ingster (1997), who studied the asymptotic behavior of LLRT in great detail under the assumption of normal distributions. In the same context, Jin (2004) and Donoho and Jin (2004) used the term detection boundary, which divides the plane, that represents the parametrisation of signal strength and the probability of a signal, into two areas. By doing this they illustrate their results and the ones of Ingster (1997): Underneath the boundary LLRT yields no better results than flipping a coin (as $n\to\infty$). Above the boundary LLRT can completely separate the null and the alternative (as $n\to\infty$). Moreover, Donoho and Jin (2004) showed that the latter is also valid for HC. In contrast to LLRT HC does not depend on the unknown signal strength and probability of a signal. Thus, it is applicable in practice. Similar results concerning HC were also shown for other distributions, see the above-mentioned references.

In the second chapter we present an extension of the model which was studied in the literature. The main difference between the models is that the signal strength and the probability of a signal can differ in each observation. In the following first main part of this thesis, we discuss the asymptotic behavior of LLRT. We are especially interested in the limit distribution of the test statistic on the detection boundary. There are already results in the literature concerning this, see Cai et al. (2011), Cai and Wu (2014), Donoho and Jin (2004) and Ingster (1997), which we can extend to our general model. In the second main part of this thesis, we show that the detection boundaries of HC and LLRT coincide for different assumptions concerning the distributions. Moreover, we show that HC has no power on the boundary under these assumptions. We want to emphasize that the behavior of HC on the boundary was an open problem until now.

Deutsche Zusammenfassung:

In dieser Arbeit beschäftigen wir uns mit dem Testproblem, ob innerhalb von weißem Rauschen einige wenige Signale (Alternative) oder keine Signale (Nullhypothese) vorliegen. Hierzu studieren wir das asymptotische Verhalten des Log-Likelihood-Quotienten Tests (LLQ) und des von Donoho und Jin (2004) modifizierten Higher Criticism Tests (HC), wenn die Anzahl n der Beobachtungen gegen unendlich strebt. Erste Resultate wurden von Ingster 1997 erzielt, der unter Normalverteilungsannahmen das asymptotische Verhalten von LLQ studierte. In diesem Kontext führten Jin (2004) und Donoho und Jin(2004) den Begriff der Erkennungsgrenze ein, welche die Ebene, die die Parametrisierung der Signalstärke und -wahrscheinlichkeit darstellt, in zwei Bereiche teilt. Auf diese Weise visualisierten sie ihre Ergebnisse sowie diejenigen von Ingster 1997: Unterhalb dieser Grenze erzielt LLQ keine besseren Ergebnisse als ein Münzwurf (für $n\to\infty$). Oberhalb dieser Grenze kann LLQ zwischen Nullhypothese und Alternative (für $n\to\infty$) ohne Fehler unterscheiden. Weiterhin zeigten Donoho und Jin (2004), dass HC Letzteres ebenfalls kann. Im Gegensatz zu LLQ hängt HC nicht von der Signalwahrscheinlichkeit und -stärke ab und ist somit in der Praxis anwendbar. Das zuvor erwähnte, asymptotisch optimale Verhalten von HC wurde auch für andere Verteilungsannahmen nachgewiesen, siehe unter anderem die bereits erwähnten Arbeiten.

Nach einem einleitenden ersten Kapitel stellen wir eine Erweiterung des bisher betrachteten Modells im zweiten Kapitel vor, indem wir zulassen, dass die Signalwahrscheinlichkeit und -stärke für verschiedene Beobachtungen unterschiedlich sein kann. Zudem schränken wir das Modell nicht auf bestimmte Verteilungsannahmen, z.B. Normalverteilung, ein. Im ersten Hauptteil der Arbeit beschäftigen wir uns mit dem asymptotischen Verhalten von LLQ. Insbesondere sind wir an dem Konvergenzverhalten der Teststatistik auf der Erkennungsgrenze interessiert. Hierbei lassen sich die bisherigen Ergebnisse bezüglich Normalverteilungsannahmen, siehe Cai et al. (2011), Cai und Wu (2014), Donoho und Jin (2004) und Ingster (1997), auf unser allgemeineres Modell erweitern. Im zweiten Hauptteil der Arbeit widmen wir uns HC. Wir zeigen, dass die Erkennungsgrenzen von HC und LLQ unter noch nicht betrachteten Verteilungsannahmen übereinstimmen. Zudem präsentieren wir erste Ergebnisse zum Verhalten von HC auf der Grenze, welches in der Literatur bisher noch nicht studiert wurde.
Lizenz:In Copyright
Urheberrechtsschutz
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät » WE Mathematik » Mathematische Statistik und Wahrscheinlichkeitstheorie
Dokument erstellt am:06.07.2017
Dateien geändert am:06.07.2017
Promotionsantrag am:25.11.2016
Datum der Promotion:28.06.2017
english
Benutzer
Status: Gast
Aktionen