Dokument: Computational Methods for the Study of Influenza A Virus Phylodynamics

Titel:Computational Methods for the Study of Influenza A Virus Phylodynamics
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=23282
URN (NBN):urn:nbn:de:hbz:061-20121211-111758-7
Kollektion:Dissertationen
Sprache:Englisch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor: Steinbrück, Lars [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]5,64 MB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 10.12.2012 / geändert 10.12.2012
Beitragende:Prof. Dr. McHardy, Alice [Gutachter]
Prof. Dr. Lercher, Martin [Gutachter]
Prof. Dr. Liberles, David [Gutachter]
Stichwörter:Phylogenetics, Phylodynamics, Influenza, Viral Evolution
Dewey Dezimal-Klassifikation:000 Informatik, Informationswissenschaft, allgemeine Werke » 004 Datenverarbeitung; Informatik
Beschreibungen:Influenza ist eine ansteckende virale Erkrankung der Atemwege, die seit Jahrhunderten für beträchtliche Morbidität und Mortaliät in der menschlichen Bevölkerung verantwortlich ist. Allein in den USA verursacht das Influenzavirus jährlich trotz weitreichender Impfstrategien etwa 41.000 Todesfälle. Damit stellt Influenza eine erhebliche Belastung für das Gesundheitswesen und die Wirtschaft dar. Es zirkulieren drei verschiedene Typen in der menschlichen Bevölkerung, wobei sich Viren vom Typ A am schnellsten weiterentwickeln und gewöhnlich für die meisten Infektionen verantwortlich sind. Durch einen Prozess, der als ``antigenic drift'' bezeichnet wird, verändert das Virus fortlaufend die genetische Zusammensetzung seiner zwei Oberflächenproteine Hämagglutinin und Neuraminidase, um einer Erkennung und Neutralisierung durch das menschliche Immunsystem zu entkommen. Dementsprechend muss die Zusammensetzung des Influenzaimpfstoffes regelmäßig erneuert werden. In diesem Zusammenhang ist eine genaue und rechtzeitige Erkennung von viralen Stämmen, welche das Potential zur Dominanz in der viralen Population besitzen, von größter Bedeutung, um eine hinreichende Wirksamkeit des Impfstoffes zu gewährleisten.
Ziel dieser Arbeit war die Entwicklung von Methoden für die Analyse der ``Phylodynamiken'' von Influenza-A-Viren. Die Hauptaufgabe bestand somit darin, die evolutionären und epidemiologischen Vorgänge von Influenza zu untersuchen und darzustellen, wie deren Zusammenspiel die Evolution des Virus beeinflusst. Zwei verschiedene Strategien wurden entwickelt, welche diese Fragestellung von (i) einem populationsgenetischen Punkt und von (ii) einem molekulargenetischen Blickwinkel aus betrachten.
Influenza-A-Viren zeichnen sich durch eine hohe Mutationsrate und Populationsgröße aus. Dadurch laufen die zugehörigen evolutionären Prozesse zeitlich auf einer ähnlichen Skala ab wie epidemiologische Prozesse. Diese Gegebenheit ermöglicht eine gemeinsame Analyse der genetischen und räumlich-zeitlichen Dynamik des Virus. Wir haben ``allele dynamics plots'' (AD-plots) entwickelt, welche die evolutionären Veränderungen eines Genes in einer Population grafisch darstellen. AD-plots visualisieren Gen-Allele und deren Häufigkeiten über die Zeit unter Verwendung von datierten genetischen Sequenzen. Allele sind in diesem Zusammenhang als nicht-leere Mengen von Aminosäureaustauschen definiert, die für einzelne "Aste eines phylogenetischen Baumes inferiert wurden. Die Vorzüge dieser Methode wurden anhand einer Untersuchung der evolutionären Dynamiken saisonaler Influenza-A-Viren demonstriert. AD-plots des Hämagglutinin von saisonalen Influenza-A-Viren (Subtyp H3N2) und 2009 pandemischen Influenza-A-Viren (Subtyp H1N1) zeigen die Abfolge von Substitutionen, die in der Evolution der zwei viralen Populationen fixiert wurden. Des Weiteren erlauben AD-plots die Identifizierung von Allelen, die wahrscheinlich einer gerichteten Selektion unterliegen. Die Identifizierung der Allele mit dem größten Häufigkeitanstieg zwischen aufeinanderfolgenden Saisons erlaubte die zeitige Erkennung solcher Influenza-A-Viren (Subtyp H3N2), die zu einem späteren Zeitpunkt dominant in der viralen Population wurden.
Der selektive Vorteil individueller Allele impliziert eine signifikante Veränderung des antigenischen Phänotyps bezüglich anderer Allele, die bereits mit einer hohen Häufigkeit in der viralen Population zirkulieren. Allerdings tragen nicht alle Substitutionen, die mit einem Allel assoziiert sind, gleichermaßen zu der veränderten Antigenizität bei. Daher ist die Unterscheidung von Substitutionen, die einen signifikanten Einfluss auf den antigenischen Phänotyp haben, von (fast) neutralen ``hitchhicker-Mutationen'' von entscheidender Bedeutung. Wir haben eine Methode für die Inferenz von antigenischen Bäumen für Influenza-A-Viren (Subtyp H3N2) entwickelt. In antigenischen Bäumen werden paarweise antigenische Distanzen auf eine gegebene Baumtopologie mittels Optimierung der kleinsten Quadrate abgebildet. Dies ermöglicht die Inferenz von antigenischen Astlängen und somit die Aufdeckung des antigenischen Einflusses der Ast-assoziierten Aminosäureaustausche. Die Genauigkeit dieser Methode mit Bezug auf die Vorhersage antigenischer Distanzen ist vergleichbar mit derer von ``antigenic cartography''. Neben der Identifizierung antigenischer Typen, d.h. Gruppen von Viren mit ähnlichen genetischen und antigenischen Charakteristika, konnten wir sieben Positionen und fünf Aminosäureaustausche bestimmen, die einen großen antigenischen Einfluss in der Evolution von Influenza-A-Viren (Subtyp H3N2) zwischen 1968 und 2003 hatten.
Zusammenfassend stellen die entwickelten Methoden nützliche Werkzeuge in der Analyse der ``Phylodynamik'' und der antigenischen Evolution von Influenza-A-Viren mit einer potentiellen Anwendungmöglichkeit für die halbjährlich stattfindende Auswahl geeigneter Impfstämme dar. Die Anwendung dieser Verfahren ist allerdings nicht auf diesen Erreger beschränkt. Im Prinzip kann jeder Organismus oder Erreger mittels AD-plots analysiert werden, für den homologe genetische Sequenzen und entsprechende Datierungsinformationen vorhanden sind. Phänotyp-Bäume können inferiert werden, wenn homologe genetische Sequenzen und paarweise phänotypische Distanzen vorhanden sind. Daher sind die entwickelten Methoden auf viele wissenschaftliche Fragestellungen übertragbar.

Influenza is a contagious respiratory viral infection that has been endemic in humans for centuries causing substantial morbidity and mortality. Despite of comprehensive vaccination campaigns influenza is annually responsible for approximately 41,000 deaths in the USA alone and, thus, results in an enormous health and economy burden. Three distinct types are endemic in humans with type A viruses evolving most rapidly and being commonly associated with the most influenza infections. In a process known as antigenic drift, the virus continuously alters the sequence composition of the two surface antigens, hemagglutinin and neuraminidase, to evade recognition by the host immune system. Therefore, the composition of the influenza vaccine has to be updated on a regular basis. Based on this, the correct and accurately timed identification of strains that are on the rise to predominance is of utmost importance to ensure sufficient vaccine efficiency.
The aim of this work was to develop computational methods for the analysis of the phylodynamics of seasonal influenza A viruses. This means that the developed methods should allow the analysis of the genetic, antigenic and epidemiological dynamics of influenza and give insights into how their interplay shapes the evolution of the virus. Two different strategies were developed to tackle the problem from (i) a population genetics point and (ii) a molecular genetics point.
The rapid evolution of influenza A viruses results in the evolutionary processes to proceed on a similar scale to the epidemiological processes. This allows for a joint analysis of the genetic and spatiotemporal dynamics of the virus. In this context, we developed allele dynamics plots (AD plots), for the visualization of the evolutionary dynamics of a gene in a population. Based on a sample of dated genetic sequences AD plots visualize gene alleles, i.e. non-empty sets of amino acid changes mapped to individual branches of a phylogeny, and their frequency over time. The method's merits are demonstrated with a study of the evolutionary dynamics of seasonal influenza A viruses. AD plots for the major surface protein of seasonal influenza A (H3N2) and the 2009 swine-origin influenza A (H1N1) viruses show the succession of substitutions that became fixed in the evolution of the two viral populations. Furthermore, AD plots enable the identification of those alleles that are likely to be subject to directional selection. Identification of alleles with the largest frequency increase between consecutive influenza seasons resulted in the early detection of those influenza A (H3N2) virus strains that later rise to predominance.
A selective advantage of individual alleles implies their novelty in the antigenic phenotype with respect to alleles already circulating at high frequency. However, not all substitutions associated with an allele contribute equally to the change in antigenicity. In this sense, distinguishing substitutions in the hemagglutinin of human influenza A viruses that have a significant impact on the antigenic phenotype from (near-) neutral `hitchhikers' is of high relevance. We therefore developed a method that allows for the inference of antigenic trees for the major viral surface protein hemagglutinin. Antigenic trees enable the determination of antigenic branch lengths for a given tree topology using least-squares optimization. Thus, it allows to resolve the antigenic impact of branch-associated amino acid changes. The accuracy of our technique to predict antigenic distances is comparable to antigenic cartography. However, the inference of antigenic trees allows for a more detailed study of the antigenic evolution of influenza A (H3N2) viruses. Besides the identification of antigenic types, i.e. groups of viruses with similar genetic and antigenic properties, we identified seven sites and five amino acid changes with high antigenic impact in the evolution of influenza A (H3N2) viruses from 1968 to 2003.
In summary, the developed methods are useful tools for the analysis of the phylodynamics of influenza A viruses with a potential application for the biannual vaccine strain selection process. However, application is not limited to this pathogen. With AD plots any organism/pathogen where homologous genetic sequence data and associated sampling times are available can be analyzed. For phenotype trees, application is possible if pair-wise phenotype distances and according homologous genetic sequence data are available. Thus, the developed methods have value for a broad scientific community.
Lizenz:In Copyright
Urheberrechtsschutz
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät » WE Informatik » Algorithmische Bioinformatik
Dokument erstellt am:11.12.2012
Dateien geändert am:11.12.2012
Promotionsantrag am:11.07.2012
Datum der Promotion:04.12.2012
english
Benutzer
Status: Gast
Aktionen