Dokument: Änderungen in Lebensstil und Nährstoffangebot als treibende Kräfte der Genomevolution in Escherichia coli und Salmonella

Titel:Änderungen in Lebensstil und Nährstoffangebot als treibende Kräfte der Genomevolution in Escherichia coli und Salmonella
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=32982
URN (NBN):urn:nbn:de:hbz:061-20141216-133549-3
Kollektion:Dissertationen
Sprache:Deutsch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor:Dr. Laubach, Thomas [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]15,11 MB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 16.12.2014 / geändert 16.12.2014
Beitragende:Prof. Dr. Lercher, Martin [Betreuer/Doktorvater]
Prof. Dr. Martin, William [Gutachter]
Stichwörter:Escherichia coli, Salmonella, Molekulare Evolution, Phylogenetics, LGT, HGT, lateral gene transfer, lateraler Gentransfer, Lebensstil, Nährstoffangebot, anzestrale Verteilungen
Dewey Dezimal-Klassifikation:000 Informatik, Informationswissenschaft, allgemeine Werke » 004 Datenverarbeitung; Informatik
Beschreibungen:Die Erhellung der Ursachen der Pathogenität vieler Stämme von Escherichia coli und aller Salmonellen, die nahe Verwandte von E. coli sind, ist von großer Bedeutung für die medizinische Forschung. Bakterien evolvieren fortwährend, was die Behandlung der von ihnen hervorgerufenen Krankheitsbilder erschwert. Sie tauschen Resistenzen gegen Antibiotika über lateralen Gentransfer (LGT) aus, der in der Bakterienevolution eine große Rolle spielt, die Ableitung von Phylogenien aber erschwert. Können wir verstehen, was die Evolution von E. coli durch LGT antreibt? Wie wird LGT von der Lebensumgebung der Bakterien beeinflußt?
Für Anschlußuntersuchungen sind zunächst statistisch robuste Phylogenien notwendig, da auf ihnen später die anzestralen Verteilungen von Gen-Anwesenheit und -abwesenheit mittels Maximum Parsimony geschätzt werden. Mittels MMN, einem für diese Arbeit entwickelten Perl-Programm, wurden zunächst Maximum-Likelihood-Phylogenien auf Grundlage konkatenierter universeller Genfamilien berechnet. Die E. coli-Phylogenie enthält 61 der 63 vollständig sequenzierten Genome, die Salmonellen-Phylogenie alle 25 (Stand 9/2013). Sie wurden mit Phylogenien verglichen, die mit zwei anderen Methoden inferiert worden sind, welche darauf abzielen, den Effekt von LGT auf die Ableitung der Phylogenie zu vermindern. Eine Methode („iTol“) basiert auf ausgewählten COGs, die andere („Maslov“) benutzt als Distanzmaß die Zahl rekombinanter Regionen zwischen zwei Genomen. Beide lieferten – entgegen der Erwartung - statistisch schlecht unterstützte Phylogenien, die sich deutlich von den ML-Phylogenien unterscheiden.
Zwei Phylogenien, die subjektiv als ähnlich empfunden werden, werden von den populären Distanzverfahren, insbesondere der Split-Distanz, nicht als ähnlich ausgewiesen. Das Distanzmaß ssRF wurde konzipiert, das diesen Nachteil beseitigt und nur als signifikant empfundene Splits bei der Distanzberechnung berücksichtigt. Es wurde für die Phylogenievergleiche in dieser Arbeit verwendet.
Für eine der untersuchten Phylogenien war keine maschinenlesbare Datenquelle mehr vorhanden. Für einen solchen Fall wurde vom Verfasser das Java-Programm TreeSnatcher Plus entwickelt. Damit wurde die Abbildung der Phylogenie digitalisiert und in einen Newick-Ausdruck umgewandelt.
Um sich den eingangs gestellten Fragen zu nähern, wurde die Verteilung der anzestralen Gengehalte der Verteilung der rekonstruierten essentiellen Nährstoffe auf den Phylogenien von E. coli und Salmonellen gegenübergestellt. Die These war, daß LGT auf dem Stammbaum nicht mit gleichmäßiger Rate geschehen ist, sondern daß die betrachteten Bakterien immer dann die Fähigkeit erworben (verloren) haben, bestimmte essentielle Nährstoffe aus der Umwelt metabolisch zu nutzen, wenn sie gleichzeitig Gene hinzugewonnen (abgegeben) haben. Das für diese Untersuchung konzipierte Verfahren lieferte mathematisch assoziierte Gen/Nährstoff-Paarungen, die auch biologisch sinnvoll sind. Neben untersuchenswerten Paaren mit hypothetischen Proteinen befanden sich in der Ergebnisliste insbesondere auch Paare aus Nährstoff und dem Gen für den entsprechenden Transporter - eine Information, die so nicht explizit in den Eingangsdaten vorhan-den gewesen ist. Das Verfahren lieferte also eine Mehrzahl von Ergebnissen, die die o. g. These unterstützen.
Die Evolution von Bakterien wird möglicherweise auch von Änderungen in ihrem Lebensstil mitgestaltet. So ist vorstellbar, daß sich apathogene E. coli an einen Lebensstil als Pathogene anpaßten, indem sie verstärkt Gene aufnahmen oder abgaben. In einer zweiten Analyse wurde diese Hypothese untersucht. Die Ergebnisse deuten an, daß Lebensstil-Änderungen bei E. coli tatsächlich von einer erhöhten Rate von Gen-Änderungen begleitet waren.

The elucidation of the causes of the pathogenicity of many strains of Escherichia coli and of all Salmonella who are close relatives of E. coli, is of great importance for medical research. Bacteria evolve continually, which complicates the treatment of the diseases caused by them. They exchange resistances against antibiotics by means of lateral gene transfer (LGT), which plays a major role in bacterial evolution. However, it makes the derivation of phylogenies difficult. Can we understand what drives the evolution of E. coli by LGT? How is LGT influenced by the living environment of the bacteria?
First of all, statistically robust phylogenies are required as on them ancestral gene presence/absence patterns will be estimated using Maximum Parsimony. By means of MMN, a Perl program developed for this thesis, Maximum Likelihood phylogenies based on concatenated universal gene families were inferred. The E. coli phylogeny contains 61 of the 63 fully sequenced genomes, the Salmonella phylogeny all 25 (as of 9/2013). They were compared with phylogenies that have been inferred with two other methods, which aim to reduce the effect of LGT on phylogeny inferences. The first method ("iTol") is based on selected COGs, the other ("Maslov") uses as distance measure the number of recombinant regions between two genomes. Both delivered - contrary to expectation - statistically insufficiently supported phylogenies that differ significantly from the phylogenies obtained with Maximum Likelihood.
Two lineage trees that are subjectively perceived as similar, are not recognized by the popular distance methods, in particular the split distance, as similar. The distance measure ssRF has been designed which eliminates this drawback. It only considers as significant perceived splits in its distance calculation. In this work, it was used for the comparisons of the phylogenies.
For one of the studied phylogenies no machine-readable data source was present. For such a case, the author had developed the Java program TreeSnatcher Plus. It was used to digitize the phylogeny that was contained in a picture and to convert it into a Newick expression.
To approach the questions asked at the outset, the distribution of ancestral gene content was compared to the distribution of the reconstructed essential nutrients on the phylogenies of E. coli and Salmonella. The hypothesis was that LGT has not occurred on the family tree at an even rate, but that the bacteria always acquired (lost) the ability to use certain essential nutrients from the environment metabolically whenever they simultaneously gained (lost) genes. The procedure that were designed for this study yielded mathematically associated gene/nutrient pairings that are biologically meaningful. In addition to pairs with hypothetical proteins worth investigating there were also pairs of nutrient and the gene for the corresponding transporter - information that has not explicitly been present in the input data. Thus, the method provided a plurality of results that support the above hypothesis.
The evolution of bacteria might be shaped also by changes in their lifestyle. Thus, it is conceivable that non-pathogenic E. coli adapted to a lifestyle as pathogens by accepting or donating genes with an increased rate. In a second analysis of this hypothesis has been investigated. The results indicate that lifestyle changes in E. coli were indeed accompanied by an increased rate of gene changes.
Lizenz:In Copyright
Urheberrechtsschutz
Bezug:Januar 2010 - Juli 2014
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät » WE Informatik » Bioinformatik
Dokument erstellt am:16.12.2014
Dateien geändert am:16.12.2014
Promotionsantrag am:09.07.0014
Datum der Promotion:11.12.0014
english
Benutzer
Status: Gast
Aktionen