Dokument: Bioinformatische Analysen zur Rekonstruktion tiefer phylogenomischer Stammbäume und Netzwerke am Beispiel früher evolutionärer Ereignisse

Titel:Bioinformatische Analysen zur Rekonstruktion tiefer phylogenomischer Stammbäume und Netzwerke am Beispiel früher evolutionärer Ereignisse
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=26170
URN (NBN):urn:nbn:de:hbz:061-20130702-093308-5
Kollektion:Dissertationen
Sprache:Deutsch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor: Röttger, Mayo [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]13,45 MB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 01.07.2013 / geändert 01.07.2013
Beitragende:Prof. Dr. Martin, William [Gutachter]
Prof. Dr. Lercher, Martin [Gutachter]
Dewey Dezimal-Klassifikation:500 Naturwissenschaften und Mathematik » 570 Biowissenschaften; Biologie
Beschreibungen:Phylogenetische und phylogenomische Analysen werden durch eine Vielzahl an Fehlerquellen beeinflusst, die zu Rekonstruktionsartefakten und Fehlinterpretation der tatsächlich stattgefundenen evolutionären Ereignisse führen können. Die betroffenen Schritte sind: Clusteranalyse, anschließendes Alignment orthologer Sequenzen, sowie die Rekonstruktion der Stammbäume.

Ein Beispiel, welches die inhärenten Probleme bei der Aufklärung tiefster Divergenzen in Stammbäumen verdeutlicht ist die Frage nach der ältesten Verzweigung in der Evolutionsgeschichte der Prokaryoten. Untersuchungen zur Bestimmung der Position einer Wurzel innerhalb einer prokaryotischen Phylogenie kamen bisher zu sehr widersprüchlichen Ergebnissen. In der vorliegenden Arbeit wurde ein verbreitetes Verfahren zur Gruppierung orthologer Sequenzen dazu verwendet, Proteinfamilien unterschiedlicher Altersgruppen zu generieren. Die aus dem Vergleich dieser Gruppen ermittelten Aufteilungsinformationen wurden zur Rekonstruktion phylogenetischer Netzwerke verwendet, auf deren Basis die Wurzel im Stammbaum der Prokaryoten zuverlässig zwischen Archaebakterien und Eubakterien, als die beiden ältesten Gruppen, bestimmt werden konnte. Fehleranfällige Schritte, wie die Rekonstruktion von Sequenzalignments und Stammbäumen, wurden dabei vermieden. Außerdem wurde gezeigt, dass es für die betrachteten Sequenzen nur einige wenige prokaryotische Gruppen mit erhöhten relativen Evolutionsraten gab, die Archaebakterien jedoch, entgegen der Aussagen in anderen Studien, nicht zu diesen gehörten.

Auf der Stufe des Sequenzalignments können Artefakte statistisch hinreichend unterstützte und dennoch falsch rekonstruierte Stammbäume generieren. Unstimmige Äste zwischen Genbäumen und einem Referenzstammbaum der betrachteten Organismen werden häufig als Anzeichen lateralen Gentransfers gedeutet. Analysen im Rahmen dieser Arbeit deuteten darauf hin, dass vor allem problematische Alignments Unstimmigkeiten als Artefakte bei der phylogenetischen Rekonstruktion generieren. Untersuchungen anhand der Ergebnisse einer Studie zur Ableitung lateraler Gentransferereignisse, auf der Basis orthologer Genfamilien aus 144 prokaryotischen Genomen, zeigten, dass Veränderungen in den Eigenschaften der zugrundeliegenden Alignments die Anfälligkeit hierfür begünstigten und damit eine korrekte Ableitung der Stammbäume verhinderten. Allein mit Hilfe dieser Unterschiede in den Eigenschaften war es möglich, mit 80 prozentiger Sicherheit zu bestimmen, ob ein bestimmtes Genalignment hinreichend unterstützte unstimmige Äste generieren würde oder nicht, unabhängig von einem eventuell vorhandenen phylogenetischen Signal in den entsprechenden Sequenzen.

Die Bedeutung verlässlich erstellter Sequenzalignments zur Vermeidung von Artefakten in phylogenomischen Analysen wird noch einmal unterstrichen, wenn die Ableitung endosymbiotischer Gentransferereignisse vom Vorfahren der Plastiden in Algen- und Pflanzengenomen betrachtet wird.
In Abhängigkeit der Alignmentverlässlichkeit konnte ein großer Anteil von Genen endosymbiotischen Ursprungs in den untersuchten photosynthetischen Eukaryoten ermittelt werden. Die Suche nach einem Cyanobakterium mit der zu einem hypothetischen Vorfahren der Plastiden ähnlichsten Gensammlung ergab, dass eine Phylogenie auf der Basis universell verteilter kernkodierter Proteine cyanobakteriellen Ursprungs und ihrer cyanobakteriellen Homologe kein verlässliches Ergebnis zulässt. Die erzeugten Stammbäume sowie die zugrundeliegenden Alignments enthielten Anzeichen für wohlbekannte Artefakte in der Rekonstruktion von Stammbäumen. Aus diesem Grund wurden alternativ die Verteilungsmuster und die mittlere Sequenzidentität der Algen- und Pflanzengene cyanobakteriellen Ursprungs in cyanobakteriellen Genomen untersucht. Hierbei konnte eine hohe Ähnlichkeit zu den Gensammlungen der heutigen Untergruppen IV und V festgestellt werden.
Im Gegensatz zu allen anderen Cyanobakterien zeichnen sich deren Vertreter vor allem durch ihre zahlreichen Möglichkeiten der Zelldifferenzierung und der Möglichkeit molekularen Stickstoff in dafür spezialisierten Zellen zu binden, als eine sehr hoch entwickelte Gruppe aus. Sequenzanalysen ergaben, dass der komplexe filamentöse Phänotyp mit echten Verzweigungen der Untergruppe V vermutlich nur auf wenige Gene zurückzuführen ist, welche Einfluss auf Komponenten der Zellteilung ausüben. Aus universellen Proteinfamilien, die in allen untersuchten Genomen jeweils einfach kodiert vorlagen, wurde ein Stammbaum der Cyanobakterien erstellt. Dieser lässt einen Ursprung der oxygenen Photosynthese im Süßwasser vermuten und legt außerdem einen gemeinsamen Ursprung aller filamentösen Stämme nahe. Ein Netzwerk cyanobakteriellen Gentransfers auf Basis dieses Stammbaumes konnte zeigen, dass lateraler Gentransfer ein sehr häufiges Ereignis in der Evolution der Cyanobakterien darstellt, dabei jedoch selten viele Gene gemeinsam übertragen wurden. Die Verzerrung der cyanobakteriellen Phylogenie durch diesen verbreiteten Transfermechanismus konnte jedoch ausgeschlossen werden.

Phylogenetic and phylogenomic analyses are prone to copious sources of errors which can lead to reconstruction artifacts and misinterpretation of the true history of the evolutionary events that sequences in question have undergone.
Affected operations are mainly cluster analysis, alignment of orthologous sequences, and the reconstruction of evolutionary trees.

One example, which illustrates inherent problems in solving deep divergences in phylogenetic trees is the question concerning the most ancient split in the evolutionary history of prokaryotes. Up until now, studying the position of a root in the prokaryotic phylogeny lead to very conflicting results. We were able to use a familiar method for clustering orthologous sequences to generate protein families of different age groups. The genome split information derived from comparisons between these groups were used to reconstruct phylogenetic networks. On basis of these networks, the root in the evolutionary tree of prokaryotes could be robustly estimated between archaebacteria and eubacteria as being the oldest prokaryotic groups. Therefore, error-prone steps like reconstruction of sequence alignments and phylogenetic trees were avoided. Moreover, elevated evolutionary rates were shown to exist only in a few prokaryotic lineages, archaebacteria being none of these as had been consistently suggested before.

At the stage of sequence alignment, artifacts can generate statistically well supported yet erroneous reconstructed trees. Conflicting branches between gene trees and a reference phylogeny of the analyzed organisms are often interpreted as indicators of lateral gene transfers. Analyses under this study indicated that majorly problematic alignments are generating these conflicts as artifacts in the phylogenetic reconstruction. In the analyzed dataset, changes in alignment properties supported this vulnerability and therefore impeded reliable reconstruction of trees. Only by the observed differences in properties it was possible to predict with 80 percent certainty, if a particular alignment would generate sufficiently supported conflicting branches or not, disregarding the potentially existing phylogenetic signal in the respective sequences.

The importance of creating reliable sequence alignments to prevent artifacts in phylogenomic analyses is emphasized by the reconstruction of endosymbiotic gene transfer events from the ancestor of plastids into genomes of algae and plants. In dependance on alignment reliability, a hight proportion of genes of endosymbiotic origin could be estimated in the analyzed photosynthetic eukaryotic genomes. The attempt to identify the collection of genes with the highest similarity to that of a hypothetical ancestor of plastids among recent cyanobacterial genomes, based on a phylogeny of universally distributed nuclear encoded proteins of cyanobacterial origin and their cyanobacterial homologs, showed that this method can hardly be relied on. Reconstructed trees and underlying alignments proved to contain indicators of well known tree building artifacts. Hence, presence / absence patterns and average sequence identity of genes of cyanobacterial origin from algae and plants in cyanobacterial genomes were analyzed. Highest similarity could be observed with the collection of genes present in recent subsections IV and V.

From all other cyanobacteria, these representatives are distinguished by numerous capabilities in cell differentiation and the ability to fix molecular nitrogen in specialized cells as a highly evolved group of cyanobacteria. Analyzes revealed that the complex true-branching filamentous phenotype of subsection V members is presumably referable to a few genes which influence components of cell division. Universal protein families encoded in all studied genomes as single-copy genes, were used to reconstruct the cyanobacterial species tree. It supports the origin of oxygenic photosynthesis in fresh water environment and furthermore suggests a common ancestry of all filamentous strains. A cyanobacterial gene transfer network based on this backbone phylogeny marked lateral gene transfer as being a very frequent event in the evolution of cyanobacteria, however the coupled transfer of many genes was rare. A biased cyanobacterial species tree due to this prevailing transfer mechanism could be rejected.
Lizenz:In Copyright
Urheberrechtsschutz
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät » WE Biologie » Ökologische Pflanzenphysiologie
Dokument erstellt am:02.07.2013
Dateien geändert am:02.07.2013
Promotionsantrag am:03.05.2013
Datum der Promotion:19.06.2013
english
Benutzer
Status: Gast
Aktionen