Dokument: Von Genotyp zu Phänotyp: Identifizierung von Beziehungen zwischen mikrobiellen Eigenschaften und genetischen Merkmalen

Titel:Von Genotyp zu Phänotyp: Identifizierung von Beziehungen zwischen mikrobiellen Eigenschaften und genetischen Merkmalen
Weiterer Titel:From genotype to phenotype: inferring relationships between microbial traits and genomic components
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=42035
URN (NBN):urn:nbn:de:hbz:061-20170427-113814-8
Kollektion:Dissertationen
Sprache:Englisch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor:MSc. Weimann, Aaron [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]8,07 MB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 15.04.2017 / geändert 15.04.2017
Beitragende:Prof. Dr. Lercher, Martin [Gutachter]
Prof. Dr. McHardy, Alice [Gutachter]
Stichwörter:microbial traits, phenotypes, support vector machines, phyletic patterns, ancestral trait reconstruction, metagenomics, genotype-phenotype inference, single-cell genomics, plant biomass degradation, cellulosic biofuels, pseudomonas aeruginosa, antibiotic resistance
Dewey Dezimal-Klassifikation:000 Informatik, Informationswissenschaft, allgemeine Werke » 004 Datenverarbeitung; Informatik
Beschreibungen:Bakterien besiedeln alle vorstellbaren Lebensräume. Solche, in denen sehr extreme Umweltbedingungen vorherrschen (z.B. in heißen Thermalquellen) genauso wie im Verdauungstrakt von Rindern und Menschen. Indem sich Bakterien an solche Lebensräumen angepasst haben, haben sie im Laufe der Evolution ein Arsenal von Enzymen hervorgebracht, das in verschiedensten Stoffwechselwegen zum Einsatz kommt. Manche solcher Enzyme fördern sogar unsere Verdauung oder können zur Optimierung von biotechnologischen Prozessen eingesetzt werden. Andere Enzyme dagegen haben eine schädliche Wirkung, z.B. Virulenzfaktoren von Krankheitserregern. Das Verständnis des funktioniellen Potentials solcher Bakterien ermöglicht es, Fragestellungen in der Biotechnologie und in der Infektionsforschung zu adressieren. Das ist besonders wichtig, da mehr und mehr pathogene Organismen Antibiotikaresistenzen entwickeln, die zu Todesfällen und hohen ökonomische Kosten führen.

Die Fortschritte bei Hochdurchsatz-Sequenziertechnologien haben zu einem rapiden Anstieg der Anzahl der sequenzierten bakteriellen Genome geführt. Für viele diese Genome, ist das funktionelle oder pathogene Potential noch nicht bekannt. Um einen Nutzen aus diesen großen Datenmengen zu ziehen, bedarf es ausgeklügelter Techniken zur Datenauswertung, die die bereits existierenden Genomannotationen gezielt ausnutzen können. Dazu gehören auch Ansätze, die systematisch Genotyp und Phänotyp von Bakterien in Beziehung setzen, die dann auch eingesetzt werden können, um das phänotypische Potential von neu sequenzierten Bakterien zu bestimmmen.

In einem ersten Ansatz haben wir die genetischen Ursprünge des bakteriellen Pflanzen-Biomasseabbaus untersucht. Enzyme, die in den Genomen solcher bakterieller Biomasse-Abbauer codiert sind, können in der biotechnologischen Umsetzung von Pflanzenmaterial in Biotreibstoff eingesetzt werden, der langfristig konventionelle klimaschädliche fossile Treibstoffe ersetzen könnte. Hierzu haben wir ein L1-regularisiertes L2-penalisiertes Stützvektor-Verfahren eingesetzt, um einen akuraten Phänotyp-Klassifikator basierend auf den Proteinfamilien-Profilen der Genome eines großen und kuratierten Datensatzes von Pflanzen-Biomasseabbauern zu entwickeln. Auf Basis dieses Klassifikators konnten wir mittels Methoden zur Merkmalsidentifizierung Enzym-Proteinfamilien finden. Teils solche, die schon durch physiologische und biochemische Tests mit dem Abbau von pflanzlicher Biomasse in Verbindung gebracht wurden, andererseits aber auch uncharakterisierte Proteinfamilien, die aussichtsreiche Kandidaten für die tiefergehende biochemische Charakterisierung darstellen.

Zweitens haben wir Traitar entwickelt, ein Programm, um gleichzeitig viele Phänotypen anhand von einem Genom vorherzusagen. Die Phänotypen, die mit Traitar klassifiziert werden können, decken viele Aspekte des bakteriellen Metabolismus ab, wie zum Beispiel die Nutzung von verschiedensten Substraten als Kohlenstoff- und Energiequelle, dem Sauerstoffbedarf, Morphologie, Antibiotikaresistenzen, Proteolyse und weitere Enzymaktivitäten. Traitar bietet zwei verschiedene Vorhersagemodi: Einer basierend auf Profilen von Proteinfamilien und ein weiterer, der auch die evolutionäre Geschichte der Proteinfamilien berücksichtigt. Traitar wurde zuerst trainiert und anschließend gründlich auf Phänotypen und Genomen von 572 Spezies aus 8 Phyla evaluiert. Ferner benötigt Traitar zur Vorhersage nur Merkmale, die direkt aus den Genomsequenzen berechnet werden können, und ist dabei für die rapide ansteigende Anzahl von Genomen einsetzbar, egal, ob diese aus einzelnen Zellen, Isolaten oder Metagenomen stammen.

Zuletzt haben wir die genetischen Faktoren von Antibiotikaresistenzen in Pseudomonas aeruginosa mit Hilfe von logistischer Regression untersucht. Hierzu haben wir Expressions- und Mutationsprofile einer großen Anzahl von Isolaten verwendet. Wir konnten die Resistenzen gegen fünf Antibiotika akurat vorhersagen und haben dabei bekannte Resistenzmarker aber auch uncharakterisierte Proteine identifiziert, die weitere Einblicke in die Resistenzmechanismen der unterschiedlichen Antibiotika gewähren könnten.

Zusammenfassend erlauben die hier präsentierten Methoden, das phänotypische Potential von Bakterien basierend auf ihrem Genom zu studieren. Indem die Genotyp-Phänotyp-Assoziationen für biotechnologisch wichtige Phänotypen aufgedeckt werden, könnten in Zukunft neue Enzyme mit Einsatzmöglichkeiten in industriellen Prozessen gefunden werden. Genauso haben die Biomarker, die für die Antibiotikaresistenzen gefunden wurden das Potential, die Therapie und Diagnostik von multiresistenten Keimen wie \emph{P. aeruginosa} zu verbessern.

Bacteria live in almost any imaginable environment, from the most extreme environments (e.g. in hydrothermal vents) to the bovine and human gastrointestinal tract. By adapting to such diverse environments, they have developed a large arsenal of enzymes involved in a wide variety of biochemical reactions. While some such enzymes support our digestion or can be used for the optimization of biotechnological processes, others may be harmful -- e.g. mediating the roles of bacteria in human diseases. Thus, understanding the functional potential of bacteria holds promises for biotechnology and for addressing important questions in the treatment of bacterial infections. This is especially true, as more and more pathogens develop resistances to available antimicrobial drugs, causing deaths and large economic costs.

Due to advances in high-throughput DNA sequencing, the number of sequenced bacterial genomes is growing rapidly. For many of these, their functional or pathogenic potential is not known. Making use of these data sets requires sophisticated interpretation techniques that leverage existing genome annotations, including methods to systematically deduce bacterial genotype-phenotype associations, which can then be used to determine the phenotypic potential of newly sequenced genomes. In this thesis I describe three such approaches that use machine learning techniques for relating bacterial phenotypes to their genotypes, with applications in infection research and biotechnology.

First, we were interested in learning the genetic determinants of bacterial plant biomass degradation. Enzymes encoded in the genomes of plant biomass degrading bacteria can be used in the biotechnological conversion of plant material into biofuels, which could eventually replace climate-damaging fossil fuels. We used an L1-regularized L2-penalized support vector machine to learn an accurate phenotype classifier based on the profiles of protein families from the genomes of a large and manually curated set of plant biomass degraders. Based on feature selection from the obtained phenotype model, we identified protein families of enzymes known by physiological and biochemical tests to be implicated in the degradation of various components of plant biomass, as well as uncharacterized protein families, which represent targets for biochemical characterization.

Second, we developed Traitar, a multi-trait prediction software. The traits available for classification in Traitar cover many aspects of the bacterial metabolism, such as use of various substrates as carbon and energy sources, oxygen requirement, morphology, antibiotic susceptibility, proteolysis and other enzymatic activities. Traitar provides two prediction modes: one based on the profiles of protein families and one also incorporating the evolutionary history of protein families. The phenotype classifiers provided by Traitar were trained and rigorously evaluated on phenotypes and genomes from 572 species of 8 phyla. Traitar only requires features that can be computed directly from the genome sequences and is applicable to the rapidly increasing number of genomes recovered from single cells, isolates, and metagenomes

Last, we learned the determinants of multi-drug resistance of Pseudmonas aeruginosa by employing a logistic regression classifier. Here, we used expression and mutational profiles from a large set of clinical isolates. We could accurately predict the resistance to five different antibiotics and identified known resistance markers, as well as uncharacterized proteins that might provide further insights into the resistance acquisition mechanisms.

In summary, the methods presented in this thesis allow to study the phenotypic potential of bacteria based on their genomes. Uncovering the genotype-phenotype associations for biotechnologically important traits may aid in the discovery of novel enzymes that can be employed in industrial processes. Similarly, biomarkers of antibiotic resistance could improve the selection of antibiotics in patient therapy.
Lizenz:In Copyright
Urheberrechtsschutz
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät » WE Informatik » Algorithmische Bioinformatik
Dokument erstellt am:27.04.2017
Dateien geändert am:27.04.2017
Promotionsantrag am:29.08.0016
Datum der Promotion:24.02.0017
english
Benutzer
Status: Gast
Aktionen