Dokument: Algorithms for Improving the Predictive Power of Flux Balance Analysis

Titel:Algorithms for Improving the Predictive Power of Flux Balance Analysis
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=38719
URN (NBN):urn:nbn:de:hbz:061-20160627-143711-6
Kollektion:Dissertationen
Sprache:Englisch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor:Dr Desouki, Abdelmoneim [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]1,37 MB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 22.06.2016 / geändert 22.06.2016
Stichwörter:FBA cycleFreeFlux molecular crowding gene expression
Dewey Dezimal-Klassifikation:500 Naturwissenschaften und Mathematik » 510 Mathematik
Beschreibungen:Beschränkungs-basierte Methoden zu metabolischen Modellierung (insbesondere die Flux-Balance-Analyse, FBA) werden routinemäßig für die Vorhersage metabolischer Phänotypen eingesetzt, etwa zur Berechnung von Wachstumsraten, der ATP-Ausbeute oder der Fitness von Gen-Knockouts. Trotz der Leistungsfähigkeit der FBA hat diese Methode einige wichtige Anwendungsgrenzen. FBA-Lösungen sind nicht eindeutig bestimmt und können thermodynamisch unmögliche interne Zyklen beinhalten. FBA ignoriert die Regulation von Genen, weshalb FBA-Lösungen eventuell experimentell bestimmten Genexpressions-Zuständen widersprechen. Entscheidend für die Limitierungen der FBA ist die Tatsache, dass diese Methode wichtige biologische Beschränkungen ignoriert. Insbesondere beschränkt das begrenzte Volumen der Zelle die Menge an Proteinen, die gleichzeitig exprimiert werden können, ein Phänomen, das häufig als molekulare Verdrängung (molecular crowding) bezeichnet wird. In dieser Dissertation führe ich drei verschiedene Arten ein, mit Hilfe derer die Flux-Balance-Analyse verbessert werden kann.
Die erste Verbesserung eliminiert thermodynamisch unmögliche Zyklen. Sie basiert auf einem schnellen Nachverarbeitungsschritt für beschränkungs-basierte Lösungen. Der Algorithmus CycleFreeFlux entfernt interne Zyklen von einer beliebigen Flussverteilung v(0), ohne diejenigen Flüsse zu verändern, die nicht an Zyklen beteiligt sind. Das Verfahren arbeitet über die Minimierung der Summe der Flussbeträge ||v||1. Sie benötigt lediglich einen linearen Optimierungsschritt und ist damit im Vergleich zu alternativen Strategien ausgesprochen effizient in Bezug auf seine Laufzeit.
Die zweite Verbesserung der FBA, ccFBA (für capacity-constrained FBA, Kapazitäts-beschränkte FBA), stellt einen Rahmen für die Konvertierung eines beliebigen vollständigen FBA-Modells in ein Model für metabolische Modellierung unter Berücksichtigung der Enzymkinetik (MOMENT) zur Verfügung, welches die Beschränkung durch molekulare Verdrängung berücksichtigt. Ich stelle eine verbesserte Implementierung für das Bakterium E. coli sowie die erste Implementierung überhaupt für die Hefe Saccharomyces cerevisiae zur Verfügung. ccFBA ist eine Erweiterung von sybil, einer Bibliothek für effiziente beschränkungs-basierte Modellierung in der Umgebung für statistische Berechnungen R. ccFBA verbessert die ursprüngliche Version von MOMENT, indem sie multifunktionale Enzyme zwischen den verschiedenen von ihnen katalysierten Reaktionen aufteilt. Obwohl die verbesserte Implementierung für E. coli kinetische Konstanten für 117 zusätzliche Enzyme enthält, zeigen die vorhergesagten Wachstumsraten auf verschiedenen Kohlenstoffquellen dennoch eine sehr viel geringere Variation als die entsprechenden experimentellen Werte; diese Diskrepanz ist vermutlich auf die Umgebungs-abhängige Expression von Proteinen in Vorbereitung auf Umgebungsveränderungen zurück zu führen, ein wichtiges, aber noch weitgehend unverstandenes Phänomen des mikrobiellen Metabolismus.
Schließlich führe ich noch drei neuartige Methoden ein, die Transkriptom- oder Proteomdaten verwenden, um metabolische Flüsse auf Genomskala vorherzusagen. Die erste dieser Methoden bezeichne ich als FECorr. FECorr fitted stückweise lineare Funktionen an die Beziehung zwischen experimentell beobachteter Genexpression und den aus Simulationen erhaltenen möglichen Wertebereich des Flusses der entsprechenden Reaktion. Dafür nutzt es Genexpressionsdaten aus verschiedenen Experimenten simultan. Die Flussverteilungen, die so vorhergesagt werden, zeigen eine bessere Übereinstimmung mit gemessenen Flusswerten als alle anderen Methoden, die in einer kürzlich publizierten Vergleichsstudie untersucht wurden. Die zweite von mir eingeführte Methode in diesem Teil der Dissertation wird als ATM-FBA bezeichnet. Sie identifiziert automatisch die optimalen Grenzwerte, um aktive von nicht-aktiven Genen und Reaktionen zu unterscheiden. ATM-FBA macht ebenfalls etwas bessere Vorhersagen als zuvor publizierte Methoden, die Genexpressiondaten verwenden. Die dritte neue Methode ist eFBA-gene. Ähnlich wie andere Methoden benutzt diese einen konstanten Grenzwert als Eingabe und formuliert ein Mixed-Integer lineares Problem (MILP) mit dem Ziel, die Diskrepanz zwischen Expressionsdaten und vorhergesagten Flüssen zu minimieren. Im Gegensatz zu anderen Methoden bewertet eFBA-gene jedoch die Übereinstimmung zwischen simulierten Flüssen und Genexpressiondaten nicht pro Reaktion sondern pro Gen. Für bestimmte Kombinationen aus Genexpressions- und Fluss-Grenzwert macht auch eFBA-Gen bessere Vorhersagen als vergleichbare Methoden.

Constraint-based metabolic modeling methods such as Flux Balance Analysis (FBA) are routinely used to predict metabolic phenotypes, e.g. growth rates, ATP yield or the fitness of gene knockouts. In this thesis, I introduce three different ways to improve Flux Balance Analysis predictions.

In the first, we propose a simple postprocessing of constraint-based solutions, which removes internal cycles from any given flux distribution v(0) without disturbing other fluxes not involved in the loops. This new algorithm, termed CycleFreeFlux, works by minimizing the sum of absolute fluxes ||v||1 while (i) conserving the exchange fluxes and (ii) using the fluxes of the original solution to bound the new flux distribution. This strategy reduces internal fluxes until at least one reaction of every possible internal cycle is inactive, a necessary and sufficient condition for the thermodynamic feasibility of a flux distribution. Our method requires only one additional linear optimization, making it computationally very efficient compared to alternative strategies.

The second proposed improvement provides a framework to convert any complete FBA model into a model accounting for molecular crowding of enzymes (MOMENT), with implementations for Escherichia coli and Saccharomyces cerevisiae. This algorithm improves previous approaches by partitioning multifunctional enzymes between the different reactions that they catalyze, and by adding kinetic constants for 117 E. coli reactions. However, predicted E. coli growth rates across different carbon sources still show much less variation than observed experimentally.

The final part of the thesis introduces three novel methods that use transcriptomic or proteomic data to predict internal metabolic fluxes. The first method fits piecewise linear relationships between gene expression and flux values across several experiments, resulting in more accurate flux predictions than previous methods. The second method uses an automatic threshold to distinguish active from non-active genes, which also leads to a slight improvement over previous approaches. The third method minimizes the discrepancy between measured gene states and predicted gene states based on predicted fluxes; this differs from all previous algorithms, which instead minimize the discrepancy between reaction states. For some parameter settings, this method also outperforms other expression-based methods.
Lizenz:In Copyright
Urheberrechtsschutz
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät » WE Informatik » Bioinformatik
Dokument erstellt am:27.06.2016
Dateien geändert am:27.06.2016
Datum der Promotion:16.06.2016
Gültig ab:20.06.2016
english
Benutzer
Status: Gast
Aktionen