Dokument: Computational methods for studying posttranscriptional gene regulation in cancer from PAR-CLIP and RNA-Seq data
Titel: | Computational methods for studying posttranscriptional gene regulation in cancer from PAR-CLIP and RNA-Seq data | |||||||
Weiterer Titel: | Computer-gestützte Methoden zur Erforschung von post-transkriptionellen Gen-Regulation in Krebs durch PAR-CLIP und RNA-Seq Daten | |||||||
URL für Lesezeichen: | https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=42264 | |||||||
URN (NBN): | urn:nbn:de:hbz:061-20170621-100435-2 | |||||||
Kollektion: | Dissertationen | |||||||
Sprache: | Englisch | |||||||
Dokumententyp: | Wissenschaftliche Abschlussarbeiten » Dissertation | |||||||
Medientyp: | Text | |||||||
Autor: | Klötgen, Andreas [Autor] | |||||||
Dateien: |
| |||||||
Beitragende: | Prof. Dr. McHardy, Alice [Gutachter] Prof. Dr. Borkhardt, Arndt [Gutachter] Prof. Dr. Schwender, Holger [Gutachter] | |||||||
Dewey Dezimal-Klassifikation: | 500 Naturwissenschaften und Mathematik » 570 Biowissenschaften; Biologie | |||||||
Beschreibungen: | Krebs ist eine komplexe Krankheit, die durch eine maligne Transformation von Zellen verschiedensten Ursprungs entsteht. Krebs verursacht etwa 13% aller Todesfälle weltweit pro Jahr. Die entscheidenden molekularen Veränderungen, die einen Tumor auslösen können, sind zwischen Tumoren aus verschiedenen Geweben sehr unterschiedlich. Die molekularen Veränderungen sind unter anderem chromosomale Verkürzungen, Punktmutationen, abnormale DNA-Methylierungsmuster, Gen-Verlust/Duplizierung oder abnormale Expressions-Profile von RNAs oder Proteinen. Die betroffenen Gene gehören überwiegend zu den sogenannten Onkogenen und Tumorsuppressoren, deren Funktionen alle Ebenen der Genregulation betreffen, von transkriptioneller Kontrolle und posttranskriptioneller Regulation bis zu translationaler Kontrolle. Die vorliegende Doktorarbeit beschäftigt sich dabei ausschließlich mit der Analyse von posttranskriptioneller Genregulation in Tumoren, welche überwiegend durch RNA-bindende Protein (RBPs) und nicht-kodierende RNAs beeinflusst wird. Allerdings erschwert das komplexe Zusammenspiel dieser verschiedenen Regulationsebenen eine genomweite Vorhersage für entscheidende genomische Abnormalitäten. Daher ist eine Datenintegration von Datensätzen, die verschiedene Ebenen der Genregulation analysieren, von entscheidender Bedeutung um tiefere Einblicke in die Tumor-Biologie zu erhalten.
In den letzten Jahren haben Verbesserungen in Sequenziertechnologien weitreichendere Analysen ermöglicht. Die Sequenziertechnologien der sogenannten nächsten Generation ermöglichen so heute genomweite Vorhersagen für Mutationen, transkriptomweite Charakterisierung von Expressionsprofilen, genomweite Identifikation von RNA-Bindestellen eines RBPs und vieles mehr. Diese Doktorarbeit beschäftigt sich mit Verbesserungen für die computergestützte Analyse von „photoactivatable ribonucleoside-enhanced crosslinking and immunoprecipitation“ (PAR-CLIP) Daten, welche das gebundene „RNA-Netzwerk“ eines RBPs erfassen können. Diese Arbeit beinhaltet zudem die Analyse von RNA-Sequenzdaten (RNA-Seq) für Posttranscriptional gene regulation in cancer kodierende und nicht-kodierende Gene und die Integration von PAR-CLIP und RNA-Seq Daten zur Verknüpfung der verschienenen Ebenen der Genregulation. Die Modifikation des Sequenzier-Read Aligners BWA (Burrows-Wheeler Aligner) für die hier entwickelte PAR-CLIP analyzer suite (PARA-suite) ist speziell für die Datenauswertung von PAR-CLIP konzipiert. Der modifizierte Algorithmus der PARA-suite bezieht ein empirisch ermitteltes Fehlerprofil in das Alignment mit ein, um PAR-CLIP spezifische Nukleotid-Konversionen im Alignmentprozess besser zu berücksichtigen. Die PARA-suite konnte damit die Detektion von RNA-Bindestellen für RBPs aus PAR-CLIP Daten entscheidend verbessern. Die PARA-suite wurde zur Analyse eines AGO-PAR-CLIP Experimentes im Rahmen des International Cancer Genome Consortium Project “Determining Molecular Mechanisms in Malignant Lymphoma by Sequencing” (ICGC MMML-Seq) verwendet. Dadurch konnten gebundene mRNAs von AGO2, einem Protein des sogenannten „RNA-induced silencing complex“ (RISC), identifiziert werden. Das RISC ist entscheidend für miRNA-induzierte posttranskriptionelle Genregulation. Durch dieses Projekt konnten posttranskriptionelle Regulationen durch miRNAs erkannt werden, dessen Ziel-mRNAs zuvor bereits in verschiedenen Lymphom-Typen mit der Tumorgenese assoziiert wurden. Die weitere RNA-Sequenzierung einer großen Kohorte an Lymphom-Patienten ermöglichte die Erkennung differentiell exprimierter miRNAs und mRNAs. Durch die Kombination all dieser Informationsebenen konnten negative Expressions-Korrelationen zwischen den verifizierten miRNA-mRNA Regulationspaaren erkannt werden, welche relevant für die Tumorentwicklung sind. Diese Arbeit beschäftige sich zudem mit der differenzierenden Analyse von T Zell akuter lymphoblastischer Leukämie (T-ALL) in Neugeborenen im Vergleich zu jugendlichen Patienten. Basierend auf RNA-Sequenz Daten für kodierende und nicht-kodierende Gene konnten negative Expressions-Korrelationen zwischen miRNA-mRNA Paaren erkannt werden. Diese zeigten ebenso die Bedeutung von epigenetischen Regulationen von Onkogenen und Tumorsuppressoren in T-ALL auf.Cancer is a complex disease that arises from malignant transformations of cells from various origins. It is one of the leading causes for deaths and accounts for approximately 13% of all deaths per year world-wide. The driving molecular dysfunctions leading to tumors are diverse and vary among tumors originating from different tissues. These driving dysfunctions include amongst others chromosomal shortenings, point mutations, aberrant DNA methylation patterns, gene gains and losses or aberrant expression profiles of RNAs and proteins. The affected genes mainly belong to the classes of oncogenes and tumor suppressors. Their functions include all levels of gene regulation, from transcriptional control and posttranscriptional regulation to translational control. This thesis focuses on posttranscriptional gene regulation in cancer, which is mainly mediated by RNA-binding proteins (RBPs) and non-coding RNAs. However, the complex interplay between these regulators makes it difficult to predict the consequences of driving aberrations (i.e. affected oncogenes or tumor suppressors). Thus data integration of datasets analyzing different levels of regulation is important for gaining deeper insights into tumor biology. During recent years, the rapid advances in sequencing technologies and its diverse applications enabled a wide range of analyses. Next-generation sequencing is nowadays available for the genome-wide identification of mutations, for the transcriptome-wide characterization of expression profiles, the genome-wide identification of RNA binding sites for RPBs and much more. This thesis deals with the improvement of computational methods for photoactivatable ribonucleoside-enhanced crosslinking and immunoprecipitation (PAR-CLIP) data analysis, which reveals the bound “RNA network” of a given RBP. The second part focuses on the analysis of RNA sequencing expression data (RNA-Seq) from coding and non-coding genes and the integration of PAR-CLIP and RNA-Seq data, which identified connections between the different regulatory levels. A modification of the sequencing read aligner BWA (Burrows-Wheeler Aligner) specific for PAR-CLIP data, was implemented in the here described Posttranscriptional gene regulation in cancer PAR-CLIP analyzer suite (PARA-suite). The modified algorithm takes an empirical error profile into account to accommodate for PAR-CLIP specific nucleotide conversions. The PARA-suite obtained a higher accuracy than other read aligners in the detection of RNA-binding sites on the basis of simulated PAR-CLIP data. The PARA-suite was applied to an AGO-PAR-CLIP dataset obtained within a project of the International Cancer Genome Consortium Project “Determining Molecular Mechanisms in Malignant Lymphoma by Sequencing” (ICGC MMML-Seq). This analysis revealed mRNAs targeted by AGO2, which is a core member of the RNA-induced silencing complex (RISC). The RISC is important for miRNA-mediated posttranscriptional gene regulation. Thereby, mRNA targets were identified that were specifically regulated by miRNAs and were recently associated with lymphomagenesis of different lymphoma subtypes. Further RNA-Seq analysis of a large cohort of lymphoma patients revealed differentially expressed miRNAs and mRNAs between heterogeneous lymphoma subtypes. The RNA-Seq results were combined with the miRNA-mRNA interaction pairs from the AGO-PAR-CLIP results. This enabled the calculation of negative expression correlations between the differentially expressed miRNAs and mRNAs on the basis of the RNA-Seq expression data. This approach identified lymphoma relevant miRNA-mRNA correlation pairs. This thesis also includes a differential analysis of infant T-cell acute lymphoblastic leukemia (T-ALL) in comparison to incidences during childhood. On the basis of RNA-Seq data for coding and non-coding genes, negative correlations of miRNA-mRNA expressions were measured between the two cohorts. This analysis revealed important epigenetic regulations of oncogenes and tumor suppressors in T-ALL. | |||||||
Lizenz: | Urheberrechtsschutz | |||||||
Fachbereich / Einrichtung: | Mathematisch- Naturwissenschaftliche Fakultät » WE Informatik » Algorithmische Bioinformatik | |||||||
Dokument erstellt am: | 21.06.2017 | |||||||
Dateien geändert am: | 21.06.2017 | |||||||
Promotionsantrag am: | 10.10.2016 | |||||||
Datum der Promotion: | 24.04.2017 |