Dokument: Strukturbasierte Beschreibung und Suche von RNA-Familien in genomischen Sequenzdaten
Titel: | Strukturbasierte Beschreibung und Suche von RNA-Familien in genomischen Sequenzdaten | |||||||
URL für Lesezeichen: | https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=3037 | |||||||
URN (NBN): | urn:nbn:de:hbz:061-20050204-001037-5 | |||||||
Kollektion: | Dissertationen | |||||||
Sprache: | Deutsch | |||||||
Dokumententyp: | Wissenschaftliche Abschlussarbeiten » Dissertation | |||||||
Medientyp: | Text | |||||||
Autor: | Gräf, Stefan [Autor] | |||||||
Dateien: |
| |||||||
Beitragende: | Prof. Dr. Steger, Gerhard [Gutachter] Prof. Dr. Wagner, Rolf [Gutachter] | |||||||
Stichwörter: | RNA, Muster, Suche, Sequenz, Struktur, hybride Muster, Bioinformatik, Hammerhead, RibozymeRNA, pattern, search, sequence, structure, hybrid pattern, bioinformatics, hammerhead, ribozyme | |||||||
Dewey Dezimal-Klassifikation: | 500 Naturwissenschaften und Mathematik » 570 Biowissenschaften; Biologie | |||||||
Beschreibung: | Im Zeitalter der Genomsequenzierungen wächst die Menge an Sequenzdaten exponentiell an. Eine Herausforderung ist es, in diesen großen Datenmengen funktionelle, jedoch nicht für Proteine kodierende Ribonukleinsäuren, sog. non-coding RNAs (ncRNAs), zu identifizieren. Die Suche nach ncRNA-Genen ist im Gegensatz zu jener nach Protein-kodierenden Genen deutlich schwieriger, da ihre Genstruktur nicht signifikant durch z.B. Splicestellen oder Leserahmen definiert ist. Jedoch bilden ncRNAs charakteristische Sekundär- und Tertiärstrukturen aus, auf denen die diversen strukturellen und funktionellen Aufgaben von ncRNAs basieren. Mit Hilfe einer Beschreibungssprache können diese für eine bestimmte RNA-Familie spezifischen Eigenschaften in einem Muster zusammengefasst werden, das dann mit dem zugehörigen Software-Werkzeug in Sequenzdaten gesucht werden kann. Im Rahmen der hier vorliegenden Arbeit wurde ein solches System zur Sequenz- und Struktur-basierten Beschreibung und effizienten Suche von RNAs in großen Sequenzdatensätzen entwickelt und angewendet. Dazu wurde zunächst eine umfangreiche Musterbeschreibungssprache HyPaL (für Hybrid Pattern Language) definiert, mit der flexibel sog. hybride Muster (Hybrid Patterns, kurz HyPa) formuliert werden können. Hybride Muster kombinieren die Beschreibung von Konsensus-Sequenz- und Konsensus-Struktur-Motiven mit zusätzlichen Bewertungsfunktionen, wie z. B. für die thermodynamische Stabilität. Mit Hilfe von HyPaL wurde eine Bibliothek von hybriden Mustern (Hybrid Pattern Library, kurz HyPaLib) erstellt, die eine Vielzahl von einfachen und komplexen RNA-Motiven enthält (Gräf et al., 2001). Für die Suche mit hybriden Mustern wurde und wird in Zusammenarbeit mit der Arbeitsgruppe von Dr. Stefan Kurtz (Universität Hamburg) ein Suchwerkzeug namens HyPaSearch entwickelt, dass diese Muster effizient und schnell in großen Sequenzdatensätzen suchen kann. Durch erste Laufzeitvergleiche mit dem bereits existierenden Suchwerkzeug PatScan (D'Souza et al., 1997) konnte die Effizienz von HyPaSearch bestätigt werden. Zudem konnte im Rahmen dieser Arbeit der Einsatz des entwickelten Systems an einigen biologischen Anwendungsbeispielen erfolgreich demonstriert werden. So wurden beispielsweise genomisch kodierte RNAs in Dictyostelium discoideum gefunden, die intramolekular lange doppelsträngige Bereiche ausbilden können. Die Lokalisation einer überwiegenden Zahl dieser RNAs in antisense-Orientierung zu Exon-Bereichen lässt vermuten, dass diese RNAs die Expression der Proteine über einen RNA-Interferenz-Mechanismus post-transkriptionell regulieren (Gräf et al., 2004). Außerdem wurden im Genom von Arabidopsis thaliana erstmals natürlich vorkommende, funktionelle Hammerhead-Ribozyme gefunden. Diese werden in der Pflanze organspezifisch exprimiert und zeigen in vivo und in vitro katalytische Aktivität (Przybilski et al., 2005). Um das entwickelte HyPa-System der Allgemeinheit zur Verfügung zu stellen, wurde ein Datenbank-gestützter Webserver (http://onyx.biophys.uni-duesseldorf.de/hypa) eingerichtet, der die Musterbibliothek HyPaLib umfasst sowie Benutzerschnittstellen, welche die Suche mit hybriden Mustern in Sequenzdaten und die Auswertung von Mustersuchen ermöglichen. | |||||||
Lizenz: | Urheberrechtsschutz | |||||||
Fachbereich / Einrichtung: | Mathematisch- Naturwissenschaftliche Fakultät » WE Biologie | |||||||
Dokument erstellt am: | 04.02.2005 | |||||||
Dateien geändert am: | 12.02.2007 | |||||||
Promotionsantrag am: | 01.02.2005 | |||||||
Datum der Promotion: | 01.02.2005 |