Dokument: Strukturbasierte Beschreibung und Suche von RNA-Familien in genomischen Sequenzdaten

Titel:Strukturbasierte Beschreibung und Suche von RNA-Familien in genomischen Sequenzdaten
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=3037
URN (NBN):urn:nbn:de:hbz:061-20050204-001037-5
Kollektion:Dissertationen
Sprache:Deutsch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor: Gräf, Stefan [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]2,10 MB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 09.02.2007 / geändert 09.02.2007
Beitragende:Prof. Dr. Steger, Gerhard [Gutachter]
Prof. Dr. Wagner, Rolf [Gutachter]
Stichwörter:RNA, Muster, Suche, Sequenz, Struktur, hybride Muster, Bioinformatik, Hammerhead, RibozymeRNA, pattern, search, sequence, structure, hybrid pattern, bioinformatics, hammerhead, ribozyme
Dewey Dezimal-Klassifikation:500 Naturwissenschaften und Mathematik » 570 Biowissenschaften; Biologie
Beschreibung:

Im Zeitalter der Genomsequenzierungen wächst die Menge an Sequenzdaten exponentiell an. Eine Herausforderung ist es, in diesen großen Datenmengen funktionelle, jedoch nicht für Proteine kodierende Ribonukleinsäuren, sog. non-coding RNAs (ncRNAs), zu identifizieren. Die Suche nach ncRNA-Genen ist im Gegensatz zu jener nach Protein-kodierenden Genen deutlich schwieriger, da ihre Genstruktur nicht signifikant durch z.B. Splicestellen oder Leserahmen definiert ist. Jedoch bilden ncRNAs charakteristische Sekundär- und Tertiärstrukturen aus, auf denen die diversen strukturellen und funktionellen Aufgaben von ncRNAs basieren. Mit Hilfe einer Beschreibungssprache können diese für eine bestimmte RNA-Familie spezifischen Eigenschaften in einem Muster zusammengefasst werden, das dann mit dem zugehörigen Software-Werkzeug in Sequenzdaten gesucht werden kann.

Im Rahmen der hier vorliegenden Arbeit wurde ein solches System zur Sequenz- und Struktur-basierten Beschreibung und effizienten Suche von RNAs in großen Sequenzdatensätzen entwickelt und angewendet. Dazu wurde zunächst eine umfangreiche Musterbeschreibungssprache HyPaL (für Hybrid Pattern Language) definiert, mit der flexibel sog. hybride Muster (Hybrid Patterns, kurz HyPa) formuliert werden können. Hybride Muster kombinieren die Beschreibung von Konsensus-Sequenz- und Konsensus-Struktur-Motiven mit zusätzlichen Bewertungsfunktionen, wie z. B. für die thermodynamische Stabilität. Mit Hilfe von HyPaL wurde eine Bibliothek von hybriden Mustern (Hybrid Pattern Library, kurz HyPaLib) erstellt, die eine Vielzahl von einfachen und komplexen RNA-Motiven enthält (Gräf et al., 2001). Für die Suche mit hybriden Mustern wurde und wird in Zusammenarbeit mit der Arbeitsgruppe von Dr. Stefan Kurtz (Universität Hamburg) ein Suchwerkzeug namens HyPaSearch entwickelt, dass diese Muster effizient und schnell in großen Sequenzdatensätzen suchen kann. Durch erste Laufzeitvergleiche mit dem bereits existierenden Suchwerkzeug PatScan (D'Souza et al., 1997) konnte die Effizienz von HyPaSearch bestätigt werden. Zudem konnte im Rahmen dieser Arbeit der Einsatz des entwickelten Systems an einigen biologischen Anwendungsbeispielen erfolgreich demonstriert werden. So wurden beispielsweise genomisch kodierte RNAs in Dictyostelium discoideum gefunden, die intramolekular lange doppelsträngige Bereiche ausbilden können. Die Lokalisation einer überwiegenden Zahl dieser RNAs in antisense-Orientierung zu Exon-Bereichen lässt vermuten, dass diese RNAs die Expression der Proteine über einen RNA-Interferenz-Mechanismus post-transkriptionell regulieren (Gräf et al., 2004). Außerdem wurden im Genom von Arabidopsis thaliana erstmals natürlich vorkommende, funktionelle Hammerhead-Ribozyme gefunden. Diese werden in der Pflanze organspezifisch exprimiert und zeigen in vivo und in vitro katalytische Aktivität (Przybilski et al., 2005). Um das entwickelte HyPa-System der Allgemeinheit zur Verfügung zu stellen, wurde ein Datenbank-gestützter Webserver (http://onyx.biophys.uni-duesseldorf.de/hypa) eingerichtet, der die Musterbibliothek HyPaLib umfasst sowie Benutzerschnittstellen, welche die Suche mit hybriden Mustern in Sequenzdaten und die Auswertung von Mustersuchen ermöglichen.


Lizenz:In Copyright
Urheberrechtsschutz
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät » WE Biologie
Dokument erstellt am:04.02.2005
Dateien geändert am:12.02.2007
Promotionsantrag am:01.02.2005
Datum der Promotion:01.02.2005
english
Benutzer
Status: Gast
Aktionen