Dokument: Next generation sequencing approaches to facilitate the breeding of barley and potato
Titel: | Next generation sequencing approaches to facilitate the breeding of barley and potato | |||||||
URL für Lesezeichen: | https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=60831 | |||||||
URN (NBN): | urn:nbn:de:hbz:061-20221006-114056-8 | |||||||
Kollektion: | Dissertationen | |||||||
Sprache: | Deutsch | |||||||
Dokumententyp: | Wissenschaftliche Abschlussarbeiten » Dissertation | |||||||
Medientyp: | Text | |||||||
Autor: | Weisweiler, Marius [Autor] | |||||||
Dateien: |
| |||||||
Beitragende: | Benjamin Stich [Gutachter] Gunnar Klau [Gutachter] | |||||||
Dewey Dezimal-Klassifikation: | 500 Naturwissenschaften und Mathematik » 570 Biowissenschaften; Biologie | |||||||
Beschreibungen: | Fortschritte in der Züchtung waren für eine Produktionssteigerung von Nutzpflanzen während des letzten Jahrhunderts verantwortlich. Dennoch ist es auch in der heutigen Zeit notwendig eine weitere Produktionssteigerung von Nutzpflanzen zu erzielen, um die Bedürfnisse einer wachsenden Weltbevölkerung zu decken. Ein Teil dieser Produktionssteigerung muss auch heutzutage durch Züchtung erzielt werden, beispielsweise durch ein besseres Verständnis der genetischen Information von Nutzpflanzen, wodurch Züchtungszyklen beschleunigt werden können und verbesserte Nutzpflanzensorten gezüchtet werden können. Deshalb kann eine fortschreitende Charakterisierung der genomischen Variation einschließlich der Analyse von neuen genetischen Markern zu einem Fortschritt in Züchtungsprogrammen führen. Mit der Erfindung der Hochdurchsatzsequenzierung wurde die Identifikation von verschiedenen Sequenzvarianten, welche als genetische Marker in Nutzpflanzen benutzt werden, wesentlich erleichtert. Allerdings werden für die Identifizierung von Sequenzvarianten basierend auf der Hochdurchsatzsequenzierung hoch qualitative Referenzsequenzen benötigt. Deshalb nutzte ich eine Kombination aus Hochdurchsatzsequenzierungstechnologien, um eine hoch qualitative Referenzsequenz des Kartoffelgenoms einer Züchtungselitesorte zu erstellen und beobachtete eine hohe Diversität zwischen der neuen Referenz und denen der bereits vorhandenen Kartoffelsorten. Die Nutzung dieser neuen Referenzsequenz wurde für verschiedene genomische Methoden evaluiert, wodurch sich ein hohes Potential zur Nutzung in züchtungs-relevanten Anwendungen zeigte. Eine genomische Eigenschaft, die zu phänotypischer Variation von agronomischer Bedeutung in Gerste beitragen soll, sind Anwesenheit/Abwesenheit Variationen (PAV). Daher wurde mRNA-Sequenzierung verschiedener Gewebe verwendet, um genomische und transkriptomische PAV, sowie trankriptomische Variation in 23 Sommergersten-Inzuchtlinien, die aus einer weltweiten Sammlung stammen und die die Eltern einer neuen Ressource für Kopplungs- und Assoziationskartierung sind, zu untersuchen. Durch die Analyse der transkriptomischen PAV zeigte sich, dass mehr als 50% aller Gene nicht in allen 23 Gersten-Inzuchtlinien expremiert waren. Des Weiteren wurde eine Methode entwickelt, wie trankriptomische PAV basierend auf der Identifizierung von genomischen PAV ermittelt werden können. Aufgrund dieser vielversprechenden Ergebnisse entstand ein Interesse, strukturelle Varianten (SV) im Gersten- und Kartoffelgenom systematisch zu untersuchen. In Gerste und Kartoffel wurden bisher nur einzelne SV mit qualitativen phänotypischen Merkmalen assoziiert. Deshalb evaluierte ich verschiedene Algorithmen, die SV identifizieren, basierend auf Computer-Simulationen und zwei verschiedenen Ansätzen der Hochdurchsatzsequenzierung, unter der Berücksichtigung von verschiedenen technischen und genomischen Charakteristika wie den SV-Typ, die SV-Länge und die Sequenziertiefe, um die beste Kombination aus Algorithmen und Sequenziertechniken zu finden, um SV im Gersten- und Kartoffelgenom zu bestimmen. Anhand der Simulationen wurde gezeigt, dass die beste Kombination aus Algorithmen eine Sensitivität > 70% und eine Präzision > 95% für alle Kombinationen von SV-Typen und SV-Längen im Gerstengenom aufwies. Im Kartoffelgenom wurden noch höhere Sensitivitäts und Präzisionswerte beobachtet. Des Weiteren zeigten die Simulationen im Kartoffelgenom die jeweiligen Stärken zweier Hochdurchsatzsequenzierungsansätze zur Bestimmung von SV, welche die Bestimmung der SV-Länge langer Insertionen durch linked-read Sequenzierung und die Identifizierung kurzer SV durch short-read Signale sind. Die optimale Kombination aus Algorithmen wurde dann verwendet, um das Auftauchen und die Verteilung von SV im Gerstengenom zu untersuchen. DNA-Sequenzierung wurde genutzt, um SV zu identifizieren, welche mit genom-weiter und gen-spezifischer Genexpression assoziiert wurden. Des Weiteren zeigte sich, dass transkriptomische PAV, SV und Genexpressionsdaten, die in den Gersten-Inzuchtlinien bestimmt wurden, zusätzliche genetische Informationen verglichen zu Einzelnukleotid-Varianten (SNV) beinhalten. Deshalb wurden diese für die Vorhersage von verschiedenen phänotypischen Merkmalen verwendet, bei der eine höhere Vorhersage-Genauigkeit verglichen zu der klassischen Nutzung eines SNV arrays aufgewiesen wurde. Diese Ergebnisse zeigen sowohl den Nutzen, SV Informationen zu berücksichtigen, wenn Genloci kodierend für quantitative Merkmale identifiziert wurden und das zugrundeliegende Gen analysiert wird, als auch das große Potential, SV, transkriptomische PAV und Genexpressionsdaten für die Vorhersage der Phänotypen in Datensätzen mit hoher genetischer Vielfalt zu nutzen.Improvements in breeding were responsible for crop productivity increase over the last century. Nevertheless, it is nowadays still crucial to further increase the crop productivity to meet the demands of the growing world population. This likewise requires proceeding improvements in breeding, e.g. a better understanding of the genetic background information to accelerate breeding cycles as well as to develop improved crop varieties. Therefore, a further characterization of genomic variation including the examination of new genetic markers can lead to an improvement in breeding programs. The detection of various sequence variants used as genetic markers in complex crop genomes became considerably simpler due to the development of next generation sequencing (NGS). However, for the detection of sequence variants based on NGS, high quality reference sequences need to be available. I therefore used a combination of NGS technologies to create a high quality reference sequence for a potato clone derived from an elite variety and observed a high divergence between the new reference sequence and that of other potato varieties. Additionally, I evaluated the usefulness of this new reference sequence for various genomic approaches and illustrated the high potential to use it for breeding applications. A genomic layer which was suggested to contribute to phenotypic variation of agronomic importance in barley was presence/absence variation (PAV). Thus, a multi-tissue mRNA sequencing approach was used to examine the genomic and expression PAV, as well as the transcriptomic variation in 23 spring barley inbreds which were selected from a panel of a world-wide collection and which are the parents of a new resource for joint linkage and association mapping, the double round robin population. Examining expression PAV data, I observed that more than 50% of all genes were not expressed in the 23 barley inbreds. Furthermore, an approach was developed to detect genomic PAV based on the identification of expression PAV. Because of these promising results, the interest arose to systematically explore structural variants (SV) in the barley and potato genomes. For both crops, only single SV have been identified and associated with qualitative phenotypic traits. I therefore evaluated different SV detection algorithms using computer simulations on short-read and linked-read sequencing considering various technical and genomic features as the SV type, SV length, as well as the sequencing coverage to find the best combination of algorithms and sequencing approaches to detect SV in the barley and potato genomes. Based on the simulation scenarios, the best combination of SV callers reached a sensitivity > 70% and precision > 95% for all combinations of SV types and SV lengths in the barley genome. Even higher sensitivity and precision values were observed using linked-read sequencing in the potato genome. Additionally, the simulation scenarios in the potato genome illustrated the respective strengths of linked- and short-read sequencing signals for SV detection, which are the determination of the SV length of large insertions due to the usage of long-range molecule signals and the detection of short SV by considering short-read signals. The optimal combination of SV callers were then used to study the occurrence and distribution of SV in the barley genome. The SV detected by a DNA sequencing approach were associated with genome-wide gene and gene-specific gene expression. Further, SV, expression PAV, and gene expression data detected in barley showed additional genetic information compared to single nucleotide variants (SNV) and were therefore used to predict different phenotypic traits and showed an increased prediction ability compared to the classical approach using a SNV array. These findings suggest the usefulness of exploiting SV information when fine mapping and cloning the causal gene underlying quantitative traits as well as the high potential of using SV, expression PAV, and gene expression data for the prediction of phenotypes in diverse germplasm sets. | |||||||
Lizenz: | ![]() Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz | |||||||
Fachbereich / Einrichtung: | Mathematisch- Naturwissenschaftliche Fakultät » WE Biologie » Genetik | |||||||
Dokument erstellt am: | 06.10.2022 | |||||||
Dateien geändert am: | 06.10.2022 | |||||||
Promotionsantrag am: | 30.03.2022 | |||||||
Datum der Promotion: | 28.09.2022 |