Dokument: Checkpointing in heterogenen, verteilten Umgebungen

Titel:Checkpointing in heterogenen, verteilten Umgebungen
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=15682
URN (NBN):urn:nbn:de:hbz:061-20100816-151433-0
Kollektion:Dissertationen
Sprache:Deutsch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor: Mehnert-Spahn, John [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]2,10 MB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 19.07.2010 / geändert 19.07.2010
Beitragende:Prof. Dr. Schöttner, Michael [Betreuer/Doktorvater]
Prof. Dr. Conrad, Stefan [Gutachter]
Stichwörter:Fehlertoleranz, Heterogenität, Grid / Cloud Computing
Dewey Dezimal-Klassifikation:000 Informatik, Informationswissenschaft, allgemeine Werke » 004 Datenverarbeitung; Informatik
Beschreibung:Wissenschaftliche und ökonomische Problemstellungen können in zunehmendem Maße nicht mehr mit den lokal, bei Forschungs- oder Wirtschaftunternehmen, verfügbaren Ressourcen bewältigt werden. Mit Gridtechnologien sind umfangreiche, verteilte Ressourcen, die durch Zusammenschluss mehrerer Standorte entstehen, gemeinsam nutzbar. Mit einer steigenden Anzahl von Rechenknoten erhöht sich gleichzeitig die Wahrscheinlichkeit von Knotenausfällen. Um Zwischenzustände, beispielsweise lang laufender Anwendungen, bei einem Rechnerausfall nicht zu verlieren, müssen Fehlertoleranzmechanismen eingesetzt werden. Fehlertoleranz kann vor allem durch Checkpoint/Restart erzielt werden, das heißt, Anwendungszustände werden in periodischen Abständen gesichert und können im Fehlerfall wiederhergestellt werden.
In dieser Arbeit wird eine Grid-Checkpointing-Architektur (GCA) entworfen, um Grid-Fehlertoleranz zu realisieren. Der Schwerpunkt liegt auf der Unterstützung von Heterogenität, das heißt, es wird untersucht, inwieweit unterschiedliche, existierende, knotengebundene Checkpointer-Pakete in eine GCA integriert werden können.
Die Analyse verfügbarer Checkpointer-Pakete zeigt große Unterschiede hinsichtlich deren Fähigkeiten, Prozessressourcen wie IPC, Sockets, Dateien, et cetera sichern und wiederherstellen zu können. Dies bedingt, Anwendungen mit eingesetzten Checkpointer-Paketen abzugleichen, damit alle Prozessressourcen einer Anwendung nach einem Ausfall rekonstruiert werden können.
Kernelement der GCA bildet die sogenannte Uniforme Checkpointer-Schnittstelle (UCS), welche als einheitliche Schnittstelle zu heterogenen Checkpointer-Paketen dient. Die Schnitt-stellenimplementierung muss Bezug zu existierenden Checkpointing-Protokollen nehmen, dabei auf die Abbildung von Semantiken der Grid- auf jene der Gridknotenebene (Prozess- und Benutzer-Management) achten, individuelle Aufrufsemantiken berücksichtigen und Checkpointdatei- und Callback-Management realisieren.
Sogenannte Container basieren auf leichtgewichtiger Virtualisierung. Mit ihrer Hilfe können potentielle Ressourcenkonflikte beim Restart vermieden werden, insofern Kennungen von Prozessen, IPC-Objekten et cetera bereits vergeben sind. In dieser Arbeit wird dargelegt, welche Auswirkungen auf die GCA entstehen, wenn verschiedene Container unterstützende Checkpointer-Pakete integriert werden.
Eine zentrale Herausforderung bei Grid-Fehlertoleranz besteht darin, dass heterogene Checkpointer-Pakete an der Sicherung/Wiederherstellung einer verteilten Anwendung beteiligt sind. Um beispielsweise Kanalzustände, mithilfe heterogener Checkpointer-Pakete an beiden Kanalenden, sichern zu können, müssen diese bei einem Marker-basierten Ansatz miteinander kooperieren. Kooperation darf jedoch nicht auf Kosten der Checkpoint- oder Anwendungs-Modifizierung stattfinden. Techniken wie Callbacks und Library Interposition stellen hierbei geeignete Mittel dar.
Das Ziel adaptiven Checkpointings ist, Checkpointingperformanz zu erhöhen. Dazu wurde in dieser Arbeit der beidseitige Wechsel zwischen koordineirtem und unkoordiniertem Checkpointing untersucht sowie inkrementelles Grid Checkpointing implementiert.
Anhand dieser Arbeit wird gezeigt, dass Grid-Fehlertoleranz mithilfe heterogener Checkpointer-Pakete realisierbar ist. Der entwickelte Prototyp
integriert drei verschiedene Checkpointer-Pakete, welche verwendet werden, um Anwendungen koordiniert, unabhängig und inkrementell zu sichern und wiederherzustellen. Die Anwendungen müssen dabei nicht abgeändert werden. Die umfangreichen Messungen belegen, dass die GCA keinen nennenswerten Aufwand gegenüber nativen Checkpointer-Paketen verursacht.
Lizenz:In Copyright
Urheberrechtsschutz
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät » WE Informatik
Dokument erstellt am:20.07.2010
Dateien geändert am:19.07.2010
Promotionsantrag am:23.06.2010
Datum der Promotion:13.07.2010
english
Benutzer
Status: Gast
Aktionen