Dokument: From Collecting, Integrating, and Visualizing Student Data to Predicting Student Dropout and Performance

Titel:From Collecting, Integrating, and Visualizing Student Data to Predicting Student Dropout and Performance
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=57196
URN (NBN):urn:nbn:de:hbz:061-20210826-114100-8
Kollektion:Dissertationen
Sprache:Englisch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor: Askinadze, Alexander [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]3,14 MB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 20.08.2021 / geändert 20.08.2021
Beitragende:Prof. Dr. Conrad, Stefan [Gutachter]
Prof. Dr. Harmeling, Stefan [Gutachter]
Dewey Dezimal-Klassifikation:000 Informatik, Informationswissenschaft, allgemeine Werke » 004 Datenverarbeitung; Informatik
Beschreibungen:Advancing digitization is leading to more and more data, making the storage, integration, and processing of these large amounts of data (often referred to as big data) a challenge. As digitization extends to many areas of life, it also changes education immensely, so that education increasingly takes place in digital learning environments. Several research areas, such as educational data mining and learning analytics, have been established, which deal with the collection and analysis of student data from various perspectives. In this thesis, we deal with the following question: How can educational data be collected, integrated, analyzed, visualized, and finally used to predict dropout and performance?

To answer this question, we described the development of a dashboard in which we integrated data from hierarchical and non-hierarchical modules of two study programs. We proposed visualization techniques based on Sankey, UpSet, and Venn diagrams, which we used to visualize student progress for different cohorts. We found that a small amount of student data (information whether exams have been passed or not) is sufficient to predict student dropout and proposed a new method that uses the temporal aspect of student progress data to predict dropout.

If digital learning is offered in learning management systems (LMS) in addition to the usual teaching, then students, for example, open teaching materials in the LMS or learn with interactive learning elements offered by third party providers. This results in heterogeneous data that can be analyzed. Therefore, we investigated how the student interaction data from different digital learning environments can be tracked and integrated in order to apply data mining to this data. Based on several case studies, we investigated how interaction data can be used to predict student performance.

Since the application of learning analytics and educational data mining is not possible without considering data protection issues, we investigated what universities have to consider if they want to conduct learning analytics and educational data mining in compliance with GDPR. We found that educational institutions must be open and transparent in providing information about what data is stored and for what purposes it is processed. If the purposes of processing are well-argued, student consent is not always necessary. However, if students have the choice of which of their data may be tracked and stored, this leads to data sets with missing values. Therefore, we investigated the extent to which the missing values can be predicted from existing data in order to create better predictive models.

Die fortschreitende Digitalisierung führt zu immer mehr Daten, was die Speicherung, Integration und Verarbeitung dieser großen Datenmengen (oft als Big Data bezeichnet) zu einer Herausforderung macht. Da sich die Digitalisierung auf viele Lebensbereiche ausdehnt, verändert sie auch die Bildung immens, so dass Bildung zunehmend in digitalen Lernumgebungen stattfindet. Es wurden mehrere Forschungsbereiche, wie z.B. Educational Data Mining und Learning Analytics eingerichtet, die sich mit der Sammlung und Analyse von studentischen Daten aus verschiedenen Perspektiven befassen. In dieser Arbeit beschäftigen wir uns mit der folgenden Frage: Wie können Bildungsdaten gesammelt, integriert, analysiert, visualisiert und schließlich zur Vorhersage von Studienabbruch und studentischen Leistungen verwendet werden?

Um diese Frage zu beantworten, haben wir die Entwicklung eines Dashboards beschrieben und verschiedene Visualisierungstechniken zur Visualisierung des Studentenfortschritts für verschiedene Kohorten vorgeschlagen, die auf Sankey-, UpSet- und Venn-Diagrammen basieren. Wir fanden heraus, dass eine kleine Menge an Daten der Studierenden (Informationen darüber, ob Prüfungen bestanden wurden oder nicht) ausreicht, um den Studienabbruch vorherzusagen. Dazu haben wir eine Methode vorgeschlagen, die den zeitlichen Aspekt der Studienverlaufsdaten zur Vorhersage nutzt.

Wenn digitales Lernen in Lernmanagementsystemen (LMS) zusätzlich zum üblichen Unterricht angeboten wird, dann öffnen die Studierenden beispielsweise Lehrmaterialien im LMS oder lernen mit interaktiven Lernelementen, die von Drittanbietern angeboten werden. Dies führt zu heterogenen Daten, die analysiert werden können. Daher haben wir untersucht, wie die aus Interaktionen mit digitalen Lernelementen resultierenden Daten gesammelt und integriert werden können. Auf der Grundlage mehrerer Fallstudien haben wir untersucht, wie Interaktions-Daten zur Vorhersage von studentischen Leistungen verwendet werden können.

Da die Anwendung von Learning Analytics und Educational Data Mining ohne Berücksichtigung von datenschutzrechtlichen Fragen nicht möglich ist, haben wir untersucht, was Bildungseinrichtungen beachten müssen, wenn sie studentische Daten DSGVO konform nutzen wollen. Dabei haben wir festgestellt, dass Bildungseinrichtungen offen und transparent Auskunft darüber geben müssen, welche Daten gespeichert und zu welchen Zwecken sie verarbeitet werden. Wenn die Zwecke der Verarbeitung gut begründet sind, ist die Zustimmung der Studierenden nicht immer erforderlich. Wenn Studenten jedoch die Wahl gegeben wird, welche Daten die Bildungseinrichtungen tracken und speichern dürfen, dann führt dies zu Datensätzen mit fehlenden Werten. Wir haben untersucht, inwieweit sich die fehlenden Werte aus den vorhandenen Daten vorhersagen lassen, um bessere Vorhersagemodelle zu erstellen.
Lizenz:In Copyright
Urheberrechtsschutz
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät » WE Informatik » Datenbanken und Informationssysteme
Dokument erstellt am:26.08.2021
Dateien geändert am:26.08.2021
Promotionsantrag am:20.05.2020
Datum der Promotion:05.10.2020
english
Benutzer
Status: Gast
Aktionen