Dokument: Automated Discussion Analysis in Online Participation Projects

Titel:Automated Discussion Analysis in Online Participation Projects
Weiterer Titel:Automatisierte Diskussionsanalyse in Online-Partizipationsverfahren
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=47989
URN (NBN):urn:nbn:de:hbz:061-20181206-105833-4
Kollektion:Dissertationen
Sprache:Englisch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor: Liebeck, Matthias [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]776,4 KB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 05.12.2018 / geändert 05.12.2018
Beitragende:Prof. Dr. Conrad, Stefan [Gutachter]
Prof. Dr. Mauve, Martin [Gutachter]
Dewey Dezimal-Klassifikation:000 Informatik, Informationswissenschaft, allgemeine Werke » 004 Datenverarbeitung; Informatik
Beschreibungen:Cities and municipalities in Germany are more frequently using online participation projects to incorporate the opinion of their citizens into political decision-making processes. Citizens are able to voice their opinions, ideas, and comments in text form on online-based, forum-like platforms. The evaluation of these projects is conducted manually and can be very time consuming if the participants have written thousands of text contributions. In cooperation with technical service providers and cities as part of the PhD program Online Participation, we identified a need for automated approaches that assist in the manual evaluation.

First, we focused on argument mining. On the basis of the project Tempelhofer Feld, we identified a suitable argument model for online participation projects, annotated text content from a part of the project with three annotators, and achieved a high inter-annotator agreement. Then, we worked on the two machine learning tasks of automatically identifying argumentative content and classifying argument components. In our approach, we evaluated a classical machine learning approach with feature engineering as well as deep learning techniques.

Afterwards, we focused on online participation projects with a high number of text contributions and the task of automatically creating a broad overview of the discussion topics. We started by creating a new lemmatizer for German based on Wiktionary. After a fundamental debate about which text content should be considered for a topic extraction method and how the extracted topics should be visualized, we applied different topic extraction methods to several online participation projects and discussed their results.

Finally, we used text content from citizens involved in the discussion and dealt with the task of automatically inferring demographic attributes in order to identify underrepresented population strata. We developed a multi-lingual author profiling approach for the PAN author profiling challenge in 2016 and achieved first place out of 22 participating teams for gender detection in English text.

In Deutschland setzen Städte und Kommunen vermehrt Online-Partizipationsprojekte ein, um die Meinung ihrer Bürger in politischen Entscheidungsprozessen berücksichtigen zu können. Dazu werden onlinebasierte, forenähnliche Plattformen verwendet, auf denen die Bürger ihre Meinungen, Ideen und Kommentare in Textform äußern. Die Auswertung solcher Projekte erfolgt manuell und führt bei einer sehr hohen Anzahl an Textbeiträgen schnell zu einer Überlastung personeller Kapazitäten. In Kooperation mit technischen Dienstleistern und Städten im Rahmen des NRW Fortschrittskollegs Online-Partizipation haben wir einen Forschungsbedarf an automatisierten Verfahren in mehreren Bereichen identifizieren können.

Zunächst haben wir im Bereich des Argument Minings auf Grundlage des Beteiligungsprojekts Tempelhofer Feld und anhand von bestehenden Argumentationsmodellen ein geeignetes Modell für Online-Partizipationsverfahren identifiziert und mit drei Annotatoren einen Teil des Beteiligungsprojekts mit hoher Übereinstimmung annotiert. Anschließend haben wir auf diesem Datensatz die beiden Machine Learning-Aufgaben der Erkennung von argumentativem Textinhalt und der Klassifikation von Argumentationskomponenten bearbeitet. Dabei haben wir sowohl klassische Machine Learning-Verfahren mit Feature Engineering als auch Deep Learning-Verfahren ausführlich evaluiert.

Danach widmeten wir uns der Problemstellung, wie bei einer sehr großen Anzahl an Textbeiträgen automatisch ein Überblick über die Diskussionsthemen erstellt werden kann. Hierfür haben wir zunächst ein paar notwendige Vorarbeiten, wie die Erstellung eines neuen Verfahrens zur Grundformreduktion, durchgeführt. Nach grundlegenden Diskussionen über die für die Extraktion zu berücksichtigen Textinhalte und die Darstellungsform der extrahierten Themen, haben wir Verfahren der Themenextraktion auf mehrere Online-Partizipationsverfahren angewendet und ihre Ergebnisse diskutiert.

Abschließend haben wir uns mit der Aufgabe beschäftigt, wie automatisiert Verteilungen von demografischen Angaben über die an der Diskussion beteiligten Personen anhand von Textbeiträgen bestimmt werden können, um unterrepräsentierte Bevölkerungsschichten identifizieren zu können. Hierzu haben wir einen multilingualen Ansatz entwickelt, der für englische Texte in der PAN author profiling challenge 2016 für die Vorhersage des Geschlechts eines Autors den ersten Platz von 22 beteiligten Teams erreichen konnte.
Lizenz:In Copyright
Urheberrechtsschutz
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät » WE Informatik » Datenbanken und Informationssysteme
Dokument erstellt am:06.12.2018
Dateien geändert am:06.12.2018
Promotionsantrag am:13.12.2017
Datum der Promotion:06.04.2018
english
Benutzer
Status: Gast
Aktionen