Dokument: Opinion Mining in Newspapers for a Media Response Analysis

Titel:Opinion Mining in Newspapers for a Media Response Analysis
Weiterer Titel:Automatische Meinungsanalyse in Zeitungen für eine Medienresonanzanalyse
URL für Lesezeichen:https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=28289
URN (NBN):urn:nbn:de:hbz:061-20140205-105529-3
Kollektion:Dissertationen
Sprache:Englisch
Dokumententyp:Wissenschaftliche Abschlussarbeiten » Dissertation
Medientyp:Text
Autor: Scholz, Thomas [Autor]
Dateien:
[Dateien anzeigen]Adobe PDF
[Details]3,50 MB in einer Datei
[ZIP-Datei erzeugen]
Dateien vom 04.02.2014 / geändert 04.02.2014
Beitragende:Prof. Dr. Conrad, Stefan [Gutachter]
Prof. Dr. Mauve, Martin [Gutachter]
Stichwörter:Opinion Mining, Text Mining, Media Response Analysis
Dewey Dezimal-Klassifikation:000 Informatik, Informationswissenschaft, allgemeine Werke » 004 Datenverarbeitung; Informatik
Beschreibungen:A part of the broad research domains Knowledge Discovery and Information Retrieval deals only with Data Mining in texts: Text Mining. In general, Text Mining tries to obtain knowledge by identifying patterns in textual data. One of its most important areas is Opinion Mining, which is the main topic of this thesis.

Opinion Mining is a far-reaching research area, because it is potentially interesting for many different fields of application as well as its results are very valuable: Opinions are analysed in reviews of products, services, etc. to create very detailed reports about the subject of the reviews or to identify fake or spam reviews. Furthermore, contributions for Opinion Mining in Social Media try to discover opinions in these networks such as Twitter, Facebook, and Youtube. We concentrate on Opinion Mining in news articles, because automatically extracted opinions from news have a high economic value, especially for media monitoring services, but at the same time, this domain has been rather neglected by approaches for Opinion Mining.

Thus, we complement this research area by tasks of a Media Response Analysis, which includes the extraction of statements, the classification of the tonality, and the determination of viewpoints. To establish these tasks within the Opinion Mining community, we published an own dataset of a Media Response Analysis (MRA).

A major challenge is the extraction of statements for an MRA. In this step, the text parts of a news article have to be identified, which are most relevant for analysis objects and contain opinions, even if the tonality of the opinion is neutral.

The classification of the tonality for a given text or text part represents the most difficult task for almost every Opinion Mining approach. Many contributions involve only this step and apply a broad spectrum of techniques to tackle this problem: The creation of sentiment dictionaries, the analysis of contextual information, machine learning, heuristic rules, profoundly linguistic analyses, and many more. During this thesis we investigate many characteristics for the determination of tonality in our domain in contrast to recent research and propose a very well working approach for the tonality classification of statements in newspaper articles, which is adjusted to the requirements of a practical solution and achieves better results for our task than current state-of-the-art techniques.

Extracted and rated statements are difficult to assess for MRA, if they do not contain any information about the viewpoint. To complete a fully automated solution of Opinion Mining for a Media Response Analysis, we explain and evaluate our ontology-based approach for the determination of viewpoints.

Ein Teil der weitreichenden Forschungsgebiete von Knowledge Discovery und Information Retrieval beschäftigt sich nur mit Data Mining in Texten: Text Mining. Allgemein versucht man beim Text Mining durch Mustererkennung Wissen aus textuellen Daten zu ziehen. Eines der bekanntesten Gebiete in Text Mining ist Opinion Mining, das grundlegende Thema dieser Arbeit.

Opinion Mining ist ein weitreichender Forschungszweig, weil Opinion Mining für viele Anwendungsgebiete interessant ist und gleichzeitig die Resultate potentiell wertvoll sind: Meinungen können in Bewertungen zu Produkten, Dienstleistungen, etc. untersucht werden, um detaillierte Berichte über den Gegenstand der Bewertung zu erstellen oder um nicht glaubwürdige oder nutzlose Bewertungen zu identifizieren. Im Bereich soziale Netzwerke versucht man Meinungen z. B. bei Twitter, Facebook, Youtube, etc. zu entdecken. Wir konzentrieren uns auf Opinion Mining in Zeitungsartikeln, weil automatisch extrahierte Meinungen aus Zeitungen von großem wirtschaftlichen Wert sind, besonders für Medienbeobachter und ihre Kunden. Zugleich ist Opinion Mining in Zeitungen von aktuellen Arbeiten eher vernachlässigt worden.

Deshalb komplettieren wir dieses Forschungsgebiet um die Herausforderungen einer Medienresonanzanalyse, die eine Aussagenextraktion, eine Tonalitätsklassifikation und eine Perspektivbestimmung umfasst. Wir veröffentlichten einen eigenen Datensatz einer solchen Analyse um diese Herausforderungen noch weiter zu etablieren.

Eine Schlüsselaufgabe ist die Extraktion von Aussagen für eine Medienresonanzanalyse (MRA). In diesem Schritt müssen die Abschnitte von Zeitungsartikeln identifiziert werden, die relevant für die Analyseobjekte sind und eine Meinung beinhalten, selbst wenn die Tonalität dieser Meinung neutral ist.

Die Klassifikation der Tonalität für einen gegebenen Text oder Textteile ist meistens die schwierigste Aufgabe innerhalb einer automatischen Meinungsanalyse. Viele Ansätze drehen sich nur um diesen Schritt und schlagen ein breites Spektrum an Techniken für dieses Problem vor: Generierung von Tonalitätswörterbüchern, Analyse des Kontextes, maschinelles Lernen, heuristische Regeln, tiefgehende sprachliche Analysen und vieles mehr. Innerhalb dieser Arbeit stellen wir viele Besonderheiten für die Tonalitätsbestimmung in Zeitungen im Vergleich zu aktuellen Arbeiten heraus und entwickeln einen sehr gut funktionierenden Ansatz für die Klassifikation der Tonalität in Aussagen aus Zeitungsartikeln, der an die Voraussetzungen für einen Einsatz in der Praxis angepasst ist und bessere Resultate erzielt als der aktuelle Stand der Technik.

Extrahierte und mit Tonalität versehene Aussagen sind allerdings immer noch schwierig zu bewerten innerhalb einer MRA, wenn keine Informationen über die Perspektive verfügbar sind. Deshalb vervollständigen wir unsere automatische Lösung für eine Medienresonanzanalyse um eine Perspektivbestimmung durch einen ontologiebasierten Ansatz.
Lizenz:In Copyright
Urheberrechtsschutz
Fachbereich / Einrichtung:Mathematisch- Naturwissenschaftliche Fakultät » WE Informatik » Datenbanken und Informationssysteme
Dokument erstellt am:05.02.2014
Dateien geändert am:05.02.2014
Promotionsantrag am:31.10.2013
Datum der Promotion:04.02.2014
english
Benutzer
Status: Gast
Aktionen