Dokument: Frame-Semantic Parsing with Lexicalized Tree Rewriting Grammars
Titel: | Frame-Semantic Parsing with Lexicalized Tree Rewriting Grammars | |||||||
Weiterer Titel: | Frame-Semantisches Parsing mit lexikalisierten Baumgrammatiken | |||||||
URL für Lesezeichen: | https://docserv.uni-duesseldorf.de/servlets/DocumentServlet?id=66379 | |||||||
URN (NBN): | urn:nbn:de:hbz:061-20240903-103718-9 | |||||||
Kollektion: | Dissertationen | |||||||
Sprache: | Englisch | |||||||
Dokumententyp: | Wissenschaftliche Abschlussarbeiten » Dissertation | |||||||
Medientyp: | Text | |||||||
Autor: | Bladier, Tatiana [Autor] | |||||||
Dateien: |
| |||||||
Beitragende: | Prof. Dr. Kallmeyer, Laura [Gutachter] Apl.-Prof. Dr. Petersen, Wiebke [Gutachter] Dr. Balogh, Katalin [Gutachter] | |||||||
Stichwörter: | Parsing, Semantik, Syntax, Frames, Frame Semantik, Tree Adjoining Grammar, Tree Wrapping Grammar, Role and Reference Grammar | |||||||
Dokumententyp (erweitert): | Dissertation | |||||||
Dewey Dezimal-Klassifikation: | 400 Sprache » 410 Linguistik | |||||||
Beschreibungen: | This dissertation is a compilation of publications that seek to develop a large-scale data-driven frame-semantic parsing algorithm based on grammar theories with the property of extended domain of locality (EDL), particularly Tree Rewriting Formalisms of Tree-Adjoining Grammar and Tree Wrapping Grammar. We pursue this aim with a particular focus on the syntax-semantics interface, thus working on developing both a syntactic parsing methodology and combining it with frame semantics. This is, to our best knowledge, the first attempt to implement a large-scale deep semantic parser based on such formalisms, although some prototypical small-scale semantic parsers for different versions of Tree Rewriting Grammars already exist. We show that Tree Rewriting Grammars are a useful additional source for neural semantic parsing. %Since such combination of tree rewriting formalisms with the theory of semantic frames comes along with a notion of predicate-argument locality, it allows to generalize over event structures in a meaningful way.
The second chapter of the dissertation describes our method for automatically extracting tree-rewriting grammars from constituency treebanks. These grammars can be utilized for both syntactic and semantic parsing. Since these grammars are extracted from large treebanks, they facilitate generalization over elementary trees and the development of parsers relying on probabilities. The third chapter of the dissertation outlines our method for syntactic parsing using the extracted tree-rewriting grammars. Our parsing algorithm is based on supertagging followed by a parsing step. We experiment with various deep learning architectures for the supertagger and adapt an existing probabilistic TAG parser for integration into the pipeline using predicted supertags. This adaptation reduces the search space of the parser, thereby speeding up parsing. Additionally, we modify this parser to handle the tree combination operations unique to TWG. The fourth chapter of the dissertation describes our effort to create treebanks based on the typologically inspired grammar theory of Role and Reference Grammar, which is a major framework used in typological language modeling. RRG places semantics and its interfaces with morphosyntax, information structure, and discourse at the center of the theory. We utilize these treebanks to extract large-scale grammars for our experiments. Finally, the fifth chapter describes our approach to large-scale frame-semantic parsing with Tree Rewriting Grammars, using linguistic features extracted from the tree-rewriting grammars. We adopt a compositional approach to map syntax and semantics and utilize deep learning tools to predict components for our parser.Diese Dissertation ist eine Zusammenstellung von Veröffentlichungen, die darauf abzielen, einen groß angelegten, datengesteuerten Frame-semantischen Parsing-Algorithmus auf der Grundlage von Grammatiktheorien mit der Eigenschaft des erweiterten lokalen Bereichs (EDL) zu entwickeln, insbesondere baumbasierte Formalismen der Baumadjunktions-Grammatik (Tree Adjoining Grammar, TAG) und der Tree Wrapping Grammar (TWG). Wir verfolgen dieses Ziel mit besonderem Fokus auf die Schnittstelle von Syntax und Semantik, indem wir sowohl eine syntaktische Parsing-Methodologie entwickeln als auch diese mit der Frame-Semantik kombinieren. Nach unserem besten Wissen ist dies der erste Versuch, einen groß angelegten tiefen semantischen Parser auf Basis solcher Formalismen zu implementieren, obwohl bereits einige prototypische, klein angelegte semantische Parser für verschiedene Versionen von Baumgrammatiken existieren. Wir zeigen, dass Baumgrammatiken eine nützliche zusätzliche Quelle für neuronales semantisches Parsing sind. Das zweite Kapitel der Dissertation beschreibt unsere Methode zur automatischen Extraktion von Baumgrammatiken aus Konstituenten-Baumbanken. Diese Grammatiken können sowohl für das syntaktische als auch für das semantische Parsing genutzt werden. Da diese Grammatiken aus großen Baumbanken extrahiert werden, erleichtern sie die Generalisierung über elementare Bäume und die Entwicklung von Parsern, die auf Wahrscheinlichkeiten basieren. Das dritte Kapitel der Dissertation skizziert unsere Methode für das syntaktische Parsing mit den extrahierten Baumgrammatiken. Unser Parsing-Algorithmus basiert auf Supertagging, gefolgt von einem Parsing-Schritt. Wir experimentieren mit verschiedenen Deep-Learning-Architekturen für den Supertagger und passen einen bestehenden probabilistischen TAG-Parser zur Integration in die Pipeline unter Verwendung vorhergesagter Supertags an. Diese Anpassung reduziert den Suchraum des Parsers und beschleunigt dadurch das Parsing. Zusätzlich modifizieren wir diesen Parser, um die für TWG einzigartigen Baumkombinationsoperationen zu bewältigen. Das vierte Kapitel der Dissertation beschreibt unsere Bemühungen, Baumbanken auf Basis der typologisch inspirierten Grammatiktheorie der Role und Reference Grammar (RRG) zu erstellen, die ein wichtiges Rahmenwerk in der typologischen Sprachmodellierung darstellt. RRG stellt die Semantik und deren Schnittstellen mit Morphosyntax, Informationsstruktur und Diskurs ins Zentrum der Theorie. Wir nutzen diese Baumbanken, um groß angelegte Grammatiken für unsere Experimente zu extrahieren. Schließlich beschreibt das fünfte Kapitel unseren Ansatz zum groß angelegten Frame-semantischen Parsing mit Baumgrammatiken unter Verwendung von linguistischen Merkmalen, die aus den Baumgrammatiken extrahiert wurden. Wir verfolgen einen kompositionellen Ansatz, um Syntax und Semantik abzubilden, und nutzen Deep-Learning-Werkzeuge, um Komponenten für unseren Parser vorherzusagen. | |||||||
Lizenz: | ![]() Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz | |||||||
Fachbereich / Einrichtung: | Philosophische Fakultät » Institut für Sprache und Information » Computerlinguistik | |||||||
Dokument erstellt am: | 03.09.2024 | |||||||
Dateien geändert am: | 03.09.2024 | |||||||
Promotionsantrag am: | 26.04.2024 | |||||||
Datum der Promotion: | 05.07.2024 |