Treebanking user-generated content: A proposal for a unified representation in universal dependencies


Sanguinetti, Manuela ; Bosco, Cristina ; Cassidy, Lauren ; Çetinoğlu, Özlem ; Cignarella, Alessandra Teresa ; Lynn, Teresa ; Rehbein, Ines ; Ruppenhofer, Josef ; Seddah, Djamé ; Zeldes, Amir


[img]
Vorschau
PDF
2020.lrec-1.645.pdf - Veröffentlichte Version

Download (285kB)

URL: https://madoc.bib.uni-mannheim.de/55423
Weitere URL: https://www.aclweb.org/anthology/2020.lrec-1.645
URN: urn:nbn:de:bsz:180-madoc-554237
Dokumenttyp: Konferenzveröffentlichung
Erscheinungsjahr: 2020
Buchtitel: LREC 2020 Marseille : Twelfth International Conference on Language Resources and Evaluation$dMay 11-16, 2020, Palais du Pharo, Marseille, France : conference proceedings
Seitenbereich: 5240-5250
Veranstaltungstitel: LREC 2020
Veranstaltungsort: Marseille, France
Veranstaltungsdatum: 11.-16.05.2020
Herausgeber: Calzolari, Nicoletta
Ort der Veröffentlichung: Paris ; Mannheim
Verlag: ELRA ; IDS, Bibliothek
ISBN: 979-10-95546-34-4 , 979-10-95546-61-0
Sprache der Veröffentlichung: Englisch
Einrichtung: Außerfakultäre Einrichtungen > SFB 884
Bereits vorhandene Lizenz: Creative Commons Namensnennung, nicht kommerziell 4.0 International (CC BY-NC 4.0)
Fachgebiet: 004 Informatik
Abstract: The paper presents a discussion on the main linguistic phenomena of user-generated texts found in web and social media, and proposes a set of annotation guidelines for their treatment within the Universal Dependencies (UD) framework. Given on the one hand the increasing number of treebanks featuring user-generated content, and its somewhat inconsistent treatment in these resources on the other, the aim of this paper is twofold: (1) to provide a short, though comprehensive, overview of such treebanks - based on available literature - along with their main features and a comparative analysis of their annotation criteria, and (2) to propose a set of tentative UD-based annotation guidelines, to promote consistent treatment of the particular phenomena found in these types of texts. The main goal of this paper is to provide a common framework for those teams interested in developing similar resources in UD, thus enabling cross-linguistic consistency, which is a principle that has always been in the spirit of UD.




Dieser Eintrag ist Teil der Universitätsbibliographie.

Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Download-Statistik

Downloads im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen