Treebanking user-generated content: A proposal for a unified representation in universal dependencies
Sanguinetti, Manuela
;
Bosco, Cristina
;
Cassidy, Lauren
;
Çetinoğlu, Özlem
;
Cignarella, Alessandra Teresa
;
Lynn, Teresa
;
Rehbein, Ines
;
Ruppenhofer, Josef
;
Seddah, Djamé
;
Zeldes, Amir
URL:
|
https://madoc.bib.uni-mannheim.de/55423
|
Weitere URL:
|
https://www.aclweb.org/anthology/2020.lrec-1.645
|
URN:
|
urn:nbn:de:bsz:180-madoc-554237
|
Dokumenttyp:
|
Konferenzveröffentlichung
|
Erscheinungsjahr:
|
2020
|
Buchtitel:
|
LREC 2020 Marseille : Twelfth International Conference on Language Resources and Evaluation$dMay 11-16, 2020, Palais du Pharo, Marseille, France : conference proceedings
|
Seitenbereich:
|
5240-5250
|
Veranstaltungstitel:
|
LREC 2020
|
Veranstaltungsort:
|
Marseille, France
|
Veranstaltungsdatum:
|
11.-16.05.2020
|
Herausgeber:
|
Calzolari, Nicoletta
|
Ort der Veröffentlichung:
|
Paris ; Mannheim
|
Verlag:
|
ELRA ; IDS, Bibliothek
|
ISBN:
|
979-10-95546-34-4 , 979-10-95546-61-0
|
Sprache der Veröffentlichung:
|
Englisch
|
Einrichtung:
|
Außerfakultäre Einrichtungen > SFB 884
|
Bereits vorhandene Lizenz:
|
Creative Commons Namensnennung, nicht kommerziell 4.0 International (CC BY-NC 4.0)
|
Fachgebiet:
|
004 Informatik
|
Abstract:
|
The paper presents a discussion on the main linguistic phenomena of user-generated texts found in web and social media, and proposes a set of annotation guidelines for their treatment within the Universal Dependencies (UD) framework. Given on the one hand the increasing number of treebanks featuring user-generated content, and its somewhat inconsistent treatment in these resources on the other, the aim of this paper is twofold: (1) to provide a short, though comprehensive, overview of such treebanks - based on available literature - along with their main features and a comparative analysis of their annotation criteria, and (2) to propose a set of tentative UD-based annotation guidelines, to promote consistent treatment of the particular phenomena found in these types of texts. The main goal of this paper is to provide a common framework for those teams interested in developing similar resources in UD, thus enabling cross-linguistic consistency, which is a principle that has always been in the spirit of UD.
|
| Dieser Eintrag ist Teil der Universitätsbibliographie. |
| Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt. |
Suche Autoren in
BASE:
Sanguinetti, Manuela
;
Bosco, Cristina
;
Cassidy, Lauren
;
Çetinoğlu, Özlem
;
Cignarella, Alessandra Teresa
;
Lynn, Teresa
;
Rehbein, Ines
;
Ruppenhofer, Josef
;
Seddah, Djamé
;
Zeldes, Amir
Google Scholar:
Sanguinetti, Manuela
;
Bosco, Cristina
;
Cassidy, Lauren
;
Çetinoğlu, Özlem
;
Cignarella, Alessandra Teresa
;
Lynn, Teresa
;
Rehbein, Ines
;
Ruppenhofer, Josef
;
Seddah, Djamé
;
Zeldes, Amir
Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail
Actions (login required)
|
Eintrag anzeigen |
|