Tagging named entities in Croatian tweets


Baksa, Krešimir ; Golović, Dino ; Glavaš, Goran ; Šnajder, Jan


[img] PDF
document.pdf - Veröffentlichte Version

Download (238kB)

DOI: https://doi.org/10.4312/slo2.0.2016.1.20-41
URL: https://madoc.bib.uni-mannheim.de/60356
Weitere URL: https://revije.ff.uni-lj.si/slovenscina2/article/v...
URN: urn:nbn:de:bsz:180-madoc-603568
Dokumenttyp: Zeitschriftenartikel
Erscheinungsjahr: 2016
Titel einer Zeitschrift oder einer Reihe: Slovenščina 2.0
Band/Volume: 4
Heft/Issue: 1
Seitenbereich: 20-41
Ort der Veröffentlichung: Ljubljana
Verlag: Ljubljana University Press, Faculty of Arts
ISSN: 2335-2736
Verwandte URLs:
Sprache der Veröffentlichung: Englisch
Einrichtung: Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Text Analytics for Interdisciplinary Research (Juniorprofessur) (Glavaš 2017-2021)
Bereits vorhandene Lizenz: Creative Commons Namensnennung, Weitergabe unter gleichen Bedingungen 4.0 International (CC BY-SA 4.0)
Fachgebiet: 004 Informatik
Abstract: Named entity extraction tools designed for recognizing named entities in texts written in standard language (e.g., news stories or legal texts) have been shown to be inadequate for user-generated textual content (e.g., tweets, forum posts). In this work, we propose a supervised approach to named entity recognition and classification for Croatian tweets. We compare two sequence labelling models: a hidden Markov model (HMM) and conditional random fields (CRF). Our experiments reveal that CRF is the best model for the task, achieving a very good performance of over 87% micro-averaged F1 score. We analyse the contributions of different feature groups and influence of the training set size on the performance of the CRF model.
Zusätzliche Informationen: Online-Ressource




Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.

Dieser Datensatz wurde nicht während einer Tätigkeit an der Universität Mannheim veröffentlicht, dies ist eine Externe Publikation.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Download-Statistik

Downloads im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen