Eliminating fuzzy duplicates in crowdsourced lexical resources
Kiselev, Yuri
;
Ustalov, Dmitry
;
Porshnev, Sergey
URL:
|
https://ub-madoc.bib.uni-mannheim.de/43369
|
URN:
|
urn:nbn:de:bsz:180-madoc-433699
|
Dokumenttyp:
|
Konferenzveröffentlichung
|
Erscheinungsjahr:
|
2016
|
Buchtitel:
|
Proceedings of the Eighth Global WordNet Conference (GWC-16) : January 27-30, Bucharest, Romania
|
Seitenbereich:
|
161-167
|
Veranstaltungstitel:
|
Global WordNet Conference 2016
|
Veranstaltungsort:
|
Bucharest, Romania
|
Veranstaltungsdatum:
|
January 27-30, 2016
|
Herausgeber:
|
Barbu Mititelu, Verginica
|
Ort der Veröffentlichung:
|
Bucarest
|
Verlag:
|
Global WordNet Association
|
ISBN:
|
978-606-714-239-6 , 978-973-0-20728-6
|
Sprache der Veröffentlichung:
|
Englisch
|
Einrichtung:
|
Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Information Systems III: Enterprise Data Analysis (Ponzetto 2016-)
|
Fachgebiet:
|
004 Informatik
|
Abstract:
|
Collaboratively created lexical resources is a trending approach to creating high quality thesauri in a short time span at a remarkably low price. The key idea is to invite non-expert participants to express and share their knowledge with the aim of constructing a resource. However, this approach tends to be noisy and error-prone, thus making data cleansing a highly topical task to perform. In this paper, we study different techniques for synset deduplication including machine- and crowd-based ones. Eventually, we put forward an approach that can solve the deduplication problem fully automatically, with the quality comparable to the expert-based approach.
|
| Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt. |
| Dieser Datensatz wurde nicht während einer Tätigkeit an der Universität Mannheim veröffentlicht, dies ist eine Externe Publikation. |
Suche Autoren in
Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail
Actions (login required)
|
Eintrag anzeigen |
|
|