Learning Conflict Resolution Strategies for Cross-language Wikipedia Data Fusion


Bryl, Volha ; Bizer, Christian



DOI: https://doi.org/10.1145/2567948.2578999
URL: http://www.dl.kuis.kyoto-u.ac.jp/webquality2014/p1...
Weitere URL: http://dws.informatik.uni-mannheim.de/fileadmin/le...
Dokumenttyp: Konferenzveröffentlichung
Erscheinungsjahr: 2014
Buchtitel: 23rd International World Wide Web Conference, WWW '14, Seoul, Republic of Korea, April 7-11, 2014, Companion Volume
Seitenbereich: 1129-1134
Veranstaltungstitel: 4th Workshop on Web Quality (WebQuality2014)
Veranstaltungsdatum: April 2014
Herausgeber: Chung, Chin-Wan
Ort der Veröffentlichung: New York, NY
Verlag: ACM
ISBN: 978-1-4503-2745-9
Sprache der Veröffentlichung: Englisch
Einrichtung: Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Information Systems V: Web-based Systems (Bizer 2012-)
Fachgebiet: 004 Informatik
Freie Schlagwörter (Englisch): Data Fusion, Data Integration, Wikipedia
Abstract: In order to efficiently use the ever growing amounts of structured data on the web, methods and tools for quality-aware data integration should be devised. In this paper we propose an approach to automatically learn the conflict resolution strategies, which is a crucial step in large-scale data integration. The approach is implemented as an extension of the Sieve data quality assessment and fusion framework. We apply and evaluate our approach on the use case of fusing data from 10 language editions of DBpedia, a large-scale structured knowledge base extracted from Wikipedia. We also propose a method for extracting rich provenance metadata for each DBpedia fact, which is later used in data fusion.




Dieser Eintrag ist Teil der Universitätsbibliographie.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Aufruf-Statistik

Aufrufe im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen