Learning Conflict Resolution Strategies for Cross-language Wikipedia Data Fusion
Bryl, Volha
;
Bizer, Christian
DOI:
|
https://doi.org/10.1145/2567948.2578999
|
URL:
|
http://www.dl.kuis.kyoto-u.ac.jp/webquality2014/p1...
|
Weitere URL:
|
http://dws.informatik.uni-mannheim.de/fileadmin/le...
|
Dokumenttyp:
|
Konferenzveröffentlichung
|
Erscheinungsjahr:
|
2014
|
Buchtitel:
|
23rd International World Wide Web Conference, WWW '14, Seoul, Republic of Korea, April 7-11, 2014, Companion Volume
|
Seitenbereich:
|
1129-1134
|
Veranstaltungstitel:
|
4th Workshop on Web Quality (WebQuality2014)
|
Veranstaltungsdatum:
|
April 2014
|
Herausgeber:
|
Chung, Chin-Wan
|
Ort der Veröffentlichung:
|
New York, NY
|
Verlag:
|
ACM
|
ISBN:
|
978-1-4503-2745-9
|
Sprache der Veröffentlichung:
|
Englisch
|
Einrichtung:
|
Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Information Systems V: Web-based Systems (Bizer 2012-)
|
Fachgebiet:
|
004 Informatik
|
Freie Schlagwörter (Englisch):
|
Data Fusion, Data Integration, Wikipedia
|
Abstract:
|
In order to efficiently use the ever growing amounts of structured data on the web, methods and tools for quality-aware data integration should be devised. In this paper we propose an approach to automatically learn the conflict resolution strategies, which is a crucial step in large-scale data integration. The approach is implemented as an extension of the Sieve data quality assessment and fusion framework. We apply and evaluate our approach on the use case of fusing data from 10 language editions of DBpedia, a large-scale structured knowledge base extracted from Wikipedia. We also propose a method for extracting rich provenance metadata for each DBpedia fact, which is later used in data fusion.
|
| Dieser Eintrag ist Teil der Universitätsbibliographie. |
Suche Autoren in
Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail
Actions (login required)
|
Eintrag anzeigen |
|
|