WInte.r - a web data integration framework


Lehmberg, Oliver ; Brinkmann, Alexander ; Bizer, Christian



URL: http://ceur-ws.org/Vol-1963/paper506.pdf
Weitere URL: http://ceur-ws.org/Vol-1963/
Dokumenttyp: Konferenzveröffentlichung
Erscheinungsjahr: 2017
Buchtitel: ISWC-P&D-Industry 2017 : Proceedings of the ISWC 2017 Posters & Demonstrations and Industry Tracks co-located with 16th International Semantic Web Conference (ISWC 2017) Vienna, Austria, October 23rd to 25th, 2017
Titel einer Zeitschrift oder einer Reihe: CEUR Workshop Proceedings
Band/Volume: 1963
Seitenbereich: Paper 506
Veranstaltungstitel: 16th International Semantic Web Conference (ISWC 2017)
Veranstaltungsort: Vienna, Austria
Veranstaltungsdatum: October 23-25,2017
Herausgeber: Nikitina, Nadeschda
Ort der Veröffentlichung: Aachen, Germany
Verlag: RWTH Aachen
ISSN: 1613-0073
Sprache der Veröffentlichung: Englisch
Einrichtung: Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Information Systems V: Web-based Systems (Bizer 2012-)
Fachgebiet: 004 Informatik
Freie Schlagwörter (Englisch): Data Integration , Schema Matching , Identity Resolution , Data Fusion , Web Data
Abstract: The Web provides a plethora of structured data, such as semantic annotations in web pages, data from HTML tables, datasets from open data portals, or linked data from the Linked Open Data Cloud. For many use cases, it is necessary to integrate such web data with existing local datasets. This integration entails schema matching, identity resolution, as well as data fusion. As an alternative to using a combination of partial or ad hoc solutions, this poster presents the Web Data Integration Framework (WInte.r ), which supports end-to-end data integration by providing algorithms and building blocks for data pre-processing, schema matching, and identity resolution, as well as data fusion. While being fully usable out-of-the box, the framework is highly customisable and allows for the composition of sophisticated integration architectures such as T2K Match, which is used to match millions of web tables against DBpedia. A second use case for which WInte.r was employed is the task of stitching (combining) web tables from the same web site into larger tables as a preprocessing step before matching. The WInte.r framework is written in Java and is available as open source under the Apache 2.0 license.




Dieser Eintrag ist Teil der Universitätsbibliographie.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Aufruf-Statistik

Aufrufe im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen