The Web Data Commons structured data extraction


Primpeli, Anna ; Meusel, Robert ; Bizer, Christian ; Stuckenschmidt, Heiner


[img]
Vorschau
PDF
est_poster_vice-uc_17-03-2017.pdf - Veröffentlichte Version

Download (460kB)

DOI: https://doi.org/10.11588/heidok.00022891
URL: https://madoc.bib.uni-mannheim.de/47870
Weitere URL: http://www.ub.uni-heidelberg.de/archiv/22891
URN: urn:nbn:de:bsz:180-madoc-478707
Dokumenttyp: Konferenzveröffentlichung
Erscheinungsjahr: 2017
Buchtitel: E-Science-Tage 2017: Forschungsdaten managen
Seitenbereich: 1
Veranstaltungstitel: E-Science-Tage 2017
Veranstaltungsort: Heidelberg, Germany
Veranstaltungsdatum: 16.-17. März 2017
Ort der Veröffentlichung: Heidelberg
Verlag: Heidelberg University
Sprache der Veröffentlichung: Englisch
Einrichtung: Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Information Systems V: Web-based Systems (Bizer 2012-)
Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Practical Computer Science II: Artificial Intelligence (Stuckenschmidt 2009-)
Fachgebiet: 004 Informatik
Abstract: More and more websites annotate their content using different markup formats. These annotations involve a large number of topics such as persons, events, products, hotels, organizations and cities. The purpose of embedding structured data in HTML pages is to make the content of those pages understandable to web applications. In this way, the retrieval and integration of data deriving from different web pages is greatly facilitated. The presented poster gives an overview of the Web Data Commons - structured data project for the year 2016. The Web Data Commons project extracts structured data from the web corpus provided by Common Crawl, the largest public web corpus, and offers the extracted data for public download. In order to process these huge amounts of data, Web Data Commons builds upon its Extraction Framework and the Amazon Web Services.




Dieser Eintrag ist Teil der Universitätsbibliographie.

Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Download-Statistik

Downloads im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen