Towards automatic topical classification of LOD datasets


Meusel, Robert ; Spahiu, Blerina ; Bizer, Christian ; Paulheim, Heiko



URL: http://ceur-ws.org/Vol-1409/paper-03.pdf
Weitere URL: http://www.slideshare.net/BlerinaSpahiu/towards-au...
Dokumenttyp: Konferenzveröffentlichung
Erscheinungsjahr: 2015
Buchtitel: LDOW 2015 : Proceedings of the Workshop on Linked Data on the Web ; co-located with the 24th International World Wide Web Conference (WWW 2015) ; Florence, Italy, May 19th, 2015
Titel einer Zeitschrift oder einer Reihe: CEUR Workshop Proceedings
Band/Volume: 1409
Seitenbereich: Paper 03
Veranstaltungstitel: LDOW 2015
Veranstaltungsort: Florence, Italy
Veranstaltungsdatum: May 19th 2015
Herausgeber: Bizer, Christian
Ort der Veröffentlichung: Aachen, Germany
Verlag: RWTH Aachen
ISSN: 1613-0073
Sprache der Veröffentlichung: Englisch
Einrichtung: Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Information Systems V: Web-based Systems (Bizer 2012-)
Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Web Data Mining (Juniorprofessur) (Paulheim 2013-2017)
Fachgebiet: 004 Informatik
Freie Schlagwörter (Englisch): LOD , LDOW , Classification
Abstract: The datasets that are part of the Linking Open Data cloud diagramm (LOD cloud) are classified into the following topical categories: media, government, publications, life sciences, geographic, social networking, user-generated content, and cross-domain. The topical categories were manually assigned to the datasets. In this paper, we investigate to which extent the topical classification of new LOD datasets can be automated using machine learning techniques and the existing annotations as supervision. We conducted experiments with different classification techniques and different feature sets. The best classification technique/feature set combination reaches an accuracy of 81.62% on the task of assigning one out of the eight classes to a given LOD dataset. A deeper inspection of the classification errors reveals problems with the manual classification of datasets in the current LOD cloud.
Zusätzliche Informationen: Online-Ressource




Dieser Eintrag ist Teil der Universitätsbibliographie.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Aufruf-Statistik

Aufrufe im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen