Understanding the message of images
Weiland, Lydia
Doctoral dissertation
Place of publication:
Universität Mannheim
Ponzetto, Simone Paolo
8 June 2018
School of Business Informatics and Mathematics > Information Systems III: Enterprise Data Analysis (Ponzetto 2016-)
004 Computer science, internet
Bildverstehen , Suche , Rangordnung
Gist understanding , Image understanding , Media-iconic images , Entity ranking, Multimodal search and retrieval, Multimodal indexing
We investigate the problem of understanding the message (gist) conveyed by images and
their captions as found, for instance, on websites or news articles. To this end, we propose a
methodology to capture the meaning of image-caption pairs on the basis of large amounts
of machine-readable knowledge that have previously been shown to be highly effective for
text understanding. Our method identifies the connotation of objects beyond their denotation:
where most approaches to image or image-text understanding focus on the denotation of
objects, i.e., their literal meaning, our work addresses the identification of connotations,
i.e., iconic meanings of objects, to understand the message of images. We view image
understanding as the task of representing an image-caption pair on the basis of a widecoverage
vocabulary of concepts such as the one provided by Wikipedia, and cast gist
detection as a concept-ranking problem with image-caption pairs as queries.
Verstehen der Botschaft von Bildern
Wir untersuchen die Problematik des Verstehens der Kernbotschaft (Kern), die durch Bilder
und ihren Bildunterschriften, wie sie z.B. auf Webseiten oder in Nachrichtenartikeln zu
finden sind, vermittelt wird. Zu diesem Zweck präsentieren wir eine Methodik zur Erfassung
der Bedeutung von Bild-Bildunterschriften-Paaren auf Basis von großen Mengen maschinenlesbaren
Wissens, welches sich in der Vergangenheit für Textverständnis als sehr effektiv
erwiesen hat. Unsere Methode identifiziert die Konnotation von Objekten jenseits ihrer
Denotation: Während die meisten Ansätze zum Bild- oder Bild-Text-Verständnis sich auf
die Benennung von Objekten, d.h. ihrer wörtlichen Bedeutung, konzentrieren, beschäftigt
sich unsere Arbeit mit der Identifikation von Konnotationen, d.h. ikonischen Bedeutungen
von Objekten, um die Botschaft von Bildern zu verstehen. Wir betrachten das Bildverstehen
als die Aufgabe, ein Bild-Bildunterschriftenpaar auf Basis eines umfangreichen Vokabulars
von Konzepten, wie sie in Wikipedia bereit gestellt werden, zu repräsentieren und gehen das
Bild-Kern Verstehens als Konzept-Ranking Problem mit Bild-Bildunterschriften-Paaren als
Abfrage an.
