Statistical Shape Knowledge in Variational Image Segmentation


Cremers, Daniel


[img]
Preview
PDF
52_1.pdf - Published

Download (25MB)

URL: http://ub-madoc.bib.uni-mannheim.de/52
URN: urn:nbn:de:bsz:180-madoc-520
Document Type: Doctoral dissertation
Year of publication: 2002
The title of a journal, publication series: None
Publishing house: Universität Mannheim
Evaluator: Schnörr, Christoph
Date of oral examination: 24 July 2002
Publication language: English
Institution: School of Business Informatics and Mathematics > Bildverarbeitung, Mustererkennung u. Computergrafik (Schnörr 1999-2008)
Subject: 004 Computer science, internet
Classification: MSC: 68T45 ,
Subject headings (SWD): Computer Vision , Bildsegmentierung , Mustererkennung , Variationsrechnung , Statistik
Individual keywords (German): Optischer Fluss
Keywords (English): computer vision , image segmentation , statistical shape models , variational methods , diffusion snake
Abstract: When interpreting an image, a human observer takes into account not only the external input given by the intensity information in the image, but also internally represented knowledge. The present work is devoted to modeling such an interaction by combining in a segmentation process both low-level image cues and statistically encoded prior knowledge about the shape of expected objects. To this end, we introduce the diffusion snake as a hybrid model combining the external energy of the Mumford-Shah functional with the internal energy of the snake. In particular, we present a method called "motion competition" as an extension of the Mumford-Shah functional which aims at maximizing the homogeneity with respect to the motion estimated in each region. These purely image-based segmentation methods are extended by a shape prior, which statistically encodes a set of training silhouettes. We propose two statistical shape models of different complexity. The first one is based on the assumption that the training shapes form a Gaussian distribution in the input space, whereas the second one assumes a Gaussian distribution upon a nonlinear mapping to an appropriate feature space. This nonlinear shape prior permits to simultaneously encode in a fully unsupervised manner a fairly complex set of shapes, such as the 2D silhouettes corresponding to several 3D objects. To make the shape prior independent of translation, rotation and scaling, we propose an intrinsic alignment of the evolving contour with the training set before applying the shape prior. Numerical results demonstrate that the evolving contour is restricted to a submanifold of familiar shapes while being entirely free to translate, rotate and scale. The shape prior compensates for ambiguous, missing or misleading low-level information. It permits a segmentation of objects of interest in images which are corrupted by noise, clutter or occlusion.
Translation of the title: null (German)
Translation of the abstract: Die vorliegende Arbeit widmet sich der Fragestellung, wie sich vorher gelerntes Wissen über zu segmentierende Objekte in Segemntationsverfahren integieren lässt. Basierend auf klar definierten Optimierungskriterien werden Segmentierungen berechnet, die sowohl die gegebene Bildinformation als auch vorhandenes a-priori Wissen berücksichtigen. Das Segmentationsverfahren sind die "Diffusion Snakes", ein hybrides Modell mit der externen Energie des Mumford-Shah Funktionals und der internen Energie des Snakes. Das a-priori Wissen wird durch statistische Formmodelle unterschiedlicher Komplexität modelliert. Numerische Ergebnisse belegen, dass das a-priori Wissen die Segmentation deutlich verbessert, insbesondere wenn die Bildinformation durch Rauschen, Hintergrundstrukturen und teilweise Verdeckungen der Objekte gestört ist. Im letzten Teil der Arbeit wird der datengetriebene Anteil des Segmentationsverfahrens dahingehend modifiziert, dass eine Segmentierung von Objekten aufgrund ihrer relativen Bewegung möglich wird. Numerische Experimente belegen, dass sich insbesondere auch bewegte Objekte segmentieren lassen, die sich aufgrund ihrer Helligkeit nicht vom Hintergrund unterscheiden. Mathematisch lässt sich der datengetriebene Anteil als eine Erweiterung des Mumford-Shah Funktionals für das Problem der Bewegungssegmentation interpretieren. In Anlehnung an das existierende "region competition" wurde dieses Verfahren als "motion competition" bezeichnet. (German)
Additional information:




Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.




Metadata export


Citation


+ Search Authors in

+ Download Statistics

Downloads per month over past year

View more statistics



You have found an error? Please let us know about your desired correction here: E-Mail


Actions (login required)

Show item Show item