Statistical Shape Knowledge in Variational Image Segmentation
Cremers, Daniel
URL:
|
http://ub-madoc.bib.uni-mannheim.de/52
|
URN:
|
urn:nbn:de:bsz:180-madoc-520
|
Document Type:
|
Doctoral dissertation
|
Year of publication:
|
2002
|
The title of a journal, publication series:
|
None
|
Publishing house:
|
Universität Mannheim
|
Evaluator:
|
Schnörr, Christoph
|
Date of oral examination:
|
24 July 2002
|
Publication language:
|
English
|
Institution:
|
School of Business Informatics and Mathematics > Bildverarbeitung, Mustererkennung u. Computergrafik (Schnörr 1999-2008)
|
Subject:
|
004 Computer science, internet
|
Classification:
|
MSC:
68T45 ,
|
Subject headings (SWD):
|
Computer Vision , Bildsegmentierung , Mustererkennung , Variationsrechnung , Statistik
|
Individual keywords (German):
|
Optischer Fluss
|
Keywords (English):
|
computer vision , image segmentation , statistical shape models , variational methods , diffusion snake
|
Abstract:
|
When interpreting an image, a human observer takes into account not only the external input given by the intensity information in the image, but also internally represented knowledge. The present work is devoted to modeling such an interaction by combining in a segmentation process both low-level image cues and statistically encoded prior knowledge about the shape of expected objects. To this end, we introduce the diffusion snake as a hybrid model combining the external energy of the Mumford-Shah functional with the internal energy of the snake. In particular, we present a method called "motion competition" as an extension of the Mumford-Shah functional which aims at maximizing the homogeneity with respect to the motion estimated in each region. These purely image-based segmentation methods are extended by a shape prior, which statistically encodes a set of training silhouettes. We propose two statistical shape models of different complexity. The first one is based on the assumption that the training shapes form a Gaussian distribution in the input space, whereas the second one assumes a Gaussian distribution upon a nonlinear mapping to an appropriate feature space. This nonlinear shape prior permits to simultaneously encode in a fully unsupervised manner a fairly complex set of shapes, such as the 2D silhouettes corresponding to several 3D objects. To make the shape prior independent of translation, rotation and scaling, we propose an intrinsic alignment of the evolving contour with the training set before applying the shape prior. Numerical results demonstrate that the evolving contour is restricted to a submanifold of familiar shapes while being entirely free to translate, rotate and scale. The shape prior compensates for ambiguous, missing or misleading low-level information. It permits a segmentation of objects of interest in images which are corrupted by noise, clutter or occlusion.
|
Translation of the title:
|
null
(German)
|
Translation of the abstract:
|
Die vorliegende Arbeit widmet sich der Fragestellung, wie sich vorher gelerntes Wissen über zu segmentierende Objekte in Segemntationsverfahren integieren lässt. Basierend auf klar definierten Optimierungskriterien werden Segmentierungen berechnet, die sowohl die gegebene Bildinformation als auch vorhandenes a-priori Wissen berücksichtigen. Das Segmentationsverfahren sind die "Diffusion Snakes", ein hybrides Modell mit der externen Energie des Mumford-Shah Funktionals und der internen Energie des Snakes. Das a-priori Wissen wird durch statistische Formmodelle unterschiedlicher Komplexität modelliert. Numerische Ergebnisse belegen, dass das a-priori Wissen die Segmentation deutlich verbessert, insbesondere wenn die Bildinformation durch Rauschen, Hintergrundstrukturen und teilweise Verdeckungen der Objekte gestört ist. Im letzten Teil der Arbeit wird der datengetriebene Anteil des Segmentationsverfahrens dahingehend modifiziert, dass eine Segmentierung von Objekten aufgrund ihrer relativen Bewegung möglich wird. Numerische Experimente belegen, dass sich insbesondere auch bewegte Objekte segmentieren lassen, die sich aufgrund ihrer Helligkeit nicht vom Hintergrund unterscheiden. Mathematisch lässt sich der datengetriebene Anteil als eine Erweiterung des Mumford-Shah Funktionals für das Problem der Bewegungssegmentation interpretieren. In Anlehnung an das existierende "region competition" wurde dieses Verfahren als "motion competition" bezeichnet.
(German)
|
Additional information:
|
|
| Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt. |
Search Authors in
You have found an error? Please let us know about your desired correction here: E-Mail
Actions (login required)
|
Show item |
|
|