1 |
Ein Fenster zu Gotthelfs Werk und Zeit. Die historisch-kritische Jeremias Gotthelf-Edition richtet sich an ein breites Publikum ...
|
|
|
|
BASE
|
|
Show details
|
|
3 |
Estimating shape and pose from images
|
|
|
|
Abstract:
This thesis is set in the field of pose and shape estimation of articulated objects from image observations. With the recent shift in paradigm towards deep learning also the methods for pose estimation evolved from optimizing object models in a tracking fashion, towards powerful discriminative algorithms that make frame independent estimation possible. This directional change has introduced new challenges, such as the need for good training data to supervise deep learning methods. This thesis tackles some of the challenges and proposes ways to provide training data for discriminative methods or to extend existing data sources towards new settings. First, the use of synthetic data is explored in the scope of hand pose estimation. An architecture for 3D hand pose estimation from a single image is proposed that, trained on the synthetic dataset, achieved state of the art in pose estimation and allowed surpassing previous approaches on sign language recognition. Second, existing RGB datasets are leveraged to develop an approach that estimates metrically correct human pose from RGBD inputs, with only minimal need of labeled RGBD data. The approach outperformed comparable approaches and allowed teaching a robot new tasks from few human demonstrations. Third, a new approach for estimation of 3D pose incorporating multiple camera views in a holistic fashion is presented. It is applied in a biological setting for motion capture of laboratory animals. More accurate and robust results are obtained than by using non-holistic prediction methods. Our approach can learn the task at hand from fewer labeled samples than state of the art methods. Lastly, the multi-view pose estimation algorithm is adapted to hand pose and extended by a model-based fitting procedure that yields shape fits. This allowed to create a real-world dataset of RGB images with corresponding hand shape fits, which is an important mile stone for training and evaluating single view methods. ; Diese Arbeit beschäftigt sich mit der Schätzung von Pose und Gestalt von artikulierten Objekten. Dieses Forschungsfeld hat in den letzten Jahren einen Wandel vollzogen: Es hat sich von modelbasierten Trackingverfahren hin zu diskriminative Methoden entwickelt. Diese basieren meist auf tiefen neuronalen Netzen und erlauben die Schätzung von Pose und Gestalt basierend auf einem einzigen Bild. Mit diesem methodischen Wechsel rücken neue Herausforderung in den Vordergrund, wie die Notwendigkeit von großen Mengen an annotierten Daten, um die diskriminativen Ansätze trainieren zu können. Diese Arbeit beschäftigt sich mit den Herausforderungen und entwickelt Strategien, um Trainingsdaten zu gewinnen und bestehende Daten für weitere Aufgaben nutzbar zu machen. Zunächst wird die Anwendbarkeit von künstlich generierten Datensätzen geprüft, um das Problem der Hand Posen Schätzung von einem einzelnen Farbbild zu lernen. Hierzu wird eine tiefe Netzarchitektur entwickelt und auf dem erzeugten Datensatz trainiert. Der resultierende Algorithmus erlaubt es 3D Hand Pose von einem einzelnen Farbbild zu bestimmen und dadurch den Stand der Technik in der Detektion von Handzeichensprache zu verbessern. Nachfolgend wird ein Ansatz vorgestellt, der es erlaubt Körperpose von Menschen anhand von RGBD Bildern zu schätzen. Dieser baut auf bestehenden RGB Datensätzen auf und benötigt daher nur eine geringe Menge annotierter RGBD Beispiele. Der entwickelte Ansatz wird dazu genutzt einem Roboter neue Aufgaben beizubringen, indem er einen menschlichen Lehrer während der Demonstration beobachtet und anschließend imitiert. Als nächstes wird eine Methode vorgestellt, die es erlaubt Pose von Tieren unter Zuhilfenahme von mehreren Kameras zu bestimmen. Die Methode verfolgt einen ganzheitlichen Ansatz aller Kamera, was den vorgestellten Ansatz robuster und exakter arbeiten lässt als bisherige Methoden. Anwendung findet der Algorithmus im Rahmen biologischer Experimente mit Versuchstieren. Hierbei ermöglicht er deren Bewegungsschätzung und erlaubt es die Wirkung von opto-genetischer Stimulation zu quantisieren. Letztlich wird die vorige Methode um einen Ansatz zur Schätzung der Handgestalt erweitert. Hierbei wird ein parametrisches Handmodell verwendet, dass unter Zuhilfenahme von Posen- und Segmentierungsschätzung positioniert wird. Dies erlaubt es einen großen Datensatz mit echten RGB Bildern und zugehörigen Hand Annotation zu erstellen, in dessen Erstellung manueller Aufwand nur in geringem Umfang einfließen muss.
|
|
Keyword:
Deep learning; Maschinelles Lernen; Maschinelles Sehen
|
|
URL: https://www.freidok.uni-freiburg.de/dnb/download/174719 https://nbn-resolving.org/urn:nbn:de:bsz:25-freidok-1747197 https://doi.org/10.6094/UNIFR/174719 https://freidok.uni-freiburg.de/data/174719
|
|
BASE
|
|
Hide details
|
|
5 |
Learning to Estimate 3D Hand Pose from Single RGB Images ...
|
|
|
|
BASE
|
|
Show details
|
|
10 |
Das Idiotikon: Schlüssel zu unserer sprachlichen Identität und mehr : [Frühjahrstagung der Schweizerischen Akademie der Geistes- und Sozialwissenschaften Zürich, 24. April 2008] = L' Idiotikon: une clé pour notre identité linguistique, voire plus
|
|
|
|
BDSL
|
|
BLLDB
|
|
UB Frankfurt Linguistik
|
|
Show details
|
|
|
|