title: |
Visuelle Aufmerksamkeitsmodelle basierend auf neuronalen Netzwerken |
|
other title: |
Neural nezwork based visual attention models
[translated]
|
|
contributing persons: |
|
contributing corporate bodies: |
Universität Rostock[Grad-verleihende Institution] |
|
38329-6 |
Universität Rostock, Mathematisch-Naturwissenschaftliche Fakultät[Grad-verleihende Institution] |
|
2147083-2 |
|
|
abstract: |
Ziel dieser Arbeit war es, eine Architektur aufzubauen, welche sowohl die Lokalisierung
als auch die Erkennung von Objekten in Bildern ermöglicht und dabei effizient skaliert.
Inspiriert durch die Art und Weise der menschlichen Wahrnehmung, wird ein Modell konzipiert,
welches mittels Aufmerksamkeit selektiv Bildregionen fokussiert und diese sequentiell
verarbeitet. Konzepte aus dem überwachten und bestärkenden Lernen werden kombiniert,
um ein globales Training des Modells zu ermöglichen. Die Arbeit endet mit Experimenten
zum Klassifizieren von Ziffern und Lokalisieren von KFZ-Kennzeichen.
[German] |
The goal of this thesis was to create an architecture, which is able to both localize
and recognize objects in a scene, while simultaneously scaling efficiently. Inspired
by the way of the human perception, a model is designed to selectively focus its attention
on different regions in an image and process them sequentially. By combining concepts
from supervised and reinforcement learning, a method is created, which enables the
architecture to be trained globally. The thesis ends with experiments on digit classification
and license plate localisation.
[English] |
|
document type: |
|
institution: |
Faculty of Mathematics and Natural Sciences |
|
language: |
|
subject class (DDC): |
|
extent: |
|
|
publication / production: |
Rostock
Rostock: Universität Rostock
|
2016
|
|
statement of responsibility: |
|
|
identifiers: |
|
|
access condition: |
|
license/rights statement: |
all rights reserved This work may only be used under the terms of the German Copyright Law (Urheberrechtsgesetz). |
|
|
RosDok id: |
rosdok_thesis_0000000025 |
created / modified: |
18.10.2018 / 08.08.2023
|
metadata license: |
The metadata of this document was dedicated to the public domain (CC0 1.0 Universal Public Domain Dedication). |