Titel: |
Visuelle Aufmerksamkeitsmodelle basierend auf neuronalen Netzwerken |
|
Weitere Titel: |
Neural nezwork based visual attention models
[übersetzt]
|
|
Beteiligte Personen: |
|
Beteiligte Körperschaften: |
Universität Rostock[Grad-verleihende Institution] |
|
38329-6 |
Universität Rostock, Mathematisch-Naturwissenschaftliche Fakultät[Grad-verleihende Institution] |
|
2147083-2 |
|
|
Zusammenfassung: |
Ziel dieser Arbeit war es, eine Architektur aufzubauen, welche sowohl die Lokalisierung
als auch die Erkennung von Objekten in Bildern ermöglicht und dabei effizient skaliert.
Inspiriert durch die Art und Weise der menschlichen Wahrnehmung, wird ein Modell konzipiert,
welches mittels Aufmerksamkeit selektiv Bildregionen fokussiert und diese sequentiell
verarbeitet. Konzepte aus dem überwachten und bestärkenden Lernen werden kombiniert,
um ein globales Training des Modells zu ermöglichen. Die Arbeit endet mit Experimenten
zum Klassifizieren von Ziffern und Lokalisieren von KFZ-Kennzeichen.
[Deutsch] |
The goal of this thesis was to create an architecture, which is able to both localize
and recognize objects in a scene, while simultaneously scaling efficiently. Inspired
by the way of the human perception, a model is designed to selectively focus its attention
on different regions in an image and process them sequentially. By combining concepts
from supervised and reinforcement learning, a method is created, which enables the
architecture to be trained globally. The thesis ends with experiments on digit classification
and license plate localisation.
[Englisch] |
|
Dokumenttyp: |
|
Einrichtung: |
Mathematisch-Naturwissenschaftliche Fakultät |
|
Sprache: |
|
Sachgruppe der DNB: |
|
Umfang: |
|
|
Veröffentlichung / Entstehung: |
Rostock
Rostock: Universität Rostock
|
2016
|
|
Verantwortlichkeitsangabe: |
|
|
Identifikatoren: |
|
|
Zugang: |
frei zugänglich (Open Access)
|
|
Lizenz/Rechtehinweis: |
alle Rechte vorbehalten Das Werk darf ausschließlich nach den vom deutschen Urheberrechtsgesetz festgelegten Bedingungen genutzt werden. |
|
|
RosDok-ID: |
rosdok_thesis_0000000025 |
erstellt / geändert am: |
18.10.2018 / 08.08.2023
|
Metadaten-Lizenz: |
Die Metadaten zu diesem Dokument sind gemeinfrei (CC0 1.0 Universal Public Domain Dedication). |