Visuelle Aufmerksamkeitsmodelle basierend auf neuronalen Netzwerken

Johannes Michael

doi:10.18453/rosdok_id00002317

Johannes Michael

Visuelle Aufmerksamkeitsmodelle basierend auf neuronalen Netzwerken

Universität Rostock, 2016

https://doi.org/10.18453/rosdok_id00002317

Abstract: Ziel dieser Arbeit war es, eine Architektur aufzubauen, welche sowohl die Lokalisierung als auch die Erkennung von Objekten in Bildern ermöglicht und dabei effizient skaliert. Inspiriert durch die Art und Weise der menschlichen Wahrnehmung, wird ein Modell konzipiert, welches mittels Aufmerksamkeit selektiv Bildregionen fokussiert und diese sequentiell verarbeitet. Konzepte aus dem überwachten und bestärkenden Lernen werden kombiniert, um ein globales Training des Modells zu ermöglichen. Die Arbeit endet mit Experimenten zum Klassifizieren von Ziffern und Lokalisieren von KFZ-Kennzeichen.

Masterarbeit Freier Zugang

100%0 °

Titel:

Visuelle Aufmerksamkeitsmodelle basierend auf neuronalen Netzwerken

Weitere Titel:

Neural nezwork based visual attention models [übersetzt]

Beteiligte Personen:

Johannes Michael[VerfasserIn]
Tobias Grüning[AkademischeR BetreuerIn]
Roger Labahn[AkademischeR BetreuerIn]
	0000-0003-1901-9644
	170999645

Beteiligte Körperschaften:

Universität Rostock[Grad-verleihende Institution]
	38329-6
Universität Rostock, Mathematisch-Naturwissenschaftliche Fakultät[Grad-verleihende Institution]
	2147083-2

Zusammenfassung:

Ziel dieser Arbeit war es, eine Architektur aufzubauen, welche sowohl die Lokalisierung als auch die Erkennung von Objekten in Bildern ermöglicht und dabei effizient skaliert. Inspiriert durch die Art und Weise der menschlichen Wahrnehmung, wird ein Modell konzipiert, welches mittels Aufmerksamkeit selektiv Bildregionen fokussiert und diese sequentiell verarbeitet. Konzepte aus dem überwachten und bestärkenden Lernen werden kombiniert, um ein globales Training des Modells zu ermöglichen. Die Arbeit endet mit Experimenten zum Klassifizieren von Ziffern und Lokalisieren von KFZ-Kennzeichen. [Deutsch]

The goal of this thesis was to create an architecture, which is able to both localize and recognize objects in a scene, while simultaneously scaling efficiently. Inspired by the way of the human perception, a model is designed to selectively focus its attention on different regions in an image and process them sequentially. By combining concepts from supervised and reinforcement learning, a method is created, which enables the architecture to be trained globally. The thesis ends with experiments on digit classification and license plate localisation. [Englisch]

Dokumenttyp:

Masterarbeit

Einrichtung:

Mathematisch-Naturwissenschaftliche Fakultät

Sprache:

Deutsch

Sachgruppe der DNB:

510 Mathematik

Umfang:

Online-Ressource

Veröffentlichung /
Entstehung:

Rostock