title: |
Neural text line extraction in historical documents: a two-stage clustering approach |
|
contributing persons: |
|
contributing corporate bodies: |
Universität Rostock[Grad-verleihende Institution] |
|
38329-6 |
Universität Rostock, Mathematisch-Naturwissenschaftliche Fakultät[Grad-verleihende Institution] |
|
2147083-2 |
|
|
abstract: |
Accessibility of the valuable cultural heritage which is hidden in countless scanned
historical documents is the motivation for the presented dissertation. The developed
(fully automatic) text line extraction methodology combines state-of-the-art machine
learning techniques and modern image processing methods. It demonstrates its quality
by outperforming several other approaches on a couple of benchmarking datasets. The
method is already being used by a wide audience of researchers from different disciplines
and thus contributes its (small) part to the aforementioned goal.
[English] |
Das Erschließen des unermesslichen Wissens, welches in unzähligen gescannten historischen
Dokumenten verborgen liegt, bildet die Motivation für die vorgelegte Dissertation.
Durch das Verknüpfen moderner Verfahren des maschinellen Lernens und der klassischen
Bildverarbeitung wird in dieser Arbeit ein vollautomatisches Verfahren zur Extraktion
von Textzeilen aus historischen Dokumenten entwickelt. Die Qualität wird auf verschiedensten
Datensätzen im Vergleich zu anderen Ansätzen nachgewiesen. Das Verfahren wird bereits
durch eine Vielzahl von Forschern verschiedenster Disziplinen genutzt.
[German] |
|
document type: |
|
institution: |
Faculty of Mathematics and Natural Sciences |
|
language: |
|
subject class (DDC): |
|
|
publication / production: |
Rostock
Rostock: Universität Rostock
|
2018
|
|
statement of responsibility: |
vorgelegt von Tobias Grüning |
|
|
identifiers: |
|
|
access condition: |
|
license/rights statement: |
all rights reserved This work may only be used under the terms of the German Copyright Law (Urheberrechtsgesetz). |
|
|
RosDok id: |
rosdok_disshab_0000002077 |
created / modified: |
27.03.2019 / 08.08.2023
|
metadata license: |
The metadata of this document was dedicated to the public domain (CC0 1.0 Universal Public Domain Dedication). |