Automatische Texterkennung von Handschriften und historischen Drucken - Qualität und Normierung von Ground-Truth-Daten in der Praxis


Huff, Dorothee ; Will, Larissa ; Stöbener, Kristina


[img] PDF
Huff_BoA-FORGE2023.pdf - Published

Download (66kB)

DOI: https://doi.org/10.5281/zenodo.8386502
URL: https://zenodo.org/records/8386502
URN: urn:nbn:de:bsz:180-madoc-696911
Document Type: Conference or workshop publication
Year of publication: 2023
Book title: FORGE 2023 - Forschungsdaten in den Geisteswissenschaften: Anything Goes?! Forschungsdaten in den Geisteswissenschaften - kritisch betrachtet; Konferenzabstracts; Eberhard Karls Universität Tübingen, 04. bis 06. Oktober 2023
Page range: 64-67
Conference title: FORGE 2023
Location of the conference venue: Tübingen
Date of the conference: 04.-06.10.2023
Publisher: Derntl, Michael ; Gietz, Peter ; Helling, Patrick
Place of publication: Tübingen
Publishing house: Zenodo
Publication language: German
Institution: Zentrale Einrichtungen > University Library
Pre-existing license: Creative Commons Attribution 4.0 International (CC BY 4.0)
Subject: 020 Library and information sciences
Individual keywords (German): OCR , ATR , HTR , Texterkennung , Transkribus , eScriptorium , Paläographie , Ground Truth , Vortrag
Keywords (English): OCR , ATR , HTR , text recognition , Transkribus , eScriptorium , paleography , ground truth , lecture
Abstract: Automatische Texterkennung (OCR) übersetzt textliche Bildinhalte in digitale Textformate. Auf diese Weise werden der Zugang zu historischen Drucken und Handschriften erhöht und neue Forschungsfragen an das Material ermöglicht. Vor der wissenschaftlichen Auswertung der Daten gilt es jedoch, sich über Aspekte wie Qualität und Normierung der Ground-Truth-Daten und des erzeugten Outputs bewusst zu werden, diese zu hinterfragen und bei der Nachnutzung der Daten in Betracht zu ziehen. Anhand von Beispielen sollen unterschiedliche Vorgehensweisen bei der Erzeugung von Ground-Truth-Daten sowie Ergebnisse der jeweiligen Modelltrainings vorgestellt und problematisiert werden.




Dieser Eintrag ist Teil der Universitätsbibliographie.

Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.




Metadata export


Citation


+ Search Authors in

+ Download Statistics

Downloads per month over past year

View more statistics



You have found an error? Please let us know about your desired correction here: E-Mail


Actions (login required)

Show item Show item