Automatische Texterkennung von Handschriften und historischen Drucken - Qualität und Normierung von Ground-Truth-Daten in der Praxis


Huff, Dorothee ; Will, Larissa ; Stöbener, Kristina


[img] PDF
Huff_BoA-FORGE2023.pdf - Veröffentlichte Version

Download (66kB)

DOI: https://doi.org/10.5281/zenodo.8386502
URL: https://zenodo.org/records/8386502
URN: urn:nbn:de:bsz:180-madoc-696911
Dokumenttyp: Konferenzveröffentlichung
Erscheinungsjahr: 2023
Buchtitel: FORGE 2023 - Forschungsdaten in den Geisteswissenschaften: Anything Goes?! Forschungsdaten in den Geisteswissenschaften - kritisch betrachtet; Konferenzabstracts; Eberhard Karls Universität Tübingen, 04. bis 06. Oktober 2023
Seitenbereich: 64-67
Veranstaltungstitel: FORGE 2023
Veranstaltungsort: Tübingen
Veranstaltungsdatum: 04.-06.10.2023
Herausgeber: Derntl, Michael ; Gietz, Peter ; Helling, Patrick
Ort der Veröffentlichung: Tübingen
Verlag: Zenodo
Sprache der Veröffentlichung: Deutsch
Einrichtung: Zentrale Einrichtungen > UB Universitätsbibliothek
Bereits vorhandene Lizenz: Creative Commons Namensnennung 4.0 International (CC BY 4.0)
Fachgebiet: 020 Bibliotheks- und Informationswissenschaft
Freie Schlagwörter (Deutsch): OCR , ATR , HTR , Texterkennung , Transkribus , eScriptorium , Paläographie , Ground Truth , Vortrag
Freie Schlagwörter (Englisch): OCR , ATR , HTR , text recognition , Transkribus , eScriptorium , paleography , ground truth , lecture
Abstract: Automatische Texterkennung (OCR) übersetzt textliche Bildinhalte in digitale Textformate. Auf diese Weise werden der Zugang zu historischen Drucken und Handschriften erhöht und neue Forschungsfragen an das Material ermöglicht. Vor der wissenschaftlichen Auswertung der Daten gilt es jedoch, sich über Aspekte wie Qualität und Normierung der Ground-Truth-Daten und des erzeugten Outputs bewusst zu werden, diese zu hinterfragen und bei der Nachnutzung der Daten in Betracht zu ziehen. Anhand von Beispielen sollen unterschiedliche Vorgehensweisen bei der Erzeugung von Ground-Truth-Daten sowie Ergebnisse der jeweiligen Modelltrainings vorgestellt und problematisiert werden.




Dieser Eintrag ist Teil der Universitätsbibliographie.

Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Download-Statistik

Downloads im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen