Volltexterschließung leicht gemacht: Ein Crashkurs zur Transkriptionsplattform eScriptorium


Will, Larissa ; Kamlah, Jan ; Schmidt, Thomas


[img] PDF
HandsOnLab_BiblioCon2024.pdf - Published

Download (2MB)

URL: https://opus4.kobv.de/opus4-bib-info/frontdoor/ind...
URN: urn:nbn:de:bsz:180-madoc-696827
Document Type: Conference presentation
Year of publication: 2024
Conference title: BiblioCon 2024
Location of the conference venue: Hamburg, Germany
Date of the conference: 04.-07.06.2024
Publication language: German
Institution: Zentrale Einrichtungen > University Library
Pre-existing license: Creative Commons Attribution, Share Alike 4.0 International (CC BY-SA 4.0)
Subject: 020 Library and information sciences
Individual keywords (German): OCR , HTR , ATR , Texterkennung , eScriptorium , Handschriften , Drucke , Workshop
Keywords (English): OCR , HTR , ATR , text recognition , eScriptorium , manuscripts , print , workshop
Abstract: Volltexterschließung historischer Bestände stellt bis heute für Bibliotheken eine Herausforderung dar. Doch das, was nicht erschlossen ist, kann von der Öffentlichkeit und Forschungs-Community weder gefunden noch nachgenutzt werden. Genau hier setzt die Texterkennungs- und Transkriptionsplattform eScriptorium an und unterstützt Sie bei der Erschließung dieser wertvollen Dokumente. Egal, ob es sich um eine Postkarte, eine historische Zeitung oder ein amtliches Dokument handelt, eScriptorium bietet Ihnen die Werkzeuge, um die Vergangenheit lesbar und zugänglich zu machen. Dabei ist eScriptorium eine quelloffene und kostenlose Transkriptionsplattform und so eine Alternative zu proprietären Programmen wie Transkribus. Sie ermöglicht die automatisierte oder manuelle Bearbeitung von handschriftlichen und gedruckten Texten auf dem eigenen PC oder Server. Die Plattform erfreut sich wachsender Beliebtheit in der OCR-Community und ermöglicht auch das Training von Modellen zur Layoutanalyse und Texterkennung. Das Hands-On Lab bietet den Teilnehmenden einen Einblick in die Software und die neuesten Funktionen sowie deren praktische Anwendung. Anhand von realen Beispieldokumenten wird gemeinsam der Workflow von der automatischen Layouterkennung bis zur Transkription Schritt für Schritt durchlaufen. Die manuelle Korrektur der Ergebnisse, Annotationsmöglichkeiten sowie das Modelltraining anhand aktueller Standards wie der OCR-D Ground-Truth-Richtlinie werden behandelt. Die Teilnehmenden sollen in die Lage versetzt werden, eigenständig Trainingsmaterial zu erstellen, das Training in eScriptorium durchzuführen und eigene Digitalisate mit sehr guten Volltexten anzureichern. Die Universitätsbibliothek Mannheim betreibt eine eigene Instanz von eScriptorium und stellt diese für den Kurs bereit. Daher wird lediglich ein eigener Laptop mit WLAN und aktuellem Browser benötigt. Fragen und Wünsche können vorab per E-Mail kommuniziert werden, auch Kurzentschlossene sind herzlich willkommen.




Dieser Eintrag ist Teil der Universitätsbibliographie.

Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.




Metadata export


Citation


+ Search Authors in

+ Download Statistics

Downloads per month over past year

View more statistics



You have found an error? Please let us know about your desired correction here: E-Mail


Actions (login required)

Show item Show item