Volltexterschließung leicht gemacht: Ein Crashkurs zur Transkriptionsplattform eScriptorium


Will, Larissa ; Kamlah, Jan ; Schmidt, Thomas


[img] PDF
HandsOnLab_BiblioCon2024.pdf - Veröffentlichte Version

Download (2MB)

URL: https://opus4.kobv.de/opus4-bib-info/frontdoor/ind...
URN: urn:nbn:de:bsz:180-madoc-696827
Dokumenttyp: Präsentation auf Konferenz
Erscheinungsjahr: 2024
Veranstaltungstitel: BiblioCon 2024
Veranstaltungsort: Hamburg, Germany
Veranstaltungsdatum: 04.-07.06.2024
Sprache der Veröffentlichung: Deutsch
Einrichtung: Zentrale Einrichtungen > UB Universitätsbibliothek
Bereits vorhandene Lizenz: Creative Commons Namensnennung, Weitergabe unter gleichen Bedingungen 4.0 International (CC BY-SA 4.0)
Fachgebiet: 020 Bibliotheks- und Informationswissenschaft
Freie Schlagwörter (Deutsch): OCR , HTR , ATR , Texterkennung , eScriptorium , Handschriften , Drucke , Workshop
Freie Schlagwörter (Englisch): OCR , HTR , ATR , text recognition , eScriptorium , manuscripts , print , workshop
Abstract: Volltexterschließung historischer Bestände stellt bis heute für Bibliotheken eine Herausforderung dar. Doch das, was nicht erschlossen ist, kann von der Öffentlichkeit und Forschungs-Community weder gefunden noch nachgenutzt werden. Genau hier setzt die Texterkennungs- und Transkriptionsplattform eScriptorium an und unterstützt Sie bei der Erschließung dieser wertvollen Dokumente. Egal, ob es sich um eine Postkarte, eine historische Zeitung oder ein amtliches Dokument handelt, eScriptorium bietet Ihnen die Werkzeuge, um die Vergangenheit lesbar und zugänglich zu machen. Dabei ist eScriptorium eine quelloffene und kostenlose Transkriptionsplattform und so eine Alternative zu proprietären Programmen wie Transkribus. Sie ermöglicht die automatisierte oder manuelle Bearbeitung von handschriftlichen und gedruckten Texten auf dem eigenen PC oder Server. Die Plattform erfreut sich wachsender Beliebtheit in der OCR-Community und ermöglicht auch das Training von Modellen zur Layoutanalyse und Texterkennung. Das Hands-On Lab bietet den Teilnehmenden einen Einblick in die Software und die neuesten Funktionen sowie deren praktische Anwendung. Anhand von realen Beispieldokumenten wird gemeinsam der Workflow von der automatischen Layouterkennung bis zur Transkription Schritt für Schritt durchlaufen. Die manuelle Korrektur der Ergebnisse, Annotationsmöglichkeiten sowie das Modelltraining anhand aktueller Standards wie der OCR-D Ground-Truth-Richtlinie werden behandelt. Die Teilnehmenden sollen in die Lage versetzt werden, eigenständig Trainingsmaterial zu erstellen, das Training in eScriptorium durchzuführen und eigene Digitalisate mit sehr guten Volltexten anzureichern. Die Universitätsbibliothek Mannheim betreibt eine eigene Instanz von eScriptorium und stellt diese für den Kurs bereit. Daher wird lediglich ein eigener Laptop mit WLAN und aktuellem Browser benötigt. Fragen und Wünsche können vorab per E-Mail kommuniziert werden, auch Kurzentschlossene sind herzlich willkommen.




Dieser Eintrag ist Teil der Universitätsbibliographie.

Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Download-Statistik

Downloads im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen