Zurück zur Übersicht
Exportieren als [feed] RSS 1.0 [feed] RSS 2.0

Zitation

Gruppieren nach: Dokumenttyp | Erscheinungsjahr | Keine Sortierung
Anzahl der Einträge: 7.

Zeitschriftenartikel

Schmidt, Thomas ORCID: 0000-0003-3620-3355 ; Kamlah, Jan ; Weil, Stefan ORCID: 0000-0002-0524-9898 (2024) Reichsanzeiger-GT : an OCR ground truth dataset based on the historical newspaper “Deutscher Reichsanzeiger und Preußischer Staatsanzeiger” (German Imperial Gazette and Prussian Official Gazette) (1819–1945). Open Access Data in Brief Amsterdam [u.a.] 54 Article 110274 1-7 [Zeitschriftenartikel]
[img]

Konferenzveröffentlichung

Rehbein, Ines ; Ruppenhofer, Josef ; Schmidt, Thomas Improving sentence boundary detection for spoken language transcripts. Calzolari, Nicoletta 7102-7111 In: LREC 2020 Marseille : Twelfth International Conference on Language Resources and Evaluation$dMay 11-16, 2020, Palais du Pharo, Marseille, France : conference proceedings (2020) Paris ; Mannheim LREC 2020 (Marseille, France) [Konferenzveröffentlichung]

Schmidt, Thomas ; Geyken, Alexander ; Storrer, Angelika Refining and exploiting the structural markup of the eWDG. Bernal, Elisenda Sèrie Activitas 20 469-481 In: Proceedings of the XIII Euralex International Congress : Barcelona, 15-19 july 2008 (2008) Barcelona XIII Euralex International Congress (Barcelona, Spain) [Konferenzveröffentlichung]

Präsentation auf Konferenz

Kamlah, Jan ; Schmidt, Thomas ORCID: 0000-0003-3620-3355 Der Weg zum nutzbaren Volltext. Werkspezifisches Training als Baustein der OCR-Volltexterkennung für Alte Drucke. Open Access (2022) 8. Bibliothekskongess Leipzig 2022: #FreiräumeSchaffen, BID (Leipzig, Germany) [Präsentation auf Konferenz]
[img]

Schmidt, Thomas ORCID: 0000-0003-3620-3355 ; Kamlah, Jan Finetune your OCR! Improving automated text recognition for early printed works by finetuning existing Tesseract models. Open Access (2022) ELAG 2022 (Riga, Latvia) [Präsentation auf Konferenz]
[img]

Kamlah, Jan ; Schmidt, Thomas ORCID: 0000-0003-3620-3355 ; Shigapov, Renat ORCID: 0000-0002-0331-2558 Extracting research data from historical documents with eScriptorium and Python. Open Access (2022) Focused Tutorial on Capturing, Enriching, Disseminating Research Data Objects, Use Cases from Text+, NFDI4Culture and BERD@NFDI (Mannheim, Germany) [Präsentation auf Konferenz]
[img]

Arbeitspapier

Kamlah, Jan ; Schmidt, Thomas ORCID: 0000-0003-3620-3355 (2023) Transkriptionsregeln und Guidelines zur Layoutbearbeitung im DFG-Projekt “Workflow für werkspezifisches Training auf Basis generischer Modelle mit OCR-D sowie Ground-Truth-Aufwertung”. Open Access Mannheim [Arbeitspapier]
[img]

Diese Liste wurde am Fri Apr 19 01:22:23 2024 CEST automatisch erstellt.