Ocromore : Combining multiple OCR-engine results to improve character recognition accuracy


Kamlah, Jan ; Stegmüller, Johannes


[img]
Vorschau
PDF (Ocromore)
Ocromore.pdf - Veröffentlichte Version

Download (7MB)

DOI: https://doi.org/10.5281/zenodo.1493860
URL: https://ub-madoc.bib.uni-mannheim.de/48756
URN: urn:nbn:de:bsz:180-madoc-487569
Dokumenttyp: Präsentation auf Konferenz
Erscheinungsjahr: 2018
Veranstaltungstitel: 14. International Bibliotheca Baltica Symposium
Veranstaltungsort: Rostock, Germany
Veranstaltungsdatum: 04.-05.10.2018
Sprache der Veröffentlichung: Englisch
Einrichtung: Zentrale Einrichtungen > UB Universitätsbibliothek
Lizenz: CC BY 4.0 Creative Commons Namensnennung 4.0 International (CC BY 4.0)
Fachgebiet: 020 Bibliotheks- und Informationswissenschaft
Abstract: One of the goals of the Aktienführer-Datenarchiv project is to process data from the Aktienführer and store it in a structured manner in a database. The Aktienführer is a reference work published annually between 1956-1999 as print book comprising data for companies listed at stock exchanges in Germany. A high character recognition accuracy is crucial for structure recognition and further analyses of the OCR-output. To optimize the OCR quality, "Ocromore" was developed. It is a toolset for combining multiple OCR-outputs. The best combined result is achieved with an word-wise character confidence-based multi sequence alignment (msa) approach. Our results show an character accuracy increase of 0,49% and an error reduction of 33% compared to the best single result.




Dieser Eintrag ist Teil der Universitätsbibliographie.

Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Download-Statistik

Downloads im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen