Sentence alignment methods for improving text simplification systems
Štajner, Sanja
;
Franco-Salvador, Mark
;
Ponzetto, Simone Paolo
;
Rosso, Paolo
;
Stuckenschmidt, Heiner

DOI:
|
https://doi.org/10.18653/v1/P17-2016
|
URL:
|
http://aclanthology.coli.uni-saarland.de/pdf/P/P17...
|
Weitere URL:
|
http://www.aclweb.org/anthology/P17-2016
|
Dokumenttyp:
|
Konferenzveröffentlichung
|
Erscheinungsjahr:
|
2017
|
Buchtitel:
|
The 55th Annual Meeting of the Association for Computational Linguistics - proceedings of the conference : July 30-August 4, 2017, Vancouver, Canada : ACL 2017
|
Band/Volume:
|
2
|
Seitenbereich:
|
97-102
|
Veranstaltungstitel:
|
The 55th Annual Meeting of the Association for Computational Linguistics (ACL)
|
Veranstaltungsort:
|
Vancouver, Canada
|
Veranstaltungsdatum:
|
July 30 - August 4 2017
|
Herausgeber:
|
Barzilay, Regina
|
Ort der Veröffentlichung:
|
Stroudsburg, PA
|
Verlag:
|
Association for Computational Linguistics
|
ISBN:
|
978-1-945626-76-0
|
Verwandte URLs:
|
|
Sprache der Veröffentlichung:
|
Englisch
|
Einrichtung:
|
Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Information Systems III: Enterprise Data Analysis (Ponzetto 2016-) Außerfakultäre Einrichtungen > SFB 884 Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Practical Computer Science II: Artificial Intelligence (Stuckenschmidt 2009-)
|
Fachgebiet:
|
004 Informatik
|
Freie Schlagwörter (Englisch):
|
automated text simplification , sentence alignment , natural language processing
|
Abstract:
|
We provide several methods for sentence alignment of texts with different complexity levels. Using the best of them, we sentence-align the Newsela corpora, thus providing large training materials for automatic text simplification (ATS) systems. We show that using this dataset, even the standard phrase-based statistical machine translation models for ATS can outperform
the state-of-the-art ATS systems.
|
 | Dieser Eintrag ist Teil der Universitätsbibliographie. |
Suche Autoren in
BASE:
Štajner, Sanja
;
Franco-Salvador, Mark
;
Ponzetto, Simone Paolo
;
Rosso, Paolo
;
Stuckenschmidt, Heiner
Google Scholar:
Štajner, Sanja
;
Franco-Salvador, Mark
;
Ponzetto, Simone Paolo
;
Rosso, Paolo
;
Stuckenschmidt, Heiner
ORCID:
Štajner, Sanja, Franco-Salvador, Mark, Ponzetto, Simone Paolo ORCID: https://orcid.org/0000-0001-7484-2049, Rosso, Paolo and Stuckenschmidt, Heiner ORCID: https://orcid.org/0000-0002-0209-3859
Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail
Actions (login required)
 |
Eintrag anzeigen |
|
|