Using large language models for preprocessing and information extraction from unstructured text: A proof-of-concept application in the social sciences


Schwitter, Nicole


[img] PDF
schwitter-2025-using-large-language-models-for-preprocessing-and-information-extraction-from-unstructured-text-a-proof.pdf - Veröffentlichte Version

Download (196kB)

DOI: https://doi.org/10.1177/20597991251313876
URL: https://journals.sagepub.com/doi/10.1177/205979912...
URN: urn:nbn:de:bsz:180-madoc-688782
Dokumenttyp: Zeitschriftenartikel
Erscheinungsjahr Online: 2025
Datum: 17 Januar 2025
Titel einer Zeitschrift oder einer Reihe: Methodological Innovations
Band/Volume: tba
Heft/Issue: tba
Ort der Veröffentlichung: London
Verlag: Sage Publishing
ISSN: 2059-7991
Sprache der Veröffentlichung: Englisch
Einrichtung: Außerfakultäre Einrichtungen > MZES - Arbeitsbereich A
Bereits vorhandene Lizenz: Creative Commons Namensnennung 4.0 International (CC BY 4.0)
Fachgebiet: 300 Sozialwissenschaften, Soziologie, Anthropologie
Abstract: Recent months have witnessed an increase in suggested applications for large language models (LLMs) in the social sciences. This proof-of-concept paper explores the use of LLMs to improve text quality and to extract predefined information from unstructured text. The study showcases promising results with an example focussed on historical newspapers and highlights the effectiveness of LLMs in correcting errors in the parsed text and in accurately extracting specified information. By leveraging the capabilities of LLMs in these straightforward, instruction-based tasks, this research note demonstrates their potential to improve on the efficiency and accuracy of text analysis workflows. The ongoing development of LLMs and the emergence of robust open-source options underscores their increasing accessibility for both, the quantitative and qualitative, social sciences and other disciplines working with text data.




Dieser Eintrag ist Teil der Universitätsbibliographie.

Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.

Diese Publikation ist bisher nur Online erschienen. Diese Publikation nun als "Jetzt in Print erschienen" melden.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Download-Statistik

Downloads im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen