Measuring progress in cictionary learning for language model interpretability with board game models


Karvonen, Adam ; Wright, Benjamin ; Rager, Can ; Angell, Rico ; Brinkmann, Jannik ; Smith, Logan Riggs ; Verdun, Claudio Mayrink ; Bau, David ; Marks, Samuel



URL: https://openreview.net/forum?id=SCEdoGghcw
Dokumenttyp: Präsentation auf Konferenz
Erscheinungsjahr: 2024
Veranstaltungstitel: NeurIPS 2024
Veranstaltungsort: Vancouver, Canada
Veranstaltungsdatum: 09.-15.12.2024
Verwandte URLs:
Sprache der Veröffentlichung: Englisch
Einrichtung: Außerfakultäre Einrichtungen > Institut für Enterprise Systems (InES)
Fachgebiet: 004 Informatik




Dieser Eintrag ist Teil der Universitätsbibliographie.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Aufruf-Statistik

Aufrufe im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen