Ein sprachgestütztes Trainingssystem zur Evaluierung der Nasalität


Zecevic, Anto


[img]
Preview
PDF
Dissertation_Zecevic.pdf - Published

Download (2MB)

URL: https://ub-madoc.bib.uni-mannheim.de/84
URN: urn:nbn:de:bsz:180-madoc-846
Document Type: Doctoral dissertation
Year of publication: 2002
The title of a journal, publication series: None
Publishing house: Universität Mannheim
Evaluator: Männer, Reinhard
Date of oral examination: 18 July 2003
Publication language: German
Institution: School of Business Informatics and Mathematics > Informatik V (Männer 1992-2008)
Subject: 004 Computer science, internet
Subject headings (SWD): Digitale Sprachverarbeitung , Nasalität
Keywords (English): digital speech analysis , nasality
Abstract: In der vorliegenden Arbeit wurde ein sprachgestütztes Trainingssystem zur Evaluierung der Nasalität aus Mikrophonaufnahmen konzipiert und prototypisch implementiert. Die wichtigste Voraussetzung für dieses Vorhaben war die automatische Messung der Nasalität mit einer hohen Güte. Hierzu wurde die Sprachdatenbank NASAL mit verschiedenen Sprechergruppen, Passagen und Nasalitätsausprägungen aufgebaut und logopädisch bewertet. Aufbauend auf dieser erfolgten umfangreiche Untersuchungen zur Quantifizierung der Nasalität. Als ein wesentliches Ergebnis dieser Untersuchungen wird ein automatisches Verfahren zur Quantifizierung der Nasalität mit einer hohen Güte vorgestellt. Dieses beruht auf den Frequenzbandintensitäten und Sprachmodellparametern stimmhafter Laute. Um Aussagen über die beeinflussenden Faktoren der Nasalität gewinnen zu können, wurde als Klassifizierungsverfahren die Lineare Diskriminanzanalyse gewählt. Die im Trainingssystem zu Zuge kommende Spracherkennungstechnologie basiert auf dem kommerziellen Produkt „ViaVoice“ der Firma IBM. Über das Mikrophon aufgenommene Sprachdaten werden sowohl bzgl. der Nasalität als auch der Spracherkennungsleistung bewertet. Gerade in der dabei beobachteten sehr niedrigen Spracherkennungsrate zeigte sich die Komplexität bei der Verarbeitung sprechgestörter Aussprache. Die Integration der kommerziellen Spracherkennung ist daher zum jetzigen Zeitpunkt nicht empfehlenswert.
Translation of the title: A speech based training system for the evaluation of nasality (English)
Translation of the abstract: This work presents the Design and the prototypically implementation of a speech based training system for the evaluation of nasality from microphone input. The most important prerequisite for this project was the automatic measurement of the nasality with a high quality. To this purpose the speech database NASAL with different speaker groups, speech passages and nasality degrees was built and logopadically evaluated. Based on this database extensive analyses for the quantification of nasality were performed. As an essential result of these examinations, an automatic procedure for the quantification of nasality with a high quality is presented. The procedure bases on frequency group intensities and speech model parameters of voiced sounds. In order to gain statements over the influencing factors of the nasality, the linear discriminant analysis was chosen as classification method. The used speech recognition technology bases on the commercial product "ViaVoice" of the company "IBM". The microphone input is evaluated concerning the nasality as well as the speech recognition quality. The very low recognition rate measured indicates the complexity of processing disordered speech. Therefore the integration of the commercial speech recognition is not commendable to the present time. (English)
Additional information:




Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.




Metadata export


Citation


+ Search Authors in

BASE: Zecevic, Anto

Google Scholar: Zecevic, Anto

+ Download Statistics

Downloads per month over past year

View more statistics



You have found an error? Please let us know about your desired correction here: E-Mail


Actions (login required)

Show item Show item