In der vorliegenden Arbeit wurde ein sprachgestütztes Trainingssystem zur Evaluierung der Nasalität aus Mikrophonaufnahmen konzipiert und prototypisch implementiert. Die wichtigste Voraussetzung für dieses Vorhaben war die automatische Messung der Nasalität mit einer hohen Güte. Hierzu wurde die Sprachdatenbank NASAL mit verschiedenen Sprechergruppen, Passagen und Nasalitätsausprägungen aufgebaut und logopädisch bewertet. Aufbauend auf dieser erfolgten umfangreiche Untersuchungen zur Quantifizierung der Nasalität. Als ein wesentliches Ergebnis dieser Untersuchungen wird ein automatisches Verfahren zur Quantifizierung der Nasalität mit einer hohen Güte vorgestellt. Dieses beruht auf den Frequenzbandintensitäten und Sprachmodellparametern stimmhafter Laute. Um Aussagen über die beeinflussenden Faktoren der Nasalität gewinnen zu können, wurde als Klassifizierungsverfahren die Lineare Diskriminanzanalyse gewählt. Die im Trainingssystem zu Zuge kommende Spracherkennungstechnologie basiert auf dem kommerziellen Produkt „ViaVoice“ der Firma IBM. Über das Mikrophon aufgenommene Sprachdaten werden sowohl bzgl. der Nasalität als auch der Spracherkennungsleistung bewertet. Gerade in der dabei beobachteten sehr niedrigen Spracherkennungsrate zeigte sich die Komplexität bei der Verarbeitung sprechgestörter Aussprache. Die Integration der kommerziellen Spracherkennung ist daher zum jetzigen Zeitpunkt nicht empfehlenswert.
Übersetzter Titel:
A speech based training system for the evaluation of nasality
(Englisch)
Übersetzung des Abstracts:
This work presents the Design and the prototypically implementation of a speech based training system for the evaluation of nasality from microphone input. The most important prerequisite for this project was the automatic measurement of the nasality with a high quality. To this purpose the speech database NASAL with different speaker groups, speech passages and nasality degrees was built and logopadically evaluated. Based on this database extensive analyses for the quantification of nasality were performed. As an essential result of these examinations, an automatic procedure for the quantification of nasality with a high quality is presented. The procedure bases on frequency group intensities and speech model parameters of voiced sounds. In order to gain statements over the influencing factors of the nasality, the linear discriminant analysis was chosen as classification method. The used speech recognition technology bases on the commercial product "ViaVoice" of the company "IBM". The microphone input is evaluated concerning the nasality as well as the speech recognition quality. The very low recognition rate measured indicates the complexity of processing disordered speech. Therefore the integration of the commercial speech recognition is not commendable to the present time.
(Englisch)
Zusätzliche Informationen:
Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.