Inhalt des Dokuments
zur Navigation
Blinde Quellentrennung
Um stark gestörte oder verzerrte Sprachsignale für automatische Spracherkennungssysteme zugänglich zu machen, können statistische Eigenschaften der Sprach- und Störsignale ausgenutzt werden. Dadurch werden auch Probleme, die rein deterministisch bisher nicht zu lösen sind, mathematisch handhabbar. Besonders vorteilhaft können solche Methoden bei mehrkanaligen Aufnahmen eingesetzt werden. Ein Beispiel für den Einsatz statistischer Methoden ist die Independent Component Analysis (ICA), die für die Extraktion von Signalen verschiedener Sprecher aus einem Signalgemisch benutzt werden kann. Neben dem Einsatz der Independent Component Analysis und einer darauf aufbauenden Computational Auditory Scene Analysis werden auch andere Methoden der mehrkanaligen statistischen Signalverarbeitung untersucht, darunter spektrale Schätzverfahren wie das Ephraim-Malah-Filter und darauf basierende, aktuelle Methoden, wie zum Beispiel das IMCRA-Verfahren, das das Störsignalmodell auch adaptieren kann, während der Zielsprecher aktiv ist.Um die Methoden der Blinden Quellenrennung (Blind Source Separation) und ICA (Independent Component Analysis) für akustische Signale zu entwickeln, zu verbessern und in realen Anwendungsf¨allen zu testen, befasst sich die Gruppe mit der Rekonstruktion gestörter Sprache und zielt dabei auf eine Verbesserung der Sprachqualität und Sprachverständlichkeit in gestörten Umgebungen und in Umgebungen, in denen mehrere Sprecher gleichzeitig aktiv sind. Die Grundidee der ICA besteht darin, mehrkanalige Signale in ihre statistisch unabhängigen Komponenten zu zerlegen. Da die Trennung blind, d.h. ohne Vorwissen über die Mischung oder die Quellen erfolgt, wird sie bei Mischungen von Luftschall als akustische blinde Quellentrennung bezeichnet. Bei der Anwendung der akustischen blinden Quellentrennung bestehen zurzeit noch wesentliche Probleme. Zum einen sind die vorhandenen ICA-Lösungen extrem zeitaufwendig, was eine praktische Anwendung der Verfahren schwierig macht. Zum anderen treten bei den ICA-Algorithmen Permutations- und Skalierungsprobleme auf, die unter Umständen nicht eindeutig gelöst werden können. Deswegen liegen spezielle Schwerpunkte auf (echtzeitfähiger) Implementierung, Untersuchung und Test von bereits existierenden und neuen ICA-, CASA- (Computational Auditory Scene Analysis) und ICA-basierten Beamforming- Algorithmen in realen Umgebungen (z.B. Autos, Büroräume etc.)
Ein weiterer Forschungsaspekt ist die Verbesserung der Trennungsergebnissen durch Anwendung der CASA-Methoden (Computational Auditory Scene Analysis). Bei den CASA-Methoden geht es darum, durch Analyse der geschätzten Quellsignale und extrahierten Mischungsmatrizen (Richtcharakteristika, Amplitudendifferenz, mehrkanalige Voice-Activity-Detection sowie psychoakustische Analyse) die Stellen in den Signalen zu finden, wo die bleibenden Störsignale/Übersprecherprecher aktiv sind und diese dann durch geeignete Zeit-Frequenz-Maskierung zu minimieren. Unter andrem liegt der Schwerpunkt bei der Wahl der Maskierungsfunktion auf der Adaption der einkanaligen Störgeräuschreduktionsverfahren (z.B. Ephraim-Malah-Filter usw.) zu den mehrkanaligen Situationen.