Quellentrennung und Störreduktion für die automatische Spracherkennung in dynamischen akustischen Szenarien

Überblick

In diesem Projekt soll die Robustheit eines Spracherkennungssystems für Sprachbedienung im Freisprechmodus mit Anwendungen im Smart Home Bereich verbessert werden. Aufbauend auf den Ergebnissen aus dem DFG-Vorgängerprojekt sollen die dort entwickelten mehrkanaligen Quellentrennungs- und Störreduktionsverfahren unter realistischen Randbedingungen hinsichtlich Störszenarien, erlaubter Latenz der Verarbeitung und Realisierbarkeit auf eingebetteten Systemen weiterentwickelt werden. Es soll ein Prototyp entwickelt werden, der unter praktischen raumakustischen Umgebungsbedingungen und typischen Anwendungsszenarien in Echtzeit mit geringer Latenz lauffähig ist und ein bereits beim Anwendungspartner existierendes Spracherkennungssystem in der erreichbaren Erkennungsrate schlägt. Als Alternative zu dem parametrischen Quellentrennungs- und Störreduktionsverfahren soll weiterhin ein Signalverbesserungsverfahren basierend auf einem neuronalen Netzwerk entwickelt werden und die Vor- und Nachteile der jeweiligen Verfahren in realistischen Anwendungsszenarien hinsichtlich erreichbarer Signalqualität, Latenz, Rechen- und Speicherressourcenbedarf, sowie Robustheit gegenüber variierenden akustischen Umgebungsbedingungen herausgearbeitet werden.

DFG-Verfahren Sachbeihilfen (Transferprojekt)

Anwendungspartner voice INTER connect GmbH

Key Facts

Grant Number:
316471544
Laufzeit:
08/2016 - 12/2021
Gefördert durch:
DFG
Websites:
DFG-Datenbank gepris
Abgeschlossene Projekte des Fachgebietes

Detailinformationen

Projektleitung

contact-box image

Prof. Dr. Reinhold Häb-Umbach

Nachrichtentechnik (NT) / Heinz Nixdorf Institut

Zur Person

Kooperationspartner

voice INTER connect GmbH

Kooperationspartner

Zur Website