Bayes'sche Merkmalsverbesserung zur Erkennung verhallter und verrauschter Sprache bei großem Vokabular

Overview

In diesem Vorhaben sollen Verfahren zur automatischen Spracherkennung für komplexe Erkennungsaufgaben mit großem Vokabular entwickelt werden für den Fall, dass die aufgenommene Sprache durch Raumhall und additives Rauschen gestört ist. Um eine möglichst breite Einsetzbarkeit zu gewährleisten, wird dabei von lediglich einkanalig vorliegenden Sprachaufnahmen ausgegangen. Ausgangspunkt der Untersuchungen ist auf der einen Seite ein in Vorarbeiten entwickeltes Bayes'schen Merkmalsverbesserungsverfahren, welches sich auf kleineren Erkennungsaufgaben als sehr effektiv erwiesen hat, sowie auf der anderen Seite ein ausgefeiltes Spracherkennungssystem für großes Vokabular, das sich bereits in vielen internationalen Projekten und Benchmarks bewährt hat. Das Merkmalsverbesserungsverfahren soll weiterentwickelt werden, um auch den höheren Anforderungen eines großen Erkennungsvokabulars gerecht zu werden, und in das große Erkennungssystem optimal integriert werden, um einen leistungsfähigen Erkenner von mit entfernten Mikrofonen aufgenommener Sprache bei großen Vokabularien zu realisieren.

DFG-Verfahren Sachbeihilfen

Antragsteller Professor Dr.-Ing. Reinhold Häb-Umbach; Privatdozent Dr. Ralf Schlüter

Key Facts

Grant Number:
235486169
Project duration:
01/2013 - 12/2019
Funded by:
DFG
Website:
DFG-Datenbank gepris

More Information

Principal Investigators

contact-box image

Prof. Dr. Reinhold Häb-Umbach

Communications Engineering / Heinz Nixdorf Institute

About the person
contact-box image

Ralf Schlüter

Rheinisch-Westfälische Technische Hochschule Aachen (RWTH)

About the person (Orcid.org)