Geräuscherkennung mit begrenzter Überwachung über Sensornetzwerke

Überblick

Eine Diskrepanz zwischen der Statistik der Trainings- und der Testdaten kann zu einer erheblichen Verschlechterung der Leistung von Systemen für maschinelles Lernen führen. Bei der Erkennung von Geräuschen in akustischen Sensornetzen (ASN) ist dies aufgrund der großen Anzahl und Variabilität von Geräuschen und akustischen Umgebungen sowie aufgrund der großen Vielfalt von Sensorstandorten und geometrischen Konfigurationen, die auftreten können, ein erhebliches Problem. Aus diesem Grund werden bestehende Datenbanken für die Geräuscherkennung fast nie perfekt auf eine konkrete Zielanwendung in akustischen Sensornetzen zugeschnitten sein. Das Hauptziel dieses Projekts besteht darin, Techniken zu entwickeln, die es ermöglichen, verfügbare Ressourcen für die Entwicklung von leistungsstarken akustischen Ereignis- und Szenenklassifikatoren für eine bestimmte Zielanwendung in einem ASN zu nutzen. Bei diesen verfügbaren Ressourcen handelt es sich zum einen um schwach gelabelte Daten (Daten, die nur mit der Ereignisklasse, nicht aber mit zeitlichen On/Offset-Informationen annotiert sind), die aus einer anderen Domäne stammen als die Zieldomäne, für die eine Anwendung entwickelt werden soll. Andererseits gehen wir davon aus, dass viele unmarkierte Audioaufnahmen aus der Zieldomäne zur Verfügung stehen. Wir werden Techniken entwickeln, um starke Kennzeichnungen zu berechnen (Ereigniskategorie plus Einschalt- und Ausschaltzeiten), um domäneninvariante Merkmale zu berechnen und um eine Domänenanpassung durchzuführen. Die wichtigste Methodik werden tiefe generative Modelle verwendet.

Key Facts

Laufzeit:
01/2017 - 12/2023
Gefördert durch:
DFG

Detailinformationen

Projektleitung

contact-box image

Prof. Dr. Reinhold Häb-Umbach

Nachrichtentechnik (NT) / Heinz Nixdorf Institut

Zur Person