Das Programm „Apollo 11“ gehört zu den bekanntesten wissenschaftlichen Erfolgsgeschichten der Raumfahrthistorie. Originaltonbandaufnahmen dokumentieren heute noch die Kommunikation zwischen Astronauten und Bodenpersonal bei dieser Mission. Das Problem: Die Aufzeichnungen enthalten viele Störgeräusche. Bei der „Fearless Steps Challenge“ traten nun Wissenschaftler*innen in einem internationalen Wettbewerb an, um ihre Algorithmen und Verfahren zur Sprachdetektion, Signalentstörung und automatischen Verschriftung zu vergleichen. Zwei Wissenschaftler des Fachgebiets Nachrichtentechnik der Universität Paderborn unter der Leitung von Prof. Reinhold Häb-Umbach waren bei einer der Aufgabenstellung, der Sprachaktivitätsdetektion, besonders erfolgreich: Jens Heitkämper und Dr.-Ing. Jörg Schmalenströer belegten mit ihrem System den ersten Platz. Insgesamt gab es 111 Einreichungen zu dem Wettbewerb.
Um die Tonbandaufnahmen einer maschinellen Verarbeitung zugänglich zu machen, wurden zuvor 19.000 Stunden des Tonmaterials an der US-amerikanischen Universität Dallas digitalisiert. Mit ihrem System, das auf einem speziell für diese Aufgabe entworfenem neuronalen Netz basiert, konnten sich die Paderborner Wissenschaftler gegenüber der Konkurrenz durchsetzen. Häb-Umbach: „Die Aufnahmen stellen eine echte Herausforderung dar, da sie ein schlechtes und schwankendes Signal-zu-Rauschleistungsverhältnis haben und auch viele andere Störungen enthalten, wie etwa Alterungseffekte des analogen Tonbandes.“ Heitkämper: „Unser System basiert auf einem neuronalen Netz, das über eine Trainingsphase lernt, Sprache von Störungen zu unterscheiden. Um uns von anderen Teilnehmern abzusetzen, haben wir eine neue, auf die Problemstellung angepasste, Netzarchitektur entworfen.“
Die vollständigen Ergebnisse gibt es unter:
https://fearless-steps.github.io/ChallengePhase2/Final.html