Tagungsprogramm | Universität Paderborn

Mittwoch, 5.10.2016

14:00 - 14:15

Opening Session

14:15 - 15:15 Keynote by
Bhiksha Raj
on "Understanding the application of neural networks for signal enhancement"

15:15 - 15:45 Coffee Break

15:45 - 17:15 Oral Session: Iterative Algorithms & Machine Learning for Speech Enhancement

EXIT Charts for Turbo Automatic Speech Recognition: A Case Study
Timo Lohrenz, Simon Receveur and Tim Fingscheidt, TU Braunschweig

Introducing Block-Wise Processing into Turbo Viterbi ASR
Simon Receveur, Timo Lohrenz and Tim Fingscheidt, TU Braunschweig

Noise-Presence-Probability-Based Noise PSD Estimation by Using DNNs

Aleksej Chinaev, Jahn Heymann, Lukas Drude and Reinhold Haeb-Umbach, Universität Paderborn

Iterative Harmonic Speech Enhancement

Johannes Stahl and Pejman Mowlaee, Graz University of Technology

Factor Graph Decoding for Speech Presence Probability Estimation

Thomas Glarner, Mohammad Mahdi Momenzadeh, Lukas Drude and Reinhold Haeb-Umbach, Universität Paderborn

New Insights into Turbo-Decoding-Based AVSR with Dynamic Stream Weights

Sebastian Gergen¹, Steffen Zeiler¹, Ahmed Hussen Abdelaziz² and Dorothea Kolossa¹,
¹Ruhr-Universität Bochum, ²International Computer Science Institute Berkeley

17:15 - 18:45 Poster Session: Iterative Algorithms & Machine Learning for Speech Enhancement

Unsupervised Classification of Voiced Speech and Pitch Tracking Using Forward-Backward Kalman Filtering

Benedikt Bönninghoff¹, Robert Nickel², Steffen Zeiler¹ and Dorothea Kolossa¹ Ruhr-Universität Bochum, ²Bucknell University

A Combination of Pre-Trained Approaches and Generic Methods for an Improved Speech Enhancement

Robert Rehr and Timo Gerkmann, Universität Oldenburg

Balancing Gaussianity and sparseness in feature-space speaker adaptation for word prominence detection

Andrea Schnall¹ and Martin Heckmann²,
¹ TU Darmstadt, ²Honda Research Institute Europe GmbH

17:15 - 18:45 Poster Session: Selected Topics in Speech Processing

Evaluation of Enhanced F0-Trajectories for Speech Detection and Classification in Acoustic Monitoring

Frank Kurth and Alessia Cornaggia-Urrigshardt, Fraunhofer FKIE

General Detection of Speech Signals in the Time-Frequency Plane

Sebastian Urrigshardt, Sebastian Kreuzer and Frank Kurth, Fraunhofer FKIE

Improving Vector Quantization-Based Decoders for Correlated Processes in Error-Free Transmission

Ziyue Zhao, Sai Han and Tim Fingscheidt, TU Braunschweig

Head-Orientation-Based Device Selection: Are You Talking to Me?

Menno Müller¹, Steven van de Par² and Jörg Bitzer¹,
¹Jade Hochschule, ²Universität Oldenburg

Voice Activity Detection Based on Modulation-Phase Differences

Simon Graf¹, Tobias Herbig¹, Markus Buck¹ and Gerhard Schmidt²,
¹Nuance Communications Deutschland GmbH, ²Universität Kiel

A Method to Analyze the Spatial Response of Informed Spatial Filters

Soumitro Chakrabarty, Oliver Thiergart and Emanuël A.P. Habets, International Audio Laboratories Erlangen

Estimating Source Dominated Microphone Clusters in Ad-Hoc Microphone Arrays by Fuzzy Clustering in the Feature Space

Sebastian Gergen and Rainer Martin, Ruhr-Universität Bochum

On the Bias of Direction of Arrival Estimation Using Linear Microphone Arrays

Florian Jacob and Reinhold Haeb-Umbach, Universität Paderborn

Coding of Parametric Models with Randomized Quantization in a Distributed Speech and Audio Codec

Tom Bäckström and Johannes Fischer, International Audio Laboratories Erlangen

17:15 - 18:45 Poster Session: Emerging Topics and Applications

“Listen, Follow me”: The Transformational Leadership Corpus (TLC)

Chia-Chun Hsu¹, Jarek Krajewski¹, Jörg Felfe², Joachim Mrnka², Andre Wiggerich³ and Sebastian Schnieder¹,
¹Universität Wuppertal, ²Helmut-Schmidt-Universität, ³TU Dresden

Towards Opaque Audio Features for Privacy in Acoustic Sensor Networks

Alexandru Nelus, Sebastian Gergen, Jalal Taghia and Rainer Martin, Ruhr-Universität Bochum

The Fraunhofer IAIS Audio Mining System: Current State and Future Directions

Christoph Schmidt, Michael Stadtschnitzer and Joachim Köhler, Fraunhofer IAIS

Personalized News Event Retrieval for Small Talk in Social Dialog Systems

Lucas Bechberger¹, Maria Schmidt¹, Alex Waibel¹ and Marcello Federico²,
¹Karlsruher Institut für Technologie, ²Human Language Technology Fondazione Bruno Kessler

Using Tweets as "Ice-Breaking" Sentences in a Social Dialog System

Aleksandar Andonov, Maria Schmidt, Jan Niehues and Alex Waibel, Karlsruher Institut für Technologie

18:30 - 19:30 ITG Fachgruppensitzung

19:00 - 21:00 Welcome Reception

Donnerstag, 6.10.2016

8:30-9:30 Keynote by

Richard C. Hendriks

on
"
Optimizing Speech Intelligibility in Noisy Environments Using a Simple Model of Communication"

9:30 - 10:00 Coffee Break

10:00 - 11:00 Oral Session: Speech Processing for ear-mounted devices

Performance Comparison of Bilateral and Binaural MVDR-based Noise Reduction Algorithms in the Presence of DOA Estimation Errors

Daniel Marquardt and Simon Doclo, Universität Oldenburg

Active Cancellation of the Occlusion Effect in Hearing Aids by Time Invariant Robust Feedback

Stefan Liebich, Peter Jax and Peter Vary, RWTH Aachen

A Model-Based Placement Strategy for a Nearby External Microphone for Speech Enhancement in Hearing Aids

Dianna Yee¹, Rainer Martin², Homayoun Kamkar-Parsi¹ and Henning Puder¹ ¹Sivantos GmbH, ²Ruhr-Universität Bochum

On the Use of Beamforming Approaches for Binaural Speaker Localization

Mehdi Zohourian, Gerald Enzner and Rainer Martin, Ruhr-Universität Bochum

11:00 - 12:30 Poster Session: Speech Processing for ear-mounted devices

Probabilistic Spatial Filter Estimation for Multi-Channel Signal Enhancement in Hearing Aids

Hendrik Kayser and Jörn Anemüller, Universität Oldenburg

Development of a Sound Coding Strategy based on a Deep Recurrent Neural Network for Monaural Source Separation in Cochlear Implants

Waldo Nogueira¹, Tom Gajęcki², Benjamin Krüger¹, Jordi Janer² and Andreas Büchner¹,
¹Medizinische Hochschule Hannover, ²Universitat Pompeu Fabra

On The Impact of Quantization on Binaural MVDR Beamforming

Jamal Amini¹, Richard C. Hendriks¹, Richard Heusdens¹, Meng Guo² and Jesper Jensen²,
¹TU Delft, ²Aalborg University

A Robust Null-Steering Beamformer for Acoustic Feedback Cancellation for a Multi-Microphone Earpiece

Henning Schepker¹, Linh Tran², Sven Nordholm² and Simon Doclo¹,
¹Universität Oldenburg, ²Curtin University

Two-channel Coherence-Based Own Voice Detection for Privacy-aware Long-term Acoustic Measurements

Joerg Bitzer and Sven Kissner, Jade Hochschule

11:00 - 12:30 Poster Session: Quality Evaluation

Method for analyzing personalized telephone speech in quiet and noisy environments in normal-hearing and hearing-impaired listeners

Tobias Bruns¹, Dirk Oetting¹, Markus Meis² and Jan Rennies¹,
¹Fraunhofer IDMT, ²Hörzentrum Oldenburg GmbH

Design of Double Talk Sequences in Different Languages to Harmonize Third Party Listening Test Results

Frank Kettler, Silvia Poschen and Radi Serafimov, HEAD acoustics GmbH

Towards VoIP quality testing with real-life devices and degradations

Michal Soloducha¹, Alexander Raake¹, Frank Kettler², Nils Rohrer², Eva Parotat³, Marcel Wältermann³, Sven Trevisany³ and Peter Voigt³,
¹TU Ilmenau, ²HEAD acoustics GmbH, ³AVM GmbH

Instrumental speech and noise quality assessment for super-wideband and fullband transmission

Jan Reimes and H. W. Gierlich, HEAD acoustics GmbH

Emotion Intelligibility within Codec-Compressed and Reduced Bandwith Speech

Ingo Siegert¹, Alicia Flores Lotz¹, Michael Maruschke², Jokisch Oliver² and Andreas Wendemuth¹,
¹Otto von Guericke Universität, ²Hochschule für Telekommunikation Leipzig

Voice and Speech Assessment From Telephone Recordings Using Prosodic Analysis Based on mu-Law-Companded Features

Tino Haderlein, Anne Schützenberger, Michael Döllinger and Elmar Nöth, Universität Erlangen-Nürnberg

Evaluation of Communication Systems for Full-Face Firefighter Masks

Michael Brodersen¹, Moritz Juengling² and Gerhard Schmidt²,
¹Dräger Safety AG, ²Universität Kiel

11:00 - 12:30 Poster Session: Speech & Diagnostics

Large Sleepy Reading Corpus (LSRC): Applying Read Speech for Detecting Sleepiness

Jarek Krajewski¹, Christopher Monschau², Raphael Titt³, Martin Golz⁴, David Sommer⁴ and Sebastian Schnieder¹,
¹Bergische Universität Wuppertal, ²Rheinische Fachhochschule Köln, ³Universität Tübingen, ⁴FH Schmalkalden

An Analysis of Perplexity to Reveal the Effects of Alzheimer's Disease on Language

Sebastian Wankerl, Elmar Nöth and Stefan Evert, Universität Erlangen

Gender–dependent GMM–UBM for tracking Parkinson’s disease progression from speech

Tomás Arias¹, Juan Camilo Vasquez¹, Juan Rafael Orozco¹, Jesús Francisco Vargas¹, Tino Haderlein² and Elmar Nöth²,
¹Universidad de Antioquia, ²Universität Nürnberg-Erlangen

Towards Cross-lingual Automatic Diagnosis of Autism Spectrum Condition in Children's Voices

Maximilian Schmitt¹, Erik Marchi², Fabien Ringeval³ and Björn Schuller¹,
¹Universität Passau, ²Universität München, ³Université Grenoble Alpes

Acoustic and grammatical characterization of crisis-related babblings in Italian persons undergoing Courts-of-Law examinations

Licia Sbattella, Roberto Tedesco and Sonia Cenceschi, Politecnico di Milano

Non-invasive photoglottography for use in the lab and the field

Eike Suthau¹, Peter Birkholz¹, Alexander Mainka¹ and Adrian P. Simpson²,
¹TU Dresden, ²Universität Jena

On the Role of the Limbic Brain System in Recognizing Emotions From Paralinguistic Speech Features

Sascha Frühholz, Universität Zürich

12:30 - 13:30 Lunch Break

13:30 - 14:30 Oral Session: Quality Evaluation

Non-Intrusive Estimation Model for the Speech-Quality Dimension Loudness

Friedemann Köster, Victor Cercos-Llombart, Gabriel Mittag and Sebastian Möller, TU Berlin

Predicting the quality of processed speech by combining modulation based features and model-trees

Benjamin Cauchi¹, Joao F. Santos², Kai Siedenburg³, Tiago H. Falk², Patrick A. Naylor⁴, Simon Doclo³ and Stefan Goetze¹,
¹Fraunhofer IDMT, ²Institut National de la Recherche Scientifique, ³Universität Oldenburg, ⁴Imperial College London

A Paired-Comparison Listening Test for Collecting Voice Likability Scores

Laura Fernández Gallardo, TU Berlin

Objective Assessment of Artificial Speech Bandwidth Extension Approaches

Johannes Abel¹, Magdalena Kaniewska², Cyril Guillaumé², Wouter Tirry² and Tim Fingscheidt¹,
¹TU Braunschweig, ²NXP Software

14:30 - 15:30 Oral Session: Speech & Diagnostics

A Bag-of-Audio-Words Approach for Snore Sounds’ Excitation Localisation

Maximilian Schmitt¹, Christoph Janott², Kun Qian¹, Vedhas Pandit¹, Clemens Heiser², Werner Hemmert² and Björn Schuller¹,
1 Universität Passau, 2 TU München

Wavelet-Based Time-Frequency Representations for Automatic Recognition of Emotions from Speech

Juan Camilo Vasquez-Correa¹, Tomas Arias-Vergara¹, Juan Rafael Orozco Arroyave¹, Jesus Francisco Vargas Bonilla¹ and Elmar Nöth²,
¹Universidad de Antioquia, ²Universität Erlangen-Nürnberg

Detection of Intra-Personal Development of Cognitive Impairment From Conversational Speech

Jochen Weiner and Tanja Schultz, Universität Bremen

Parkinson-Speech Analysis: Methods and Aims

Christin Baasch, Gerhard Schmidt, Ulrich Heute, Adelheid Nebel and Günther Deuschl,
Universität Kiel

15:30 - 16:00 Coffee Break

16:00 - 18:45 Excursion Town & HNF Computer Museum

19:00 - 23:00 Dinner Gut Ringelsbruch

Freitag, 7.10.2016

8:30-9:30 Keynote by

Hynek Hermansky

on "Multistream Recognition of Speech"

9:30 - 10:00 Coffee Break

10:00 - 11:30 Oral Session: Speech Enhancement in Dynamic Acoustic Scenarios

Time Domain Approach for Listening Enhancement in Noisy Environments

Markus Niermann, Christian Thierfeld, Peter Jax and Peter Vary, RWTH Aachen

Multiframe Echo Suppression Based on Orthogonal Signal Decompositions

Hai Huang¹, Christian Hofmann², Walter Kellermann², Jingdong Chen¹ and Jacob Benesty³,
¹Northwestern Polytechnical University, ²Universität Nürnberg-Erlangen, ³University of Quebec

Combined Single-Microphone Wiener and MVDR Filtering based on Speech Interframe Correlations and Speech Presence Probability

Dörte Fischer¹, Timo Gerkmann¹, Simon Doclo¹ and Emanuel A. P. Habets²,
¹Universität Oldenburg, ²International Audio Laboratories Erlangen

A Priori SNR Estimation Using Weibull Mixture Model

Aleksej Chinaev, Jens Heitkaemper and Reinhold Haeb-Umbach, Universität Paderborn

Maximum-Likelihood Approach to Multichannel-Wiener-Postfiltering for Wind-Noise

Reduction

Philipp Thüne and Gerald Enzner, Ruhr-Universität Bochum

Kurtosis-Controlled Babble Noise Suppression

Simon Graf¹, Tobias Herbig¹, Markus Buck¹ and Gerhard Schmidt² ¹ Nuance Communications Deutschland GmbH, ² Universität Kiel

11:30 - 13:00 Poster Session: Speech Enhancement in Dynamic Acoustic Scenarios

Combined Linear and Nonlinear Residual Echo Suppression Using a Deficient Distortion Model - A Proof of Concept

Ingo Schalk-Schupp¹, Friedrich Faubel¹, Markus Buck¹ and Andreas Wendemuth²,
¹ Nuance Communications Deutschland GmbH, ²Otto-von-Guericke Universität

On the Performance of LPTV Coherence Reduction Methods in the Sub-band Domain for Stereophonic Acoustic Echo Cancellation

Maria Luis Valero and Emanuel A. P. Habets, International Audio Laboratories Erlangen

Spectral Envelope Statistics for Source Modelling in Speech Enhancement

Sneha Das, Alexandra Craciun, Tobias Jähnel and Tom Bäckström, International Audio Laboratories Erlangen

A Practical Beamformer-Postfilter System for Microphone Arrays on Seat Belts

Mohammed Krini¹, Zafar-Baig Mirza² and Klaus Rodemer² ¹Hochschule Aschaffenburg, ²Paragon AG

HMM Embedded Conditional Vector Estimation Applied to Noisy Line Spectral Frequencies

André Klein and Stefan Feldes, Hochschule Mannheim

Acoustic Feedback Compensation with Reverb-based Stepsize Control for In-car Communication Systems

Philipp Bulling¹, Klaus Linhard¹, Arthur Wolf¹ and Gerhard Schmidt^2, ¹Daimler AG, ²Universität Kiel

Noise Reduction in the Time Domain Using ARMA Filtering

Florian Heese, Richard Steinbiss, Peter Jax and Peter Vary, RWTH Aachen

11:30 - 13:00 Poster Session: Efficient Modeling ASR

Phoneme Boundary Detection using Deep Bidirectional LSTMs

Jörg Franke¹, Markus Müller¹, Fatima Hamlaoui², Sebastian Stüker¹ and Alex Waibel¹ ¹Karlsruher Institut für Technologie, ²Zentrum für Allgemeine Sprachwissenschaft

Training Deep Neural Networks for Reverberation Robust Speech Recognition

Marvin Ritter, Markus Müller, Sebastian Stüker, Florian Metze and Alex Waibel
Karlsruher Institut für Technologie

11:30 - 13:00 Poster Session: Show & Tell

Binaural Noise Reduction using Raspberry Pi

Masoumeh Azarpour and Gerald Enzner, Ruhr-Universität Bochum

3PASS & HHP IV - up-to-date speech quality tests of terminals

Christian Schüring, HEAD acoustics GmbH

Real-time Noise Reduction and Speech Dereverberation Using a Small Microphone Array

Benjamin Cauchi, Ante Jukic, Feifei Xiong, Jan Wellman, Simon Doclo and Stefan Goetze, Fraunhofer IDMT

13:00 - 14:00 Lunch Break

14:00 - 15:30 Oral Session: Efficient Modeling ASR

Robust Online Multi-Channel Speech Recognition

Markus Kitza¹, Jahn Heymann², Albert Zeyer¹, Ralf Schlüter¹ and Reinhold Haeb-Umbach² ¹RWTH Aachen, ²Universität Paderborn

Modeling of Phone Features for Phoneme Perception

Harald Höge, Universität der Bundeswehr München

Language Feature Vectors for Resource Constraint Speech Recognition

Markus Müller, Sebastian Stüker and Alex Waibel, Karlsruher Institut für Technologie

Uncertainty Decoding Using a Sampling Strategy Based on the Eigenvalue Decomposition

Christian Huemmer, Philipp Stadter and Walter Kellermann, Universität Erlangen-Nürnberg

Growing a Deep Neural Network Acoustic Model with Singular Value Decomposition

Kevin Kilgour, Igor Tseyzer, Thai Son Nguyen, Sebastian Stüker and Alex Waibel
Karlsruher Institut für Technologie

Rank based Decoding for Improved DNN/HMM Hybrid Acoustic Models in the EML Transcription Platform

Volker Fischer and Siegfried Kunzmann, European Media Laboratory GmbH

15:30 - 15:45 Closing Session

15:45 - 16:00 Coffee Break