UPB Logo
Contact
  • Deutsch
  • English
    • Open Page "Studies"
      • Open Page "Prospective students"
      • Eltern
    • Students
    • International students & prospective students
    • School & teachers
    • Open Page "Teaching"
      • Open Page "Profile"
      • Academic Mission Statement
      • Digitalization & E-Learning
      • Open Source
      • Open Page "Teaching"
      • Competence-Oriented Education
      • Exam design
      • Organizing Courses
      • Course Evaluations
      • General Education Requirements
      • Lecture series on sustainability
    • AI in teaching
      • Open Page "Digital Teaching"
      • Digital Teaching
      • Digital learning rooms
      • Digital test formats
      • Digital test formats
      • Digital tools
      • FAQs
      • Open Page "Qualification and service"
      • Higher Education Development Unit
      • Writing Center
      • Internal Professional Development and Further Education
      • Interdisciplinary Cooperation to Improve Quality in Teacher Education (PLAZ)
      • Faculty-Specific Initiatives
      • Internationally Focused Academics
      • Open Page "Educational innovations"
      • Teaching Awards at UPB
      • Fellowship
      • Best-Practices Teaching Symposium
      • Teaching Projects
      • E-Learning Label
      • Open Page "Teaching research networks"
      • DH.NRW
      • Foundation for Innovation in Higher Education
      • Centre for Higher Mathematics Education (khdm)
      • Academic quality
    • Open Page "Research"
      • Open Page "Research profile"
      • Key research areas
      • Interdisciplinary research institutes
      • Research in the faculties
      • Collaborative Research Centres
      • Graduate Programmes and Schools
      • DFG Research Units
      • DFG Priority Programmes
      • ERC Grants
      • Leibniz Prize Winners
      • Heinz Maier Leibnitz Prize Winners
      • Open Page "Academic career"
      • Early career stages
      • Professorship at Paderborn University
      • Job portal
      • University as an employer
      • Open Page "Research funding and services"
      • Funding and application advice
      • Legal advice in research and development
      • Ethics Committee
      • Research Information at UPB
      • Research data management
      • Publication Service of the University Library
      • Open Access Portal
      • Inventions & patents
      • Start-ups and entrepreneurship
      • Network for Interdisciplinary Research
      • Internal grants (Committee for Research and Junior Academics)
      • Open Page "Research culture"
      • Research-Oriented Standards on Gender Equality
      • Gender & Diversity Consulting
      • Ethics committee
      • Good Research Practice
      • Human Resources Strategy for Researchers
    • Open Page "Transfer"
    • Creating together
    • Innovating together
    • Reflecting together
    • Contacts
    • Open Page "International"
    • International Profile
    • International Campus
    • Open Page "University"
      • Open Page "About us"
      • Mission Statement
      • History
      • Important Personalities and Pioneers
      • University Society
      • Alumni
      • Unishop
      • Open Page "Our organisation"
      • University Executive Board
      • Advisory Board
      • Senate
      • Faculties
      • Central University Administration
      • Central research institutes
      • Central operating units
      • Agencies and authorised representatives
      • Anlauf- und Beratungsstellen
      • Universitätskommissionen
      • Open Page "Working at UPB"
      • Vacancies
      • Equality, Compatibility and Diversity
      • Welcome Services
      • Personnel development
      • Scientific career paths
      • Dual Career Service
      • Healthy university
      • Social, sporting and cultural activities
    • Maps & directions
    • Open Page "Faculties"
    • Faculty of Arts and Humanities
    • Faculty of Business Administration and Economics
    • Faculty of Science
    • Faculty of Mechanical Engineering
    • Faculty of Computer Science, Electrical Engineering and Mathematics
  • Press
  1. Paderborn University
Back to the news list

Auto­mat­ische Sprac­h­erken­nung

14.11.2018  |  Forschung

A contribution from Pressemitteilung

Share post on:

  • Share on Instagram
  • Teilen auf Twitter
  • Teilen auf Facebook
  • Teilen auf Xing
  • Teilen auf LinkedIn
  • Teilen über E-Mail
  • Link kopieren

DFG-Forschungsprojekt im Bereich Nachrichtentechnik

Wie haben Siri und Co. sprechen gelernt und warum sind die digitalen Assistenten doch nicht so klug, wie wir denken? Die Hintergründe kennt Prof. Dr. Reinhold Häb-Umbach vom Fachgebiet Nachrichtentechnik der Universität Paderborn. Der Wissenschaftler beschäftigt sich mit der automatisierten Verarbeitung von gesprochener Sprache und mit maschinellem Lernen. Aktuell hat er im Rahmen eines DFG-Projekts ein Verfahren entwickelt, das es ermöglicht, neben anderen Störgeräuschen sogar den Halleffekt in der Signalübertragung auf ein Minimum zu reduzieren. Die Methode erlaubt es außerdem, verschiedene Sprecher zu erfassen und ein Gespräch simultan zu verschriftlichen, was mit konventionellen Systemen bisher nicht möglich war.

„Alexa, stell den Wecker!“

Während der Mensch sein Gegenüber in der Regel auch unter schwierigen akustischen Bedingungen versteht, indem er sich konzentriert und Umgebungsgeräusche weitestgehend ausblendet, können Spracherkennungsprogramme das noch lange nicht. Das Ergebnis: Die Sprache-zu-Text-Verarbeitung funktioniert nicht mehr und auf Befehle wie „Alexa, stell den Wecker“ reagiert der Assistent mit einer Bestellung beim Bäcker. „Um solche Fehler künftig zu vermeiden, haben wir es uns zum Ziel gesetzt, die akustische Signalverarbeitung deutlich zu verbessern und Störgeräusche fast vollständig zu eliminieren“, so Häb-Umbach. „Wenn wir sprechen, machen wir zwischendurch kurze Pausen. Die Störgeräusche im Hintergrund laufen aber weiter. Innerhalb dieser „Lücken“ können sie vom Mikrofon identifiziert werden. Die gewonnenen Daten kann man anschließend isoliert betrachten und das Störsignal löschen“, erklärt er.

Die Technologie, mit der Hall aus Sprachsignalen entfernt werden kann, ist neu und mit Anwendungen wie Amazon Echo brandaktuell geworden. „Störfilter für Rauschen gibt es inzwischen schon in jedem Handy. Für Hall gab es bislang allerdings keine wirklich geeigneten Tools. Das Problem wird konkret, wenn Mikrofone in größerem Abstand zum Sprecher stehen, wie es bei den digitalen Assistenten ja der Fall ist.“ Durch den Hall wird das Sprachsignal an Flächen in der Umgebung reflektiert und gelangt so auf unterschiedlichen Wegen mit unterschiedlicher Laufzeit und Dämpfung zum Mikrofon. Dazu Häb-Umbach: „Jeder kennt das: Im Badezimmer hört sich die Sprache anders an als im Wohnzimmer. Dieser Hall verwirrt den Spracherkenner. Man kann ihn eliminieren, indem man aus Trainingsdaten lernt, wie man vom verhallten Signal auf das unverhallte Signal zurückrechnen kann“.

Neue Technologie für die Identifizierung von unterschiedlichen Sprechern

Schwieriger wird es im Fall der sogenannten „blinden Quellentrennung“: Sobald mehrere Personen gleichzeitig reden, gelangen die Systeme an ihre Grenzen. „Verschiedene Sprecher zu erkennen und die Gespräche automatisch in eine vernünftige schriftliche Form zu bringen, war bis dato eine große Herausforderung. Uns ist es jetzt gelungen, mithilfe von neuronalen Netzen hervorragende Ergebnisse in der automatischen Spracherkennung zu erzielen “, erklärt Häb-Umbach. Dafür werden in einem ersten Schritt überlagerte Sprachsignale voneinander getrennt und anschließend separat betrachtet. „Jede Einheit wird für sich genommen von dem Spracherkennungssystem analysiert. Im Ergebnis steht ein fertiger Text, genauer gesagt ein Transkript, das eine exakte Wiedergabe des Gesprochenen ist.“ Ein Gerät, das eigenständig Gespräche verschriftlicht, könnte es also bald geben, meint der Experte.

Um überhaupt in der Lage zu sein, eine Sprache automatisch zu erkennen, müssen die Systeme vorher mit Daten „gefüttert“ werden. Dazu Häb-Umbach: „Wir sprechen hier von der Lernphase. Dabei speisen wir Sprachsignale und gleichzeitig auch die entsprechenden Texte ein. So lernen die Systeme, welche schriftliche Repräsentation zu welchem Laut passt. Das System lernt also auch, wie die jeweiligen Wörter ausgesprochen werden.“ Inzwischen sind die Forscher sogar noch einen Schritt weiter: Sie arbeiten an selbstlernenden Systemen, die eine vorherige „Fütterung“ überflüssig machen und trotzdem fehlerfreie Protokolle liefern. „Es gibt nur ein Audiosignal und keinen Text, der als Lerngrundlage dient. Das bezeichnet man auch als „Unüberwachtes Lernen“. Nützlich ist das zum Beispiel für die Dokumentation seltener Sprachen. Linguisten könnten mithilfe der Technologie schnell Korpora, also digitale Textsammlungen, aufbauen. Das Spracherkennungsprogramm nimmt ihnen viel Arbeit ab. Denn: Die Sprachdaten mühselig per Hand zu transkribieren, nimmt unglaublich viel Zeit in Anspruch“, weiß Häb-Umbach.

Maschinelles Lernen macht es möglich: Die Forscher haben eine Methode entwickelt, die die akustischen Bausteine gesprochener Sprache identifiziert und ein Verfahren zum Trennen der Laute entwickelt. „Das heißt, Laute werden segmentiert und als wiederkehrende Muster erkannt. So kommt man letztendlich zu dem Silbenaufbau, zu Wörtern bis hin zu ganzen Sätzen“, erklärt der Elektrotechniker. Das stößt auch bei der Industrie auf großes Interesse: „Wir haben Kontakt zu Google, Facebook, NTT und vielen anderen großen Playern“, sagt Häb-Umbach.

Nina Reckendorf, Stabsstelle Presse und Kommunikation

Grafik (Universität Paderborn, Glabica & Pauly): Automatische Spracherkennung steht im Fokus des Forschungsprojekts der Universität Paderborn.
Download (27 KB)
Foto (Universität Paderborn): Prof. Dr. Reinhold Häb-Umbach.
Download (1 MB)

Contact

business-card image

Prof. Dr. Reinhold Häb-Umbach

Communications Engineering / Heinz Nixdorf Institute

Head of Department of Communications Engineering

Write email +49 5251 60-3626
More about the person
Universität Paderborn

Warburger Str. 100
33098 Paderborn
Germany

Phone University

+49 5251 60-0
Quick links
  • Cafeteria
  • Online application
  • Library
  • PAUL
  • PANDA
Social networks
Legal notice
  • Imprint
  • Data privacy
  • Whistleblower system
  • Accessibility Declaration