Bundesministerium für Bildung und Forschung fördert zwei KI-Nachwuchsgruppen an der Universität Paderborn
Künstliche Intelligenz (KI) gilt als eine der zukünftigen Schlüsseltechnologien. Ob Sprachassistenten, Smarthomes oder Modelle zur Vorhersage von Pandemien: KI unterstützt uns in unzähligen Bereichen und ist aus unserem Alltag nicht mehr wegzudenken. Um die rasanten technischen Entwicklungen umfassend verstehen, die Technologie zielgerichtet weiterentwickeln und in die Anwendung bringen zu können, ist Forschung auf dem Gebiet wichtiger denn je. Wie sich maschinelles Lernen optimieren und effektiver einsetzen lässt als bisher, erforschen seit September gleich zwei neue KI-Nachwuchsgruppen an der Universität Paderborn. Ziel der jungen Wissenschaftler*innen ist es zum einen, durch die Kombination von maschinellem Lernen und Expertenwissen die Qualität von Modellen dynamischer Systeme zu verbessern und zum anderen, das Training tiefer neuronaler Netze durch sogenannte Mehrzieloptimierungsmethoden robuster, effizienter und interaktiver zu gestalten. Das Bundesministerium für Bildung und Forschung (BMBF) fördert beide Gruppen für drei Jahre mit insgesamt ca. 1,8 Millionen Euro.
Die zwei Teams planen, eng zusammenzuarbeiten, um ihre Kompetenzen im KI-Bereich bestmöglich zu bündeln. Paderborn bietet dafür die optimale Infrastruktur: Durch das Paderborn Center for Parallel Computing (PC2) haben die Wissenschaftler*innen die Möglichkeit, neuste HPC-Hardware (High Performance Computing) für Funktions- und Demonstrationstests zu nutzen. Die Methoden, Softwarewerkzeuge und Daten der Nachwuchsgruppen sollen am Ende einer breiten Anwendergemeinschaft kostenfrei als Open-Access-Material zur Verfügung gestellt werden.
Vorteile von Experten- und Datenwissen für Modellbildung vereinen
Von der Temperaturschätzung in Elektromotoren bis hin zur Vorhersage der COVID-19-Verbreitungsdynamik oder der Arbeitslosenquote: Eine Vielzahl dynamischer Systeme in den Ingenieur-, Wirtschafts- und Sozialwissenschaften sowie der Physik, Biologie, Chemie und Medizin können durch mathematische Modelle beschrieben werden. Die Modellierung dieser komplexen dynamischen Systeme ist jedoch oft eine Herausforderung. „In den vergangenen Jahren ist ein klarer Trend weg von Experten- hin zu Black-Box-Modellen, die mittels maschinellen Lernens entwickelt werden, erkennbar. Beide haben für sich genommen viele Vor- allerdings auch Nachteile“, so Dr.-Ing. Oliver Wallscheid vom Paderborner Institut für Elektrotechnik und Informationstechnik und Leiter einer der neuen KI-Nachwuchsgruppen. Ziel der Wissenschaftler*innen um Wallscheid ist es, die Vorteile von experten- und datengetriebener Modellbildung zu vereinen, um die Modellgüte in Bezug auf Genauigkeit, Robustheit und Komplexität für verschiedene Anwendungen maßgeblich zu verbessern. Im Projekt „Automatisierte Modellbildung und -validierung dynamischer Systeme mittels des maschinellen Lernens sowie a priori Expertenwissen“ (ML-Expert) erforschen sie, wie die im Grundsatz verschiedenen Modellierungsparadigmen – von Fachleuten bzw. durch KI entwickelt – in einer hybriden Modellbildung vereint werden können.
Wallscheid erklärt die bisherige Problematik: „Während expert*innen-basierte Ansätze das Systemverhalten robust und interpretierbar wiedergeben, benötigen diese häufig viel Zeit sowie Personalressourcen und weisen systematische Abweichungen aufgrund von Vereinfachungen auf. Demgegenüber können Black-Box-Modelle, also datengetriebene Modelle, mitunter schnell und ohne nennenswertes Vorwissen generiert werden. Dadurch lassen sich zwar genaue und skalierbare Modelle erzeugen, es mangelt ihnen allerdings u. a. an Interpretierbarkeit und Robustheit gegenüber Ausreißern.“
Durch eine effiziente und ressourcenorientierte Datengenerierung, Modellbildung und -validierung sollen zukünftig schnellere Entwicklungs- und Applikationszyklen erreicht werden. „Insbesondere für kostenrelevante industrielle Anwendungen, z. B. in der Automobil-, Energie- oder Automatisierungsbranche, stellt das auch vor dem Hintergrund eines sich zuspitzenden Fachkräftemangels einen signifikanten Mehrwert dar. Unsere Arbeiten sollen allerdings nicht auf diese Branchen beschränkt, sondern domänenübergreifend ausgerichtet sein“, betont Wallscheid.
Optimale Kompromisslösungen für maschinelle Lernverfahren
Maschinelle Lernverfahren stecken darüber hinaus in zahlreichen weiteren Anwendungen. Sogenannte tiefe neuronale Netze (engl.: Deep Neural Networks, kurz: DNN) ermöglichen beispielsweise eine intelligente Bilderkennung oder Sprachverarbeitung. Der Anstieg verfügbarer Rechenkapazitäten erlaubt es, immer größere, tiefere und komplexere DNNs zu konstruieren. Mit diesen Fortschritten steigen auch die Herausforderungen: Im Optimalfall sollten bei der Konstruktion und dem Training von DNNs zeitgleich zahlreiche, mitunter widersprüchliche, Ziele bestmöglich erfüllt werden. „Im Gegensatz zu vielen Bereichen aus Technik und Gesellschaft, in denen die Betrachtung mehrerer Kriterien selbstverständlich ist, z. B. bei der Krebsbehandlung, liegt das enorme Potenzial einer Mehrzielbetrachtung im maschinellen Lernen bislang weitestgehend brach“, so Jun.-Prof. Dr. Sebastian Peitz vom Institut für Informatik. Das will der Leiter der neuen KI-Nachwuchsgruppe mit dem Vorhaben „Multikriterielles Maschinelles Lernen – Effizienz, Robustheit, Interaktivität und Systemwissen“ (MultiML) ändern. Ziel ist es, durch die Entwicklung von Mehrzieloptimierungsmethoden das Training von DNNs robuster, effizienter und interaktiver zu machen und somit entscheidend zu verbessern. Darüber hinaus soll die zusätzliche Einbindung von Systemwissen die Konstruktion extrem effizienter, auf bestimmte Problemklassen zugeschnittener Methoden ermöglichen.
Peitz nennt einfache Beispiele: „In nahezu allen Bereichen aus Technik, Wirtschaft und Gesellschaft tritt das Dilemma auf, dass miteinander in Konkurrenz stehende Kriterien von ähnlicher Bedeutung sind: Elektrische Fahrzeuge sollen gleichzeitig schnell fahren und eine hohe Reichweite haben, ein herzustellendes Produkt soll eine hohe Qualität und niedrige Produktionskosten aufweisen und bei politischen Entscheidungen sollen sowohl ökonomische als auch ökologische Aspekte berücksichtigt werden.“ Die Herausforderung lautet dabei immer: optimale Kompromisslösungen, sogenannte Pareto-Optima, identifizieren und auswählen. „Auch im maschinellen Lernen gibt es zahlreiche Kriterien, die gleichzeitig bestmöglich erfüllt werden sollten, wie die Robustheit gegenüber unvollständigen Eingangsdaten, die Generalisierung über die Trainingsdaten hinaus oder die bestmögliche Einhaltung physikalischer Gesetzmäßigkeiten“, so der Informatiker weiter.
Durch die Entwicklung von Mehrzieloptimierungsmethoden für das maschinelle Lernen sollen Algorithmen ermöglicht werden, die es erlauben, auf höchst effiziente Art die Menge der optimalen Kompromisse zu bestimmen. „Die Kenntnis aller Kompromisslösungen ermöglicht es Anwender*innen unter anderem, sehr viel informierter und bewusster Abwägungen zu treffen und Lernverfahren situationsbedingt anzupassen, indem eine neue Priorisierung der einzelnen Ziele vorgenommen werden kann“, erklärt Peitz.