TRR 318 - Constructing Explainability
Overview
In unserer digitalen Gesellschaft nehmen die algorithmischen Ansätze (wie das maschinelle Lernen) rasant an Komplexität zu. Diese erschwert es den Bürger:innen, die Assistenz nachzuvollziehen und die von Algorithmen vorgeschlagenen Entscheidungen zu akzeptieren. Als Antwort auf diese gesellschaftliche Herausforderung hat die Forschung begonnen, selbsterklärende Algorithmen zu entwickeln, die darauf abzielen, Erklärungen auf intelligente Weise bereitzustellen (XAI). Obwohl solche KI-Systeme, Menschen Erklärungen vermitteln können, ist ihre Interaktion stark eingeschränkt, da sie auf der (impliziten) Vorstellung aufbauen, Erklärungen würden ‚geliefert‘, d.h. Informationen nur bereitgestellt. Das Risiko eines solchen Paradigmas besteht darin, Erklärungen zu erzeugen, die nicht auf das Verständnis der Empfänger zugeschnitten sind—geschweige denn auf ihre Informationsbedürfnisse oder den gegebenen Kontext.Mit dem interdisziplinären Sonderforschungsbereich (TRR) stellen wir diese reduktionistische Sichtweise infrage und schlagen ein neues Paradigma der Ko-Konstruktion einer Erklärung vor, das zu neuartigen Formen der Interaktion mit Maschinen beitragen wird: Darin nimmt der Mensch aktiv an Erklärpraktiken teil, indem er das Ziel und den Prozess mitgestaltet. Unser Ansatz fördert die aktive Teilnahme der Menschen an soziotechnischen Systemen und erhöht so ihre Informationssouveränität. Da ein solcher innovativer Paradigmenwechsel einen interdisziplinären Ansatz erfordert, bringt unser vorgeschlagener TRR Linguist:innen, Psycholog:innen, Medienforscher:innen, Soziolog:innen, Ökonomen und Informatiker:innen zusammen, die davon überzeugt sind, dass die Erforschung der Mechanismen von Erklärbarkeit und Erklärungen das menschliche Verständnis in den Mittelpunkt stellen und dieses als Produkt einer kontextualisierten multimodalen Ko-Konstruktion betrachten muss.In unserem Ansatz werden wir den Erklärungsprozess als eine Interaktion modellieren, die sich im Verlauf der Zeit entfaltet und die Konstruktion des Erklärungsansatzes vorantreibt. Daher werden wir das Explanandum als dynamisches Produkt der Interaktion untersuchen. Dieser Ansatz wird die aktuelle Forschung (in der Informatik) erweitern und neue Antworten auf die oben genannte gesellschaftliche Herausforderung geben, indem er einen Beitrag leistet zur Entwicklung von: (i) einem multidisziplinären Verständnis vom Erklärungsprozess in enger Kopplung mit dem Prozess des Verstehens und den ihn modulierenden Kontextfaktoren, (ii) Computermodellen und komplexen KI-Systemen, die ihre Erklärung effizient für den Partner in einem aktuellen Kontext generieren, und (iii) einer Theorie der Erklärungen als soziale Praktiken, die die Erwartungen der Partner und ihre Rollen im kommunikativen Handeln berücksichtigt. Unsere Forschung wird die Grundlagen für erklärbare und verstehbaren KI-Systeme legen, die es den Bürger:innen eine aktive und kritische Teilnahme an einer digitalen Gesellschaft ermöglichen.
DFG-Verfahren Transregios
Laufende Projekte
A01 - Adaptive Erklärungsgenerierung (Teilprojektleiterinnen / Teilprojektleiter Buhl, Heike M.; Kopp, Stefan; Rohlfing, Katharina)
A02 - Das Verständnis von Erklärungen überprüfen und beobachten (Teilprojektleiterinnen / Teilprojektleiter Buschmeier, Hendrik; Grimminger, Angela; Wagner, Petra)
A03 - Ko-Konstruktion von Erklärungen mit emotionaler Ausrichtung zwischen KI-Erklärer und menschlichem Adressaten (Teilprojektleiterinnen Thommes, Kirsten; Wrede, Britta)
A04 - Integration des technischen Modells in das Partnermodell bei der Erklärung von digitalen Artefakten (Teilprojektleiterinnen / Teilprojektleiter Buhl, Heike M.; Kern, Friederike; Schulte, Carsten)
A05 - Kontextualisierte und online Parametrisierung der Aufmerksamkeit im Mensch-Roboter-Erklärdialog (Teilprojektleiterinnen Rohlfing, Katharina; Scharlau, Ingrid; Wrede, Britta)
A06 - Ko-Konstruktion sozialer Signale des Verstehens für Inklusives Monitoring (Teilprojektleiterin Drimalla, Hanna)
B01 - Ein dialogbasierter Ansatz zur Erklärung von Modellen des maschinellen Lernen (Teilprojektleiterinnen / Teilprojektleiter Cimiano, Philipp; Esposito, Elena; Ngonga Ngomo, Axel-Cyrille)
B03 - Erkundung von Benutzern, Rollen und Erklärungen in realen Kontexten (Teilprojektleiterinnen / Teilprojektleiter Horwath, Ilona; Matzner, Tobias)
B05 - Ko-Konstruktion von Erklärbarkeit mit einem interaktiv lernenden Roboter (Teilprojektleiterin Vollmer, Anna-Lisa)
B06 - Ethik und Normativität der erklärbaren KI (Teilprojektleiterinnen / Teilprojektleiter Alpsancar, Suzana; Matzner, Tobias)
C01 - Gesundes Misstrauen in Erklärungen (Teilprojektleiterinnen Hammer, Barbara; Scharlau, Ingrid)
C02 - Interaktives Lernen von erklärbaren, situationsangepassten Entscheidungsmodellen (Teilprojektleiterinnen / Teilprojektleiter Hüllermeier, Eyke; Thommes, Kirsten)
C03 - Interpretierbares maschinelles Lernen: Veränderung erklären (Teilprojektleiterinnen / Teilprojektleiter Hammer, Barbara; Hüllermeier, Eyke)
C04 - Metaphern als Mittel der Erklärung (Teilprojektleiterinnen / Teilprojektleiter Scharlau, Ingrid; Wachsmuth, Henning)
C05 - Erstellen von Erklärungen in der kollaborativen Mensch-Maschine-Wissensexploration (Teilprojektleiter Cimiano, Philipp; Kopp, Stefan)
C06 - Technisch ermöglichtes Erklären von Sprecher-Eigenschaften (Teilprojektleiterinnen / Teilprojektleiter Häb-Umbach, Reinhold; Wagner, Petra)
INF - Bewertung der Erklärungsqualität (Teilprojektleiter Cimiano, Philipp; Wachsmuth, Henning)
MGK - Integriertes Graduiertenkolleg (Teilprojektleiterin Scharlau, Ingrid)
Z - Verwaltungsprojekt (Teilprojektleiterin Rohlfing, Katharina)
Ö - Fragen zur erklärbaren Technik (Teilprojektleiterinnen / Teilprojektleiter Horwath, Ilona; Schulte, Carsten; Wrede, Britta)
Antragstellende Institution Universität Paderborn
Mitantragstellende Institution Universität Bielefeld
Beteiligte Hochschule Ludwig-Maximilians-Universität München
Sprecherin Professorin Dr. Katharina Rohlfing
Der von der DFG zum 01. Juli 2021 an den Universitäten Bielefeld und Paderborn neu eingerichtete Sonderforschungsbereich/Transregio „Constructing Explainability“ (TRR 318) beschäftigt sich mit der Fragestellung, wie Transparenz von algorithmischen Entscheidungen, insbesondere durch Black-Box Verfahren der modernen Künstlichen Intelligenz, hergestellt werden kann. Die zentrale Hypothese des TRR 318 ist, dass Erklärungen am effektivsten sind, wenn sie von Erklärer:in und Erklärungsempfänger:in gemeinsam ko-konstruiert werden. Die Mechanismen dieser Ko-Konstruktion werden in einem interdisziplinären Konsortium untersucht, um die Grundlagen für neue Paradigmen der Erklärungen in Mensch-Maschine-Interaktion zu schaffen und damit Menschen zur souveränen und informierten Entscheidungsfindung in Interaktion mit intelligenten Systemen zu befähigen. Der TRR ist in drei Bereiche gegliedert: A "Explaining", B "Social practice", C "Representing and computing explanations". Die Bereiche wiederum gliedern sich in interdisziplinäre Teilprojekte, an denen insgesamt 21 Projektleiter:innen aus der Linguistik, Psychologie, Medienwissenschaft, Soziologie, Wirtschaftswissenschaft und Informatik der Universitäten Bielefeld und Paderborn beteiligt sind.
Funding program
Deutsche Forschungsgemeinschaft (DFG, German Research Foundation): TRR 318/1 2021 – 438445824
Key Facts
- Grant Number:
- 438445824
- Project duration:
- 07/2021 - 06/2025
- Funded by:
- DFG
- Subprojects:
-
- TRR 318 - Project Area A
- TRR 318 - Project Area B
- TRR 318 - Project Area C
- TRR 318 - Project Area Ö
- TRR 318 - Subproject IRG BI
- TRR 318 - Subproject IRG PB - Developing a symmetric mental models approach
- Administrative project (Z)
- TRR 318 - Project Area INF
- TRR 318 - Project Area RTG - Integrated Research Training Group
- Websites:
-
Homepage
DFG-Datenbank gepris
Projektseite DICE
- Social Media: