Projektlogo

OPAL: Portal zur Nutzung offener Daten (Open Data Portal Germany)

Überblick

Mit mCLOUD stellt das Bundesministerium für Verkehr und digitale Infrastruktur (BMVI) auf einer zentralen Plattform offene Daten aus seinem Geschäftsbereich zur Verfügung. Von dem damit verfolgten Open-Data-Ansatz hat bereits eine Vielfalt neuer innovativer Projekte und Unternehmen profitiert. Dieser Ausprägung des Open Data Ansatzes hat jedoch Schwächen. Dazu zählt, dass Datensätze oft als monolithisch sowie voneinander unabhängig bereitgestellt und betrachtet werden. Dies erschwert nicht nur die Suche nach Datensätzen sondern auch die Nutzung der Datensätze in innovativen, datengetriebenen Anwendungen. Das möchte OPAL ändern.

Vorhaben OPAL

Ziele des Projekts Open Data Portal Germany (OPAL) sind die Konzeption und Entwicklung eines ganzheitlichen Portals für offene Daten. Hierbei werden insbesondere offene Daten aus mCLOUD und MDM integriert. Anders als die Mehrzahl der existierenden Open-Data-Portale wird OPAL Metadaten veredeln und in 5-Star Linked Open Data transformieren. Damit wird das Portal das einfache Auffinden von Datensätzen und den einfachen Zugriff auf diese Datensätze sowohl für Menschen als auch für Software-Agenten (z.B. andere Datenportale, datengetriebene Anwendungen, etc.) sicherstellen. Zusätzlich wird OPAL die Suche auch über inhaltliche (anstatt nur Metadaten-) Facetten (wie z.B. automatisch generierte Themen, Ortsangaben und zeitliche Einschränkungen) ermöglichen.

Alleinstellungsmerkmale von OPAL sind die 1) technische Basis in Form von Linked-Open-Data-Technologien, die es ermöglicht, einzelne derzeit unabhängige Datensätze miteinander in Verbindung zu bringen. 2) Die dafür erforderliche automatische Extraktion von Metadaten mittels maschinellem Lernen und fokussiertes Crawling ermöglichen eine umfangreichere Suche auf Inhalten und Metadaten. 3) Dies stellt auch eine Grundlage für innovative Suchfunktionalität wie z.B. Question Answering (das Beantworten natürlichsprachlicher Anfragen) dar.


Suche und weitere Anwendungsfälle

Beispielsweise lässt sich damit ermitteln, welche Datensätze Informationen zu Pollenbelastung oder Funknetzabdeckung an einem bestimmten Ort bereithalten. Diese Informationen liegen derzeit nur implizit in den Datensätzen vor. Für den Anwendungsfall der Suche nach z.B. “Leipzig” bzw. “Welche Pollenart fliegt derzeit in Leipzig” liefert mCLOUD daher noch keine Ergebnisse. Neben der im Portal integrierten Suchfunktion sollen als weitere Anwendungsfälle eine mobile App und ein Social Bot, die auf geeignete Datensätze hinweisen, umgesetzt werden. Eine enge Zusammenarbeit mit dem LIMBO-Projekt ist vorgesehen, um weitere Metadaten zu Inhalten der Datensätze, z.B. Themen und Schema-Eigenschaften, zu ermitteln.

Key Facts

Grant Number:
19F2028A
Laufzeit:
07/2017 - 12/2020
Gefördert durch:
BMDV
Websites:
Homepage
Projektseite DICE
Nachricht
GITHUB

Detailinformationen

Projektleitung

contact-box image

Adrian Wilke, M.Sc.

Data Science / Heinz Nixdorf Institut

Zur Person

Projektmitglieder

contact-box image

Dr. Caglar Demir

Data Science / Heinz Nixdorf Institut

Zur Person
contact-box image

Prof. Dr. Axel-Cyrille Ngonga Ngomo

Sonderforschungsbereich Transregio 318

Zur Person
contact-box image

Svetlana Pestryakova

Zur Person
contact-box image

Melissa Das

Zur Person
contact-box image

Afshin Amini

contact-box image

Abdelmoneim Amer Desouki

Zur Person (Orcid.org)
contact-box image

Matthias Wauer

contact-box image

Geraldo de Souza