- Veranstaltung
- byte Event
- Open Data
Data Dive im Biergarten
Bei unserem ersten Digital Buzzwords Event hat sich gezeigt, dass gerade das Thema (Open) Data noch einige Fragen aufwirft. Deswegen haben wir interessierte Mitarbeiterinnen und Mitarbeiter aus der Staatsverwaltung zum „Data Dive: Eine Einführung in die Welt der Daten” eingeladen.
Daten werden oft als „Gold des digitalen Zeitalters” bezeichnet. Neue Geschäftsmodelle, optimierte Arbeitsabläufe oder passgenaue Services - häufig ist die Grundlage dafür die systematische Erhebung und Auswertung von Daten. Auch generative KI beziehungsweise Large Language Models (LLMs) die von Tools wie ChatGPT oder Bard genutzt werden, benötigen große Mengen an Daten, damit sie funktionieren.
Anhand einer virtuellen Biergartenreise näherten wir uns schrittweise dem Thema Daten. An unterschiedlichen Stationen des Biergartenbesuchs wurden verschiedene Begrifflichkeiten aus der Welt der Daten erläutert. Einstieg war die Klassifizierung von Daten. So gibt es unter anderem personenbezogene Daten, geographische Daten oder Meta-Daten. In unserem fiktiven Biergarten befinden sich beispielsweise auf einer Bonuskarte, der sogenannten „Bayerischen Biergarten Bonuskarte”, persönliche Daten, wie der Name oder das Lieblingsessen.
Bei digitalen Daten spielt zudem das Labeling von Rohdaten eine wichtige Rolle. Dabei werden Daten um Eigenschaften ergänzt, sogenannten Meta-Daten. Ähnlich wie im Biergarten die einzelnen Speisen und Getränke beschriftet werden, um die vorliegenden Speisen besser zuordnen zu können, sind Beschriftungen auch im digitalen Kontext wichtig. So helfen Labels dem Computer unterschiedliche Daten – etwa „Emmentaler“ und „Obazdn“ auseinanderzuhalten aber auch der Übergruppe „Käse“ zuzuordnen. Diese Meta-Daten dienen als Referenzpunkte, die Algorithmen helfen, aus den Daten zu lernen und diese sinnvoll weiterzuverarbeiten. Das ist die Grundvoraussetzung dafür, dass Modelle, die Künstliche Intelligenz nutzen, mit Daten umgehen können.
Werden verschiedene Daten in einer organisierten Sammlung zusammengeführt, so spricht man von einer Datenbank. Dort können Daten verwaltet, bearbeitet, abgerufen, und organisiert werden. Datenbanken bilden damit den Grundstein vieler moderner Technologien. In unserer Biergarten-Datenbank lassen sich beispielsweise durch die Biergarten Bonuskarte Daten zum Besuchsverhalten, Vorlieben bei Essen und Getränken der Biergartenbesucherinnen und -besucher und ähnliche Informationen speichern. Das kann für die Planung der Essens- und Getränkebestellungen besonders praktisch sein. Durch Daten-basierte Vorhersagen wird ermittelt, welches Essen wann besonders beliebt ist, Bestellungen können entsprechend angepasst werden. Tatsächlich werden vergleichbare Systeme in der Gastronomie bereits genutzt, um tagesaktuell bessere Prognosen über den erwarteten Konsum zu treffen. So wird auch der Nahrungsmittelverschwendung entgegengewirkt.
Eine Methode, durch die die Daten in solchen Datenbanken analysiert werden, ist das Data Sampling. Hier wird anhand eines kleineren, ausgewählten Teils der Daten Schlussfolgerungen über die Inhalte und Charakteristika einer Subgruppe des Datensatzes gezogen. So könnten im Biergarten beispielsweise anhand der gespeicherten Daten aller existierenden Bayerischen Biergarten Bonuskarten Rückschlüsse auf das Konsumverhalten der vegetarischen Biergartenbesucherinnen und -besucher gezogen werden. Die Betreiberinnen könnten aber auch Spätzle-Fans identifizieren und diesen dann besondere Angebote zukommen lassen.
Open Data: Transparenz, Effizienz und Innovation
Es gibt unterschiedliche Herangehensweisen mit Daten, Datenspeicherung und Datennutzungen umzugehen. So sind Daten, die im kommerziellen Bereich genutzt werden, oftmals geschlossen: die Daten von großen Social Media Plattformen gehören den Anbietern und sind nicht öffentlich zugänglich oder nutzbar. Daten, die von den unzähligen Sensoren in modernen Autos erhoben werden, werden von den Herstellern für sich beansprucht. Für sensible Daten, etwa aus den Bereichen Gesundheit oder kritische Infrastrukturen, gelten besonders strenge Regeln.
Einen anderen Ansatz bietet das Konzept der offenen Daten. Hier werden Daten öffentlich zugänglich und nutzbar gemacht. Open Data ist daher vergleichbar mit „Open Source“, also „offener Software“, deren Quelltext frei zugänglich ist und der von Dritten gelesen, verändert und genutzt werden kann. Bei Open Data haben alle die Möglichkeit, auf diese Daten zuzugreifen und sie zu verwenden. Damit wird beispielsweise auch kleineren Unternehmen, Forschenden und anderen Gruppen die Möglichkeiten gegeben, mit großen Datensätzen zu arbeiten und einen positiven Mehrwert zu schaffen. Mit dem Open Data Portal open.bydata.de bietet die byte eine Möglichkeit, öffentliche Daten für Wirtschaft, Wissenschaft und Zivilgesellschaft zugänglicher und einfach nutzbar zu machen.
Open Data bedeutet für uns Transparenz, Effizienz und Innovation. Wir bauen deswegen bei der byte ein Open Data Team auf und treiben das Thema weiter voran. So schaffen wir die Grundlage für datengetriebene Innovationen und stiften Mehrwert in einer digitalisierten Welt.