Startseite
Blick in einen leeren Biergarten im Herbst als Symbolbild für das Buzzword Event: Data Dive, Fotograf: jplenio
  • Veranstaltung
  • byte Event
  • Open Data

Data Dive im Biergarten

Bei unserem ersten Digital Buzzwords Event hat sich gezeigt, dass gerade das Thema (Open) Data noch einige Fragen aufwirft. Deswegen haben wir interessierte Mitarbeiterinnen und Mitarbeiter aus der Staatsverwaltung zum „Data Dive: Eine Einführung in die Welt der Daten” eingeladen.

Daten werden oft als „Gold des digitalen Zeitalters” bezeichnet. Neue Geschäftsmodelle, optimierte Arbeitsabläufe oder passgenaue Services - häufig ist die Grundlage dafür die systematische Erhebung und Auswertung von Daten. Auch generative KI beziehungsweise Large Language Models (LLMs) die von Tools wie ChatGPT oder Bard genutzt werden, benötigen große Mengen an Daten, damit sie funktionieren.

Anhand einer virtuellen Biergartenreise näherten wir uns schrittweise dem Thema Daten. An unter­schied­lichen Stationen des Biergartenbesuchs wurden verschiedene Begrifflichkeiten aus der Welt der Daten erläutert. Einstieg war die Klassifizierung von Daten. So gibt es unter anderem personenbezogene Daten, geographische Daten oder Meta-Daten. In unserem fiktiven Biergarten befinden sich beispielsweise auf einer Bonuskarte, der sogenannten „Bayerischen Biergarten Bonuskarte”, persönliche Daten, wie der Name oder das Lieblingsessen.

Bei digitalen Daten spielt zudem das Labeling von Rohdaten eine wichtige Rolle. Dabei werden Daten um Eigenschaften ergänzt, sogenannten Meta-Daten. Ähnlich wie im Biergarten die einzelnen Speisen und Getränke beschriftet werden, um die vorliegenden Speisen besser zuordnen zu können, sind Beschriftungen auch im digitalen Kontext wichtig. So helfen Labels dem Computer unterschiedliche Daten – etwa „Emmentaler“ und „Obazdn“ auseinanderzuhalten aber auch der Übergruppe „Käse“ zuzuordnen. Diese Meta-Daten dienen als Referenzpunkte, die Algorithmen helfen, aus den Daten zu lernen und diese sinnvoll weiterzuverarbeiten. Das ist die Grundvoraussetzung dafür, dass Modelle, die Künstliche Intelligenz nutzen, mit Daten umgehen können.

Werden verschiedene Daten in einer organisierten Sammlung zusammengeführt, so spricht man von einer Datenbank. Dort können Daten verwaltet, bearbeitet, abgerufen, und organisiert werden. Datenbanken bilden damit den Grundstein vieler moderner Technologien. In unserer Biergarten-Datenbank lassen sich beispielsweise durch die Biergarten Bonuskarte Daten zum Besuchsverhalten, Vorlieben bei Essen und Getränken der Biergartenbesucherinnen und -besucher und ähnliche Informationen speichern. Das kann für die Planung der Essens- und Getränkebestellungen besonders praktisch sein. Durch Daten-basierte Vorhersagen wird ermittelt, welches Essen wann besonders beliebt ist, Bestellungen können entsprechend angepasst werden. Tatsächlich werden vergleichbare Systeme in der Gastronomie bereits genutzt, um tagesaktuell bessere Prognosen über den erwarteten Konsum zu treffen. So wird auch der Nahrungs­mittel­verschwendung entgegengewirkt.

Eine Methode, durch die die Daten in solchen Datenbanken analysiert werden, ist das Data Sampling. Hier wird anhand eines kleineren, ausgewählten Teils der Daten Schlussfolgerungen über die Inhalte und Charakteristika einer Subgruppe des Datensatzes gezogen. So könnten im Biergarten beispielsweise anhand der gespeicherten Daten aller existierenden Bayerischen Biergarten Bonuskarten Rückschlüsse auf das Konsumverhalten der vegetarischen Biergartenbesucherinnen und -besucher gezogen werden. Die Betreiberinnen könnten aber auch Spätzle-Fans identifizieren und diesen dann besondere Angebote zukommen lassen.

Open Data: Transparenz, Effizienz und Innovation

Es gibt unterschiedliche Herangehensweisen mit Daten, Datenspeicherung und Datennutzungen umzugehen. So sind Daten, die im kommerziellen Bereich genutzt werden, oftmals geschlossen: die Daten von großen Social Media Plattformen gehören den Anbietern und sind nicht öffentlich zugänglich oder nutzbar. Daten, die von den unzähligen Sensoren in modernen Autos erhoben werden, werden von den Herstellern für sich beansprucht. Für sensible Daten, etwa aus den Bereichen Gesundheit oder kritische Infrastrukturen, gelten besonders strenge Regeln.

Einen anderen Ansatz bietet das Konzept der offenen Daten. Hier werden Daten öffentlich zugänglich und nutzbar gemacht. Open Data ist daher vergleichbar mit „Open Source“, also „offener Software“, deren Quelltext frei zugänglich ist und der von Dritten gelesen, verändert und genutzt werden kann. Bei Open Data haben alle die Möglichkeit, auf diese Daten zuzugreifen und sie zu verwenden. Damit wird beispielsweise auch kleineren Unternehmen, Forschenden und anderen Gruppen die Möglichkeiten gegeben, mit großen Daten­sätzen zu arbeiten und einen positiven Mehrwert zu schaffen. Mit dem Open Data Portal open.bydata.de bietet die byte eine Möglichkeit, öffentliche Daten für Wirtschaft, Wissenschaft und Zivilgesellschaft zugänglicher und einfach nutzbar zu machen.

Open Data bedeutet für uns Transparenz, Effizienz und Innovation. Wir bauen deswegen bei der byte ein Open Data Team auf und treiben das Thema weiter voran.  So schaffen wir die Grundlage für datengetriebene Innovationen und stiften Mehrwert in einer digitalisierten Welt.

Amy Webb bei der SXSW 2024
  • Veranstaltung
  • ...
Florian Baumann

SXSW 2024 in Austin: Ein Rendezvous mit der Zukunft

Das South by Southwest (SXSW) Festival 2024 in Austin, Texas, hat unsere Erwartungen erfüllt und einmal mehr bewiesen: Die Zukunft der Technologie ist nicht nur spannend, sondern findet jetzt statt! Gleichzeitig haben wir und andere Teilnehmer die Frage aufgeworfen: Hat die „South by“ ihren Zenit schon überschritten?

Digitalminister Fabian Mehring bei der KI Roadshow
  • Veranstaltung
  • ...
Daniel Müller
+ 1

KI: Kenn ich, kann ich.

In der aktuellen Debatte rangiert Künstliche Intelligenz (KI) zwischen den beiden Polen „Heilsbringerin“ oder „unser Untergang“. Sachlich betrachtet ist KI vor allem eins: ein mächtiges Werkzeug. Nur, wie kann ich mir Künstliche Intelligenz als Werkzeug zu Nutze machen? Dieser Frage gehen wir mit unserer KI Roadshow auf den Grund und erarbeiten gemeinsam mit der staatlichen Verwaltung in Bayern mögliche KI-Anwendungen für den Arbeitsalltag.

Dr. Karolina Engenhorst an einem Redepult
  • Veranstaltung
Dr. Karolina Engenhorst
+ 1

Der 10. Zukunftskongress oder „Das Haus Digitale Verwaltung“

„Lasst es uns richten“ — ein vielversprechendes Motto zum 10. Zukunftskongress in München. Errichtet werden sollte im Rahmen des Kongresses das „Haus Digitale Verwaltung“.  Die dafür notwendigen „Gewerke“ trafen sich am vergangenen Dienstag, den 6. Februar, um sich über zukunftsrelevante Digitalisierungsthemen für die bayerische Verwaltung auszutauschen. 

Zurück zur Übersichtsseite