#62: Kafka und Datenströme erklärt – und wie das jetzt auch in R läuft

#62: Kafka und Datenströme erklärt – und wie das jetzt auch in R läuft

Data Science Deep Dive · 2024-12-19

Kafka, aber in R? Das geht jetzt! In dieser Folge klären wir, warum Kafka für schnelle Datenströme unverzichtbar ist und warum unser neuer R-Kafka-Client ein Gamechanger ist. Was ist Kafka, wofür braucht man es (oder auch nicht), und wie funktioniert unser Paket? Hört rein und probiert es aus!

Zusammenfassung

Apache Kafka als schnelles, ausfallsicheres System für Event-Streaming und DatenströmeEinsatzbereiche: Überall wo Daten fortlaufend und in Echtzeit verarbeitet werdenUnser R Kafka Client ermöglicht nun die direkte Nutzung von Kafka in R, ohne Umweg über PythonFeatures: Consumer/Producer-Modelle, asynchrone Datenverarbeitung, hohe Performance und AusfallsicherheitAusblick: Veröffentlichung auf CRAN, Admin-Client für Cluster-Management, Blogartikel mit Beispiel (siehe unten in den Links)

Links

Apache Kafka https://kafka.apache.org/Confluent https://www.confluent.io/Rcpp (CRAN) https://cran.r-project.org/web/packages/Rcpp/index.htmlreticulate (CRAN) https://cran.r-project.org/web/packages/reticulate/index.htmlR Paket kafka auf GitHub https://github.com/INWTlab/r-kafka Blogartikel zum R Paket kafka https://www.inwt-statistics.de/blog/r-paket-kafkanats https://nats.io/Azure EventHub https://azure.microsoft.com/de-de/products/event-hubsRedpanda https://www.redpanda.com/Fragen, Feedback und Themenwünsche gern an [email protected]

Data Science Deep Dive

Wir machen Data Science. Und in unserem Podcast Data Science Deep Dive reden wir darüber.

Du bist ebenfalls Data Scientist oder interessierst dich für Daten, ML und AI? Dann ist dieser Podcast für dich. Wir teilen unsere Learnings aus über 180 Projekten, du bekommst Infos und Anregungen zu spannenden Themen rund um Daten.

Wir klären auf, geben Hinweise und teilen unsere Erfahrungen, die wir in über 10 Jahren als Data Scientists im B2B Bereich gesammelt haben.
Wir decken auf, was wirklich hinter den Hypes und Trends der Data Science Branche steckt.
Wir hinterfragen, was ein Data Science Projekt erfolgreich macht und welche Faktoren es zum Scheitern verurteilen.

  • Anzahl der Folgen: 81
  • Letzte Folgen: 2025-09-04
  • Technologie

Wo kannst du zuhören?

Apple Podcasts Logo Spotify Logo Podtail Logo Google Podcasts Logo RSS

Folgen