
#67: "It works on my machine" war gestern – Docker Best Practices für Data Science
Dieser Satz "it works on my machine" hat IT-Teams und Data Scientists lange Nerven gekostet. Früher war Deployment ein mühsames Zusammenspiel aus Setup-Anleitungen, inkompatiblen Umgebungen und endlosen Rückfragen. Docker bringt endlich Ordnung ins Chaos: Anwendungen laufen isoliert, reproduzierbar und unabhängig vom Host-System. Warum Containerisierung für Data Science ein echter Gamechanger ist und welche Best Practices du kennen solltest, erfährst du in dieser Folge!
Zusammenfassung
Früher war Deployment umständlich: lange Setup-Anleitungen, inkompatible Umgebungen, viele Rückfragen Virtuelle Maschinen haben das Problem teilweise gelöst, sind aber ressourcenintensiv und unflexibelData Scientists arbeiten oft mit R/Python, was IT-Abteilungen vor Herausforderungen stelltFehlende Reproduzierbarkeit führt zu Stress, Verzögerungen und hohem KommunikationsaufwandDocker schafft eine standardisierte, isolierte und reproduzierbare Umgebung für AnwendungenContainer laufen direkt auf dem Host-OS, sind schlanker als VMs und starten schnellerMit Dockerfiles lassen sich Umgebungen als Code definieren und automatisch deployenBest Practices: schlanke Base-Images, .dockerignore, nur benötigte Abhängigkeiten installierenAutomatisierung mit CI/CD-Pipelines beschleunigt den Entwicklungs- und Deploy-ProzessContainerisierung ist für moderne Data-Science-Workflows unverzichtbar und spart IT sowie Data Science viel ZeitLinks
Offizielle Docker Dokumentation https://docs.docker.com/Docker Hub https://hub.docker.com/[Blog] Die Welt der Container: Einführung in Docker https://www.inwt-statistics.de/blog/die-welt-der-container-einfuehrung-in-docker[Podcast] #14: Kubernetes https://www.podbean.com/ew/pb-m5ggz-13454c7[Podcast] #59: Besser mit Helm: komplexe Deployments einfach(er) umsetzen https://www.podbean.com/ew/pb-txhnf-17314de[Video] Solomon Hykes stellt Docker vor (2013) "The future of Linux Containers" https://www.youtube.com/watch?v=wW9CAH9nSLs&t=158sFragen, Feedback und Themenwünsche gern an [email protected]
Data Science Deep Dive
Wir machen Data Science. Und in unserem Podcast Data Science Deep Dive reden wir darüber.
Du bist ebenfalls Data Scientist oder interessierst dich für Daten, ML und AI? Dann ist dieser Podcast für dich. Wir teilen unsere Learnings aus über 180 Projekten, du bekommst Infos und Anregungen zu spannenden Themen rund um Daten.
Wir klären auf, geben Hinweise und teilen unsere Erfahrungen, die wir in über 10 Jahren als Data Scientists im B2B Bereich gesammelt haben.
Wir decken auf, was wirklich hinter den Hypes und Trends der Data Science Branche steckt.
Wir hinterfragen, was ein Data Science Projekt erfolgreich macht und welche Faktoren es zum Scheitern verurteilen.
- Anzahl der Folgen: 81
- Letzte Folgen: 2025-09-04
- Technologie