Mastering dbt: Intensivkurs zur Datenmodellierung
In diesem HMA Academy Training dreht sich alles um die moderne Datenmodellierung mit dbt (data build tool). Der Intensivkurs ist darauf ausgerichtet, Teilnehmer:innen aller Erfahrungsstufen die Fähigkeiten zu vermitteln, um effiziente und skalierbare Datenpipelines zu entwickeln und zu verwalten. Im Laufe des Workshops werden Sie nicht nur lernen, wie dbt in der Praxis eingesetzt wird, sondern auch tiefergehende Kenntnisse in den Bereichen Datenmodellierung, Testing und Dokumentation erwerben. Der Kurs deckt eine breite Palette von Themen ab, darunter das Einrichten und Konfigurieren von dbt, das Erstellen und Verwalten von Transformationen sowie fortgeschrittene Techniken wie das Schreiben eigener Makros und die Nutzung der dbt Cloud. Durch praktische Übungen und realitätsnahe Projektarbeiten können Sie das Gelernte direkt anwenden und so ein tiefes Verständnis für die Arbeitsweise und die Vorteile von dbt entwickeln. Ob Sie ein Datenanalyst, Business Intelligence Professional oder Data Engineer sind, dieser Kurs wird Ihnen helfen, Ihre Daten-Management-Fähigkeiten zu erweitern und Ihre Projekte effizienter zu gestalten.
Der Kurs ist sowohl als 2- als auch ein 3-tägiges Training buchbar. Das 2-tägige dbt-Training konzentriert sich auf grundlegende Konzepte und Techniken, die für kleinere Projekte und Teams geeignet sind, während das 3-tägige Training zusätzliche, fortgeschrittene Module umfasst, die speziell für die Anforderungen großer dbt-Projekte, umfangreiche Teams und großer Unternehmen entwickelt wurden.
2 bzw. 3 Tage Training / In unserem Schulungszentrum am Schliersee, in München oder Inhouse in Ihrem Unternehmen (auf Anfrage) / 3-8 Teilnehmer:innen / Geeignet für alle Fachbereiche und Branchen
Tag 1
Dieser intensive Trainingstag gibt Ihnen eine allgemeine Einführung in den Marketing Data Stack (MDS), verbunden mit einer tiefen Einführung in dbt (Data Build Tool). Sie lernen, ein dbt-Projekt von Grund auf zu initialisieren, effektive Kontrollpraktiken für Versionierungen anzuwenden und grundlegende dbt-Konzepte wie Modelle, Quellen und Tests meisterhaft zu nutzen. Die Theorie wird jeweils durch praktische Übungen ergänzt.
In dieser Session werden wir eine Einführung in den modernen Data Stack geben, dabei die Rollen des Data Engineers und des Analytics Engineers beleuchten und aufzeigen, wie diese Disziplinen die Datenanalyse und -verarbeitung in Unternehmen revolutionieren.
Sie lernen, wie ein dbt-Projekt initialisiert wird, inklusive der Erstellung und Organisation von .yml und .sql Dateien, der Integration in ein Data Warehouse und der Implementierung von Versionskontrolle zur Sicherung und Koordination der Projektentwicklung.
Diese Session deckt die Grundlagen von Git ab, einschließlich der Einrichtung und Verwaltung verschiedener Umgebungen, der Arbeit mit Feature Branches und der Durchführung von Code Reviews, um eine hohe Codequalität und effektive Teamzusammenarbeit zu gewährleisten.
Wir tauchen tief in die Grundlagen von dbt ein, erkunden Modelle, Quellen und Modularität und diskutieren, wie Tests und Materialisierungen effektiv genutzt werden können, um leistungsstarke, wiederverwendbare und wartbare Datenpipelines zu bauen.
Tag 2
An diesem fortgeschrittenen Trainingstag fokussieren wir uns auf erweiterte Techniken und Funktionen in dbt, die essentiell sind, um die Effizienz, Überwachung und Automatisierung von Datenpipelines zu maximieren. Sie gewinnen tiefe Einblicke in die Anwendung von Jinja in dbt, fortgeschrittene Materialisierungsstrategien, erweiterte Testverfahren und das Einrichten von Benachrichtigungen sowie Monitoring.
In dieser Session erlernen Sie den Einsatz von Jinja-Templates und Macros innerhalb von dbt, um dynamische Logik in Ihren Code einzuführen. Zudem wird die Verwendung und Entwicklung eigener Packages behandelt, um Wiederverwendbarkeit und Modularität zu erhöhen.
Diese Session vertieft das Verständnis für fortgeschrittene Materialisierungsoptionen in dbt, insbesondere die Implementierung und Optimierung von inkrementellen Materialisierungen. Sie lernen, wie Sie große Datenmengen effizient verarbeiten und dabei die Laufzeit und Ressourcennutzung Ihrer Projekte optimieren können.
Sie werden in die erweiterten Testing-Techniken eingeführt, die in dbt verfügbar sind, einschließlich benutzerdefinierter Tests und der Nutzung von Macros zur Erstellung komplexer Testlogiken. Diese Kenntnisse helfen Ihnen, die Datenintegrität und -qualität in dynamischen und komplexen Datenumgebungen sicherzustellen.
In der letzten Session des Tages konzentrieren wir uns auf das Einrichten von Notifications und das Monitoring von dbt-Projekten. Durch die Verwendung von APIs, Webhooks und automatisierten Benachrichtigungssystemen erlernen Sie, wie Sie den Zustand Ihrer Datenpipelines effektiv überwachen und bei Bedarf reagieren können.
Tag 3 (optional)
Am letzten Tag unseres dbt-Trainings widmen wir uns der praktischen Anwendung und Umsetzung von dbt-Projekten in der Produktion. Sie lernen die effektiven Methoden für das Deployment, die Datenmodellierung, die Integration von Python in dbt, sowie den Einsatz von dbt Mesh und die Implementierung einer semantischen Schicht kennen. Dieser Tag schließt das Training mit einer vertieften Betrachtung ab, wie dbt in einer vollständig operationalisierten Umgebung effektiv genutzt wird.
In dieser Session besprechen wir die Best Practices und Strategien für das erfolgreiche Deployment von dbt-Projekten. Sie lernen, wie man dbt-Projekte sicher in Produktionsumgebungen überführt, einschließlich der Verwendung von CI/CD-Pipelines und der Verwaltung von Versionskontrollen.
Diese Session konzentriert sich auf die Datenmodellierungstechniken und die Modularisierung innerhalb von dbt. Wir erkunden, wie man effektive, wiederverwendbare und skalierbare Datenmodelle erstellt, die die Grundlage für Analyse und Berichterstattung in einer Organisation bilden.
Sie lernen, wie Sie Python-Modelle in dbt integrieren, um komplexe Datenverarbeitungslogik zu implementieren, die über traditionelle SQL-Operationen hinausgeht. Diese Fähigkeiten erweitern das Spektrum der datenwissenschaftlichen Anwendungen, die mit dbt realisierbar sind.
In dieser Session führen wir dbt Mesh ein, eine Methode zur Vernetzung und zum Management von Abhängigkeiten in großen dbt-Projekten. Sie erfahren, wie dbt Mesh zur Optimierung der Projektstruktur und zur Verbesserung der Zusammenarbeit zwischen verschiedenen Teams eingesetzt wird.
Abschließend betrachten wir die Implementierung einer semantischen Schicht in dbt, die als Brücke zwischen rohen Datenmodellen und Endbenutzeranwendungen dient. Wir diskutieren, wie diese Schicht die Datenzugänglichkeit und -nutzung vereinfacht und gleichzeitig die Datenintegrität erhält.
Ziel des Trainings
Das Ziel der Trainings ist ein tiefes Verständnis der Datenmodellierungstechniken, der Teststrategien und der Dokumentationspraktiken, die für die effiziente Nutzung von dbt erforderlich sind. Sie lernen, komplexe Datenmodelle zu konstruieren, die Verarbeitungsqualität durch Tests zu sichern und die Zusammenarbeit im Team durch klare Dokumentation zu verbessern. Am Ende des Trainings können Sie, dbt eigenständig in Ihren Projekten einsetzen, um die Datenverarbeitung und Analyse zu optimieren und zu automatisieren. Dies führt zu besseren, datengetrieben Entscheidungen in Ihrem Unternehmen.
Ihr Trainer
Dr. Simon Hannemann ist Business Unit Manager Data Engineering bei Hopmann Marketing Analytics und zertifizierter Experte für verschiedene Data Engineering Tools. In seiner täglichen Arbeit als Berater und Team Lead ist er für die erfolgreiche Entwicklung von ETL-Prozessen zur Datenintegration und -transformation verantwortlich. Seine tiefgehenden Kenntnisse und sein umfangreiches Praxiswissen gibt er gerne in seinem Training weiter.
Firmen- spezifisch umsetzbar
Möchten Sie selber dbt in Ihrem Unternehmen einführen und sind auf der Suche nach einem praxisorientierten Training für Ihr Team? Dann sind Sie bei uns genau richtig. Wir haben bereits einige individuelle dbt-Trainings für namhafte Kunden umgesetzt. Ob Inhouse in Ihrem Unternehmen, in unserem Trainingszentrum am Schliersee oder remote – wir sind so flexibel wie Ihre Bedürfnisse.
Termine Schliersee
auf Anfrage
Termine München
auf Anfrage
EXKLUSIVE TRAININGS ZU MARKETING-DATEN
Themenübergreifende Trainings
Hybrides Projektmanagement |
München, Schliersee oder Inhouse auf Anfrage |
auf Anfrage |
Alle, die Projekte effektiver umsetzen möchten | Mehr erfahren |
Data Visualization Trainings
Professionelle Datenvisualisierung mit Power BI |
München, Schliersee oder Inhouse auf Anfrage |
auf Anfrage |
Einsteiger:innen | Mehr erfahren |
Professionelle Datenvisualisierung mit Tableau |
München, Schliersee oder Inhouse auf Anfrage |
auf Anfrage |
Einsteiger:innen | Mehr erfahren |
Digital Analytics Trainings
Google Analytics 4 und Google Tag Manager |
München, Schliersee oder Inhouse auf Anfrage |
auf Anfrage |
Einsteiger:innen | Mehr erfahren |
Data Engineering Trainings
Mastering dbt: Intensivkurs zur Datenmodellierung |
München, Schliersee auf Anfrage |
auf Anfrage |
Data Analysts, Data Engineers und Quereinsteiger:innen mit Interesse an moderner Datenmodellierung | Mehr erfahren |
Aufbau eines Marketing Data Stack |
München, Schliersee oder Inhouse auf Anfrage |
auf Anfrage |
Data Analysts und Quereinsteiger:innen mit Interesse am Modern Data Stack | Mehr erfahren |