Online-Training: Data Scientist mit Fokus Python
Der Beruf des Data Scientist gilt als einer der gefragtesten des 21. Jahrhunderts. Sie lernen in diesem Training unüberwachtes und überwachtes maschinelles Lernen, unterschiedliche Datenvisualisierungsmethoden und das Data Storytelling kennen, sodass sie im Anschluss an das Training die Rolle des Data Scientist übernehmen können. Mit dem Abschluss des Trainings sind Sie in der Lage, das erworbene Wissen in ihrer Abteilung einzubringen und selbstständig Machine-Learning-Algorithmen zu implementieren.
Inhalte
Modul 1: Machine Learning Basics
- Modelle des überwachten und unüberwachten Lernens mit sklearn anwenden
- Datenpipelines aufbauen und Performance-Metriken analysieren, um die genutzten Modelle zu optimieren
Modul 2: Supervised Learning
- Algorithmen des überwachten Lernens wie Entscheidungsbäume und Random Forests und Support Vector Machines vertiefend anwenden
- Einblicke in Deep Learning und Anwenden künstlicher neuronaler Netze mit Keras
- Grundlagen des Natural Language Processing (NLP) anwenden, um Textdaten zu analysieren
Modul 3: Advanced Topics in Data Science
- Modellagnostische Methoden zur Interpretation von Modellen kennenlernen
- Big-Data-Verfahren mit PySpark kennenlernen
- Eigenständige Data-Science Projekte mit realen Datensätzen umsetzen
Voraussetzungen:
Teilnehmende sollten bereits gute Kenntnisse in Python im Umgang mit gängigen Modulen (pandas, matplotlib) mitbringen.
Lernziele
- Sie lernen Performance-Metriken und Annahmen von Modellen des überwachten und unüberwachten Lernens mit sklearn anzuwenden.
- Darüber hinaus werden die Grundlagen des Data Storytellings und Best Practices der informativen Gestaltung von Visualisierungen mit bokeh Algorithmen des überwachten und unüberwachten Lernens, wie Entscheidungsbäume und Random Forests erlangt.