Machine Learning in R

Der Kurs kann im Rahmen unseres Machine Learning Bootcamp in R (siehe Modul 1) separat gebucht werden.


Im Alltag, in den Medien und in der Wirtschaft werden die Begriffe künstliche Intelligenz (engl. artificial intelligence) und überwachtes machinelles Lernen (engl. supervised machine learning) oft gleichgestellt. Genaugenommen ist überwachtes maschinelles Lernen aus wissenschaftlicher Sicht aber nur ein viel kleineres Teilgebiet der künstlichen Intelligenz, da unter künstliche Intelligenz auch andere Forschungsbereiche wie Robotik und Computer-Vision gezählt werden.

In diesem Kurs werden Algorithmen und allgemeine Konzepte es überwachten maschinellen Lernens vorgestellt, die besonders für die Modellierung nicht-linearer Zusammenhänge für komplexe Klassifikations- und Regressionsprobleme geeignet sind. Die grundlegenden Prinzipien der vorgestellten Algorithmen und Konzepte werden für Anfänger verständlich erläutert, deren Funktionsweise illustriert und die Vor- und Nachteile diskutiert. Alle eingeführten Algorithmen und Themen werden anhand praktischer Beispiele und Anwendungsfälle veranschaulicht und mit Übungsaufgaben von Teilnehmern eingeübt.

logo_navbar.png

Im Kurs kommt die Anwendung des R Erweiterungspaket mlr3: Machine Learning in R zum Einsatz, welches auch vom Team der Essential Data Science Training GmbH seit Jahren mitentwickelt wird.

Themenschwerpunkte Teil 1: Einführung in Machine Learning und Predictive Modeling

Kursteilnehmer sollen mit den wichtigsten Konzepten und Begriffen des maschinellen Lernens vertraut gemacht werden, sowie erste einfache überwachte Lernmodelle trainieren und evaluieren. Folgende Themen werden behandelt:

  • Allgemeine Fragestellungen im maschinellen Lernen (Regression, Klassifikation, Clustering, …)

  • Einführung allgemeiner Begriffe (Verlustfunktion, Risikominimierung, Overfitting, Hyper- und Modelparameter, Training- und Testdaten, …)

  • Lineare und Logistische Regression aus der Perspektive des maschinellen Lernens

  • K-nächste Nachbarn Verfahren

  • Wichtige Evaluationmaße für Regression und Klassifikation und deren Eigenschaften

  • Resampling Methoden (Kreuzvalidierung, Bootstrap, …) und deren Vor- und Nachteile

Themenschwerpunkte Teil 2: Praktisches Machine Learning - Evaluation und Tuning

In diesem Kursteil werden verschiedene Algorithmen des überwachten maschinellen Lernens eingeführt. Dabei werden Vor- und Nachteile der Modelle diskutiert. Zudem werden weitere fortgeschrittene Konzepte für (überwachtes) maschinelles Lernen vermittelt um praktische Probleme besser und effizienter lösen zu können. Folgende Themen werden behandelt:

  • Hyperparameter Optimierung (Zufallssuche und Gittersuche)

  • Genestete Kreuzvalidierung für Modellwahl

  • Fortgeschrittene Evaluation und Analyse von Klassifikationsalgorithmen (Konfusionsmatrix, ROC Kurven)

  • Weitere Überwachte Modelle im Maschinellen Lernen: Regressions- und Klassifikationsbäume, Random Forests, Ausblick auf (Gradienten) Boosting 

Themenschwerpunkte Teil 3: Machine Learning Pipelines, Datenvorverarbeitung und Feature Engineering

Die Kursteilnehmer lernen praktische Methoden kennen, um häufig auftretende Probleme und Herausforderungen in Daten zu lösen und komplizierte machine learning pipelines anzuwenden. Folgende Themen werden behandelt:

  • Einfache Vorverarbeitungsmethoden (z.B. konstante und gedoppelte Feature identifizieren und entfernen)

  • Feature Transformationen (Skalierung, Zentrierung, ...)

  • Umgang mit kategorialen Features (Dummy und Impact Kodierung)

  • Fehlende Werte und Imputation

  • Unbalancierte Daten (Over/Undersampling)

  • Ausblick: Automatic Machine Learning

Folgende R-Pakete werden behandelt:

  • mlr3, mlr3verse

  • kknn, rpart, randomForest, ranger, gbm, xgboost

Voraussetzungen:

  • Kenntnisse in R (Im Umfang des 2-tägigen R Basiskurs bzw. 1-tägigen R Crashkurses)

  • Allgemeines Grundverständnis in der Datenanalyse / Statistik.



Anstehende Kurse

Kein passender Kurs verfügbar? Kein Problem, wir richten unser Kursprogramm direkt nach dem Interesse unserer Kunden aus. Teilen Sie uns Ihr Interesse mit und profitieren zusätzlich durch einen 10% bzw. 20% Rabatt.
Giuseppe CasalicchioR, MLR