Machine Learning & Data Mining mit R


In diesem Kurs werden moderne statistische Verfahren des maschinellen Lernens zur Analyse komplexer Klassifikations- und Regressionsprobleme vorgestellt, die besonders für die Modellierung überwachter, nicht-linearer Zusammenhänge geeignet sind. Die zugrundeliegenden Prinzipien der Verfahren werden für Anfänger verständlich eingeführt und illustriert, sowie Besonderheiten herausgehoben. Der Hauptteil des Kurses beschäftigt sich mit der Anwendung von in R verfügbaren Werkzeugen anhand praktischer Beispiele. Modellierungstechniken, die im Kurs behandelt werden:

  • Elementare, einfache Klassifikations- und Regressionsmodelle
  • Klassifikations- und Regressions-Bäume
  • Random Forests
  • Boosting

Weiterführende Themen, die im Kurs behandelt werden:

  • Modellevaluation und Resampling (z.B. Kreuzvalidierung, Bootstrap)
  • Modellselektion und Hyperparameter-Tuning
  • Parallelisierung

Der Kurs wird in deutscher Sprache gehalten, die Kursmaterialien sind in englischer Sprache verfasst. Wir bitten die Teilnehmer bei der Anmeldung kurz mitzuteilen, zu welchen der oben genannten Themen bereits Vorkenntnisse bestehen. Der Kurs ist als Einstiegskurs konzipiert. Sollte Bedarf zu fortgeschrittenen Themen im Bereich Machine Learning bestehen, nehmen Sie bitte direkt Kontakt mit dem Dozenten auf.


Voraussetzungen:
Grundkenntnisse in R (im Umfang des Anfängerkurses), Grundkenntnisse in Statistik

Hinweise:
Im Kurspreis bereits enthalten sind zwei Mittagessen, Kaffeepausen und die Kursunterlagen.

Jeder Teilnehmer, jede Teilnehmerin erhält ein Teilnahmezertifikat mit LMU Siegel.

Ein Teil unserer Kurse findet in den Räumlichkeiten der LMU-Weiterbildung in der Leopoldstrasse 30 statt. Für diese Kurse bitten wir Sie, einen eigenen Laptop mit einer möglichst aktuellen Version der kostenlosen Software R (https://cran.r-project.org) und RStudio (https://www.rstudio.com/products/rstudio/download/) mitzubringen. Wenn Sie keine Administrationsrechte auf Ihrem Laptop haben (oft bei Firmenlaptops der Fall), sollten Sie zusätzlich sicherstellen, dass in R auch Erweiterungspakete auf Ihrem Laptop installiert werden können. Genaueres entnehmen Sie bitte der Kursanmeldungsseite. Gerne können Sie uns bei Fragen hierzu auch kontaktieren.

Einen Internetzugang werden wir über das BayernWLAN für alle Teilnehmer bereitstellen.

Bitte installieren Sie wenn möglich vor Beginn des Kurses folgende Pakete auf Ihrem Laptop:
mlr, rpart, randomForest, gbm, xgboost, mlbench, e1071, ggplot2, ElemStatLearn

Hinweis für Teilnehmer mehrerer Kurse:
Die Inhalte der beiden Kurse  "Data Science Methodenkurs" und "Machine Learning & Data Mining mit R"
ähneln sich in kleinen Teilen. Konkret kommen die folgenden Themen in beiden Kursen vor:

- Klassifikationsbäume
- Random Forests
- Modellevaluation (Kreuzvalidierung)
- ROC-Kurven

Die Themen sind allerdings in den beiden Kursen anders aufbereitet:
Im Methodenkurs werden sie allgemeiner behandelt, und im R-Kurs wird spezifisch auf die Implementierung in R eingegangen.