Data Science Methodenkurs


Im Data Science Methodenkurs werden moderne Methoden aus dem Bereich Data Science, sowie die statistischen Grundlagen, die zum Verständnis dieser Methoden nötig sind, vorgestellt. Der Kurs gibt einen breiten Überblick über das Themengebiet, ohne zu tief in die mathematischen Details einzutauchen. Zwei Case Studies am Ende demonstrieren die praktische Umsetzung der gelernten Konzepte. In diesem Kurs kommt keine explizite Data Science Software wie z.B. R oder Python zum Einsatz. Alle Themen werden allgemein behandelt, die beigebrachten Methoden, Beispiele und Aufgaben sind unabhängig von der später verwendeten Software.

Themen, die in diesem Kurs behandelt werden:
- Einführung in Data Science und Machine Learning
- Statistische Grundlagen: Kennzahlen, Hypothesentests, und statistische Modelle
- Lineare Regressionsmodelle und Erweiterungen (log-lineare Modelle, polynomiale Modelle, Interaktionen)
- Modellwahl und Variablenselektion
- Gütemaße für Regression bzw. Klassifikation
- Machine Learning-Algorithmen
- Praxistipps für die Entwicklung von Vorhersagemodellen
- Zwei Data-Science-Projekte als Fallbeispiele: Analyse von Flugdaten, und Vorhersage von Überleben beim Titanic-Unglück

Konkret werden die folgenden Algorithmen aus dem Machine Learning behandelt:
- k-nearest-neighbors
- Support Vector Machines
- Bäume
- Random Forests
- Neuronale Netze und Deep Learning
- Bagging, Boosting, und Stacking

Der Kurs wird in deutscher Sprache gehalten, die Kursmaterialien sind in diesem Kurs (anders als in unseren anderen Kursen) ebenfalls auf deutsch.


Voraussetzungen: keine

Hinweise:
Im Kurspreis bereits enthalten sind zwei Mittagessen, Kaffeepausen, Getränke und Kursunterlagen.

Jeder Teilnehmer, jede Teilnehmerin erhält ein Teilnahmezertifikat mit LMU Siegel.

Ein Teil unserer Kurse findet in den Räumlichkeiten der LMU-Weiterbildung in der Leopoldstrasse 30 statt. Genaueres entnehmen Sie bitte der Kursanmeldungsseite. Gerne können Sie uns bei Fragen hierzu auch kontaktieren.

Einen Internetzugang werden wir über das BayernWLAN für alle Teilnehmer bereitstellen.

Hinweis für Teilnehmer mehrerer Kurse:
Die Inhalte der beiden Kurse "Data Science Methodenkurs" und "Machine Learning & Data Mining mit R" ähneln sich in kleinen Teilen. Konkret kommen die folgenden Themen in beiden Kursen vor:

- Klassifikationsbäume
- Random Forests
- Modellevaluation (Kreuzvalidierung)
- ROC-Kurven

Die Themen sind allerdings in den beiden Kursen anders aufbereitet:
Im Methodenkurs werden sie allgemeiner behandelt, und im R-Kurs wird spezifisch auf die Implementierung in R eingegangen.