Moderne Multivariate Verfahren mit R

interaktion


Multivariate Verfahren beschäftigen sich mit dem Auffinden und der Modellierung von Strukturen in höherdimensionalen Datensätzen. Kursinhalte sind:

 

  • Prognose kategorischer abhängiger Variablen (Klassifikation) mittels Diskriminanzanalyse.
  • Auffinden von Gruppen bzw. Ähnlichkeitsstrukturen in Daten mit Hilfe der Clusteranalyse.
  • Dimensionsreduktion von Datensätzen mittels Hauptkomponentenanalyse (PCA) und moderne Erweiterungen auf sparse und hochdimensionale Daten.
  • Biplots zur Visualisierung multivariater Datensätze.
  • Assoziationsanalyse.

 

Ziel der Diskriminanzanalyse ist die Klassifizierung von Beobachtungen in Gruppen (z.B. Klassifizierung von "kreditwürdige" und "nicht kreditwürdige" Kunden). Hierbei wird versucht die im Vorfeld bekannten Gruppen anhand von Merkmalen (z.B. Alter oder Einkommen eines Kunden) möglichst optimal zu trennen.

Bei der Clusteranalyse sind die Gruppen im Vorfeld nicht bekannt, d.h. es sollen für gegebene Daten verschiedene Gruppen gefunden werden (sog. Cluster). Die Einteilung in Gruppen soll so erfolgen, dass sich Beobachtungen innerhalb eines Clusters möglichst ähnlich sind und sich die Cluster untereinander möglichst unterscheiden.

Die Hauptkomponentenanalyse (englisch: Principal Component Analysis (PCA)) ersetzt eine Vielzahl miteinander korrelierter Variablen durch eine geringere Zahl unkorrelierter Hauptkomponenten. Häufig ist es vorteilhaft wenn die Lösung einer Hauptkomponentenanalyse möglichst viele Null-Einträge aufweist (englisch: sparse solution). Darüber hinaus liegen in Anwendungen zunehmend hochdimensionale Datenstrukturen vor, in denen die Anzahl der Variablen deutlich größer als die Anzahl der Beobachtungen ist.

Biplots bieten die Möglichkeit der gleichzeitigen Visualisierung der Zeilen und Spalten einer Datenmatrix, aufbauend auf dimensionsreduzierenden Verfahren.

Die Assoziationsanalyse bezeichnet die Suche nach Assoziationsregeln. Diese beschreiben Korrelationen zwischen gemeinsam auftretenden Dingen. Der Zweck einer Assoziationsanalyse besteht darin, Items (Elemente einer Menge, wie z.B. einzelne Artikel eines Warenkorbs) zu ermitteln, die das Auftreten anderer Items innerhalb einer Transaktion implizieren. Die zugrundeliegenden Prinzipien der o.a. Verfahren werden verständlich eingeführt und illustriert. Der Schwerpunkt des Kurses liegt auf der Anwendung von in R verfügbaren Werkzeugen zur Implementierung der Methoden anhand von Beispielen aus der Praxis. Der Kurs findet in deutscher Sprache statt, die Kursunterlagen sind in englischer Sprache verfasst.  


Voraussetzungen:

Praktische Erfahrung in der Anwendung von R zur Analyse von Daten (etwa im Umfang des Anfängerkurses)

 

Hinweise:

Im Kurspreis bereits enthalten sind zwei Mittagessen, Kaffeepausen, Getränke und Kursunterlagen.

Jeder Teilnehmer, jede Teilnehmerin erhält ein Teilnahmezertifikat mit LMU Siegel.

Ein Teil unserer Kurse findet in den Räumlichkeiten der LMU-Weiterbildung in der Leopoldstrasse 30 statt. Für diese Kurse bitten wir Sie, einen eigenen Laptop mit einer möglichst aktuellen Version der kostenlosen Software R (https://cran.r-project.org) und RStudio (https://www.rstudio.com/products/rstudio/download/) mitzubringen. Wenn Sie keine Administrationsrechte auf Ihrem Laptop haben (oft bei Firmenlaptops der Fall), sollten Sie zusätzlich sicherstellen, dass in R auch Erweiterungspakete auf Ihrem Laptop installiert werden können. Genaueres entnehmen Sie bitte der Kursanmeldungsseite. Gerne können Sie uns bei Fragen hierzu auch kontaktieren.

Einen Internetzugang werden wir über das BayernWLAN für alle Teilnehmer bereitstellen.