Studieren in Chemnitz. Wissen, was gut ist.






Maschinelles Lernen

Inhalte

Die Veranstaltung behandelt das Forschungsgebiet des Maschinellen Lernens, inkl. Supervised Learning, Unsupervised Learning und Reinforcement Learning. In den Übungen werden die Algorithmen der Vorlesung mittels einer Implementierung in Python vertieft. Kenntnisse in Python sind keine Vorraussetzung für die Teilnahme, sie können bei Bedarf vor dem Beginn erworben werden.

Die Themenkomplexe der Veranstaltung sind (vorläufig):

  1. Supervised Learning
    1. Linear Regression, gradient descent, Maximum-Likelihood
    2. Perceptron
    3. Generalized linear models
    4. Multi-layer Perceptron, Kernel-based methods
    5. Support vector machines
  2. Unsupervised Learning
    1. K-means, clustering
    2. PCA/ICA
    3. Growing neural gas
    4. Kohonen maps
  3. Reinforcement Learning
    1. Evaluative Feedback
    2. Formal definition of the RL-Problem
    3. Dynamic Programming
    4. Monte Carlo Methods
    5. Temporal Difference Learning (TD)
    6. Eligibility Traces
    7. Generalization and Function Approximation

Randbedingungen

Empfohlene Voraussetzungen: Grundkenntnisse Mathematik I bis IV, Grundkenntnisse in einer Skriptsprache (am liebstens Python).

Prüfung: Mündliche Prüfung, 5 Leistungspunkte.

Anfangsdatum: 10.10.2011 für die Vorlesungen und 17.10.2011 für die Übungen.

Anmeldung: julien dot vitay at informatik dot tu-chemnitz dot de.

Prüfungsdatum: 15.02.2012 und 07.03.2012. Anmeldung während die Vorlesung oder per Email.

Literatur

Folien zur Vorlesung

Kapitel 01 - Introduction
Kapitel 02 - Linear learning machines
Kapitel 03 - Learning theory
Kapitel 04 - Multi-layer perceptron and Radial-Basis Function networks
Kapitel 05 - Support-vector machines
Kapitel 06 - K-means, PCA, ICA
Kapitel 07 - Growing Neural Gas, self-organizing maps.
Kapitel 08 - Reinforcement learning, evaluative feedback.
Kapitel 09 -Dynamic programming, Monte-Carlo, Temporal-Difference.

Übungsaufgaben und Lösungen

Übung 01 - Introduction to Python and NumPy. Text - Datei - Lösung.
Übung 02 - Linear learning machines. Text - Datei- Lösung.
Übung 03 - Polynomial regression- Cross-validation. Text - Datei - Lösung.
Übung 04 - Multi-layer perceptron - Radial-Basis Function network. Text - Datei - Lösung.
Übung 05 - Lagrange optimization. Text - Lösung.
Übung 06 - Comparison of MLP, RBF and SVM. Text - Datei.
Übung 07 - K-means, Eigenfaces. Text - Datei - Lösung.
Übung 08 - Neural Gases, SOM. Text - Datei - Lösung.
Übung 09 - Evaluative Feedback. Text - Lösung.
Übung 10 - The reinforcement learning problem. Text - Lösung.