Navigation

Springe zum Hauptinhalt
Fakultät für Informatik
Informatik-Kolloquien

107. Informatik-Kolloquium

Herr Dr. Volker Roth


Herausforderungen im Maschinellen Lernen: Datenfusion, Relevanz-Determination und strukturierte Lerndomänen




Freitag, 19.1.2007
13.00 Uhr, 1/Altes Heizhaus

Alle interessierten Personen sind herzlich eingeladen!


Inhalt:

Ziel des Maschinellen Lernens ist es, Prädiktionsalgorithmen auf der Basis von Beispieldaten zu entwickeln. Die mathematische Analyse von Prädiktionseigenschaften ist im allgemeinen aber nur unter sehr eingeschränkten Annahmen möglich, die in vielen realen Lernproblemen z.B. in der Bioinformatik und dem Computersehen verletzt sind. In der Praxis müssen wir uns häufig mit fehlerbehafteten Messungen bestimmter Merkmale zufrieden geben, deren Relevanz bezüglich der zu lösenden Aufgabe oft unklar ist. Das Fusionieren von unsicherem Wissen aus unterschiedlichen Messprozessen ist daher in vielen Real-Welt Anwendungen des Maschinellen Lernens von zentraler Bedeutung.

In der Bioinformatik treten Probleme dieser Art z.B. bei der Funktionsprädiktion von Proteinen auf. Hier gilt es beispielsweise, vektorielle Gen-Expressionsdaten mit der Information aus DNA/Proteinsequenzen und relationalen Protein-Protein Interaktionen zu fusionieren. Hierarchische Abhängigkeiten und multiple Proteinfunktionen erschweren die Entwicklung von Klassifikatoren und Regressionslösungen zusätzlich.

Im Rahmen des Vortrages wird hierzu ein Lern-Modell auf der Basis von Mercer-Kernen vorgestellt, welches in der Lage ist, verschiedene Datentypen zu fusionieren und deren Relevanz für die Funktionsvorhersage automatisch zu detektieren. Die Integration in ein graphisches Modell erlaubt eine adäquate Behandlung sowohl von hierarchischen Strukturen als auch von multiplen Klassenzugehörigkeiten.

Presseartikel