Navigation

Springe zum Hauptinhalt
Fakultät für Informatik
Informatik-Kolloquien

117. Informatik-Kolloquium

Herr Prof. T. Scheffer


Maschinelles Lernen für knifflige Sprachverarbeitungsprobleme




Donnerstag, 15.02.2007
15.30 Uhr, 1/Altes Heizhaus

Alle interessierten Personen sind herzlich eingeladen!


Inhalt:

Das Themenumfeld Sprachverarbeitung ist ein unerschöpflicher Quell wissenschaftlicher Herausforderungen, deren Bewältigung Erkenntnisgewinn und zugleich praktischen Nutzen verspricht. Maschinelle Lernverfahren, insbesondere Bayessche Modelle und diskriminative Lernverfahren in strukturierten Räumen, ermöglichen große Fortschritte in der Sprachverarbeitung; unter anderem beim Parsen, beim Ranking von Suchergebnissen und bei der explorativen Analyse und der Erkennung latenter Themen in Dokumentensammlungen. Ich gehe in meinem Vortrag auf zwei offene Fragen ein. (1) In vielen Fällen unterscheiden sich die zur Verfügung stehenden Trainingsdaten systematisch von den Texten, die bei der späteren Anwendung eines Systems auftreten; Training unter "Sample Selection Bias" ist ein kniffliges Problem. (2) Verfahren der Statistik und des maschinellen Lernens basieren auf der Annahme, dass die Natur sich nicht aktiv dagegen sträubt, mit Modellen beschrieben zu werden. Für viele Sprachverarbeitungsprobleme trifft diese Annahme aber nicht zu: Spam-Versender beispielsweise optimieren ihre Werkzeuge darauf hin, dass ihre Spam-Emails nicht von den eingesetzten Filtern erkannt werden. Das resultierende Lernproblem wird zu einem kniffligen Spiel zwischen zwei Gegnern.

Presseartikel