Professur Informationssysteme und Softwaretechnik






Prof. Dr.-Ing. Petr Kroha

Vorlesung Information Retrieval Systeme

Charakteristik

Umfang: 2/0/0, im Wintersemester         Voraussetzungen: Vordiplom, Teilnahme an Vorlesung Informationssysteme

Inhalte:

  1. Einführung in die Verarbeitung von nicht-strukturierten Daten
  2. Probleme der Bibliotheken, Probleme der IRS
  3. Relevanz, Deskriptoren und Indexierung, Messen in IRS, Präzision, Recall, Anfragen
  4. Funktionalität eines IRS
  5. Normalisierung, Zoning, Zipf-Gesetz, Stemming, Dokument- und Index-Datenbank
  6. Suchmöglichkeiten von IRS, Proximity, fuzzy-Suche, Thesaurus, Konzept, Darstellung von Dokumenten, Darstellung der Anfragen
  7. Browsing, Ranking
  8. Manuelle und automatische Indexierung, Wörterbuch, gewichtete Indexierung, Vektor-Systeme
  9. Datenstrukturen für IRS, invertierte Datei, N-Gram-Struktur, PAT-Struktur, Trie-Struktur, Patricia-Tree, Signatur-Datei
  10. Suchalgorithmen, String-Search, Knuth-Morris-Pratt-Algorithmus, Boyer-Moore-Algorithmus, endliche Automaten in IRS, Aho-Corasick-Algorithmus, Rabin-Karp Signatur
  11. Dokument-Clustering, Wort-Clustering, Vektormodell der Ähnlichkeit, Centroid
  12. Datenkompression, Huffman-Kodierung, Ziv-Lempel-Kodierung, arithmetische Kodierung
  13. Auswertung von IRS
  14. Text Mining, Text-Klassifikation, supervised und unsupervised Learning, Overfitting, Naive Bayes Klassifikation
  15. Zeichenketten in Molekularbiologie, unexaktes Matching, Editdistanz, dynamische Programmierung

 

Students who want to take their written examinations in English, should tell Mr. Rentzsch before the last lecture of the semester!

Materialien
  • Kontrollfragen
  • Allgemeine Prüfungshinweise
  • Literaturempfehlungen:
    • Kowalski, Gerald: Information Retrieval Systems: Theory and Implementation. Kluwer, 1997.
    • Frakes, W.B., Baeza-Yates, R.: Information Retrieval - Data Structures & Algorithms. Prentice Hall, 1992.
    • Klassisches Buch: Salton, G.: Information Retrieval. 1987.