Informatik-Kolloquien
359. Informatik-Kolloquium
Öffentliche Verteidigung im Rahmen des Promotionsverfahrens
Frau M.Eng. M.A. Claudia Hösel
TU Chemnitz
Fakultät für Informatik
Professur Medieninformatik
"Analyse von Nachrichtentexten in Leichter Sprache und Standardsprache durch Methoden der maschinellen Sprachverarbeitung - PERLiN – Ein Index zur Identifizierung Leichter Sprache"
Montag, 10.11.2025, 13:30 Uhr, Straße der Nationen 62, Böttcher-Bau, A12.336 (alt: 1/336)
Alle interessierten Personen sind herzlich eingeladen!
Abstract
Leichte Sprache ist eine auf verschiedenen sprachlichen Ebenen nach bestimmten Regeln vereinfachte Form der deutschen Standardsprache, die es Menschen mit kognitiven Beeinträchtigungen – wie etwa geistiger Behinderung oder Demenz – ermöglicht, Texte eigenständig zu verstehen.
Die Erstellung von Texten in Leichter Sprache hat in den vergangenen Jahren auf nationaler und internationaler politischer Ebene juristische Abstützung erfahren. So verpflichtet beispielsweise die Barrierefreie-Informationstechnik-Verordnung deutsche Bundesbehörden, bestimmte Informationen (z. B. Hinweise zum Inhalt einer Webseite) in Leichter Sprache zur Verfügung zu stellen. Bisher existieren jedoch nur wenige qualitativ hochwertige Leichte-Sprache-Texte. Denn obgleich die in der jüngeren Vergangenheit insbesondere durch Deep-Learning-Modelle erzielten Fortschritte im Bereich der maschinellen Sprachverarbeitung im Anwendungsfeld der Textübersetzung zu Verbesserungen in der Übersetzungsqualität führten, lassen sich diese Modelle bei der Übersetzung in Leichte Sprache nur bedingt nutzbar machen. Zum einen fehlen ausreichende Mengen an entsprechenden Trainingsdaten, mit denen sich beispielsweise Transformermodelle adäquat trainieren lassen, zum anderen weisen die bei der Übersetzung von standardsprachlichen Texten in Leichte Sprache angewandten Regeln einen mitunter hohen Interpretationsspielraum auf.
Um mehr Texte in konstanter Qualität in Leichter Sprache bereitstellen zu können, gilt es daher, den zugrunde liegenden intralingualen Übersetzungsprozess ganzheitlich zu betrachten und zu untersuchen, wie ein Verfahren entwickelt und evaluiert werden kann, das aus Korpus-Ressourcen relevante, quantifizierbare sprachliche Merkmale extrahiert und fusioniert, sodass eine objektive Bewertung des Anteils an Leichter Sprache in Texten und damit eine prozessübergreifende Assistenz ermöglicht wird.
Im Vortrag wird ein Rahmenwerk vorgestellt, welches die genannten Aspekte adressiert und die Einschätzung von Nachrichtentexten in Leichter Sprache und Standardsprache ermöglicht. Diesbezüglich notwendige Vorarbeiten werden dabei ebenso aufgezeigt, wie die Erstellung geeigneter Korpora. Den Kern des Vortrages bildet die Vorstellung eines Instruments, welches den Anteil von Leichter und Standardsprache in Nachrichtentexten automatisiert und objektiv ermittelt und hierdurch eine prozessübergreifende Assistenz im intralingualen Übersetzungsprozess ermöglicht. Das Vorgehen bei der Merkmalsextraktion wird dabei ebenso thematisiert wie die Selektion relevanter Indexparameter. Zudem wird die Funktionsweise des im Rahmen der Dissertation entwickelten Index „Proportion of Easy-to-Read Language in News“ (PERLiN) aufgezeigt und zentrale Ergebnisse der Evaluation vorgestellt. Der Vortrag schließt mit einer Einordnung der Ergebnisse und einem Ausblick auf mögliche Weiterentwicklungen.