Navigation

Springe zum Hauptinhalt
Universitätsbibliothek
Text- und Data-Mining

Text- und Data-Mining (TDM)

Was ist TDM?

Unter Text- und Data-Mining (TDM ) fasst man verschiedene Forschungsmethoden zusammen, bei der sehr große Mengen meist unstrukturierter Daten zunächst systematisch und maschinenlesbar aufbereitet und schließlich mithilfe von computergestützten Analysen automatisiert auf Muster, Korrelationen und andere forschungsrelevante Zusammenhänge hin untersucht werden.

Jede/r Forschende kann und darf im Rahmen gesetzlicher und lizenzrechtlicher Vorgaben Text- oder Data-Mining-Methoden einsetzen.

Seit der Novelle des Urheberrechtsgesetzes (UrhG) durch das ‚Gesetz zur Angleichung des Urheberrechts an die aktuellen Erfordernisse der Wissensgesellschaft (UrhWissG) im Jahr 2018 ist dieses Recht mit §60d UrhG gesetzlich verbrieft.

  • Der Forschungszweck darf ausschließlich nicht-kommerziellen Zwecken dienen.
  • Legaler Zugang zu den Daten muss gegeben sein.
  • Diese sollten auf Grundlage einer mit dem Rechteinhaber geschlossenen Lizenzvereinbarung oder als Open-Access-Publikationen verfügbar sein.

Der offene Zugang zu Inhalten im Sinne von Open Science erleichtert die Durchführung von TDM. Das eindeutige Rechte-Management aufgrund standardisierter, maschinenlesbarer und open-content-gerechter Creative-Commons-Lizenzen trägt zur rechtssicheren Anwendung von TDM-Methoden auf Daten- und Textkorpora bei.

Portrait: Christian Schmidt
Christian Schmidt