Springe zum Hauptinhalt
Universitätsrechenzentrum
Datensicherung (RSYNC)

Backup-Dienst RSYNC

ABKÜNDIGUNG RSYNC-DIENST

Mit der Bereitstellung unseren neuen BAREOS Backup-Dienstes ist der RSYNC-Dienst abgekündigt. Bestehende Datensicherungen sind anch BAREOS zu migrieren. Weitere Informationen finden Sie hier.

Technologie

RSYNC ist eine Open Source Software, mit der Datenbestände an zwei Speicherorten synchronisiert werden können. Beim Einsatz von RSYNC zur Datensicherung erfolgt die Synchronisation immer ausgehend vom zu sichernden Datenbestand (Quelle) zum gesicherten Datenbestand (Backup). Dabei bleiben im Backup die Daten erhalten, die an der Quelle gelöscht oder modifiziert worden sind. Diese Methode ist vor allem besonders Ressourcen sparend, da ausgehend von einem Basisstand nur Differenzen gespeichert werden.

Informationen zu RSYNC sind u. a. bei Wikipedia zu finden.

Das URZ der TU Chemnitz unterstützt die Sicherung von Daten mittels RSYNC, die sich auf einem Server einer Fakultät oder Einrichtung der TU Chemnitz befinden. Die Daten werden mit einem Backup-Server des URZ synchronisiert. Auf diesem wird täglich ein Sicherungsverzeichnis erzeugt, das den aktuellen Stand der Klientendaten repräsentiert.

Voraussetzungen

Für die Nutzung dieser Technologie sind folgende Voraussetzungen auf einem zu sichernden Klient-Server notwendig:

Linux:

  • Software RSYNC muss installiert sein
  • eine geeignete Version von SSH (Secure Shell) muss verfügbar sein

Windows:

  • Freigabe der zu sichernden Daten für einen definierten Benutzer
  • Anpassung der Firewall-Regeln für Zugriff auf Port 139 vom URZ Backup-Server

Einschränkungen

Für die Speicherung der Daten auf Backup-Servern des URZ gelten folgende Einschränkungen:

  • Daten eines UNIX/LINUX-Systems werden mit Root-Rechten gesichert. Dabei werden alle Dateien mit ihren Originalrechten gesichert.
  • Von Daten eines Windows-Systems können keine Zugriffsrechte (ACL) gesichert werden. Hier kann der Administrator aber ggf. regelmäßig mit Windowsmitteln eine Zugriffsliste als Datei erzeugen, die mit gesichert werden kann.
  • Backup-Klienten sollten keine Arbeitsplatzsysteme sein.
  • Backup-Klienten müssen immer laufen, da die Backup-Zeiten variieren.
  • Zum Zeitpunkt des Backup sollten die Daten möglichst nicht verändert werden.

Entgelt

RSYNC-Backup-Aufträge gehören zu den abrechenbaren Speicherdiensten und sind innerhalb des Freikontingentes entgeltfrei. Wird durch die Nutzung dieses Freikontingent überschritten, so entstehen zusätzliche Entgelte, welche hier aufgeschlüsselt sind.

Erläuterung:

Der Speicherbedarf für die Sicherung wird bei der Beantragung des RSYNC-Auftrages durch den Kunden grob kalkuliert. Die Kalkulation umfasst den Umfang der Initialdaten sowie Speicherbedarf durch Änderungen am Datenbestand ("Diffs") und die Menge der gespeicherten Backup-Versionen. Das errechnete Gesamtspeichervolumen fließt in das Freikontingent der jeweiligen Struktur ein.

Ablauf der Datensicherung

  • Der Backup-Server ruft aktiv ein Backup-Skript auf allen beteiligten Klienten nach einem definierten Zeitplan auf.
  • Auf den Server werden die Daten auf einem lokalen RAID-Plattensystem nach folgendem Muster abgelegt:
    • Pro Klient wird ein Verzeichnis <hostname>/<RSYNC_datum> angelegt
    • <hostname> ist der Name des Klienten ohne Domainangabe
    • <RSYNC_datum> ist das Datum des Backup in Form YYYYMMDD
  • Der Dienst RSYNC wird in der Regel einmal täglich gestartet, wodurch ein neues Datumsverzeichnis des aktuellen Tages entsteht.
  • In das aktuelle Verzeichnis werden alle Dateien des Klienten kopiert, die sich seit dem vorherigen Datum geändert haben.
  • Alle anderen Dateien werden auf dem Server verlinkt (Hardlinks).
  • Dadurch entspricht der Inhalt jedes Datumsverzeichnisses exakt dem Stand auf dem Klienten zum Zeitpunkt des entsprechenden RSYNC-Aufrufes.
  • In regelmäßigen Abständen wird RSYNC mit einer Option -c aufgerufen, die alle Dateien auf dem Klient und dem Server liest und anhand derer MD4-Prüfsumme vergleicht. Das hat den Vorteil, dass die Lesbarkeit der Daten überprüft wird. Bei großen Datenbeständen kann dieser Vorgang viel Zeit in Anspruch nehmen.
  • Sollen gesicherte Daten zurückgestellt werden, kann der Klienten-Admin auf den Sicherungsstands seiner Wahl zugreifen und die Daten wiederherstellen.
  • Ist die festgelegte Aufbewahrungszeit abgelaufen, werden ältere Sicherungsstände mit einem Löschskript automatisch gelöscht.
  • Zur Sicherung der Daten wird folgender RSYNC-Aufruf verwendet:
    datum_neu=$(date +%y%m%d)
    datum_last=$(ls $BASE/$RHOST|tail -1)
    RSYNC -aR --link-dest $BASE/$RHOST/$datum_last -e "ssh -ax -i $KEY" $RUSER@$RHOST:"$FILES" $BASE/$RHOST/$datum_neu
    # BASE ist das Backup-Filesystem
    # RHOST ist der Hostname des Klientenrechners
    # RUSER ist der Loginname des Benutzers der auf dem Klienten das Backup macht
    # FILES ist die Liste der zu sichernden Verzeichnisse/Dateien auf dem Klienten
    

Aufbewahrung der gesicherten Daten

Die Menge der aufbewahrten Daten kann konfiguriert werden. Im Standardfall werden von jedem Datenbestand folgende Sicherungsstände aufgehoben:

  • ein täglicher Stand für 4 Wochen ab aktuellem Datum rückwärts
  • ein wöchentlicher Stand der letzten 3 Monate (1. 8. 16. 23.)
  • ein monatlicher Stand für 6 Monate (1.), aus Datenschutzgründen nicht länger

Zugriff auf gesicherte Daten

Die Backup-Server exportieren den gesicherten Datenbestand jeweils an den Fileserver, von dem die Daten ursprünglich stammen. In Abhängigkeit vom Betriebssystem des Fileservers erfolgt der Export per NFS bzw. Samba/CIFS (immer readonly). Am Fileserver kann also der gesicherte Datenbestand direkt zugänglich gemacht werden, er unterliegt den Zugriffsschutzmechanismen des Fileservers. Siehe dazu auch „Daten wiederherstellen“.