Replikation: Unterschied zwischen den Versionen

Version vom 24. Januar 2010, 14:31 Uhr

Replikation (Datenverarbeitung) oder Replizierung bezeichnet die mehrfache Speicherung von Daten an unterschiedlichen Standorten.

Siehe auch

Replikation dient einerseits zur Datensicherung; andererseits der Performanz, d.h. der Verkürzung Antwortzeiten, besonders für lesende Datenzugriffe.

Es gibt verschiedene Gründe und Vorteile für die Replikation:

Verwandte Konzepte zur Replikation: Bei der Versionsverwaltung (Verwaltung gleichrangiger Kopien) müssen Merge-Strategien angewendet werden (siehe unten). Bei verteilten Datenbanken haben wir es mit verschiedenen Daten an verschiedenen Orten zu tun - Gegensatz zur Replikation, bei der dieselben Daten - oder ein Teil davon - an verschiedenen Orten verwaltet werden.

Nur lesende oder lesende & schreibende Zugriffe: Ändernde Datenzugriffe machen für die Replikation im Allgemeinen aufwändiger. Bei der häufig anzutreffenden Master/Slave-Replikation unterscheidet man zwischen dem „Original“ der Daten (Primärdaten) und den abhängigen Kopien. Man unterscheidet daher Single Master, bei der Änderungen nur von einem einzigen Master akzeptiert werden und Multi-Master.

Häufigkeit: Zunächst muss bestimmt werden, welche Datenbankobjekte wie häufig sie repliziert werden müssen.

Aktualität: Es ist auch wichtig zu wissen, welche Aktualität die Replikate besitzen müssen. Die Zeitspanne zwischen der Bearbeitung/Erstellung der Primärdaten und ihrer Replizierung wird als timeliness, meist aber als latency bezeichnet. Damit verknüpft ist die Unterscheidung zwischen synchroner und asynchroner Replikation ab:

Synchrone Replikation: Bei synchroner Replikation werden Änderungsoperationen an einem Datenobjekt nur dann erfolgreich abgeschlossen, wenn sie auch auf den Replikaten durchgeführt wurden (vgl. Atomarität (Unteilbarkeit) von Transaktionen, Commit-Protokoll). Hot Standby Replikation von MS SQL-Server ist ein Beispiel dafür.

Asynchrone Replikation: Bei der asynchronen Replikation liegt zwischen der Bearbeitung der primären Daten und der Replizierung eine Latenz. Die Daten sind nur zu dem Zeitpunkt der Replikation synchron (identisch). Eine einfache Variante der asynchronen Replikation ist die „File Transfer Replication“, der Transfer von Dateien via FTP oder SSH. Strategien asynchroner Replikation sind Merge-Replikation, Primary Copy, Snapshot-Replikation und Standby-Replikation. Die Vorteile der Commit-Protokoll werden erkauft durch einen hohen Updateaufwand, erhöhter Speicherplatzbedarf und v.a. dem Problem, dass Konflikte entstehen können, die im schlimmsten Fall nur durch manuellen Eingriff gelöst werden können.

@@ Zeile 4: / Zeile 4: @@
 * [[PostgreSQL]]
 * Synchronisieren: Siehe z.B. die Tools für WikiPad http://trac.wikidpad2.webfactional.com/wiki/Sync
+== Was ist Replikation? ==
 Replikation dient einerseits zur Datensicherung; andererseits der Performanz, d.h. der Verkürzung Antwortzeiten, besonders für lesende Datenzugriffe.