Replikation: Unterschied zwischen den Versionen

Aus Geoinformation HSR
Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: „Replikation (Datenverarbeitung) oder Replizierung bezeichnet die mehrfache Speicherung von Daten an unterschiedlichen Standorten. Siehe auch * PostgreSQL *…“)
 
Zeile 4: Zeile 4:
 
* [[PostgreSQL]]
 
* [[PostgreSQL]]
 
* Synchronisieren: Siehe z.B. die Tools für WikiPad http://trac.wikidpad2.webfactional.com/wiki/Sync
 
* Synchronisieren: Siehe z.B. die Tools für WikiPad http://trac.wikidpad2.webfactional.com/wiki/Sync
 +
 +
== Was ist Replikation? ==
  
 
Replikation dient einerseits zur Datensicherung; andererseits der Performanz, d.h. der Verkürzung Antwortzeiten, besonders für lesende Datenzugriffe.  
 
Replikation dient einerseits zur Datensicherung; andererseits der Performanz, d.h. der Verkürzung Antwortzeiten, besonders für lesende Datenzugriffe.  

Version vom 24. Januar 2010, 14:31 Uhr

Replikation (Datenverarbeitung) oder Replizierung bezeichnet die mehrfache Speicherung von Daten an unterschiedlichen Standorten.

Siehe auch

Was ist Replikation?

Replikation dient einerseits zur Datensicherung; andererseits der Performanz, d.h. der Verkürzung Antwortzeiten, besonders für lesende Datenzugriffe.

Es gibt verschiedene Gründe und Vorteile für die Replikation:

  • Verfügbarkeit
  • Performance
  • Disconnected Computing (z.B. für Mobiles)
Verwandte Konzepte zur Replikation
Bei der Versionsverwaltung (Verwaltung gleichrangiger Kopien) müssen Merge-Strategien angewendet werden (siehe unten). Bei verteilten Datenbanken haben wir es mit verschiedenen Daten an verschiedenen Orten zu tun - Gegensatz zur Replikation, bei der dieselben Daten - oder ein Teil davon - an verschiedenen Orten verwaltet werden.
Nur lesende oder lesende & schreibende Zugriffe
Ändernde Datenzugriffe machen für die Replikation im Allgemeinen aufwändiger. Bei der häufig anzutreffenden Master/Slave-Replikation unterscheidet man zwischen dem „Original“ der Daten (Primärdaten) und den abhängigen Kopien. Man unterscheidet daher Single Master, bei der Änderungen nur von einem einzigen Master akzeptiert werden und Multi-Master.
Häufigkeit
Zunächst muss bestimmt werden, welche Datenbankobjekte wie häufig sie repliziert werden müssen.
Aktualität
Es ist auch wichtig zu wissen, welche Aktualität die Replikate besitzen müssen. Die Zeitspanne zwischen der Bearbeitung/Erstellung der Primärdaten und ihrer Replizierung wird als timeliness, meist aber als latency bezeichnet. Damit verknüpft ist die Unterscheidung zwischen synchroner und asynchroner Replikation ab:
Synchrone Replikation
Bei synchroner Replikation werden Änderungsoperationen an einem Datenobjekt nur dann erfolgreich abgeschlossen, wenn sie auch auf den Replikaten durchgeführt wurden (vgl. Atomarität (Unteilbarkeit) von Transaktionen, Commit-Protokoll). Hot Standby Replikation von MS SQL-Server ist ein Beispiel dafür.
Asynchrone Replikation
Bei der asynchronen Replikation liegt zwischen der Bearbeitung der primären Daten und der Replizierung eine Latenz. Die Daten sind nur zu dem Zeitpunkt der Replikation synchron (identisch). Eine einfache Variante der asynchronen Replikation ist die „File Transfer Replication“, der Transfer von Dateien via FTP oder SSH. Strategien asynchroner Replikation sind Merge-Replikation, Primary Copy, Snapshot-Replikation und Standby-Replikation. Die Vorteile der Commit-Protokoll werden erkauft durch einen hohen Updateaufwand, erhöhter Speicherplatzbedarf und v.a. dem Problem, dass Konflikte entstehen können, die im schlimmsten Fall nur durch manuellen Eingriff gelöst werden können.