OpenStreetMap und externe Datenbanken: Unterschied zwischen den Versionen

Aus Geoinformation HSR
Wechseln zu: Navigation, Suche
K
K
Zeile 8: Zeile 8:
  
 
Man kann folgende externe Datenbanken unterscheiden:
 
Man kann folgende externe Datenbanken unterscheiden:
# Externe Datenbanken im engeren Sinne, welche die OSM-Daten zu sich kopieren, filtern und aufbereiten (ohne eigene Daten/Ebenen), z.B. [http://osmbugs.org/ OpenStreetBugs], [http://hiking.lonvia.de/de/ Waymarked Trails/Wanderwege (von Lonvia)], [http://wheelmap.org/?a=b&lat=47.2269198&lon=8.8245459&q=Rapperswil&zoom=17 Wheelmap], [http://www.rollstuhlkarte.ch/ Rollstuhlkarte].
+
# Externe Datenbanken im engeren Sinne, welche die OSM-Daten zu sich kopieren, filtern und aufbereiten (ohne eigene Daten/Ebenen).
 
# Externe Datenbanken im weiteren Sinne, welche die OSM-Daten zu sich kopieren, filtern und mit eigenen Daten verknüpfen (v.a. mit der OSM-ID). Das Resultat davon muss unterliegt typischerweise der ODbL Lizenz (je nach Art der Verknüpfung).
 
# Externe Datenbanken im weiteren Sinne, welche die OSM-Daten zu sich kopieren, filtern und mit eigenen Daten verknüpfen (v.a. mit der OSM-ID). Das Resultat davon muss unterliegt typischerweise der ODbL Lizenz (je nach Art der Verknüpfung).
 
# Externe Datenbanken im weiteren Sinne, welche die eigenen Daten mit OSM vergleichen (v.a. mit der OSM-ID), ansonsten aber weitgehend eigenständig sind (auch lizenzmässig).
 
# Externe Datenbanken im weiteren Sinne, welche die eigenen Daten mit OSM vergleichen (v.a. mit der OSM-ID), ansonsten aber weitgehend eigenständig sind (auch lizenzmässig).
  
== Lösungsansätze ==
 
  
Lösungsansätze aus Sicht externe DB:
+
== Lösungsansätze externer DB im engeren Sinne ==
# Variante "Räumliche Beziehung ExtDB->OsmDB" (oder "Koordinatensystem-Beziehung"): Die exterene DB nutzt OSM nur zur Lokalisierung ihrer Objekte und zwar über das gemeinsame bzw. ineinander transformierbare Koordinatensystem (sog. "Georeferenzierung").
+
 
 +
Bei externen Datenbanken im engeren Sinne reduziert sich die Lösung der folgenden Probleme
 +
 
 +
* Synchronisation: Die Synchronisation geschieht mittels Replikation, bzw. differentiellem Update, z.B. jede Minute, Stunde, täglich oder in grösseren zeitlichen Abständen. Vgl. z.B. [[Osm2pgsql]]
 +
* Verwaltung von regionalen Ausschnitten: Die lokale Kopie kann die ganze Welt oder nur einen Ausschnitt davon sein. Dabei ist der lokale Ausschnitt zwar datenmässig handlicher, jedoch schwieriger zu handhaben mit differentiellem Update.
 +
* Aufbereitung (v.a. Polygone): Die Aufbereitung von OSM-Objekten, v.a. Flächen, zu "echten" (GIS-)Polygonen ist eine weitere Herausforderung.
 +
 
 +
Beispiele: [[PostGIS Terminal]], [[OpenPOIMap]], [http://osmbugs.org/ OpenStreetBugs], [http://hiking.lonvia.de/de/ Waymarked Trails/Wanderwege (von Lonvia)], [http://wheelmap.org/?a=b&lat=47.2269198&lon=8.8245459&q=Rapperswil&zoom=17 Wheelmap], [http://www.rollstuhlkarte.ch/ Rollstuhlkarte]
 +
 
 +
== Lösungsansätze externer DB im weiteren Sinne ==
 +
 
 +
Lösungsansätze aus Sicht einer externen DB im weiteren Sinne:
 +
# Variante "Räumliche Beziehung ExtDB->OsmDB" (oder "Koordinatensystem-Beziehung"): Die exterene DB nutzt OSM nur zur Lokalisierung ihrer Objekte und zwar über das gemeinsame bzw. ineinander transformierbare Koordinatensystem (sog. "Georeferenzierung").
 
# Variante "OsmDB[tag_id]->ExtDB": In OSM wird in den Tags eine "Tag ID" ("tag_id") erfasst, die auf die ID eines Objekts der externen DB zeigt.
 
# Variante "OsmDB[tag_id]->ExtDB": In OSM wird in den Tags eine "Tag ID" ("tag_id") erfasst, die auf die ID eines Objekts der externen DB zeigt.
 
# Variante "OsmDB[SET OF tags]->ExtDB": Die externe DB identifiziert eine (möglichst) eindeutige Kombination von Tags (ohne ID) und macht eine Query, um diese zu finden.
 
# Variante "OsmDB[SET OF tags]->ExtDB": Die externe DB identifiziert eine (möglichst) eindeutige Kombination von Tags (ohne ID) und macht eine Query, um diese zu finden.

Version vom 4. November 2012, 20:40 Uhr

Dies ist ein Versuch, die Beziehung von OpenStreetMap (OSM) und externen Datenbanken, bzw. weitere Gemeinschaften zu untersuchen und Verknüpfungsmöglichkeiten aufzuzeigen.

Einleitung

OpenStreetMap-Daten können mit anderen (Geo-)Daten verknüpft werden. Diese anderen Daten können einfache Kopien oder Ausschnitte von OSM oder aber eigenständige 'Fachinformationssysteme' (FIS,en: Professional Information System, PIS) sein. Die Mitglieder, die an den FIS beteiligt sind, können 'Fachinformationsgemeinschaften' (FIG, en:Professional Information Community/PIC) genannt werden.

Es muss vorausgeschickt werden, dass die Hauptinfrastruktur von OSM v.a. auf Webdienste ausgerichtet sind, welche es erlauben, die OSM-Datenbank zu pflegen v.a. mittels Editoren. Sobald ressourcen-intensivere Aufgaben anfallen (wie z.B. Spezialkarten), müssen die Daten von OSM zu sich kopiert werden. Das können vorgefertigte räumliche Ausschnitte davon sein und/oder sog. differentielle Updates.

Man kann folgende externe Datenbanken unterscheiden:

  1. Externe Datenbanken im engeren Sinne, welche die OSM-Daten zu sich kopieren, filtern und aufbereiten (ohne eigene Daten/Ebenen).
  2. Externe Datenbanken im weiteren Sinne, welche die OSM-Daten zu sich kopieren, filtern und mit eigenen Daten verknüpfen (v.a. mit der OSM-ID). Das Resultat davon muss unterliegt typischerweise der ODbL Lizenz (je nach Art der Verknüpfung).
  3. Externe Datenbanken im weiteren Sinne, welche die eigenen Daten mit OSM vergleichen (v.a. mit der OSM-ID), ansonsten aber weitgehend eigenständig sind (auch lizenzmässig).


Lösungsansätze externer DB im engeren Sinne

Bei externen Datenbanken im engeren Sinne reduziert sich die Lösung der folgenden Probleme

  • Synchronisation: Die Synchronisation geschieht mittels Replikation, bzw. differentiellem Update, z.B. jede Minute, Stunde, täglich oder in grösseren zeitlichen Abständen. Vgl. z.B. Osm2pgsql
  • Verwaltung von regionalen Ausschnitten: Die lokale Kopie kann die ganze Welt oder nur einen Ausschnitt davon sein. Dabei ist der lokale Ausschnitt zwar datenmässig handlicher, jedoch schwieriger zu handhaben mit differentiellem Update.
  • Aufbereitung (v.a. Polygone): Die Aufbereitung von OSM-Objekten, v.a. Flächen, zu "echten" (GIS-)Polygonen ist eine weitere Herausforderung.

Beispiele: PostGIS Terminal, OpenPOIMap, OpenStreetBugs, Waymarked Trails/Wanderwege (von Lonvia), Wheelmap, Rollstuhlkarte

Lösungsansätze externer DB im weiteren Sinne

Lösungsansätze aus Sicht einer externen DB im weiteren Sinne:

  1. Variante "Räumliche Beziehung ExtDB->OsmDB" (oder "Koordinatensystem-Beziehung"): Die exterene DB nutzt OSM nur zur Lokalisierung ihrer Objekte und zwar über das gemeinsame bzw. ineinander transformierbare Koordinatensystem (sog. "Georeferenzierung").
  2. Variante "OsmDB[tag_id]->ExtDB": In OSM wird in den Tags eine "Tag ID" ("tag_id") erfasst, die auf die ID eines Objekts der externen DB zeigt.
  3. Variante "OsmDB[SET OF tags]->ExtDB": Die externe DB identifiziert eine (möglichst) eindeutige Kombination von Tags (ohne ID) und macht eine Query, um diese zu finden.
  4. Variante "SET OF ExtDB[osm_id]->OsmDB". Ein oder mehrere Objekte der externen DB speichern bei sich die OSM-ID ("osm_id") - nebst weiteren Sachdaten (und ev. weiteren Objekten mit Geometrie).

Diskussion der Lösungsansätze:

  • In allen Fällen ist nicht ausgeschlossen, dass von der Applikation auch Daten wieder an OpenStreetMap zurückgegeben werden (z.B. Wheelmap).
  • "Allgemeine Prüfung": V.a. in den Varianten zwei und vier muss regelmässig oder periodisch mittels Tag-Regeln überprüft werden, ob ein Objekt in OSM neu eingefügt wurde, welche die externe DB betreffen.
  • Bei der ersten Variante ist die Trennung aller Daten offensichtlich. Für die übrigen drei Varianten macht es die Lösung einfacher, wenn die Geometrie nur in OSM verwaltet wird, wie dies z.B. bei Wheelmap der Fall ist.

1. Variante "Räumliche Beziehung":

  • Das entspricht einem einfache "Layering", d.h. der Anzeige der Objekte in verschiedenen Layers.
  • Eine Lösung dazu bietet z.B. der FeatureServer (siehe dort die Demoseite mit OpenLayers). Unter Berücksichtigung der ODbL kann man so eigene Geometrie und Sachdaten erfassen.

Bei der Variante 2 "OsmDB[tag_id]->ExtDB"...

  • könnte man eigene Tags oder Tags z.B. mit Präfix (in der Art "TMC:tmc_id=8326765") angeben bei der der Präfix ein Hinweis auf das Projekt ist. Ein akzeptiertes Beispiel dafür ist das Wikipedia-Tag.
  • Diese "leidet" nicht unter der instabilen OSM-ID und ist relativ einfach zu realisieren, denn es können die Werkzeuge rund um OSM genutzt werden. Die eigene Infrastruktur verlangt nicht einmal eine eigene Datenbank; für den Anfang reicht ein einfaches Content Management Systeme, das bis zu Webdiensten ausgebaut werden kann.
  • Die Variante soll aber mit besonderer Zurückhaltung gehandhabt werden, d.h. es sind die OSM-Richtlinien zu konsultieren. Ein Beispiel dafür ist Wheelmap.
  • Um - nebst der "allgemeinen Prüfung" (vgl. oben) - "synchron" zu bleiben (falls gefordert), muss die externe DB nur dijenigen Änderungen (Update, Delete) von OSM untersuche, die das "eigene" Tag-ID enthalten.

Zur dritten Variante "OsmDB[SET OF tags]->ExtDB":

  • Hier handelt es sich meist um Datenbanken im weiteren Sinne, die von FIGs verwaltet werden.
  • Dabei müssen die FIGs die Lizenzbestimmungen von OSM beachten. Dies gilt besonders, wenn die OSM-Daten heruntergeladen und zusammen mit anderen in einer Datenbank verwaltet werden.
  • Diese Variante eignet sich kaum zur Automatisierung und engen Verknüpfung mit OSM. Sie eignet sich in Fällen, wo die Beziehung zwischen FIS und OSM "lose" ist. Vgl. dazu die Verknüpfung von Wikipedia mit Objekten und Kartenausschnitten in OpenStreetMap z.B. in 'WIWOSM'.
  • Um - nebst der "allgemeinen Prüfung" (vgl. oben) - "synchron" zu bleiben (falls gefordert), muss die externe DB periodisch über sämtliche eigenen Daten kontrollieren, ob damit bei OSM noch etwas "gefunden" wird.

Zur Variante 4 "SET OF ExtDB[osm_id]->OsmDB":

  • Für die Verknüpfung bietet sich technisch die OSM-ID an - und das wird auch bei einigen Projekten so ausgenutzt. Die OSM-IDs sind aber instabil, d.h. die Eindeutigkeit und Unveränderbarkeit von OSM-IDs ist nicht garantiert! Dies u.a. um die Unabhängigkeit von OSM zu wahren und intern reorganisieren zu können (vgl. dazu einige Diskussionen auf Talk-de).
  • Diese Variante belastet die OSM in Bezug auf die Datenmenge am Wenigsten.
  • Diese Variante hat aber nebst der 'instabilen' OSM-ID den Nachteil, dass die OSMler nicht realisieren, dass da etwas "dranhängt" und löschen als Folge davon unbedacht Nodes (und in OSM gibt es kaum ein "Loesch- und Editierverbot").
  • Um - nebst der "allgemeinen Prüfung" (vgl. oben) - "synchron" zu bleiben (falls gefordert), muss die externe DB in sämtlichen Änderungen (Update, Delete) von OSM nach den OSM-IDs suchen, die in der externen DB verwaltet werden.

"OSM-ID-Webdienst" oder "OSM-Alert-Dienst"?

Eine Variation einer externen Datenbank im weiteren Sinne ist eine externe DB sowie - neu und zusätzlich - eine Applikation (ein Webdienst), die zwischen ihr und der OSM DB liegt. Die externe DB informiert sich via diesen Webdienst bei OSM, wo sich etwas geändert hat. Es ist dies eine Variante, die sich auf den ersten und vierten Lösungsansatz stützt.

Man stelle sich eine Art "OSM-ID-Webdienst" (Proxy) oder ein "OSM-Alert-Dienst" vor, der mittel Analyse der OSM-'Diffs' eruiert, was sich in OSM geändert hat. Diese Änderungen könnten in einer Webapplikation mit Admistrations-"Frontend" angezeigt und müssten dann "autonom" mit Mitteln der externen DB nachvollzogen werden. Dies lässt offen, welcher Lizenz die externe DB unterliegt.

Die Nutzer der externen DB könnten dabei auch etwas an OSM zurückgeben, in sie auch bei OSM beitragen. Natürlich muss dabei beachtet werden, dass die Daten in OSM richtig integriert sind sowie dass die Nutzer nicht nur der Lizen der externen dB zustimmen sondern dort ihre Beiträge auch unter ODbL freigeben.