Geodatenabgabe

Aus Geoinformation HSR
Wechseln zu: Navigation, Suche

Für die Abgabe von Geodaten sind aus technischer Sicht a) Webservices und b) Geodatenformate (inkl. Encoding) zu regeln.

(Geo-)Dienste sollen:

  • einfach, möglichst knapp und implementierbar (d.h. getestet) sein
  • die (schweiz.) Gesetze, Verordnungen und Vorgaben berücksichtigen
  • und wenn möglich auf Standards beruhen.

Zu Geodaten gehören auch Datenmodelle und Darstellungsmodelle.

Während viele aktuelle Dokumente von Geodateninfrastrukturen nur von Download-Dienste sprechen, unterteilen wir hier Geodatenzugriffs-Dienste in

  1. Download-Dienste (= grob-granularer Zugriff) und
  2. Online-Zugriffs-Dienste (fein-granularer Zugriff).

Im GeoIV der Scheiz z.B. ist in diesem Zusammenhang nur von Download-Dienst die Rede (vgl. auch GDI).

Online-Zugriffs-Dienste

Hier greifen verteilte GIS direkt auf den Dienst zu. Es sind dies fein-granulare, synchrone Webdienste im Gegensatz zum Datei-Download, der grob-granular ist (Quelle: WFS, Seite xiii, OpenGIS Web Feature Service 2.0 Interface Standard (also ISO 19142)).

Beispiele:

  • WFS mit GML aber auch mit anderen Formaten, wie z.B. INTERLIS oder GeoJSON (siehe unten).
  • WCS

Diskussion:

Download-Dienste

Download-Dienste (Webservices) für die Geodatenabgabe:

  1. Hypertext Transfer Protocol (HTTP) (bis max. 100 MB)
  2. File Transfer Protocoll (FTP)
  3. Peer-to-peer File Sharing Protokolle, z.B. BitTorrent (mit Resume und Throttling)
  4. weitere

Diskussion:

  • Download-Dienste können - im Gegensatz zu Online-Zugriffsdiensten - verschiedene zusätzliche Eigenschaften haben:
    • Resume-Funktion, d.h. Wiederanlauf ohne Verlust der bisher heruntergeladenen Daten.
    • Asynchroner Download, bei z.B. der dem Client eine URL per E-Mail geschickt wird, damit der Client die Daten beziehen kann, wann er möchte - auch wiederholt, d.h. mit Resume (z.B. ftp).
    • Die Datenabgabe grosser Datenmengen (> 100 MB) ist oft asynchron.
  • In Zukunft könnten für synchroner Download ev. folgende Webservices relevant werden: WMS:getFeatureInfo, WMS:getFeatureInfoById mit einem HTTP-URL- und einem SOAP-Binding.
  • WFS ist nur bedingt für Download-Dienste zu empfehlen, da es ein Standard für den fein-granularen Zugriff ist und u.a. bei grossen Dateien Timeout-Probleme hat, bei dem der Client keine Möglichkeit hat, den Download zu wiederholen (resume).

Datenformate

Abgrenzung: Systemeigene Formate ('die Proprietären') zählen wir nicht zu den Standards, da sie darauf ausgerichtet sind, interne Strukturen optimal abzubilden. Es sind meist binäre Formate der Systeme (vgl. auch die Bemerkung zur unten).

Die "Formatpyramide" (von der Fa. Infogrips, angepasst und ergänzt):

  1. GML/XML (das 'internationale') Dies ist zwar ein Geodaten-Austauschformat gemäss OGC-Industriestandard und eng mit WFS verbunden. Doch ist es sehr umfangreich, komplex (viele Namespaces) und an einigen Stellen unterspezifiziert (Umgang mit Geometrien).
  2. INTERLIS (das Format für "GIS-Spezialisten"): Nicht nur ein ASCII-Format in einer Datei, sondern lässt sich direkt aus einer eigenen Datenbankschema-Beschreibung herleiten. Publiziert vom Schweizer Standard-Verein eCH: [1] . Es gibt zurzeit zwei Formate: die INTERLIS 1 (ITF) und INTERLIS 2 (XTF/IXML). Nachteile: Auf die Schweiz beschränkt.
  3. Spatialite (das Format für "alle"): Ein binäres Format mit mehreren Tabellen mit Attributen und Geometrie in einer einzigen Datei. Beziehungen in Views. Ein SQLite-"Profil". Open Source. [2]. Nachteile: Wird noch nicht von allen GIS unterstützt.
  4. Shapefile ('das GIS-Format von Esri'). Dies ist ein verbreitetes aber auch eine veraltetes und beschränktes Format. Z.B. fehle Beziehungen, es besteht aus vielen zusammengehörenden Dateien und es werden Attributnamen abgeschnitten. Das "Personal Geodatabase" (vgl. Esri und OGR) ist nicht viel besser und wird von Esri selber nicht für den Austausch empfohlen.
  5. DXF (das Format für Architekten und Planer): Ein Text-/ASCII-Format nur mit "farbiger" Geometrie (höchstens mit Layerangaben). Nachteil: Nur Geometrie.
  6. CSV (das Format für den IT Mainstream): Bekanntes Format als kleinster gemeinsamer Nenner. Braucht bestimmte Regeln für Feldtrennzeichen und Encoding; Geometrien sollten im sog. WKT-Format codiert werden: [3]. Nachteil: eine Datei pro Tabelle.

Diskussion:

  • In Zukunft ist ev. mit einem neuen Format zu INTERLIS zu rechnen, das einfach und XML-konform ist.
  • Zu beobachten ist auch die Entwicklung von Protocol Buffers, d.h. einer Art XML, nur sehr kompakt binär und Schema-getrieben ([4]).
  • Die Fa. Esri schlägt sozusagen als Ablösung ihres Shapefile-Formats die "File Geodatabase" (vgl. auch OGR), jedoch nicht als Format sondern als geschlossene Softwarebibliothek (API). Ein solches API widerspricht jedoch der Anforderung eines Austauschstandards insofern es naturgemäss nicht das Format selber normiert und zudem eingeschränkt ist auf die Programmiersprache und die unterstützten Betriebssysteme.