Kurs Apache Superset: Unterschied zwischen den Versionen

Aus Geoinformation HSR
Wechseln zu: Navigation, Suche
K
K (Unterlagen)
 
(6 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
 
[[File:Logo_Apache_Superset.png|150px||right|]]
 
[[File:Logo_Apache_Superset.png|150px||right|]]
Schnell-Einstiegskurs (ein Tag) '''"Apache Superset''' (Kürzel "Kurs_Superset"), das '''Daten-Visualisierungs- und Publikations-Werkzeug''' ("Business Intelligence Tool"). Leitspruch: "Visualisierung einfacher als Excel und GIS!
+
Schnell-Einstiegskurs (ein Tag) '''"Apache Superset''' (Kürzel "Kurs_Superset"), das '''Daten-Visualisierungs- und Publikations-Werkzeug''' ("Business Intelligence Tool"). Es kann nicht genug betont werden, wie viel einfacher und schneller damit Daten visualisiert und publiziert werden können als mit Excel oder Online GIS. Das gilt v.a. für einfache Darstellungen, d.h. Excel und GIS werden nicht verdrängt.
  
Für den Erfolg einer Entscheidungsfindung ist eine gute Visualisierung wichtig.
+
Dies sind die drei Gründe, warum immer mehr Business Intelligence Tools eingesetzt werden:
 +
 
 +
(1) Für den Erfolg einer Entscheidungsfindung ist eine gute Visualisierung wichtig.
 
Darum müssen die Erkenntnisse eines Anliegens, Projektes oder Umfrage visualisiert werden.
 
Darum müssen die Erkenntnisse eines Anliegens, Projektes oder Umfrage visualisiert werden.
Wenn Erkenntnisse anschaulicht und nachvollziehbar dargestellt werden, erhöht das deren Verständlchkeit und Akzeptanz.
+
Wenn Ergebnisse anschaulich und nachvollziehbar dargestellt werden, erhöht das deren Verständlichkeit und Akzeptanz.
  
Visualisierung kann man zudem nicht nur zur Veranschaulichung einsetzen, sondern auch zu Datenanalyse.
+
(2) Visualisierungen komplettieren die Datenanalyse, indem räumliche Zusammenhänge aufgezeigt werden, denn wir Menschen sind schlecht darin, Zahlen zu vergleichen; grafische Muster dagegen erkennen wir gut.
Häufig erkennt man Zusammenhänge in den Daten erst durch eine geschickte Darstellung.
+
Eine Visualisierung stellt somit nicht nur die Daten graphisch dar, sondern kann auch als eigene Technik der Datenanalyse eingesetzt werden.
Wir Menschen sind schlecht darin, Zahlen zu vergleichen; grafische Muster dagegen erkennen wir gut.
+
 
Visualisierung stellt somit nicht nur die Daten graphisch dar, sondern kann auch als eigene Technik der Datenanalyse eingesetzt werden.
+
(3) Das Internet ermöglicht die Publikation der Visualisierung und stellt eine einfache Kommunikation dar mit Kunden und (Arbeits-)Kollegen.
Das Internet ermöglicht zudem die Publikation der Visualisierung und damit die einfache Kommunikation mit Kunden und (Arbeits-)Kollegen.
 
  
 
Apache Superset ist so ein Werkzeug zur Analyse, Visualisierung und zum Teilen (Sharing) von Datenquellen, d.h. von Tabellen (Excel oder LibreOffice) bis Geodaten. Es ist ein mächtiges, webbasiertes, interaktives Open-Source-Programm, das typischerweise als Cloud-Service genutzt wird. D.h. es ist keine Installation nötig (Web-Browser genügt) - und es werden keine Programmierkenntnisse verlangt (Grundkenntnisse der Tabellenkalkulation genügen für den Einstieg).
 
Apache Superset ist so ein Werkzeug zur Analyse, Visualisierung und zum Teilen (Sharing) von Datenquellen, d.h. von Tabellen (Excel oder LibreOffice) bis Geodaten. Es ist ein mächtiges, webbasiertes, interaktives Open-Source-Programm, das typischerweise als Cloud-Service genutzt wird. D.h. es ist keine Installation nötig (Web-Browser genügt) - und es werden keine Programmierkenntnisse verlangt (Grundkenntnisse der Tabellenkalkulation genügen für den Einstieg).
Zeile 18: Zeile 19:
 
''"An Apache Superset begeistert mich vor allem die Visualisierung und das Data-Sharing, welches einen leichten und ansprechenden Zugang zu den Visualisierungen erlaubt... und das Tempo mit dem eine Grafik erstellt werden kann. Die Filter-Funktion für das Dashboard ist beeindruckend."'' -- Eine Anwenderin, 23. September 2019.
 
''"An Apache Superset begeistert mich vor allem die Visualisierung und das Data-Sharing, welches einen leichten und ansprechenden Zugang zu den Visualisierungen erlaubt... und das Tempo mit dem eine Grafik erstellt werden kann. Die Filter-Funktion für das Dashboard ist beeindruckend."'' -- Eine Anwenderin, 23. September 2019.
  
   Nächste Durchführung: Fr. 24. Januar 2020 => '''[[Media:Kurs_Apache_Superset_HSR_Anmeldung.pdf |Zur Anmeldung (.pdf)]]'''
+
   Nächste Durchführung: Fr. 4. September 2020 => '''[[Media:Kurs_Apache_Superset_HSR_Anmeldung.pdf |Zur Anmeldung (.pdf)]]'''
 
   Es hat noch Plätze frei. Anmeldeschluss ist eine Woche vor Kursbeginn um 12:00 Uhr.  
 
   Es hat noch Plätze frei. Anmeldeschluss ist eine Woche vor Kursbeginn um 12:00 Uhr.  
  
Zeile 67: Zeile 68:
 
* Wer Daten hat (CSV-Dateien), die er analysieren, visualisieren und ggf. sharen möchte, kann diese ebenfalls mitnehmen.
 
* Wer Daten hat (CSV-Dateien), die er analysieren, visualisieren und ggf. sharen möchte, kann diese ebenfalls mitnehmen.
 
* Wer sich vorgängig informieren möchte, kann sich eines der Videos [https://www.youtube.com/results?search_query=%22Apache+Superset%22 hier] anschauen.
 
* Wer sich vorgängig informieren möchte, kann sich eines der Videos [https://www.youtube.com/results?search_query=%22Apache+Superset%22 hier] anschauen.
 +
* Es gibt [https://pushmetrics.io/apache-superset hier ein Kurzvideo] mit folgendem Ablauf: Interaktives Dashboard, dann Daten filtern und schliesslich Chart anpassen (exportieren) und wieder im Dashboard publizieren.
  
 
== Software ==
 
== Software ==
  
 
Es muss keine Software lokal installiert werden (gängiger Browser genügt). Apache Superset wird als Webapplikation (Apache Superset HSR Cloud) während des Kurses frei zur Verfügung gestellt. Der Zugang kann danach bis Ende Jahr (2020) kostenlos weiterbenutzt werden (der Apache Superset ist ansonsten kostenpflichtig, um die Betriebskosten zu decken). Danach kann das Abonnement kostenpflichtig verlängert werden.
 
Es muss keine Software lokal installiert werden (gängiger Browser genügt). Apache Superset wird als Webapplikation (Apache Superset HSR Cloud) während des Kurses frei zur Verfügung gestellt. Der Zugang kann danach bis Ende Jahr (2020) kostenlos weiterbenutzt werden (der Apache Superset ist ansonsten kostenpflichtig, um die Betriebskosten zu decken). Danach kann das Abonnement kostenpflichtig verlängert werden.
 
  Tipp: Hier gibt es eine [https://www.quora.com/Is-there-an-online-demo-for-Airbnbs-superset Demo]](siehe Dashboard "World‘s Bank Data").
 
  
 
== Unterlagen ==
 
== Unterlagen ==
  
 
* Offizielle Dokumentation von Apache Superset: https://superset.incubator.apache.org/ .
 
* Offizielle Dokumentation von Apache Superset: https://superset.incubator.apache.org/ .
* Auf [https://openschoolmaps.ch OpenSchoolMaps.ch] gibt es aktuelles Unterrichtsmaterial zu Apache Superset zum selber lernen ''(in Vorbereitung)''.
+
* Unterrichtsmaterial zu Apache Superset zum selber lernen: Siehe ''Apache Superset das Datenvisualisierungs- und Publikations-Werkzeug'' auf [https://openschoolmaps.ch OpenSchoolMaps.ch] .
 
* Buch mit ergänzendem Material: "Apache Superset Quick Start Guide" by Shashank Shekhar, Dec. 2018, 188 pages, Packt Publishing. Repository: https://github.com/PacktPublishing/Superset-Quick-Start-Guide .
 
* Buch mit ergänzendem Material: "Apache Superset Quick Start Guide" by Shashank Shekhar, Dec. 2018, 188 pages, Packt Publishing. Repository: https://github.com/PacktPublishing/Superset-Quick-Start-Guide .
  

Aktuelle Version vom 7. Februar 2020, 13:03 Uhr

Logo Apache Superset.png

Schnell-Einstiegskurs (ein Tag) "Apache Superset (Kürzel "Kurs_Superset"), das Daten-Visualisierungs- und Publikations-Werkzeug ("Business Intelligence Tool"). Es kann nicht genug betont werden, wie viel einfacher und schneller damit Daten visualisiert und publiziert werden können als mit Excel oder Online GIS. Das gilt v.a. für einfache Darstellungen, d.h. Excel und GIS werden nicht verdrängt.

Dies sind die drei Gründe, warum immer mehr Business Intelligence Tools eingesetzt werden:

(1) Für den Erfolg einer Entscheidungsfindung ist eine gute Visualisierung wichtig. Darum müssen die Erkenntnisse eines Anliegens, Projektes oder Umfrage visualisiert werden. Wenn Ergebnisse anschaulich und nachvollziehbar dargestellt werden, erhöht das deren Verständlichkeit und Akzeptanz.

(2) Visualisierungen komplettieren die Datenanalyse, indem räumliche Zusammenhänge aufgezeigt werden, denn wir Menschen sind schlecht darin, Zahlen zu vergleichen; grafische Muster dagegen erkennen wir gut. Eine Visualisierung stellt somit nicht nur die Daten graphisch dar, sondern kann auch als eigene Technik der Datenanalyse eingesetzt werden.

(3) Das Internet ermöglicht die Publikation der Visualisierung und stellt eine einfache Kommunikation dar mit Kunden und (Arbeits-)Kollegen.

Apache Superset ist so ein Werkzeug zur Analyse, Visualisierung und zum Teilen (Sharing) von Datenquellen, d.h. von Tabellen (Excel oder LibreOffice) bis Geodaten. Es ist ein mächtiges, webbasiertes, interaktives Open-Source-Programm, das typischerweise als Cloud-Service genutzt wird. D.h. es ist keine Installation nötig (Web-Browser genügt) - und es werden keine Programmierkenntnisse verlangt (Grundkenntnisse der Tabellenkalkulation genügen für den Einstieg).

Die Rohdaten müssen in aufbereiteter Form vorliegen, beispielsweise in einer PostgreSQL-Datenbank oder als CSV (siehe u.a. den Kurs PostGIS). Wenn nötig müssen sie mit Tabellenkalkulationsprogrammen oder QGIS aufbereitet werden (siehe u.a. den Kurs QGIS oder OpenSchoolMaps).

"An Apache Superset begeistert mich vor allem die Visualisierung und das Data-Sharing, welches einen leichten und ansprechenden Zugang zu den Visualisierungen erlaubt... und das Tempo mit dem eine Grafik erstellt werden kann. Die Filter-Funktion für das Dashboard ist beeindruckend." -- Eine Anwenderin, 23. September 2019.

 Nächste Durchführung: Fr. 4. September 2020 => Zur Anmeldung (.pdf)
 Es hat noch Plätze frei. Anmeldeschluss ist eine Woche vor Kursbeginn um 12:00 Uhr. 

Organisation

Apache Superset Dashboard World Health.jpg
  • Dauer: 1 Tag, 9:00 bis ca. 16:30 Uhr. Raum tba.
  • Kosten (inkl. WLAN, 1 Kaffee und 1 Mittagessen): CHF 500.- (Einführungspreis)
  • Für folgende Teilnehmende gibt es 20% Rabatt: Studierende (bis 25 Jahre), UNIGIS-Studierende, ETH-Erdwissenschaften Alumni, sowie HSR-Mitarbeitende.
  • Referenten: Prof. Stefan Keller (HSR) und Mitarbeitende vom Institut für Software.
  • Schulungsart: Der Anteil Übungen und Theorie ist in etwa ausgeglichen. Die Teilnehmenden nehmen einen eigenen Laptop mit (bei Bedarf werden auch Laptops zur Verfügung gestellt). Es ist Sache der Teilnehmenden, ihr Laptop/Notebook gegen Beschädigung und Diebstahl zu (ver)sichern.
  • Durchführung: Die Teilnehmerzahl ist beschränkt auf 12 (max. 15) Plätze. Der Kurs findet ab fünf zahlenden Teilnehmern statt.
  • Abmeldungen: Angemeldete Teilnehmende können sich bis eine Woche vor Beginn ohne Kostenfolge schriftlich abmelden. Bis drei Tage vorher muss pauschal 200.- in Rechnung gestellt werden. Bei noch späteren Abmeldungen muss der volle Schulungsbetrag verrechnet werden.

Beschreibung

Mit Apache Superset Daten erkunden, analysieren und visualisieren. Kurs mit interaktiven Übungen (mind. 50% zur "Theorie") an einem durchgängigen Beispiel - alles dies ohne zu Programmieren oder sich um das Schreiben von SQL oder Formeln kümmern zu müssen. Nebst Business Charts werden auch interaktive Webkarten erstellt. Am Schluss wird Apache Superset mit anderen Werkzeugen verglichen, wie Tableau, MS PowerBI, Insights for ArcGIS oder uMap, dem Karteneditor.

Auszug aus dem Programm:

  • Was sind Datenanalyse- und Data-Sharing-Werkzeuge (Business Intelligence Tools)?
  • Grundfunktionen: Benutzerverwaltung, Datenquellen, Charts (inkl. interaktive Karten) sowie Dashboards
  • Übung Datenanalyse- und -Publikation in dreieinhalb Schritten:
    • 1. Daten selektieren: Datenquellen vorbereiten
    • 2. Daten visualisieren: Listen und Grafiken erstellen
    • 3a. Daten präsentieren: Listen und Grafiken in einem Dashboard anordnen
    • 3b. Daten publizieren: Ein Dashboard über das Web mit anderen teilen
  • Fortgeschrittene Funktionen:
    • Erstellen eines Datenfilters
    • Dashboards verwalten
    • Eine eigene CSV-Datei als Datenquelle hochladen
    • Daten als Karte visualisieren
    • Datenquellen filtern (SQL)
  • Vergleich u.a. von Apache Superset mit anderen Werkzeugen
  • Ausblick: SQL Lab, Frage & Antworten, etc.

Vorkenntnisse und Vorbereitung

Vorkenntnisse:

  • Grundkenntnisse in Tabellenkalkulation und Analyse mit Excel bzw. LibreOffice/OpenOffice (z.B. Aggregationsfunktionen wie SUMME)
  • Grundkenntnisse in Datenbanksysteme (z.B. Tabellen, Attributtypen).
  • SQL-Kenntnisse oder andere Programmierkenntniss sind nicht nötig zum Verständnis dieses Kurses.

Vorbereitung

  • Es soll ein gängiger Laptop mitgebracht werden mit gängigem Browser und funktionierendem WLAN-Anschluss (es werden keine Admin-Rechte verlangt).
  • Wer Daten hat (CSV-Dateien), die er analysieren, visualisieren und ggf. sharen möchte, kann diese ebenfalls mitnehmen.
  • Wer sich vorgängig informieren möchte, kann sich eines der Videos hier anschauen.
  • Es gibt hier ein Kurzvideo mit folgendem Ablauf: Interaktives Dashboard, dann Daten filtern und schliesslich Chart anpassen (exportieren) und wieder im Dashboard publizieren.

Software

Es muss keine Software lokal installiert werden (gängiger Browser genügt). Apache Superset wird als Webapplikation (Apache Superset HSR Cloud) während des Kurses frei zur Verfügung gestellt. Der Zugang kann danach bis Ende Jahr (2020) kostenlos weiterbenutzt werden (der Apache Superset ist ansonsten kostenpflichtig, um die Betriebskosten zu decken). Danach kann das Abonnement kostenpflichtig verlängert werden.

Unterlagen

Tipps und Tricks