Kurs Apache Superset: Unterschied zwischen den Versionen

Aus Geoinformation HSR
Wechseln zu: Navigation, Suche
K
K (Unterlagen)
 
(38 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
 
[[File:Logo_Apache_Superset.png|150px||right|]]
 
[[File:Logo_Apache_Superset.png|150px||right|]]
Tageskurs '''"Apache Superset''' (Kürzel "Kurs_Superset"), das '''Datenanalyse- und -Publikations-Werkzeug''' ("Analytics- & Business Intelligence Tool"), u.a. mit Vergleich mit Werkzeugen wie Tableau, PowerBI oder ArcGIS Insights.
+
Schnell-Einstiegskurs (ein Tag) '''"Apache Superset''' (Kürzel "Kurs_Superset"), das '''Daten-Visualisierungs- und Publikations-Werkzeug''' ("Business Intelligence Tool"). Es kann nicht genug betont werden, wie viel einfacher und schneller damit Daten visualisiert und publiziert werden können als mit Excel oder Online GIS. Das gilt v.a. für einfache Darstellungen, d.h. Excel und GIS werden nicht verdrängt.  
  
Apache Superset ist ein webbasiertes, interaktives Werkzeug zur Analyse, Visualisierung und Publikation von Datenquellen, d.h. von Tabellen (Excel/LibreOffice/OpenOffice) bis Geodaten. Es ist ein mächtiges Open Source-Programm, das typischerweise als Cloud-Service genutzt wird. D.h. es ist keine Installation nötig (Web-Browser genügt) - und es werden keine Programmierkenntnisse verlangt (Grundkenntnisse der Tabellenkalkulation genügen für den Einstieg).
+
Dies sind die drei Gründe, warum immer mehr Business Intelligence Tools eingesetzt werden:
  
''"An Apache Superset begeistert mich vor allem die Visualisierung und das Sharing, welches einen leichten und ansprechenden Zugang zu den Visualisierungen erlaubt... und das Tempo mit dem eine Grafik erstellt werden kann. Die Filter-Funktion für das Dashboard ist beeindruckend."'' -- Eine Anwenderin, 23. September 2019.
+
(1) Für den Erfolg einer Entscheidungsfindung ist eine gute Visualisierung wichtig.
 +
Darum müssen die Erkenntnisse eines Anliegens, Projektes oder Umfrage visualisiert werden.
 +
Wenn Ergebnisse anschaulich und nachvollziehbar dargestellt werden, erhöht das deren Verständlichkeit und Akzeptanz.
  
   Nächste Durchführung: Fr. 24. Januar 2020 => '''[[Media:Kurs_Apache_Superset_HSR_Anmeldung.pdf |Zur Anmeldung (.pdf)]]'''
+
(2) Visualisierungen komplettieren die Datenanalyse, indem räumliche Zusammenhänge aufgezeigt werden, denn wir Menschen sind schlecht darin, Zahlen zu vergleichen; grafische Muster dagegen erkennen wir gut.
 +
Eine Visualisierung stellt somit nicht nur die Daten graphisch dar, sondern kann auch als eigene Technik der Datenanalyse eingesetzt werden.
 +
 
 +
(3) Das Internet ermöglicht die Publikation der Visualisierung und stellt eine einfache Kommunikation dar mit Kunden und (Arbeits-)Kollegen.
 +
 
 +
Apache Superset ist so ein Werkzeug zur Analyse, Visualisierung und zum Teilen (Sharing) von Datenquellen, d.h. von Tabellen (Excel oder LibreOffice) bis Geodaten. Es ist ein mächtiges, webbasiertes, interaktives Open-Source-Programm, das typischerweise als Cloud-Service genutzt wird. D.h. es ist keine Installation nötig (Web-Browser genügt) - und es werden keine Programmierkenntnisse verlangt (Grundkenntnisse der Tabellenkalkulation genügen für den Einstieg).
 +
 
 +
Die Rohdaten müssen in aufbereiteter Form vorliegen, beispielsweise in einer PostgreSQL-Datenbank oder als CSV (siehe u.a. den [[Kurs PostGIS]]). Wenn nötig müssen sie mit Tabellenkalkulationsprogrammen oder QGIS aufbereitet werden (siehe u.a. den [[Kurs QGIS]] oder [[OpenSchoolMaps]]).
 +
 
 +
''"An Apache Superset begeistert mich vor allem die Visualisierung und das Data-Sharing, welches einen leichten und ansprechenden Zugang zu den Visualisierungen erlaubt... und das Tempo mit dem eine Grafik erstellt werden kann. Die Filter-Funktion für das Dashboard ist beeindruckend."'' -- Eine Anwenderin, 23. September 2019.
 +
 
 +
   Nächste Durchführung: Fr. 4. September 2020 => '''[[Media:Kurs_Apache_Superset_HSR_Anmeldung.pdf |Zur Anmeldung (.pdf)]]'''
 
   Es hat noch Plätze frei. Anmeldeschluss ist eine Woche vor Kursbeginn um 12:00 Uhr.  
 
   Es hat noch Plätze frei. Anmeldeschluss ist eine Woche vor Kursbeginn um 12:00 Uhr.  
  
Zeile 16: Zeile 29:
 
* Für folgende Teilnehmende gibt es 20% Rabatt: Studierende (bis 25 Jahre), UNIGIS-Studierende, ETH-Erdwissenschaften Alumni, sowie HSR-Mitarbeitende.
 
* Für folgende Teilnehmende gibt es 20% Rabatt: Studierende (bis 25 Jahre), UNIGIS-Studierende, ETH-Erdwissenschaften Alumni, sowie HSR-Mitarbeitende.
 
* Referenten: Prof. Stefan Keller (HSR) und Mitarbeitende vom Institut für Software.
 
* Referenten: Prof. Stefan Keller (HSR) und Mitarbeitende vom Institut für Software.
* Schulungsart: Der Anteil Uebungen und Theorie ist in etwa ausgeglichen. Die Teilnehmenden nehmen einen eigenen Laptop mit (bei Bedarf werden auch Laptops zur Verfügung gestellt). Es ist Sache der Teilnehmenden, ihr Laptop/Notebook gegen Beschädigung und Diebstahl zu (ver)sichern.
+
* Schulungsart: Der Anteil Übungen und Theorie ist in etwa ausgeglichen. Die Teilnehmenden nehmen einen eigenen Laptop mit (bei Bedarf werden auch Laptops zur Verfügung gestellt). Es ist Sache der Teilnehmenden, ihr Laptop/Notebook gegen Beschädigung und Diebstahl zu (ver)sichern.
 
* Durchführung: Die Teilnehmerzahl ist beschränkt auf 12 (max. 15) Plätze. Der Kurs findet ab fünf zahlenden Teilnehmern statt.
 
* Durchführung: Die Teilnehmerzahl ist beschränkt auf 12 (max. 15) Plätze. Der Kurs findet ab fünf zahlenden Teilnehmern statt.
 
* Abmeldungen: Angemeldete Teilnehmende können sich bis eine Woche vor Beginn ohne Kostenfolge schriftlich abmelden. Bis drei Tage vorher muss pauschal 200.- in Rechnung gestellt werden. Bei noch späteren Abmeldungen muss der volle Schulungsbetrag verrechnet werden.
 
* Abmeldungen: Angemeldete Teilnehmende können sich bis eine Woche vor Beginn ohne Kostenfolge schriftlich abmelden. Bis drei Tage vorher muss pauschal 200.- in Rechnung gestellt werden. Bei noch späteren Abmeldungen muss der volle Schulungsbetrag verrechnet werden.
Zeile 22: Zeile 35:
 
== Beschreibung ==
 
== Beschreibung ==
  
Mit Apache Superset Daten erkunden, analysieren und visualisieren. Mit interaktiven Übungen (mind. 50% zur "Theorie") an einem durchgängigen Beispiel. Nebst Business Charts werden auch Karten-Visualisierungen erstellt - alles dies ohne Programmieren oder sich um das Schreiben von SQL oder Formeln kümmern zu müssen.
+
Mit Apache Superset Daten erkunden, analysieren und visualisieren.  
 
+
Kurs mit interaktiven Übungen (mind. 50% zur "Theorie") an einem durchgängigen Beispiel - alles dies ohne zu Programmieren oder sich um das Schreiben von SQL oder Formeln kümmern zu müssen.
Vergleich von Apache Superset mit Werkzeugen, wie Tableau, PowerBI oder ArcGIS Insights.
+
Nebst Business Charts werden auch interaktive Webkarten erstellt.
 +
Am Schluss wird Apache Superset mit anderen Werkzeugen verglichen, wie Tableau, MS PowerBI, Insights for ArcGIS oder uMap, dem Karteneditor.
  
 
Auszug aus dem Programm:
 
Auszug aus dem Programm:
* Was sind Datenanalyse- und -Publikations-Werkzeugw (Analytics- & Business Intelligence Tools)?
+
* Was sind Datenanalyse- und Data-Sharing-Werkzeuge (Business Intelligence Tools)?
* Vergleich u.a. von Apache Superset mit Tableau, PowerBI und ArcGIS Insights
+
* Grundfunktionen: Benutzerverwaltung, Datenquellen, Charts (inkl. interaktive Karten) sowie Dashboards
* Grundfunktionen: Benutzerverwaltung, Datenquellen, Charts (inkl. interaktive Karten), Dashboards, sowie SQL Lab
 
 
* Übung Datenanalyse- und -Publikation in dreieinhalb Schritten:
 
* Übung Datenanalyse- und -Publikation in dreieinhalb Schritten:
** 1. Daten analysieren: Datenquellen selektieren, filtern und aufbereiten
+
** 1. Daten selektieren: Datenquellen vorbereiten
 
** 2. Daten visualisieren: Listen und Grafiken erstellen  
 
** 2. Daten visualisieren: Listen und Grafiken erstellen  
 
** 3a. Daten präsentieren: Listen und Grafiken in einem Dashboard anordnen
 
** 3a. Daten präsentieren: Listen und Grafiken in einem Dashboard anordnen
** 3b. Daten publizieren: Ein Dashboard über das Web teilen
+
** 3b. Daten publizieren: Ein Dashboard über das Web mit anderen teilen
 
* Fortgeschrittene Funktionen:  
 
* Fortgeschrittene Funktionen:  
** Erstellen eines Filters,
+
** Erstellen eines Datenfilters
** Hochladen einer eigenen CSV-Datei
+
** Dashboards verwalten
** Daten in einer Karte visualisieren
+
** Eine eigene CSV-Datei als Datenquelle hochladen
* Ausblick
+
** Daten als Karte visualisieren
 
+
** Datenquellen filtern (SQL)
 +
* Vergleich u.a. von Apache Superset mit anderen Werkzeugen
 +
* Ausblick: SQL Lab, Frage & Antworten, etc.
  
 
== Vorkenntnisse und Vorbereitung ==
 
== Vorkenntnisse und Vorbereitung ==
  
 
Vorkenntnisse:  
 
Vorkenntnisse:  
* Grundkenntnisse in Tabellenkalkulation und Analyse mit Excel bzw. LibreOffice/OpenOffice (z.B. Zellen-Funktionen)  
+
* Grundkenntnisse in Tabellenkalkulation und Analyse mit Excel bzw. LibreOffice/OpenOffice (z.B. Aggregationsfunktionen wie SUMME)  
 
* Grundkenntnisse in Datenbanksysteme (z.B. Tabellen, Attributtypen).  
 
* Grundkenntnisse in Datenbanksysteme (z.B. Tabellen, Attributtypen).  
* SQL-Kenntnisse sind von Vorteil aber nicht nötig zum Verständnis dieses Kurses.  
+
* SQL-Kenntnisse oder andere Programmierkenntniss sind nicht nötig zum Verständnis dieses Kurses.  
  
 
Vorbereitung  
 
Vorbereitung  
Zeile 53: Zeile 68:
 
* Wer Daten hat (CSV-Dateien), die er analysieren, visualisieren und ggf. sharen möchte, kann diese ebenfalls mitnehmen.
 
* Wer Daten hat (CSV-Dateien), die er analysieren, visualisieren und ggf. sharen möchte, kann diese ebenfalls mitnehmen.
 
* Wer sich vorgängig informieren möchte, kann sich eines der Videos [https://www.youtube.com/results?search_query=%22Apache+Superset%22 hier] anschauen.
 
* Wer sich vorgängig informieren möchte, kann sich eines der Videos [https://www.youtube.com/results?search_query=%22Apache+Superset%22 hier] anschauen.
 +
* Es gibt [https://pushmetrics.io/apache-superset hier ein Kurzvideo] mit folgendem Ablauf: Interaktives Dashboard, dann Daten filtern und schliesslich Chart anpassen (exportieren) und wieder im Dashboard publizieren.
  
 
== Software ==
 
== Software ==
  
Es muss keine Software lokal installiert werden (gängiger Browser genügt). Apache Superset wird als Webapplikation (Cloud Service) während des Kurses frei zur Verfügung gestellt. Der Zugang kann danach bis Ende Jahr (2020) kostenlos weiterbenutzt werden (Wert des Apache Superset Cloud Services mind. CHF 200.- pro Jahr). Dann muss die Software entweder selber installiert werden (normalerweise auf einem Server) oder das Abonnement kann weiter kostenpflichtig verlängert werden.
+
Es muss keine Software lokal installiert werden (gängiger Browser genügt). Apache Superset wird als Webapplikation (Apache Superset HSR Cloud) während des Kurses frei zur Verfügung gestellt. Der Zugang kann danach bis Ende Jahr (2020) kostenlos weiterbenutzt werden (der Apache Superset ist ansonsten kostenpflichtig, um die Betriebskosten zu decken). Danach kann das Abonnement kostenpflichtig verlängert werden.
  
 
== Unterlagen ==
 
== Unterlagen ==
  
* ''(Kursdokumentation in Vorbereitung)''
+
* Offizielle Dokumentation von Apache Superset: https://superset.incubator.apache.org/ .
* Offizielle Dokumentation: https://superset.incubator.apache.org/
+
* Unterrichtsmaterial zu Apache Superset zum selber lernen: Siehe ''Apache Superset das Datenvisualisierungs- und Publikations-Werkzeug'' auf [https://openschoolmaps.ch OpenSchoolMaps.ch] .
* Buch und Code: "Apache Superset Quick Start Guide" by Shashank Shekhar, Dec. 2018, 188 pages, Packt Publishing. Code repository  https://github.com/PacktPublishing/Superset-Quick-Start-Guide
+
* Buch mit ergänzendem Material: "Apache Superset Quick Start Guide" by Shashank Shekhar, Dec. 2018, 188 pages, Packt Publishing. Repository: https://github.com/PacktPublishing/Superset-Quick-Start-Guide .
  
 
== Tipps und Tricks ==
 
== Tipps und Tricks ==

Aktuelle Version vom 7. Februar 2020, 13:03 Uhr

Logo Apache Superset.png

Schnell-Einstiegskurs (ein Tag) "Apache Superset (Kürzel "Kurs_Superset"), das Daten-Visualisierungs- und Publikations-Werkzeug ("Business Intelligence Tool"). Es kann nicht genug betont werden, wie viel einfacher und schneller damit Daten visualisiert und publiziert werden können als mit Excel oder Online GIS. Das gilt v.a. für einfache Darstellungen, d.h. Excel und GIS werden nicht verdrängt.

Dies sind die drei Gründe, warum immer mehr Business Intelligence Tools eingesetzt werden:

(1) Für den Erfolg einer Entscheidungsfindung ist eine gute Visualisierung wichtig. Darum müssen die Erkenntnisse eines Anliegens, Projektes oder Umfrage visualisiert werden. Wenn Ergebnisse anschaulich und nachvollziehbar dargestellt werden, erhöht das deren Verständlichkeit und Akzeptanz.

(2) Visualisierungen komplettieren die Datenanalyse, indem räumliche Zusammenhänge aufgezeigt werden, denn wir Menschen sind schlecht darin, Zahlen zu vergleichen; grafische Muster dagegen erkennen wir gut. Eine Visualisierung stellt somit nicht nur die Daten graphisch dar, sondern kann auch als eigene Technik der Datenanalyse eingesetzt werden.

(3) Das Internet ermöglicht die Publikation der Visualisierung und stellt eine einfache Kommunikation dar mit Kunden und (Arbeits-)Kollegen.

Apache Superset ist so ein Werkzeug zur Analyse, Visualisierung und zum Teilen (Sharing) von Datenquellen, d.h. von Tabellen (Excel oder LibreOffice) bis Geodaten. Es ist ein mächtiges, webbasiertes, interaktives Open-Source-Programm, das typischerweise als Cloud-Service genutzt wird. D.h. es ist keine Installation nötig (Web-Browser genügt) - und es werden keine Programmierkenntnisse verlangt (Grundkenntnisse der Tabellenkalkulation genügen für den Einstieg).

Die Rohdaten müssen in aufbereiteter Form vorliegen, beispielsweise in einer PostgreSQL-Datenbank oder als CSV (siehe u.a. den Kurs PostGIS). Wenn nötig müssen sie mit Tabellenkalkulationsprogrammen oder QGIS aufbereitet werden (siehe u.a. den Kurs QGIS oder OpenSchoolMaps).

"An Apache Superset begeistert mich vor allem die Visualisierung und das Data-Sharing, welches einen leichten und ansprechenden Zugang zu den Visualisierungen erlaubt... und das Tempo mit dem eine Grafik erstellt werden kann. Die Filter-Funktion für das Dashboard ist beeindruckend." -- Eine Anwenderin, 23. September 2019.

 Nächste Durchführung: Fr. 4. September 2020 => Zur Anmeldung (.pdf)
 Es hat noch Plätze frei. Anmeldeschluss ist eine Woche vor Kursbeginn um 12:00 Uhr. 

Organisation

Apache Superset Dashboard World Health.jpg
  • Dauer: 1 Tag, 9:00 bis ca. 16:30 Uhr. Raum tba.
  • Kosten (inkl. WLAN, 1 Kaffee und 1 Mittagessen): CHF 500.- (Einführungspreis)
  • Für folgende Teilnehmende gibt es 20% Rabatt: Studierende (bis 25 Jahre), UNIGIS-Studierende, ETH-Erdwissenschaften Alumni, sowie HSR-Mitarbeitende.
  • Referenten: Prof. Stefan Keller (HSR) und Mitarbeitende vom Institut für Software.
  • Schulungsart: Der Anteil Übungen und Theorie ist in etwa ausgeglichen. Die Teilnehmenden nehmen einen eigenen Laptop mit (bei Bedarf werden auch Laptops zur Verfügung gestellt). Es ist Sache der Teilnehmenden, ihr Laptop/Notebook gegen Beschädigung und Diebstahl zu (ver)sichern.
  • Durchführung: Die Teilnehmerzahl ist beschränkt auf 12 (max. 15) Plätze. Der Kurs findet ab fünf zahlenden Teilnehmern statt.
  • Abmeldungen: Angemeldete Teilnehmende können sich bis eine Woche vor Beginn ohne Kostenfolge schriftlich abmelden. Bis drei Tage vorher muss pauschal 200.- in Rechnung gestellt werden. Bei noch späteren Abmeldungen muss der volle Schulungsbetrag verrechnet werden.

Beschreibung

Mit Apache Superset Daten erkunden, analysieren und visualisieren. Kurs mit interaktiven Übungen (mind. 50% zur "Theorie") an einem durchgängigen Beispiel - alles dies ohne zu Programmieren oder sich um das Schreiben von SQL oder Formeln kümmern zu müssen. Nebst Business Charts werden auch interaktive Webkarten erstellt. Am Schluss wird Apache Superset mit anderen Werkzeugen verglichen, wie Tableau, MS PowerBI, Insights for ArcGIS oder uMap, dem Karteneditor.

Auszug aus dem Programm:

  • Was sind Datenanalyse- und Data-Sharing-Werkzeuge (Business Intelligence Tools)?
  • Grundfunktionen: Benutzerverwaltung, Datenquellen, Charts (inkl. interaktive Karten) sowie Dashboards
  • Übung Datenanalyse- und -Publikation in dreieinhalb Schritten:
    • 1. Daten selektieren: Datenquellen vorbereiten
    • 2. Daten visualisieren: Listen und Grafiken erstellen
    • 3a. Daten präsentieren: Listen und Grafiken in einem Dashboard anordnen
    • 3b. Daten publizieren: Ein Dashboard über das Web mit anderen teilen
  • Fortgeschrittene Funktionen:
    • Erstellen eines Datenfilters
    • Dashboards verwalten
    • Eine eigene CSV-Datei als Datenquelle hochladen
    • Daten als Karte visualisieren
    • Datenquellen filtern (SQL)
  • Vergleich u.a. von Apache Superset mit anderen Werkzeugen
  • Ausblick: SQL Lab, Frage & Antworten, etc.

Vorkenntnisse und Vorbereitung

Vorkenntnisse:

  • Grundkenntnisse in Tabellenkalkulation und Analyse mit Excel bzw. LibreOffice/OpenOffice (z.B. Aggregationsfunktionen wie SUMME)
  • Grundkenntnisse in Datenbanksysteme (z.B. Tabellen, Attributtypen).
  • SQL-Kenntnisse oder andere Programmierkenntniss sind nicht nötig zum Verständnis dieses Kurses.

Vorbereitung

  • Es soll ein gängiger Laptop mitgebracht werden mit gängigem Browser und funktionierendem WLAN-Anschluss (es werden keine Admin-Rechte verlangt).
  • Wer Daten hat (CSV-Dateien), die er analysieren, visualisieren und ggf. sharen möchte, kann diese ebenfalls mitnehmen.
  • Wer sich vorgängig informieren möchte, kann sich eines der Videos hier anschauen.
  • Es gibt hier ein Kurzvideo mit folgendem Ablauf: Interaktives Dashboard, dann Daten filtern und schliesslich Chart anpassen (exportieren) und wieder im Dashboard publizieren.

Software

Es muss keine Software lokal installiert werden (gängiger Browser genügt). Apache Superset wird als Webapplikation (Apache Superset HSR Cloud) während des Kurses frei zur Verfügung gestellt. Der Zugang kann danach bis Ende Jahr (2020) kostenlos weiterbenutzt werden (der Apache Superset ist ansonsten kostenpflichtig, um die Betriebskosten zu decken). Danach kann das Abonnement kostenpflichtig verlängert werden.

Unterlagen

Tipps und Tricks