Kurs Apache Superset: Unterschied zwischen den Versionen

Aus Geoinformation HSR
Wechseln zu: Navigation, Suche
K (Organisation)
K (Software)
(16 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
 
[[File:Logo_Apache_Superset.png|150px||right|]]
 
[[File:Logo_Apache_Superset.png|150px||right|]]
Tageskurs '''"Apache Superset''' (Kürzel "Kurs_Superset"), das '''Datenanalyse- und Data-Sharing-Werkzeug''' ("Business Intelligence Tool").
+
Schnell-Einstiegskurs (ein Tag) '''"Apache Superset''' (Kürzel "Kurs_Superset"), das '''Daten-Visualisierungs- und Publikations-Werkzeug''' ("Business Intelligence Tool"). Leitspruch: "Visualisierung einfacher als Excel und GIS!
  
Apache Superset ist ein webbasiertes, interaktives Werkzeug zur Analyse, Visualisierung und zum Teilen (Sharing) von Datenquellen, d.h. von Tabellen (Excel/LibreOffice/OpenOffice) bis Geodaten. Es ist ein mächtiges Open Source-Programm, das typischerweise als Cloud-Service genutzt wird. D.h. es ist keine Installation nötig (Web-Browser genügt) - und es werden keine Programmierkenntnisse verlangt (Grundkenntnisse der Tabellenkalkulation genügen für den Einstieg).
+
Für den Erfolg einer Entscheidungsfindung ist eine gute Visualisierung wichtig.
 +
Darum müssen die Erkenntnisse eines Anliegens, Projektes oder Umfrage visualisiert werden.
 +
Wenn Erkenntnisse anschaulicht und nachvollziehbar dargestellt werden, erhöht das deren Verständlchkeit und Akzeptanz.
 +
 
 +
Visualisierung kann man zudem nicht nur zur Veranschaulichung einsetzen, sondern auch zu Datenanalyse.
 +
Häufig erkennt man Zusammenhänge in den Daten erst durch eine geschickte Darstellung.
 +
Wir Menschen sind schlecht darin, Zahlen zu vergleichen; grafische Muster dagegen erkennen wir gut.
 +
Visualisierung stellt somit nicht nur die Daten graphisch dar, sondern kann auch als eigene Technik der Datenanalyse eingesetzt werden.
 +
Das Internet ermöglicht zudem die Publikation der Visualisierung und damit die einfache Kommunikation mit Kunden und (Arbeits-)Kollegen.
 +
 
 +
Apache Superset ist so ein Werkzeug zur Analyse, Visualisierung und zum Teilen (Sharing) von Datenquellen, d.h. von Tabellen (Excel oder LibreOffice) bis Geodaten. Es ist ein mächtiges, webbasiertes, interaktives Open-Source-Programm, das typischerweise als Cloud-Service genutzt wird. D.h. es ist keine Installation nötig (Web-Browser genügt) - und es werden keine Programmierkenntnisse verlangt (Grundkenntnisse der Tabellenkalkulation genügen für den Einstieg).
  
 
Die Rohdaten müssen in aufbereiteter Form vorliegen, beispielsweise in einer PostgreSQL-Datenbank oder als CSV (siehe u.a. den [[Kurs PostGIS]]). Wenn nötig müssen sie mit Tabellenkalkulationsprogrammen oder QGIS aufbereitet werden (siehe u.a. den [[Kurs QGIS]] oder [[OpenSchoolMaps]]).  
 
Die Rohdaten müssen in aufbereiteter Form vorliegen, beispielsweise in einer PostgreSQL-Datenbank oder als CSV (siehe u.a. den [[Kurs PostGIS]]). Wenn nötig müssen sie mit Tabellenkalkulationsprogrammen oder QGIS aufbereitet werden (siehe u.a. den [[Kurs QGIS]] oder [[OpenSchoolMaps]]).  
  
''"An Apache Superset begeistert mich vor allem die Datenanalyse und das Data-Sharing, welches einen leichten und ansprechenden Zugang zu den Visualisierungen erlaubt... und das Tempo mit dem eine Grafik erstellt werden kann. Die Filter-Funktion für das Dashboard ist beeindruckend."'' -- Eine Anwenderin, 23. September 2019.
+
''"An Apache Superset begeistert mich vor allem die Visualisierung und das Data-Sharing, welches einen leichten und ansprechenden Zugang zu den Visualisierungen erlaubt... und das Tempo mit dem eine Grafik erstellt werden kann. Die Filter-Funktion für das Dashboard ist beeindruckend."'' -- Eine Anwenderin, 23. September 2019.
  
 
   Nächste Durchführung: Fr. 24. Januar 2020 => '''[[Media:Kurs_Apache_Superset_HSR_Anmeldung.pdf |Zur Anmeldung (.pdf)]]'''
 
   Nächste Durchführung: Fr. 24. Januar 2020 => '''[[Media:Kurs_Apache_Superset_HSR_Anmeldung.pdf |Zur Anmeldung (.pdf)]]'''
Zeile 25: Zeile 35:
  
 
Mit Apache Superset Daten erkunden, analysieren und visualisieren.  
 
Mit Apache Superset Daten erkunden, analysieren und visualisieren.  
Kurs mit interaktiven Übungen (mind. 50% zur "Theorie") an einem durchgängigen Beispiel - alles dies ohne Programmieren oder sich um das Schreiben von SQL oder Formeln kümmern zu müssen..  
+
Kurs mit interaktiven Übungen (mind. 50% zur "Theorie") an einem durchgängigen Beispiel - alles dies ohne zu Programmieren oder sich um das Schreiben von SQL oder Formeln kümmern zu müssen.
Nebst Business Charts werden auch Karten-Visualisierungen erstellt.  
+
Nebst Business Charts werden auch interaktive Webkarten erstellt.  
Am Schlusss wird Apache Superset mit andereen Werkzeugen, wie Tableau, PowerBI oder ArcGIS Insights verglichen.
+
Am Schluss wird Apache Superset mit anderen Werkzeugen verglichen, wie Tableau, MS PowerBI, Insights for ArcGIS oder uMap, dem Karteneditor.
  
 
Auszug aus dem Programm:
 
Auszug aus dem Programm:
Zeile 33: Zeile 43:
 
* Grundfunktionen: Benutzerverwaltung, Datenquellen, Charts (inkl. interaktive Karten) sowie Dashboards
 
* Grundfunktionen: Benutzerverwaltung, Datenquellen, Charts (inkl. interaktive Karten) sowie Dashboards
 
* Übung Datenanalyse- und -Publikation in dreieinhalb Schritten:
 
* Übung Datenanalyse- und -Publikation in dreieinhalb Schritten:
** 1. Daten analysieren: Datenquellen selektieren, filtern und aufbereiten
+
** 1. Daten selektieren: Datenquellen vorbereiten
 
** 2. Daten visualisieren: Listen und Grafiken erstellen  
 
** 2. Daten visualisieren: Listen und Grafiken erstellen  
 
** 3a. Daten präsentieren: Listen und Grafiken in einem Dashboard anordnen
 
** 3a. Daten präsentieren: Listen und Grafiken in einem Dashboard anordnen
** 3b. Daten publizieren: Ein Dashboard über das Web teilen
+
** 3b. Daten publizieren: Ein Dashboard über das Web mit anderen teilen
 
* Fortgeschrittene Funktionen:  
 
* Fortgeschrittene Funktionen:  
 
** Erstellen eines Datenfilters  
 
** Erstellen eines Datenfilters  
Zeile 42: Zeile 52:
 
** Eine eigene CSV-Datei als Datenquelle hochladen
 
** Eine eigene CSV-Datei als Datenquelle hochladen
 
** Daten als Karte visualisieren
 
** Daten als Karte visualisieren
* Vergleich u.a. von Apache Superset mit Tableau, PowerBI und ArcGIS Insights
+
** Datenquellen filtern (SQL)
 +
* Vergleich u.a. von Apache Superset mit anderen Werkzeugen
 
* Ausblick: SQL Lab, Frage & Antworten, etc.
 
* Ausblick: SQL Lab, Frage & Antworten, etc.
  
Zeile 48: Zeile 59:
  
 
Vorkenntnisse:  
 
Vorkenntnisse:  
* Grundkenntnisse in Tabellenkalkulation und Analyse mit Excel bzw. LibreOffice/OpenOffice (z.B. Zellen-Funktionen)  
+
* Grundkenntnisse in Tabellenkalkulation und Analyse mit Excel bzw. LibreOffice/OpenOffice (z.B. Aggregationsfunktionen wie SUMME)  
 
* Grundkenntnisse in Datenbanksysteme (z.B. Tabellen, Attributtypen).  
 
* Grundkenntnisse in Datenbanksysteme (z.B. Tabellen, Attributtypen).  
* SQL-Kenntnisse sind von Vorteil aber nicht nötig zum Verständnis dieses Kurses.  
+
* SQL-Kenntnisse oder andere Programmierkenntniss sind nicht nötig zum Verständnis dieses Kurses.  
  
 
Vorbereitung  
 
Vorbereitung  
Zeile 59: Zeile 70:
 
== Software ==
 
== Software ==
  
Es muss keine Software lokal installiert werden (gängiger Browser genügt). Apache Superset wird als Webapplikation (Cloud Service) während des Kurses frei zur Verfügung gestellt. Der Zugang kann danach bis Ende Jahr (2020) kostenlos weiterbenutzt werden (Wert des Apache Superset Cloud Services mind. CHF 200.- pro Jahr). Dann muss die Software entweder selber installiert werden (normalerweise auf einem Server) oder das Abonnement kann weiter kostenpflichtig verlängert werden.
+
Es muss keine Software lokal installiert werden (gängiger Browser genügt). Apache Superset wird als Webapplikation (Apache Superset HSR Cloud) während des Kurses frei zur Verfügung gestellt. Der Zugang kann danach bis Ende Jahr (2020) kostenlos weiterbenutzt werden (der Apache Superset ist ansonsten kostenpflichtig, um die Betriebskosten zu decken). Danach kann das Abonnement kostenpflichtig verlängert werden.
 +
 
 +
  Tipp: Hier gibt es eine [https://www.quora.com/Is-there-an-online-demo-for-Airbnbs-superset Online-Demo](siehe Dashboard "World‘s Bank Data").
  
 
== Unterlagen ==
 
== Unterlagen ==

Version vom 3. Dezember 2019, 12:58 Uhr

Logo Apache Superset.png

Schnell-Einstiegskurs (ein Tag) "Apache Superset (Kürzel "Kurs_Superset"), das Daten-Visualisierungs- und Publikations-Werkzeug ("Business Intelligence Tool"). Leitspruch: "Visualisierung einfacher als Excel und GIS!

Für den Erfolg einer Entscheidungsfindung ist eine gute Visualisierung wichtig. Darum müssen die Erkenntnisse eines Anliegens, Projektes oder Umfrage visualisiert werden. Wenn Erkenntnisse anschaulicht und nachvollziehbar dargestellt werden, erhöht das deren Verständlchkeit und Akzeptanz.

Visualisierung kann man zudem nicht nur zur Veranschaulichung einsetzen, sondern auch zu Datenanalyse. Häufig erkennt man Zusammenhänge in den Daten erst durch eine geschickte Darstellung. Wir Menschen sind schlecht darin, Zahlen zu vergleichen; grafische Muster dagegen erkennen wir gut. Visualisierung stellt somit nicht nur die Daten graphisch dar, sondern kann auch als eigene Technik der Datenanalyse eingesetzt werden. Das Internet ermöglicht zudem die Publikation der Visualisierung und damit die einfache Kommunikation mit Kunden und (Arbeits-)Kollegen.

Apache Superset ist so ein Werkzeug zur Analyse, Visualisierung und zum Teilen (Sharing) von Datenquellen, d.h. von Tabellen (Excel oder LibreOffice) bis Geodaten. Es ist ein mächtiges, webbasiertes, interaktives Open-Source-Programm, das typischerweise als Cloud-Service genutzt wird. D.h. es ist keine Installation nötig (Web-Browser genügt) - und es werden keine Programmierkenntnisse verlangt (Grundkenntnisse der Tabellenkalkulation genügen für den Einstieg).

Die Rohdaten müssen in aufbereiteter Form vorliegen, beispielsweise in einer PostgreSQL-Datenbank oder als CSV (siehe u.a. den Kurs PostGIS). Wenn nötig müssen sie mit Tabellenkalkulationsprogrammen oder QGIS aufbereitet werden (siehe u.a. den Kurs QGIS oder OpenSchoolMaps).

"An Apache Superset begeistert mich vor allem die Visualisierung und das Data-Sharing, welches einen leichten und ansprechenden Zugang zu den Visualisierungen erlaubt... und das Tempo mit dem eine Grafik erstellt werden kann. Die Filter-Funktion für das Dashboard ist beeindruckend." -- Eine Anwenderin, 23. September 2019.

 Nächste Durchführung: Fr. 24. Januar 2020 => Zur Anmeldung (.pdf)
 Es hat noch Plätze frei. Anmeldeschluss ist eine Woche vor Kursbeginn um 12:00 Uhr. 

Organisation

Apache Superset Dashboard World Health.jpg
  • Dauer: 1 Tag, 9:00 bis ca. 16:30 Uhr. Raum tba.
  • Kosten (inkl. WLAN, 1 Kaffee und 1 Mittagessen): CHF 500.- (Einführungspreis)
  • Für folgende Teilnehmende gibt es 20% Rabatt: Studierende (bis 25 Jahre), UNIGIS-Studierende, ETH-Erdwissenschaften Alumni, sowie HSR-Mitarbeitende.
  • Referenten: Prof. Stefan Keller (HSR) und Mitarbeitende vom Institut für Software.
  • Schulungsart: Der Anteil Übungen und Theorie ist in etwa ausgeglichen. Die Teilnehmenden nehmen einen eigenen Laptop mit (bei Bedarf werden auch Laptops zur Verfügung gestellt). Es ist Sache der Teilnehmenden, ihr Laptop/Notebook gegen Beschädigung und Diebstahl zu (ver)sichern.
  • Durchführung: Die Teilnehmerzahl ist beschränkt auf 12 (max. 15) Plätze. Der Kurs findet ab fünf zahlenden Teilnehmern statt.
  • Abmeldungen: Angemeldete Teilnehmende können sich bis eine Woche vor Beginn ohne Kostenfolge schriftlich abmelden. Bis drei Tage vorher muss pauschal 200.- in Rechnung gestellt werden. Bei noch späteren Abmeldungen muss der volle Schulungsbetrag verrechnet werden.

Beschreibung

Mit Apache Superset Daten erkunden, analysieren und visualisieren. Kurs mit interaktiven Übungen (mind. 50% zur "Theorie") an einem durchgängigen Beispiel - alles dies ohne zu Programmieren oder sich um das Schreiben von SQL oder Formeln kümmern zu müssen. Nebst Business Charts werden auch interaktive Webkarten erstellt. Am Schluss wird Apache Superset mit anderen Werkzeugen verglichen, wie Tableau, MS PowerBI, Insights for ArcGIS oder uMap, dem Karteneditor.

Auszug aus dem Programm:

  • Was sind Datenanalyse- und Data-Sharing-Werkzeuge (Business Intelligence Tools)?
  • Grundfunktionen: Benutzerverwaltung, Datenquellen, Charts (inkl. interaktive Karten) sowie Dashboards
  • Übung Datenanalyse- und -Publikation in dreieinhalb Schritten:
    • 1. Daten selektieren: Datenquellen vorbereiten
    • 2. Daten visualisieren: Listen und Grafiken erstellen
    • 3a. Daten präsentieren: Listen und Grafiken in einem Dashboard anordnen
    • 3b. Daten publizieren: Ein Dashboard über das Web mit anderen teilen
  • Fortgeschrittene Funktionen:
    • Erstellen eines Datenfilters
    • Dashboards verwalten
    • Eine eigene CSV-Datei als Datenquelle hochladen
    • Daten als Karte visualisieren
    • Datenquellen filtern (SQL)
  • Vergleich u.a. von Apache Superset mit anderen Werkzeugen
  • Ausblick: SQL Lab, Frage & Antworten, etc.

Vorkenntnisse und Vorbereitung

Vorkenntnisse:

  • Grundkenntnisse in Tabellenkalkulation und Analyse mit Excel bzw. LibreOffice/OpenOffice (z.B. Aggregationsfunktionen wie SUMME)
  • Grundkenntnisse in Datenbanksysteme (z.B. Tabellen, Attributtypen).
  • SQL-Kenntnisse oder andere Programmierkenntniss sind nicht nötig zum Verständnis dieses Kurses.

Vorbereitung

  • Es soll ein gängiger Laptop mitgebracht werden mit gängigem Browser und funktionierendem WLAN-Anschluss (es werden keine Admin-Rechte verlangt).
  • Wer Daten hat (CSV-Dateien), die er analysieren, visualisieren und ggf. sharen möchte, kann diese ebenfalls mitnehmen.
  • Wer sich vorgängig informieren möchte, kann sich eines der Videos hier anschauen.

Software

Es muss keine Software lokal installiert werden (gängiger Browser genügt). Apache Superset wird als Webapplikation (Apache Superset HSR Cloud) während des Kurses frei zur Verfügung gestellt. Der Zugang kann danach bis Ende Jahr (2020) kostenlos weiterbenutzt werden (der Apache Superset ist ansonsten kostenpflichtig, um die Betriebskosten zu decken). Danach kann das Abonnement kostenpflichtig verlängert werden.

 Tipp: Hier gibt es eine Online-Demo(siehe Dashboard "World‘s Bank Data").

Unterlagen

Tipps und Tricks