Pandas

Pandas ist ein Python-Paket für die Bearbeitung und Analyse von Datentabellen. Im Pandas-Kurs geht es um das Laden, Säubern, Verändern, Zusammenfügen, Visualisieren von Datentabellen. Dieser Kurs setzt Python-Kenntnisse voraus. Der Kurs ist zum Beispiel interessant für Excel-Anwender, die sich wiederholende Prozesse automatisieren oder komplexere Daten analysieren wollen. Der Übungsanteil beträgt 60%-70%. Ein Trainer kommt auf 5 bis 9 Kursteilnehmer und hilft ihnen individuell. Nach dem Kurs werden die Teilnehmer sehr gründliche Pandas-Kenntnisse und viel praktische Erfahrung besitzen. Sie werden alle grundlegenden Pandas-Konstrukte kennen und einen Gesamtüberblick haben, was mit Pandas möglich ist und was nicht. Die Kursthemen:

1) Numpy

  • ndarray erstellen.
  • Auf Array-Elemente zugreifen.
  • Array - Slicing.
  • Elementweise Operationen.
  • Attribute von ndarray.

2) Das Series Objekt

  • Series Objekt erzeugen. Verschiedene Methoden.
  • Series Objekt verhält sich wie ein Numpy-ndarray Objekt in vielerlei Hinsicht.
  • Prüfen, ob index-key vorhanden ist.
  • Series Object verhält sich ähnlich zu Dict in vielerlei Hinsicht.

3) Das DataFrame Objekt

  • Erzeugen eines DataFrame Objektes. Die hauptsächlichen Methoden hierfür.
  • Spalten hinzufügen / entfernen.
  • Row-Selektierung / Slicing.
  • df.loc[], df.iloc[], df.at[], df.iat[] Selektier-/Slice-Methoden.
  • head(), tail(), transpose() Methoden.
  • DataFrame-Attribute
  • Column-wise, row-wise DataFrame-Methoden
  • DataFrame verhält sich wie zweidimensionales Numpy-ndarray in vielerlei Hinsicht.

4) Daten säubern und ersetzen in einem DataFrame

  • Wie man mit fehlenden Werten im DataFrame umgeht.
  • Die replace() Methode
  • DataFrames aus csv- oder Excel-Dateien lesen oder solche schreiben.
  • String-Operationen auf String-Series
  • Über Spalten, Zeilen, Zellen eines DataFrames iterieren.
  • Einzelne Spaltennamen, Zeilennamen umbenennen.
  • Ein DataFrame nach selbstdefinierter Art sortieren.
  • Kovarianzen / Korrelationen paarweiser Spalten berechnen.

5) SQL-ähnliche Operationen auf DataFrames

  • Das Split-Calculate-Combine Prinzip
  • Datensätze zu Series / DataFrame hinzufügen.
  • DataFrames mit SQL-Logik zusammenfügen.

6) Datenvisualisierung

  • Die Plot Methode von DataFrame.
  • Das seaborn Plotting-Paket.

Zu jedem der obigen Kapitel gibt es eine oder mehrere Übungseinheiten. Kursdauer: 5 Tage.

Auf Wunsch kann dieser Kurs auch mit anderen Kursen kombiniert oder gekürzt gehalten werden mit Dauer zwischen 2 und 5 Tagen. Wenn Sie Interesse an diesem Kurs haben, schicken Sie uns eine Nachricht, da wir die Kurse dynamisch je nach Nachfrage planen.