Pandas Schulung für die Datenverarbeitung mit Python

Pandas sind nicht nur Bären

Pandas ist ein Python-Paket für die Bearbeitung und Analyse von Datentabellen. Im Pandas-Kurs geht es um das Laden, Säubern, Verändern, Zusammenfügen, Verarbeiten und Visualisieren von Datentabellen.

Dieser Kurs setzt Python-Grundkenntnisse voraus. Der Kurs ist zum Beispiel interessant für Ingenieure, Datenanalysten oder Excel-Anwender, die sich wiederholende Prozesse automatisieren oder komplexere Daten analysieren wollen.

Der Übungsanteil beträgt rund 60%. Ein Trainer kommt auf 1 bis 9 Kursteilnehmer und hilft ihnen individuell.

Nach dem Kurs werden die Teilnehmer sehr solide Pandas-Kenntnisse und viel praktische Übung mit der Programmierung mit Pandas besitzen. Sie werden alle grundlegenden Pandas-Konstrukte kennen und einen Gesamtüberblick haben, was mit Pandas möglich ist. Die Kursthemen im Detail:

1) Numpy

  • Numpy ndarray erstellen.
  • Auf Array-Elemente zugreifen.
  • Array - Slicing.
  • Elementweise Operationen.
  • Attribute von ndarray.

2) Das Series Objekt

  • Series Objekt erzeugen. Verschiedene Methoden.
  • Series Objekt verhält sich wie ein Numpy-ndarray Objekt in vielerlei Hinsicht.
  • Prüfen, ob index-key vorhanden ist.
  • Series Object verhält sich ähnlich zu Dict in vielerlei Hinsicht.

3) Das DataFrame Objekt

  • Erzeugen eines DataFrame Objektes. Die hauptsächlichen Methoden hierfür.
  • Spalten hinzufügen / entfernen.
  • Row-Selektierung / Slicing.
  • df.loc[], df.iloc[], df.at[], df.iat[] Selektier-/Slice-Methoden.
  • head(), tail(), transpose() Methoden.
  • DataFrame-Attribute
  • Column-wise, row-wise DataFrame-Methoden
  • DataFrame verhält sich wie zweidimensionales Numpy-ndarray in vielerlei Hinsicht.

4) Daten säubern und ersetzen in einem DataFrame

  • Wie man mit fehlenden Werten im DataFrame umgeht.
  • Die replace() Methode
  • DataFrames aus csv- oder Excel-Dateien lesen oder solche schreiben.
  • String-Operationen auf String-Series
  • Über Spalten, Zeilen, Zellen eines DataFrames iterieren.
  • Einzelne Spaltennamen, Zeilennamen umbenennen.
  • Ein DataFrame nach selbstdefinierter Art sortieren.
  • Kovarianzen / Korrelationen paarweiser Spalten berechnen.

5) SQL-ähnliche Operationen auf DataFrames

  • Das Split-Calculate-Combine Prinzip
  • Datensätze zu Series / DataFrame hinzufügen.
  • DataFrames mit SQL-Logik zusammenfügen und verarbeiten.

6) Datenvisualisierung

  • Die Plot Methode von DataFrame.
  • Das seaborn Plotting-Paket. Grundaufbau von Matplotlib.

Zu jedem der obigen Kapitel gibt es eine oder mehrere Übungseinheiten. Die typische Kursdauer beträgt 3 bis 4 Tage.

Auf Wunsch kann dieser Kurs auch mit anderen Kursen kombiniert oder gekürzt gehalten werden mit Dauer zwischen 2 und 5 Tagen.

Wenn Sie Interesse an diesem Kurs haben, schicken Sie uns eine Nachricht, da wir die Kurse dynamisch je nach Nachfrage planen. Inhouse Schulungen in Deutschland, Österreich, Schweiz sowie Online-Schulungen bieten wir Ihnen gerne an. Die Kursinhalte passen wir auf Wunsch an Ihre Bedürfnisse an. Unsere Kurse haben ein sehr gutes Preis-Leistungsverhältnis. (Preisliste).