Statistik für Finanzmärkte
¶

Wintersemester 2025/2026
¶

Übung 05 - Programmiergrundlagen & Datenmanipulation II: Arbeiten mit Pandas
¶

Aufgabe 1 - Datenimport¶

1.1) Einlesen von CSV-Dateien¶

Importieren Sie die CSV-Datei DAX40_Konzerne.csv

Achten Sie beim Import den Unterschied zwischen absoluten und relativen Pfaden! Versuchen Sie mit relativen Pfaden zu arbeiten! Ermitteln Sie hierzu Ihr Working Directory!

In [ ]:
#für den Import von Datein: wo startet Python zu suchen? Working Directory!

import os
cwd = os.getcwd()
print(cwd)

1.2) Zugriff auf einzelne Datenzeilen oder Variablen¶

Wie können Sie auf die Variablen zugreifen? Was ist der Index eines DataFrames?

In [ ]:
df_konzerne['Unternehmen']

#bzw.

df_konzerne.Unternehmen

Zugriff auf spezielle Zeilen des DataFrames¶

  • Geben Sie die Zeilen 12 und 13 aus
  • Greifen Sie auf die ersten 8 Zeilen zu ohne Nutzung der '.head()' Funktion
  • Greifen Sie auf die letzten 3 Zeilen zu ohne Nutzung der '.tail()' Funktion
In [ ]:
 

1.3) Spalten vs. Listen¶

Was ist der Unterschied zwischen einer Spalte des DataFrames und einer Liste? Formen Sie die Werte der Variablen 'Unternehmen' hierzu in eine Liste um mithilfe von .tolist()!

1.4) Sortieren¶

Sortieren Sie den DataFrame alphabetisch nach den Unternehmen und kontrollieren Sie Ihr Ergebnis.

Aufgabe 2: Modifizierter Import, wenn die Datein vom Standard abweichen¶

2.1) CSV-Datei laden¶

Importieren Sie die Daten aus DAX_Daten.csv sowie DAX_Daten.xlsx! Achten Sie darauf, dass am Ende alle numerischen Variablen vom Datentyp 'float' sind!

In [ ]:
 

Hinweis: Sie sollten vorher im die zu importierende Datei ansehen (insbesondere wenn die ersten Versuche mit einer Fehlermeldung abgebrochen werden) - dann ist ersichtlich, wie mittels Argumenten die Funktion beim Importieren angepasst werden müssen! Im volriegenden Fall, ist beispielsweise die CSV nicht durch Kommas, sondern Semikolons getrennt. Außerdem sollte besonders am Anfang immer ein Blick in die Paket-Dokumentation erfolgen, in der alle Argumente nochmals detailiert erklärt sind. Außerdem sollte immer eine kurze Kontrolle des Imports erfolgen, indem man sich beispielsweise die ersten und letzten Zeilen des Datensatzes ansieht.

2.2) Datenaufbereitung¶

Lassen Sie sich die Datentypen der Spalten (KGV, Kurs, Börsenwert) anzeigen und formatieren alle numerischen Werte entsprechend als Datentyp 'float', falls dies beim Importieren nicht bereits angepasst wurde. Passen Sie dann zusätzlich obigen Import entsprechend an.

Aufgabe 3 - Arbeiten mit Daten¶

3.1) Datenzugriff und Filter: Greifen Sie auf folgende Daten zu¶

  • die Variable KGV für alle Unternehmen
  • die Variablen KGV und Kurs für alle Unternehmen
  • die 5. Zeile des DataFrames
  • alle Unternehmen, die Bayer im Unternehmensnamen enthalten
  • alle Zeilen, bei denen KGV Na ist (Wie müsste diese Abfrage modifiziert werden, damit alle Zeilen angezeigt werden, in denen eine beliebige Variable Na ist?)
  • Filtern Sie alle Unternehmen heraus, die zur Versicherungsbranche gehören
  • Gib alle Unternehmen wieder, die einen Börsenwert von über 60000 Mio. € haben

2.3) Sortiere die Unternehmen nach Börsenwert absteigend.

3.2) Variablentransformation¶

Erzeugen Sie eine extra Spalte mit der Anzahl der ausgegebenen Aktien, indem der Börsenwert durch den Kurs dividiert wird.

Aufgabe 4 - Auswertungen für Variablen oder für Untergruppen¶

4.1) Zählen:¶

Ermittels Sie die Anzahl der Unternehmen je Branche und geben Sie außerdem die prozentuale Verteilung an.

4.2) Berechne den durchschnittlichen Börsenwert und zeigen Sie alle Unternehmen an, die oberhalb dieses Durchschnittes liegen.¶

4.3) statistische Kennzahlen¶

Berechnen Sie für die einzelnen Variablen geeignete Kennzahlen

Ermitteln Sie für KGV und Kurs auch die Varianz