#für den Import von Datein: wo startet Python zu suchen? Working Directory!
import os
cwd = os.getcwd()
print(cwd)
1.2) Zugriff auf einzelne Datenzeilen oder Variablen¶
Wie können Sie auf die Variablen zugreifen? Was ist der Index eines DataFrames?
df_konzerne['Unternehmen']
#bzw.
df_konzerne.Unternehmen
Zugriff auf spezielle Zeilen des DataFrames¶
- Geben Sie die Zeilen 12 und 13 aus
- Greifen Sie auf die ersten 8 Zeilen zu ohne Nutzung der '.head()' Funktion
- Greifen Sie auf die letzten 3 Zeilen zu ohne Nutzung der '.tail()' Funktion
1.3) Spalten vs. Listen¶
Was ist der Unterschied zwischen einer Spalte des DataFrames und einer Liste? Formen Sie die Werte der Variablen 'Unternehmen' hierzu in eine Liste um mithilfe von .tolist()!
1.4) Sortieren¶
Sortieren Sie den DataFrame alphabetisch nach den Unternehmen und kontrollieren Sie Ihr Ergebnis.
Hinweis: Sie sollten vorher im die zu importierende Datei ansehen (insbesondere wenn die ersten Versuche mit einer Fehlermeldung abgebrochen werden) - dann ist ersichtlich, wie mittels Argumenten die Funktion beim Importieren angepasst werden müssen! Im volriegenden Fall, ist beispielsweise die CSV nicht durch Kommas, sondern Semikolons getrennt. Außerdem sollte besonders am Anfang immer ein Blick in die Paket-Dokumentation erfolgen, in der alle Argumente nochmals detailiert erklärt sind. Außerdem sollte immer eine kurze Kontrolle des Imports erfolgen, indem man sich beispielsweise die ersten und letzten Zeilen des Datensatzes ansieht.
2.2) Datenaufbereitung¶
Lassen Sie sich die Datentypen der Spalten (KGV, Kurs, Börsenwert) anzeigen und formatieren alle numerischen Werte entsprechend als Datentyp 'float', falls dies beim Importieren nicht bereits angepasst wurde. Passen Sie dann zusätzlich obigen Import entsprechend an.
Aufgabe 3 - Arbeiten mit Daten¶
3.1) Datenzugriff und Filter: Greifen Sie auf folgende Daten zu¶
- die Variable KGV für alle Unternehmen
- die Variablen KGV und Kurs für alle Unternehmen
- die 5. Zeile des DataFrames
- alle Unternehmen, die Bayer im Unternehmensnamen enthalten
- alle Zeilen, bei denen KGV Na ist (Wie müsste diese Abfrage modifiziert werden, damit alle Zeilen angezeigt werden, in denen eine beliebige Variable Na ist?)
- Filtern Sie alle Unternehmen heraus, die zur Versicherungsbranche gehören
- Gib alle Unternehmen wieder, die einen Börsenwert von über 60000 Mio. € haben
2.3) Sortiere die Unternehmen nach Börsenwert absteigend.
3.2) Variablentransformation¶
Erzeugen Sie eine extra Spalte mit der Anzahl der ausgegebenen Aktien, indem der Börsenwert durch den Kurs dividiert wird.
4.2) Berechne den durchschnittlichen Börsenwert und zeigen Sie alle Unternehmen an, die oberhalb dieses Durchschnittes liegen.¶
4.3) statistische Kennzahlen¶
Berechnen Sie für die einzelnen Variablen geeignete Kennzahlen
Ermitteln Sie für KGV und Kurs auch die Varianz