(yfinance)=
# Kursdaten: Import und Visualisierung

In diesem Kapitel besch√§ftigen wir uns damit, wie wir Kursdaten in Python verwenden k√∂nnen. Dabei sollen folgende Lerninhalte vermittelt werden: 

1. Einbettung und Anzeigen von Kursdaten
2. Visualisierung und Analyse von Kursen unter Einbeziehung von Charttechnik


## Einbettung und Anzeigen von Kursdaten

Grunds√§tzlich gibt es zwei M√∂glichkeiten Kurse in ein Python-Skript zu implementieren:

            a) Kursdaten werden in einer seperaten Datei aufbereitet (z.B. in .csv oder .xlsx Format)
            b) Direkter Abruf von Kursdaten aus dem Internet

Beginnen wir mit Variante a). Vorteilhaft ist es stets, die Datei der Kursdaten im gleichen Ordner zu haben. In diesem Fall verwenden wir das `pandas`-Package.

**Hinweise:** 
* Wenn es sich um eine *.xlsx-Datei* handelt muss im Vorfeld in die Python-Umgebung `openpyxl` installiert werden; handelt es sich um eine *.csv-Datei* reicht die Installation von `pandas` in der Python-Umgebung zu.
* Datenimport mittels relativer Pfade siehe  Pandas-Abschnitt {numref}`pandas-read` [](pandas-read)
<!-- https://jupyterbook.org/en/stable/content/references.html -->

Dies dann wie folgt aus: 
<a href="./Data/Allianz_Schlusskurse_2020_2025.csv" download>
  <button>üì• CSV herunterladen</button>
</a>
<!-- Make (funktioniert unter Linux aber nicht unter Windows) kopiert Data ordner nach _build/html/  -- check -->

In [None]:
import pandas as pd

#df1 = pd.read_csv("./../../Data/Allianz_Schlusskurse_2020_2025.csv")
df1 = pd.read_csv("./../../Data/Allianz_Schlusskurse_2020_2025.csv", 
                       skiprows = 3, names = ["Datum", "Schlusskurs"])
#Achtung: bitte passen Sie den relativen Pfad an Ihre eigene Ordner-Struktur an


# Falls die xlsx-Datei im gleichen Ordner liegt, dann w√ºrde der Code wiefolgt aussehen
# df = pd.read_excel("Kurse Allianz.xlsx")

print(df1)

### Abruf von Kursdaten direkt aus Internet

Kommen wir nun zu unserer Variante b) und rufen Kursdaten direkt aus dem Internet ab. Dazu verwenden wir das Package `yfinance`.

**Hinweise:** 
* Das Ticker-Symbol einer Aktie finden wir auf der [Yahoo Finance-Webseite](https://finance.yahoo.com/quote/ALV.DE) hinter dem jeweiligen Aktientitel.
* Ab und zu hat Yahoo-Finance technische Probleme und der Kursabruf wie im direkt folgendem Beispiel funktioniert trotz fehlerfreien Codes nicht! Aus diesem Grund fangen wir im weiteren Beispiel dieses Problem ab, um unn√∂tige Programmabbr√ºche zu vermeiden.
* Manchmal gibt es leider Probleme mit den aktuell installierten Paketen, so dass offensichtlich richtiger Code (hier beispielsweise zum Abrufen von Kursdaten mittels `yfinance` -- in einigen F√§llen hilft ein Update des Paketes und manchmal eine De- und Neuinstallation. Bei der Erstellung dieses Notebooks stellte sich beispielsweise heraus, dass die installierte yfinance Version 0.2.54 Probleme beim Download hatte, w√§hrend die alte Version 0.2.31 sowie die neue Version 0.2.65 problemlos funktionierte. Falls die Download-Probleme also trotz richtigen Code anhalten, ist ein Wechsel auf eine √§ltere stabile Version oder auch neue Version m√∂glich. Hierzu in der aktuellen Environment (myenv) erstmals die installierte Version √ºberpr√ºfen

        pip show yfinance

    und mittels pip auf die gew√ºnsche Version zur√ºcksetzen oder aktuallisieren (eine kurze Internetrecherche in diversen Foren ist hier sicherlich hilfreich), beispielsweise

        pip install yfinance==0.2.31


In [None]:
import yfinance as yf

alz = yf.Ticker("ALV.DE")

#### Erstelle einen Dataframe, der die Kursdaten der letzten 12 Monate enth√§lt
df2 = alz.history(period="1y", interval = "1d")


print(df2.tail(5))
# Gibt die letzten f√ºnf Zeilen der Kursdaten aus ‚Äì ideal zur Kontrolle.

In [None]:
#speichern der Daten in CSV-Datei
df2.to_csv('alz_12months.csv')

Manchmal gibt es beim Download der Daten √ºber YahooFinance leider Probleme und sobald der Code deshalb Fehler verursacht, stoppt ein Script. Will man dies vermeiden, kann man mittels `try: .. except...` diesen Fehler abfangen 

In [None]:
import yfinance as yf
import pandas as pd
import pandas_datareader as web   #siehe https://pandas-datareader.readthedocs.io/en/latest/#
from datetime import datetime
#to do: Import bereinigen, da yf und pd bereits oben... 
#       am besten immer import aller verwendeten Pakete am Anfang des Notebooks gesammelt, bzw. je subsection... 

ticker = ["TSLA"]
tickers = ["AAPL","ALV.DE"]
#prices = yf.Ticker(ticker).history('5y')  #aktuell Fehlermeldung wegen Problemen bei Yahoo-Finance

#Versuch: Fehler abzufangen mit Ausgabe des Prroblems, ohne dass es zu Abbruch des Programms kommt !
#to do: alle Beispiele zu Graphen usw. erst mit csv-Daten (und diese zum Download f√ºr Studies integrieren, 
#       dann ist sichergestellt, dass mind. 1 funktionierdende Code-Bsp als Vorlage da ist!

print("Versuche Yahoo Finance f√ºr %s:\n" % (ticker))
try:
    data = yf.download(ticker, period = "5y", interval = "1d")
except Exception as e:
    print("Fehler bei Yahoo Daten Download: %s \n" % (e))

if not data.empty:
    print("Daten f√ºr %s geladen auf Yahoo-Finance" % ticker)
    print(data.head())
    print("Datentyp R√ºckgabe yfinance: %s:\n" % type(data))
else:
    print("Probleme mit Yahoo-Finance - keine Daten f√ºr %s geladen" % (ticker))

#to do: check if not data.empty part - aktuell nicht moeglich, da immer Fehler beim Download!!!
print("\nVersuche Yahoo Finance f√ºr mehrere Assets %s :\n" % (tickers))
all_prices = {}
try:
    data2 = yf.download(tickers, period = "5y", interval = "1d", group_by = "ticker")     
except Exception as e:    
    print("Fehler bei Yahoo Daten Download: %s \n" % (e))

if not data2.empty:                            
    print(data2.head())
    #print(type(data2))
    print("Datentyp R√ºckgabe yfinance: %s\n"  % (type(data2)))
    print("Infos DataFrame:\n" )
    print(data2.info())


Neben dem Abruf von Kursdaten von Yahoo-Finance besteht ebenfalls die M√∂glichkeit mittels API-Schnittstellen auf Kursinformationen zuzugreifen. Ein API-Schnittstellen Provider ist [Alpha Vantage](https://www.alphavantage.co/support/#api-key). Nach Registrierung und Erhalt des API-Keys k√∂nnen wir nun auf B√∂rsenkurse zugreifen. Daf√ºr verwenden wir folgenden Code:

In [None]:
from alpha_vantage.timeseries import TimeSeries
import pandas as pd

#### API-Key f√ºr Alpha Vantage angeben
api_key = 'DasistkeinechterAPI-Key'

#### Verbindung zu Alpha Vantage aufbauen
ts = TimeSeries(key=api_key, output_format='pandas')
# Erstellt ein TimeSeries-Objekt ts, √ºber das du dann Methoden wie get_daily verwenden kannst.
# Mit output_format='pandas' bekommst du die Daten direkt als pandas DataFrame. Pandas ist sehr praktisch und einfach von der Handhabung

####  Tagesdaten abrufen
data, meta_data = ts.get_daily(symbol='AAPL', outputsize='compact')
# symbol='AAPL' fragt die Daten f√ºr die Apple-Aktie ab.
# data enth√§lt die eigentlichen Kurse (Open, High, Low, Close, Volume), meta_data enth√§lt Zusatzinfos (z.‚ÄØB. Abfragezeitpunkt, Symbol).

print(data.head())
# Gibt die ersten f√ºnf Zeilen der Kursdaten aus.

Werden mehrere Aktien gleichzeitig abgerufen... - Type! 

Mithilfe des Parameters `outputsize`k√∂nnen wir festlegen, wie viele Daten wir anfordern. Mit dem Wert `compact`werden nur die letzten 100 Datenpunkte angefordert. Verwenden wir `full` fordern wir hingegen den gesamten Datenbestand an. 

**1. Hinweis:** In der Regel haben kostenlose API-Schnittstellen die T√ºcke, nur ein begrenztes Limit an Abfragen pro Minute oder Tag anfordern zu k√∂nnen. Somit kann der Parameterwert `full` demnach dazu f√ºhren, dass dieses Limit schneller erreicht ist. Aber auch `yfinance` blockiert in der Regel bei zu vielen Anfragen tempor√§r die IP-Adresse. Zur L√∂sung dieses Problems k√∂nnen die Schlusskurse als csv-Datei abgespeichert werden, somit stehen sie lokal zur Verf√ºgung. Das kann mithilfe des nachfolgenden Codes durchgef√ºhrt werden. (Der Code ist auskommentiert, da verhindert werden soll, dass bei jedem Durchlauf dieses Jupyter-Skriptes ein download erfolgt.)

In [None]:
# import yfinance as yf
# import pandas as pd

# Ticker-Symbol f√ºr Allianz SE an der B√∂rse Frankfurt/Xetra
# ticker = "ALV.DE"

# Daten abrufen (01.01.2020 bis 01.01.2025)
# data = yf.download(ticker, start="2020-01-01", end="2025-01-01")

# Nur Schlusskurse extrahieren
# schlusskurse = data[["Close"]].rename(columns={"Close": "Schlusskurs"})

# Als CSV-Datei speichern
# schlusskurse.to_csv("Allianz_Schlusskurse_2020_2025.csv")

# print("CSV-Datei wurde gespeichert: Allianz_Schlusskurse_2020_2025.csv")

**2. Hinweis:** Alpha Vantage liefert in der kostenlosen Version nur Daten f√ºr US-B√∂rsen. Dies ist auch der Grund, wieso wir in dem letzten Code Kursdaten von Apple angefordert haben.

## Darstellung der Kursentwicklung

### Visualisierung mit Matplotlib oder Seaborn

In [None]:
import yfinance as yf
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime


start_date = datetime(year = 2024, month=1, day = 1)

ticker1 = "AAPL"
stock1 = yf.download(ticker1, start = start_date)
stock1.head()
stock1.tail()

stock1['Close']

plt.figure()
plt.plot(stock1['Close'], label='Closing Price', color='blue')
plt.xlabel("Date")
#plt.xticks(rotation=90)
plt.xticks(rotation=45, ha='right')
plt.legend()
plt.grid()
plt.title(ticker1)
plt.show()


In [None]:
#multiple stocks
### Multiple Stocks: Achtung group_by hat Einfluss auf die Struktur des "Doppelarrays"

tickers = ["AAPL","NVDA","META"]
stocks_v1 = yf.download(tickers, start_date,   group_by='ticker') #place ticker name as the top-level column
stocks_v2 = yf.download(tickers, start_date,   group_by='column') # place the OHLCV values as the top-level columns

last_date = stocks_v1[tickers[0]]['Close'].index[-1].date() #.strftime("")

Darstellung mittels Seaborn: Aktie f√ºr Aktie mittels For-Loop

In [None]:
plt.figure()
sns.set(style='whitegrid')

for tick in tickers:
    sns.lineplot(data = stocks_v1[tick]["Close"],label=tick)

plt.title("Stock Closing Prices %s -- %s" % (start_date.date(), last_date))
plt.xticks(rotation=45, ha='right')
plt.xlabel("Date")
plt.ylabel("Closing Price ($)")
plt.tight_layout()
plt.show()

Darstellung mehrere Aktienkurse (bei Multi-Abruf `group_by='ticker'`) mittels Seaborn

In [None]:
plt.figure()
sns.set(style='whitegrid')
sns.relplot(data=stocks_v2['Close'], kind="line",  dashes=False)
plt.title("Stock Closing Prices %s -- %s" % (start_date.date(), last_date))
plt.xticks(rotation=45, ha='right')
plt.xlabel("Date")
plt.ylabel("Closing Price ($)")
plt.tight_layout()

plt.show()


### Visualisierung und technische Chartanalyse von Kursdaten mittels Mplchart

Das Pakte `mplchart`, siehe [Webseite](https://pypi.org/project/mplchart/) oder [Github](https://github.com/furechan/mplchart), liefert eine einfache M√∂glichkeit Charts der technischen Analyse zu erstellen.

<!--
In diesem Abschnitt gehen wir dazu √ºber, unsere Kursdaten zu visualieren. Wir bleiben bei unserer Allianz-Aktie und verwenden das Package `mplchart`, siehe [Webseite](https://pypi.org/project/mplchart/) oder [Github](https://github.com/furechan/mplchart).
-->

In [None]:
#to do: bitte Demo fuer CSV-Datensatz von oben!! und dann nur zusaetzlich mittels try... fuer aktuelle Daten

from mplchart.chart import Chart
from mplchart.primitives import Candlesticks, Volume
from mplchart.indicators import SMA, RSI, MACD

#Achtung: input mplchart sind OHLCV-DataFrames (also Open, High, Low, Close, Volume mit Datetime-Index, wie yfinance liefert!!!!

# Konfiguration
max_bars = 252 # Zeige das letzte B√∂rsenjahr (in Deutschland gibt es 252 Handelstage) 
indicators = [
    Candlesticks(),
    Volume(),
    SMA(50), 
    SMA(200),
    RSI(), 
    MACD(), 
]

#Daten aus CSV-Datei oben
ticker1 = 'ALV.DE aus CSV'

print(df1["Schlusskurs"].head())  #nicht in OHLCV-Format!!!

#erzeugen kuenstlich dieses Format: Achtung nur Close richtig!!!
ohlc = pd.DataFrame({
    "Date": pd.to_datetime(df1["Datum"]),
    "Open": df1["Schlusskurs"]-10,
    "High": df1["Schlusskurs"] + 20,
    "Low": df1["Schlusskurs"]-20,
    "Close": df1["Schlusskurs"],
    "Volume": 0, #})
}, index=df1.index)

#ohlc["Date"] = pd.to_datetime(ohlc["Date"])
ohlc = ohlc.set_index("Date")

print("Umgewandelter DataFrame:\n")
print(ohlc.head())
print(ohlc.info())






In [None]:
# Plot erzeugen -- to do line 40
chart1 = Chart(ticker1, max_bars=max_bars)
chart1.plot(ohlc, indicators)  #to do: Achtung hier macht Candlestick keinen Sinn, da nur Closing Prices!!
chart1.show()

In [None]:
from mplchart.chart import Chart
from mplchart.primitives import Candlesticks, Volume
from mplchart.indicators import SMA, RSI, MACD

#Achtung: input mplchart sind OHLCV-DataFrames (also Open, High, Low, Close, Volume mit Datetime-Index, wie yfinance liefert!!!!

# Konfiguration
max_bars = 252 #Beschr√§nkung auf das letzte B√∂rsenjahr (in Deutschland gibt es 252 Handelstage) 
indicators = [
    Candlesticks(),
    Volume(),
    SMA(50), 
    SMA(200),
    RSI(), 
    MACD(), 
]


# Daten von Yahoo-Finance abrufen
ticker = "ALV.DE"

print("Versuche Yahoo Finance f√ºr %s:\n" % (ticker2))
try:
    data = yf.Ticker(ticker2).history('2y')  #hier ggf. Zeiten anpassen
except Exception as e:
    print("Fehler bei Yahoo Daten Download: %s \n" % (e))

if not data.empty:
    print(data.head())
    chart = Chart(title = ticker, max_bars=max_bars)
    chart.plot(data, indicators)
    chart.show()
   

>‚ùì **Frage:** Wir k√∂nnen wir diesen Chart nun interpretieren? 

Der _Relative Strenght Index_ ist ein sogenannter Momentum-Indikator, der in der technischen Analyse verwendet wird und das Ausma√ü der j√ºngsten Kursver√§nderungen misst. Ein RSI-Wert von 70 oder mehr deutet darauf hin, dass ein Wertpapier √ºberkauft oder √ºberbewertet ist und m√∂glicherweise f√ºr eine Trendumkehr oder einen korrigierenden Kursr√ºckgang bereit ist. Ein RSI-Wert von 30 oder darunter weist auf einen √ºberverkauften oder unterbewerteten Zustand hin. Dabei dient zur Berechnung √ºblicherweise ein Zeitraum √ºber 14 Tage, mitunter auch √ºber acht oder 38 Tage. 

Der _Moving Average Convergence/Divergence_ ist ein Indikator f√ºr Trendwechsel. Kreuzt die schwarze Linie √ºber die blaue Linie, entsteht ein Kaufsignal. Kreuzt die blaue Linie √ºber die schwarze Linie, entsteht ein Verkaufssignal.

Der _Simple Moving Average_ ist das artithmetische Mittel der letzten t-Handelstage (in unserem Fall der letzten 50 und 200 Handelstage). Ein steigender SMA deutet auf einen Aufw√§rtstrend hin, w√§hrend ein fallender SMA auf einen Abw√§rtstrend schlie√üen l√§sst (Trendbestimmungsfunktion). Wenn der Kurs von unten an den SMA st√∂√üt und von dort abprallt, kann dies als Kaufsignal interpretiert werden. Umgekehrt kann ein Sto√ü von oben und ein Abprallen nach unten als Verkaufssignal gelten. (Funktion als Wiederstands- und Unterst√ºtzungszone).
 
>üëâ Weitere Informationen zu Indikatoren finden Sie auf folgender [Webseite](https://www.boerse.de/technische-indikatoren/). 

>üí° **Aufgabe:** Versuchen Sie im Selbststudium weitere Chartindiaktoren zu verwenden und interpretieren.

## Analyse der Kursentwicklung: Renditen und Returns - to do


* Renditen = prozentualer Wertzuwachs von a nach t: $R_{a,t} = \frac{S_{a} - S_{t}}{S_a}= \frac{S_a}{S_t}-1$
* Log-Returns von a nach t: $r_{a,t} = \log{\left( \frac{S_a}{S_t} \right)} = 
  \log {\left(S_t \right)} - \log {\left(S_a \right)}$
* Zusammenhang: $R_{a,t}=e^{r_{a,t}}-1 \Leftrightarrow r_{a,t} = \log{\left( R_{a,t}+1\right)}$ 
* Taylorapproximation liefert f√ºr kurze Zeitabst√§nde $\triangleq t = t-a$ wegen $S_a \approx S_t$ und folglich $\frac{S_t}{S_a} \approx 1$, dass $r_{a,t} = \log{\left( R_{a,t}+1\right)} = \log{\left( \frac{S_t}{S_a} \right)} \approx \frac{S_t}{S_a} -1 = R_{a,t}$ beide Rendite-Begriffe kaum unterscheiden. 
* Vergleiche Graphik zur Taylorentwicklung (1. Ordnung) der Funktion $f(x)= ln(x) \approx x -1$ in $x_0 = 1$ 

In [None]:
import numpy as np

# x-Werte
x = np.linspace(0.01, 2, 400)     # f√ºr f(x) = ln(x), nur positive x

# Funktionen
f = np.log(x)
t = x - 1  #Taylor-Approximation

# Plot
plt.figure(figsize=(7,5))
plt.plot(x, f, label="f(x) = ln(x)", color="blue")
plt.plot(x, t, label="t(x) = x - 1", color="red")

# Achsen und Details
plt.axhline(0, color="black", linewidth=0.8)   # x-Achse
plt.axvline(0, color="black", linewidth=0.8)   # y-Achse
plt.title("f(x) = ln(x) und Taylorapproximation t(x) = x - 1")
plt.xlabel("x")
plt.ylabel("y")
plt.ylim([-2,1])
plt.legend()
plt.grid(True)
plt.show()


### Portfolio-Rendite

Die prozentualen Potrtfolio-Renditen ergeben sich als gewichtete Summe der Aktienrenditen: 

Wird in $t=0$ das Portfolio aus jeweils $a_i$ Stocks zum Preis $S_{i,0}$ zusammengesetzt ($i=1, \ldots,n$), gilt f√ºr den
jeweiligen Portfolioanteil der $i$-ten Aktie $w_i = \frac{S_{i,0}}{P_0}$ und $\sum\limits_{i=1}^n w_i = 1$, wobei $P_0 = a_1 S_{1,0} + \ldots + a_n S_{n,0}$ der investierte Gesamtbetrag betr√§gt. 
Wird das Portfolio bis zum Zeitpunkt $t>0$ nicht umgeschichtet, hat das Portfolio dann den Wert $P_t = \sum\limits_{i=1}^n a_i S_{i,t}$, so dass f√ºr die Portfolio-Rendite, also den prozentualen Zuwachs bis zum Zeitpunkt $t$ des Portfolios gerade $R^P_t = \frac{P_t}{P_0}-1 = \sum\limits_{i=1}^n a_i \frac{S_{i,t}}{P_0} - 1 = \sum\limits_{i=1}^n a_i \frac{S_{i,0}}{P_0} \frac{S_{i,t}}{S_{i,0}} - 1 = \sum\limits_{i=1}^n w_i \left(\frac{S_{i,t}}{S_{i,0}} - 1 \right) = \sum\limits_{i=1}^n w_i R_{i,t}$ also die gewichtete Summe der Aktien-Renditen $R_{i,t}=\frac{S_{i,t}}{S_{i,0}} - 1$.


```note
to do: 
* siehe Beispiel-Code: finance-pandas.ipynb
* Wiederholung wichtiger Pandas Grundlagen: Index als Datum anstalt Spalte und Umwandlung, sowie von Pandas vorgegebene Funktionen wie `plot()` oder `pct_change()` usw.) und als √úbungsaufgabe 
* mit aktuellen Datensatz mit einigen DAX-Aktien von oben / csv 
* Renditen vs. Returns -- Berechnung mit Hilfsfunktionen vs. eigene Berechnungen
* Portfoliowert und Rendite
* Berechnung empirischer Kennzahlen: mean, var, std, skewness, kurtosis...
* Portfoliovarianz
* einfache Grafiken: Zeitreihen, Hist, Scatterplots ...
* statistische Tests auf Normalverteilung...
* Kovarianzmatrix / Korrelationsmatrix f√ºr Zusammenhang
* evt. in Anhang aufnehmen Grundlagen statistisches Testen und Arbeiten mit verschiedenen Verteilungen??? sowie multivariate Normalverteilung???
```

Es ist deutlich zu erkennen, dass f√ºr x nahe 1 kaum ein Unterschied zwischen beiden Funktionen zu erkennen ist. Zusammenfassend: Log-Returns und arithmetische Renditen unterscheiden sich, allerdings nur minimal f√ºr entsprechend kleine Zeitabst√§nde. Beide Rendite-Begriffe haben aus finanzmathematischer Sicht Vor- und Nachteile. Wie oben gezeigt ergibt sich die arithmetische Portfolio-Rendite als gewichtete Summe der Aktienrenditen, was f√ºr die Log-Returns nicht gilt. Allerdings kumulieren sich die t√§glichen Log-Returns wegen $r_{0,t} = \log(S_t) - \log(S_0) = \log(S_t) - \log(S_{t-1}) + \log(S_{t-1}) \pm \ldots + \log(S_1)-\log(S_0)=r_{t-1,t} + \ldots + r_{0,1}$ gerade zum Return √ºber die gesamte Zeit, d.h. von 0 bis t. Somit gilt dann automatisch auch $R_{0,t}+1 = \frac{S_t}{S_0}=e^{r_0,t}=e^{\sum\limits_{k=1}^t r_{k-1,k}} = \prod\limits_{k=1}^t e^{r_{k-1,k}} = \prod\limits_{k=1}^t \left(R_{k-1,k} +1 \right)$ gilt - also √§hnlich wie beim (geometrischen) Verzinsen.

to do: code von finance-pandas.ipynb anpassen!!!

### Statistische Analyse der Returns bzw. Renditen