## Detaillierter Bericht ### Einführung in die Zinsstrukturmodellierung Die Modellierung von Zinsstrukturkurven spielt in der Finanzwelt eine zentrale und immer wichtiger werdende Rolle. Traditionelle statische Bewertungsmethoden, wie die weit verbreitete Discounted-Cash-Flow-Methode (DCF), werden von quantitativen Analysten zunehmend als unzureichend zur Bewertung von Realoptionen in einem dynamischen wirtschaftlichen Umfeld angesehen. Historisch betrachtet waren Zinsstrukturen von etwa 2002 bis 2004 relativ stabil. Der beständige Anstieg bis zur Finanzkrise 2008 – und die beispiellosen strukturellen Verschiebungen danach – haben jedoch gezeigt, dass Volatilität und Flexibilität kritische Parameter sind. Da der Barwert jedes zukünftigen Zahlungsstroms stark vom Nenner (dem Zinssatz) abhängt, stützen sich Projektbewertungen, Portfoliomanagement und die Bepreisung von Derivaten grundlegend auf die präzise Vorhersage zukünftiger Kassazinsen (Spot Rates) mithilfe von Modellen, die sich an stochastische (zufällige) Marktverhalten anpassen können. ### Stochastische Differentialgleichungen (SDEs) & Itō-Calculus Um dieses zufällige Marktverhalten akkurat zu modellieren, müssen wir von der klassischen deterministischen Analysis in den Bereich der stochastischen Prozesse wechseln. Finanzmärkte werden von unvorhersehbaren Schocks getrieben, was bedeutet, dass eine gewöhnliche Differentialgleichung (ODE) nicht ausreicht. Stattdessen verwenden wir Stochastische Differentialgleichungen (SDEs), die folgende allgemeine Form aufweisen: $$dX_t = a(X_t, t)dt + b(X_t, t)dB_t$$ Hierbei repräsentiert $a(X_t, t)dt$ den deterministischen "Drift" (die erwartete Richtung) und $b(X_t, t)dB_t$ die zufällige "Diffusion" (die Volatilität). Die Variable $dB_t$ ist die Standard-Brown'sche Bewegung (oder Wiener-Prozess). Die Brown'sche Bewegung ist ein zeitstetiger stochastischer Prozess, der durch unabhängige, normalverteilte Inkremente gekennzeichnet ist. Da ein Brown'scher Pfad unendlich gezackt und nirgends differenzierbar ist, versagt die klassische Newton-Leibniz-Analysis, wenn man versucht, ihn zu integrieren oder zu differenzieren. Um dies zu überwinden, stützt sich die Finanzmathematik auf das **Itō-Calculus**. Der Grundstein des Itō-Calculuss ist das Theorem der quadratischen Variation, welches beweist, dass die quadrierten Inkremente der Brown'schen Bewegung im Zeitverlauf linear mit der Zeit skalieren: $(dB_t)^2 \equiv dt$. Mithilfe einer Taylor-Entwicklung zweiter Ordnung leitete Kiyoshi Itō das berühmte Itō-Lemma ab, das es uns ermöglicht, Funktionen stochastischer Variablen zu differenzieren. Für eine glatte Funktion $f(t, X_t)$ ist das Itō-Lemma wie folgt definiert: $$df(t,X_t) = \left( \frac{\partial f}{\partial t} + \mu\frac{\partial f}{\partial X_t} + \frac{1}{2}\sigma^2\frac{\partial^2 f}{\partial X_t^2} \right)dt + \sigma\frac{\partial f}{\partial X_t}dB_t$$ Dieses Lemma ist der mathematische Motor, der es uns erlaubt, theoretische Anleihepreise aus den zugrundeliegenden zufälligen Zinsmodellen abzuleiten. ### Das Cox-Ingersoll-Ross (CIR) Modell Um Zinsen zuverlässig zu prognostizieren, nutzen wir das Cox-Ingersoll-Ross (CIR) Modell. Das CIR-Modell ist ein affiner stochastischer Diffusionsprozess. Es erfüllt wesentliche empirische Kriterien für eine fundierte Zinsmodellierung, wie etwa die Erzwingung von Mean Reversion und die natürliche Verhinderung einer systematischen Vorhersage negativer Zinssätze. Die instantane Zinsrate $r(t)$ im CIR-Modell wird durch die folgende stochastische Differentialgleichung definiert: $$dr(t) = \kappa(\theta - r(t))dt + \sigma\sqrt{r(t)}dB_t$$ - $\kappa$: Die Geschwindigkeitskonstante des Mean-Reversion-Prozesses. - $\theta$: Der langfristige Gleichgewichtswert (Mean-Reversion-Level). - $\sigma$: Der Volatilitätsparameter. - $dB_t$: Die Standard-Brown'sche Bewegung (Wiener-Prozess). Ein herausragendes Merkmal des CIR-Modells ist die Heteroskedastizität: Die absolute Volatilität skaliert mit der Quadratwurzel des Zinssatzes ($\sqrt{r(t)}$), wodurch die dynamischen Eigenschaften von Spot-Rate-Zeitreihen perfekt erfasst werden. Darüber hinaus geht das Modell inhärent von **Mean Reversion** aus, was bedeutet, dass die Zinssätze schließlich mit einer durch $\kappa$ bestimmten Geschwindigkeit zu einem stabilen, langfristigen Gleichgewicht ($\theta$) zurückkehren. Des Weiteren basiert es auf einer nicht-zentralen Chi-Quadrat-Verteilung, was mathematisch verhindert, dass systematisch negative Zinsen prognostiziert werden. ### Von Spot Rates zu Anleihepreisen: Das Ein-Faktor-Modell Während die CIR-Gleichung die Bewegung des instantanen kurzen Zinses elegant beschreibt, müssen Finanzinstitute Nullkuponanleihen $P(t, r, T)$ über verschiedene Laufzeiten (Maturitäten) hinweg bepreisen. In dieser Notation ist $t$ die aktuelle Zeit, $r$ die aktuelle Spot Rate und $T$ das Fälligkeitsdatum. Um diese Lücke zu schließen, konstruieren quantitative Analysten ein theoretisches, selbstfinanzierendes Portfolio, das aus Long- und Short-Positionen in Anleihen mit unterschiedlichen Laufzeiten besteht. Wir beginnen mit der Definition eines allgemeinen stochastischen Prozesses für die Spot Rate: $$dr(t) = f(r(t),t)dt + \rho(r(t),t)dB(t)$$ Hier fungiert $f(r(t),t)$ als deterministischer Driftterm, $\rho(r(t),t)$ ist der Volatilitätsterm und $dB(t)$ bleibt die Standard-Brown'sche Bewegung. Durch Anwendung des Itō-Lemmas auf die Anleihepreisfunktion $P$ können wir ihre Dynamik modellieren. Gemäß dem grundlegenden "No-Arbitrage"-Prinzip muss ein vollständig risikofreies, abgesichertes Portfolio exakt den risikofreien Zinssatz abwerfen. Wird diese strikte mathematische Bedingung auf unsere stochastischen Differentialgleichungen angewendet, kristallisiert sich aus der Herleitung ein entscheidender neuer Parameter heraus: der **Marktpreis des Risikos ($\lambda$)**. Dies führt uns zur zentralen partiellen Differentialgleichung (PDE) für den Anleihepreis: $$P_t + (f - \rho\lambda)P_r + \frac{\rho^2}{2}P_{rr} - rP = 0$$ In dieser zentralen Gleichung: - **$P_t$**: Die partielle Ableitung des Anleihepreises nach der Zeit ($t$). - **$P_r$**: Die erste partielle Ableitung des Anleihepreises nach dem Zinssatz ($r$). - **$P_{rr}$**: Die zweite partielle Ableitung des Anleihepreises nach dem Zinssatz ($r$). - **$\lambda$**: Der Marktpreis des Risikos. In der Praxis ist $\lambda$ typischerweise negativ. Diese mathematische Negativität spiegelt eine zentrale wirtschaftliche Realität wider: Investoren fordern eine Risikoprämie (höhere Renditen), wenn sie ihr Kapital in langfristige Anleihen binden, verglichen mit kurzfristigen Investitionen. Der Marktpreis des Risikos ist die mathematische Brücke, die diese Prämie über die gesamte Zinsstrukturkurve hinweg erzwingt. Um diese komplexe PDE analytisch zu lösen, nutzt die Finanzmathematik einen affinen strukturellen Ansatz: $$P(\tau) = \exp(A(\tau) - B(\tau)r)$$ Hierbei repräsentiert $\tau = T - t$ die Restlaufzeit. $A(\tau)$ und $B(\tau)$ sind zeitabhängige Funktionen, deren Lösungen durch das Lösen eines Systems von Riccati-Gleichungen gefunden werden. ### Die Realität abbilden: Die Mehr-Faktor-Erweiterung Das Ein-Faktor-CIR-Modell geht davon aus, dass die gesamte Zinsstrukturkurve von einer einzigen zugrundeliegenden Zufallsquelle angetrieben wird. Dies impliziert, dass sich alle Anleiherenditen über alle Laufzeiten hinweg im perfekten Gleichschritt bewegen. Dies widerspricht jedoch empirischen Marktbeobachtungen, bei denen sich die Zinsstrukturkurve häufig unabhängig voneinander verdreht, versteinert oder abflacht. Um diese komplexen Dynamiken zu erfassen, wird das Framework zu einem **Mehr-Faktor-Modell** erweitert. Anstelle einer einzelnen Zustandsvariablen wird der instantane Zinssatz als Summe mehrerer unabhängiger, unbeobachtbarer CIR-Prozesse (Faktoren) modelliert: $$r = \sum_{i=1}^n y_i$$ In dieser Erweiterung: - **$n$**: Die Gesamtzahl der unabhängig modellierten Faktoren. - **$y_i$**: Die einzelne, unbeobachtbare Zustandsvariable (der Faktor). Jede dieser Zustandsvariablen folgt ihrer eigenen CIR-basierten stochastischen Differentialgleichung: $$dy_i = f_i(t,y_i)dt + \sum_{j=1}^n \rho(y_i,y_j,t)dB_i(t)$$ Als Ergebnis erweitert sich der Preis der Nullkuponanleihe zu einer produktartigen Exponentialform, die alle unabhängigen Faktoren gleichzeitig berücksichtigt: $$P(\tau,y_1,y_2,...,y_n) = \exp\left(\sum_{i=1}^n A_i(\tau) - B_i(\tau)y_i\right)$$ Wobei $A_i(\tau)$ und $B_i(\tau)$ die spezifischen zeitabhängigen Riccati-Lösungen sind, die für den $i$-ten Faktor berechnet wurden, und $\tau$ weiterhin die Restlaufzeit darstellt. In einem 3-Faktor-Modell folgt jeder Faktor unabhängig seinem eigenen CIR-Prozess mit seinen eigenen einzigartigen Parametern ($\kappa_i, \theta_i, \sigma_i, \lambda_i$). Dies erlaubt es dem Modell, Rollen zu verteilen: Ein Faktor optimiert sich auf natürlichem Weg, um das kurzfristige, instantane Verhalten zu erfassen, ein anderer erfasst das langfristige makroökonomische Gleichgewicht, und der dritte übernimmt die mittelfristigen Durchbiegungen der Kurve. ### Parameterschätzung mit dem Kalman-Filter Da diese einzelnen Faktoren ($y_i$) virtuelle, unbeobachtbare Größen sind, erfordert ihre Extraktion aus rohen Marktpreisen einen fortschrittlichen Zustandsraum-Filtermechanismus. Wir haben einen Kalman-Filter implementiert. Ursprünglich berühmt für seine Echtzeitanwendungen im Apollo-Programm der NASA, fungiert der Kalman-Filter als bayesianischer Minimum-Varianz-Schätzer. Er löst ein grundlegendes Problem: Wie findet man den "wahren" Wert eines Zustands heraus, wenn sowohl das theoretische Modell als auch die Marktmessungen fehlerbehaftet sind? Im Kern berechnet der lineare Filter kontinuierlich eine **Kalmanverstärkung** ($K$) – einen dynamischen Gewichtungsfaktor, der entscheidet, welcher Quelle vertraut wird. Ist das Marktdatenrauschen extrem hoch, sinkt die Verstärkung und der Filter vertraut seinem internen mathematischen Modell. Ist das interne Modell sehr unsicher, steigt die Verstärkung und der Filter passt sich stark an die verrauschten Marktmessungen an. Nutzen Sie den interaktiven Simulator unten, um dieses Tauziehen zu beobachten. Passen Sie das Messrauschen ($R$) und das Systemrauschen ($Q$) an, um zu sehen, wie die Kalmanverstärkung ihr Vertrauen in Echtzeit verschiebt. Um dies mathematisch umzusetzen, übersetzt der Filter unser Problem in eine **Zustandsraumdarstellung**: 1. **Die Systemgleichung:** Beschreibt die verborgene Entwicklung der unbeobachtbaren CIR-Faktoren ($y_t$). $$y_{t+1} = C + F y_t + q_t$$ 2. **Die Ausgangsgleichung (Messgleichung):** Bildet diese verborgenen Faktoren auf die tatsächlichen Marktdaten ab, die wir beobachten können (z.B. empirische Preise für Nullkuponanleihen, $z_t$). $$z_t = A + H y_t + r_t$$ Hier repräsentiert $q_t$ das _Systemrauschen_ (Ungenauigkeiten, die dem theoretischen Modell innewohnen und mit der Brown'schen Bewegung verknüpft sind) mit der Kovarianz $Q$, und $r_t$ repräsentiert das _Messrauschen_ (Mikrostrukturanomalien des Marktes) mit der Kovarianz $R$. ### Weiterentwicklung zum adaptiven Kalman-Filter Der Standard-Linearfilter ist enorm leistungsstark, hat jedoch einen entscheidenden Fehler bei der Anwendung auf das CIR-Framework: Er verwendet statische Rauschparameter und geht von einer Normalverteilung aus, was mathematisch zulässt, dass der "wahre Zustand" unter Null fällt (wie im Diagramm oben zu sehen). Da der CIR-Prozess eine strikte Nicht-Negativitätsbedingung und ein zustandsabhängiges Systemrauschen (Heteroskedastizität) beinhaltet, reicht ein linearer Standardfilter nicht aus. Wir haben einen modifizierten **adaptiven (quasi-linearen) Kalman-Filter** eingesetzt, der über eine kontinuierliche Prädiktor-Korrektor-Schleife arbeitet und zwei wesentliche CIR-spezifische Erweiterungen einführt: 1. **Zustandsabhängiges Systemrauschen (Dynamisches $Q$):** Da die Volatilität mit der Quadratwurzel des Zinssatzes ($\sqrt{r(t)}$) skaliert, ist das Systemrauschen nicht konstant. Der adaptive Filter berechnet die Systemrauschmatrix bei jedem Schritt aktiv neu: $Q_t = \sigma^2 \cdot r_t \cdot dt$. Höhere Zinsen lösen automatisch eine höhere mathematische Unsicherheit aus. 2. **Die Nicht-Negativitätsbedingung:** Während der Schleife prognostiziert der Algorithmus den Zustandsvektor in die Zukunft ($\hat{y}_{t+1}$). Wenn dieser Prädiktor einen negativen Zinssatz berechnet, greift unser adaptiver Mechanismus aktiv ein. Er zwingt den Wert auf Null ($\tilde{y}_t \ge 0$), um das CIR-Modell zu respektieren, und aktualisiert sofort die Fehlerkovarianzmatrix, um diesen manuellen Eingriff zu berücksichtigen. Beachten Sie im adaptiven Simulator unten, wie das "Dynamische Systemrauschen (Q)" aktiv mit der Höhe der Kurve fluktuiert, was beweist, dass der Filter die Heteroskedastizität berücksichtigt. Beobachten Sie außerdem den "Floor Hits"-Zähler, der die aktiven Eingriffe des Algorithmus zur Verhinderung negativer Spot Rates in Phasen hoher Volatilität aufzeichnet. ### Projektziel & Implementierung Das Kernziel des Projekts bestand darin, 1-Faktor-, 2-Faktor- und 3-Faktor-CIR-Modelle anhand stark empirischer Daten zu kalibrieren. Wir verarbeiteten historische Daten für US-Nullkuponanleihen aus dem Zeitraum vom 1. Februar 1982 bis zum 1. Juni 2014 über Laufzeiten von 1 bis 10 Jahren. Die algorithmische Pipeline umfasste: 1. **Initialisierung:** Festlegung von Basisparametern basierend auf langfristigen Erwartungswerten. 2. **Filterung:** Ausführung des adaptiven Kalman-Filters über den 32-jährigen Datensatz, um die verborgenen Zustandsvariablen zu extrahieren. 3. **Optimierung:** Maximierung der Log-Likelihood-Funktion, um die ideale Kombination aus Drift, Volatilität und Mean-Reversion-Geschwindigkeit für jeden unabhängigen Faktor zu definieren. ### Ergebnisse & Fazit Die Anwendung des Kalman-Filters erwies sich als äußerst erfolgreich bei der Nachbildung des wahren Pfades der Spot Rate. Allerdings zeigten sich deutliche Leistungsunterschiede zwischen den Mehr-Faktor-Modellen: - **Die Einschränkung des 1-Faktor-Modells:** Das 1-Faktor-Modell hatte Schwierigkeiten, die gesamte Kurve akkurat abzubilden. Da es sich auf eine einzelne Zustandsvariable stützt, kann es sich nicht gleichzeitig auf kurzfristige Volatilität und langfristige Mean Reversion spezialisieren. Als Ergebnis lieferte der Optimierer kompromissbehaftete "Durchschnittsparameter", die typischerweise das kurze Ende der Kurve übergewichteten, was zu ungenauen Aufwärtstrends für lange Laufzeiten führte. - **Die Überlegenheit des 3-Faktor-Modells:** Das 3-Faktor- (und 2-Faktor-) Modell zeigte eine klare Rollenverteilung zwischen seinen Zustandsvariablen. Ein Faktor optimierte sich auf natürlichem Weg für das kurzfristige, instantane Verhalten (gekennzeichnet durch eine hohe Mean-Reversion-Geschwindigkeit $\kappa$ und hohe Volatilität $\sigma$), während ein anderer das langfristige makroökonomische Gleichgewicht (gekennzeichnet durch ein dominantes $\theta$ und geringere Volatilität) abbildete. Der dritte Faktor diente dazu, mittelfristige Schwankungen abzufangen. Mit den optimierten Parametern der Mehr-Faktor-Modelle führten wir erfolgreich eine Monte-Carlo-Simulation mit 10.000 unabhängigen Pfaden durch, um die Zinsstrukturkurve bis zum Jahr 2047 zu prognostizieren. Durch die Mittelung dieser Pfade zur Rauschunterdrückung ermöglicht diese robuste Simulations-Engine geglättete, äußerst zuverlässige Visualisierungen zukünftiger Spot Rates über alle Laufzeiten hinweg und bietet somit ein leistungsstarkes quantitatives Werkzeug für die langfristige Anlageanalyse. ### P.S. Algorithmus-Details Um vollständig zu verstehen, wie der adaptive Kalman-Filter Marktdaten rekursiv verarbeitet, können wir die Prädiktor-Korrektor-Schleife, die im Algorithmus-Flussdiagramm dargestellt ist, aufschlüsseln. **Zustands- und Messvariablen:** - $y_t$: Der wahre, unbeobachtbare Zustandsvektor, der die zugrundeliegenden CIR-Faktoren repräsentiert. - $\hat{y}_t$: Die Vorhersage des Zustandsvektors (Prädiktion) vor der Messkorrektur. - $\tilde{y}_t$: Die korrigierte Vorhersage des Zustandsvektors nach Integration der tatsächlichen Marktdaten. - $z_t$: Die tatsächlichen, am Markt gemessenen Zinssätze. - $\hat{z}_t$: Die vorhergesagten Zinssätze, abgeleitet aus dem Zustandsraum. - $\Delta z_t$: Die Differenz (das Residuum) zwischen den tatsächlichen gemessenen Werten $z_t$ und ihren Vorhersagen $\hat{z}_t$. **Matrizen und Kovarianzen:** - $F$ und $C$: Die Systemmatrix und der Vektor, die verwendet werden, um die zeitliche Entwicklung (Zeitentwicklung) des Zustandsvektors in den nächsten Zeitschritt zu berechnen. - $H$ und $A$: Die Ausgangsmatrix und der Vektor, die dazu dienen, die beobachtbaren Größen (Marktzinsen) aus dem Zustandsvektor zu berechnen. - $K_t$: Die Kalmanverstärkung, die dynamisch gewichtet, wie viel Korrektur basierend auf dem Messresiduum angewendet werden soll. - $\hat{P}_t$ und $\tilde{P}_t$: Die prädizierten und korrigierten Kovarianzmatrizen des Schätzfehlers. - $Var(z_t)$: Die Kovarianzmatrix der prädizierten Zinssätze. - $R$: Die Kovarianzmatrix des Messrauschens, die die Ungenauigkeit der gemessenen Signale darstellt. - $Q_t$: Die Kovarianzmatrix des Systemrauschens, welche die Ungenauigkeiten des theoretischen Modells erfasst. - $\mathbb{I}$: Die mathematische Einheitsmatrix (Identity Matrix). **Der Schritt-für-Schritt Ablauf (Die Schleife):** 1. **Vorhersage (Prädiktion):** Ausgehend vom zuvor etablierten Zustand prognostiziert der Algorithmus den aktuellen Zustand ($\hat{y}_t$) und seine zugehörige Fehlerkovarianz ($\hat{P}_t$). Daraus leitet er ab, wie die Marktzinsen sein sollten ($\hat{z}_t$) und berechnet deren Varianz ($Var(z_t)$). 2. **Kalmanverstärkung & Residuum:** Echte Marktdaten ($z_t$) werden eingespeist. Der Algorithmus ermittelt die Abweichung ($\Delta z_t$) und berechnet die optimale Kalmanverstärkung ($K_t$). 3. **Zustandskorrektur & Bedingung:** Der Zustand wird zu $\tilde{y}_t$ korrigiert. Entscheidend ist die Anwendung der Nicht-Negativitätsbedingung: Fällt ein Wert unter Null, wird er manuell auf Null gesetzt ($\tilde{y}_{i,t} \ge 0$). 4. **Iteration & Likelihood-Optimierung:** Die Fehlerkovarianz wird auf $\tilde{P}_t$ aktualisiert und das neue, zustandsabhängige Systemrauschen ($Q_{t+1}$) für den nächsten Zyklus generiert. Gleichzeitig wird bei jedem Schritt die Log-Likelihood berechnet, um die übergeordnete Parameteroptimierung voranzutreiben.