🟩 Fiche 1 — Systèmes d’équations linéaires
[Concepts fondamentaux et applications financières]
1- Objectif et usage
– Un système d’équations linéaires sert à trouver la valeur de plusieurs variables interdépendantes à partir d’un ensemble d’équations.
– En finance et en économie, il permet de modéliser des relations simultanées : prix, rendements, flux de trésorerie ou contraintes d’optimisation.
– Comprendre comment ces systèmes fonctionnent aide à structurer des problèmes complexes de façon logique et mathématique.
Exemple concret :
Un gestionnaire de portefeuille souhaite trouver les pondérations w1, w2 et w3 qui respectent trois conditions : un rendement cible, une contrainte de budget (somme des pondérations = 1) et une exposition au risque limitée. Ces conditions forment un système d’équations linéaires.
2- Concepts clés
– Une équation linéaire est une relation où les variables apparaissent uniquement à la première puissance et ne se multiplient jamais entre elles. Cela garantit que les effets de chaque variable sont proportionnels. En finance, cela modélise des relations proportionnelles simples, comme la variation d’un prix en fonction d’un facteur de coût.
– Un système linéaire est un ensemble de plusieurs équations linéaires partageant les mêmes variables. Par exemple, un modèle économique reliant la consommation, l’investissement et le revenu national.
– Chaque équation représente une contrainte, les coefficients indiquent la force d’influence de chaque variable et les constantes représentent les valeurs observées ou cibles.
– Un système peut avoir :
une solution unique (modèle bien défini),
aucune solution (contraintes contradictoires),
ou une infinité de solutions (plusieurs combinaisons possibles).
Dans un modèle financier, cela signifie que selon les hypothèses, un portefeuille peut être parfaitement défini, irréalisable ou avoir plusieurs structures possibles.
3- Règles et hypothèses
– Compatibilité : un système est compatible si au moins une combinaison de variables satisfait toutes les équations. En finance, un portefeuille est compatible avec les contraintes si des pondérations respectent à la fois le rendement cible et la contrainte budgétaire.
– Redondance : une équation est redondante si elle peut être obtenue comme combinaison linéaire des autres. Cela se produit souvent quand certaines contraintes expriment la même idée sous une autre forme (exemple : somme des parts de marché = 100 % et somme des pondérations = 1).
– Dépendance linéaire : deux équations sont dépendantes si elles expriment la même contrainte sous une autre forme. En pratique, cela signifie que certaines hypothèses du modèle n’ajoutent aucune information nouvelle, un problème courant en régression linéaire.
– Homogénéité : un système homogène (toutes les constantes = 0) représente souvent une situation d’équilibre ou de neutralité. Exemple : un portefeuille à rendement net nul ou un bilan équilibré.
4- Applications concrètes
– En macroéconomie : les modèles d’équilibre général (comme le modèle IS-LM) reposent sur des systèmes d’équations linéaires reliant la production, les taux d’intérêt et la demande globale.
– En finance de marché : les modèles de tarification des actifs (CAPM ou APT) utilisent des relations linéaires entre le rendement d’un actif et différents facteurs de risque.
– En gestion de portefeuille : lorsqu’un investisseur fixe un objectif de rendement et une contrainte de budget, le calcul des pondérations optimales repose sur un système d’équations linéaires.
– En comptabilité et planification budgétaire : les flux de revenus, coûts fixes et variables peuvent être exprimés sous forme d’équations linéaires pour trouver le seuil de rentabilité.
Exemple :
Une entreprise produit trois biens A, B et C avec des coûts et marges différents. En fixant un objectif de profit total et une capacité maximale de production, on obtient un système d’équations permettant de déterminer les quantités à produire pour atteindre la rentabilité souhaitée.
5- Matière complémentaire
– L’algèbre linéaire et la programmation linéaire reposent sur les mêmes principes. Ces outils sont utilisés dans la recherche opérationnelle pour optimiser des portefeuilles, planifier la production ou répartir des ressources limitées.
– Le conditionnement numérique mesure la stabilité d’un système. Si les coefficients sont presque dépendants (exemple : variables très corrélées), une petite erreur d’estimation peut changer fortement la solution. Cela est fréquent dans les modèles financiers sensibles aux corrélations.
– Interprétation graphique : pour deux variables, chaque équation représente une droite. Leur point d’intersection est la solution. En trois dimensions, ce sont des plans, et en n dimensions, des hyperplans.
🟩 Fiche 2 — Résolution des systèmes linéaires
[Méthode de Gauss et interprétation financière]
1- Objectif et usage
– La résolution d’un système linéaire consiste à trouver la ou les valeurs des variables qui satisfont simultanément plusieurs équations.
– La méthode de Gauss (ou élimination de Gauss) est une procédure systématique qui transforme un système complexe en un système plus simple, dit triangulaire, où la solution se déduit facilement.
– En finance, cette méthode est utilisée implicitement dans presque tous les logiciels de calcul (Excel, Python, R, Matlab) pour résoudre des équations liées à la tarification, à la gestion de portefeuille ou à la prévision statistique.
Exemple concret :
Dans un modèle de risque de crédit, plusieurs facteurs (revenus, ratios d’endettement, taux d’intérêt, historique de paiement) interagissent pour déterminer la probabilité de défaut. Ces relations peuvent être exprimées sous forme d’équations linéaires et résolues par la méthode de Gauss afin d’isoler l’impact individuel de chaque variable.
2- Concepts clés
– La méthode de Gauss repose sur trois opérations élémentaires effectuées sur les lignes d’un système :
Échanger deux lignes pour placer une variable plus “forte” en haut du système.
Multiplier une ligne par un nombre non nul pour ajuster les coefficients.
Ajouter à une ligne un multiple d’une autre pour éliminer une variable.
Ces opérations ne changent pas la solution du système mais le rendent plus simple à résoudre.
– Le but est de transformer progressivement le système jusqu’à ce que chaque équation contienne une variable de moins que la précédente. On parle alors d’un système triangulaire, où la dernière équation ne contient qu’une seule variable.
– Une fois le système triangulaire obtenu, on procède à la “remontée” (appelée substitution inverse) pour trouver toutes les variables une à une.
3- Règles et hypothèses
– Le succès de la méthode dépend de la présence de coefficients non nuls dans les positions clés (appelées pivots). Si un pivot vaut zéro, il faut échanger les lignes pour en trouver un non nul.
– Si tous les pivots deviennent nuls avant la fin de l’élimination, cela signifie que le système n’a pas de solution unique (il est soit incompatible, soit indéterminé).
– En pratique, pour éviter les erreurs numériques, on utilise souvent une version améliorée appelée “pivot partiel” ou “pivot total” qui choisit le plus grand coefficient possible comme pivot afin de limiter les erreurs d’arrondi.
– En finance quantitative, cette précaution est essentielle : les modèles utilisant des données empiriques comportent souvent des valeurs proches les unes des autres, ce qui rend les systèmes sensibles aux erreurs d’approximation.
4- Applications concrètes
– En gestion de portefeuille :
Lorsqu’on résout les équations d’optimisation de Markowitz (minimisation de la variance sous contraintes), le cœur du calcul repose sur l’inversion d’une matrice de covariances, obtenue par élimination de Gauss.
Exemple : trouver les pondérations optimales w1, w2 et w3 en fonction de trois équations représentant le rendement cible, la contrainte budgétaire et la somme des risques.
– En analyse des données financières :
Lorsqu’un modèle de régression linéaire est appliqué à des rendements d’actifs, les estimateurs des coefficients sont calculés à partir d’un système linéaire résolu par Gauss.
Cela permet de quantifier l’effet de chaque facteur (taux d’intérêt, inflation, volatilité) sur le rendement d’un actif.
– En ingénierie financière :
La tarification d’obligations ou de produits dérivés complexes nécessite souvent la résolution de plusieurs équations simultanées reliant prix, taux d’actualisation et flux futurs.
L’élimination de Gauss est utilisée dans les logiciels d’évaluation pour ajuster les paramètres de ces équations.
Exemple concret :
Un analyste cherche à déterminer trois variables inconnues : le taux d’actualisation, la durée moyenne et le rendement effectif d’un portefeuille obligataire. Il dispose de trois équations issues de la valeur actuelle nette, du rendement attendu et du prix observé. Ces équations forment un système que la méthode de Gauss permet de résoudre en éliminant les variables une à une.
5- Matière complémentaire
– La méthode de Gauss est l’une des premières étapes vers la compréhension de l’inversion de matrices, qui est au cœur des modèles de prévision et de risque.
– Elle est à la base de nombreux algorithmes d’ordinateur utilisés dans la finance numérique : simulation Monte Carlo, calculs de sensibilité, ou encore résolution de modèles VAR et SVAR.
– Dans Excel, les fonctions “MINVERSE” (pour l’inverse de matrice) et “MMULT” (pour la multiplication) reproduisent les calculs réalisés par Gauss sans intervention manuelle.
– En Python, la bibliothèque NumPy utilise des variantes optimisées de cette méthode (numpy.linalg.solve) pour traiter des milliers d’équations à la fois.
– Dans Matlab, les commandes “rref” et “linsolve” effectuent automatiquement l’élimination de Gauss et la substitution inverse, ce qui rend la méthode applicable même à des modèles financiers à grande échelle.
Exemple d’interprétation :
Lorsqu’un modèle de prévision du PIB ou du taux d’inflation est calibré à partir de plusieurs séries économiques, la méthode de Gauss permet de calculer simultanément tous les coefficients du modèle en réduisant progressivement le système d’équations.
🟩 Fiche 3 — Calcul matriciel
[Définitions, opérations de base et interprétations financières]
1- Objectif et usage
– Le calcul matriciel est un langage mathématique qui permet de manipuler efficacement des ensembles de données et de relations linéaires.
– En finance et en économie, les matrices servent à représenter des portefeuilles, des corrélations, des flux de trésorerie ou des systèmes d’équations complexes.
– Ce concept est fondamental car il constitue la base de l’analyse quantitative moderne : optimisation, modélisation statistique, apprentissage automatique, prévisions économiques, etc.
Exemple concret :
Une banque gère un portefeuille de 100 actifs et veut calculer les rendements moyens, les covariances et les risques combinés. Le calcul matriciel permet d’effectuer ces opérations en quelques lignes plutôt que de traiter 100 équations séparément.
2- Concepts clés
– Une matrice est un tableau rectangulaire composé de nombres organisés en lignes et colonnes.
– Chaque élément représente une relation entre deux dimensions (par exemple, le rendement d’un actif à une période donnée).
– Les matrices sont notées généralement par des lettres majuscules (A, B, C), tandis que leurs éléments sont notés par des indices (a11, a12, etc.).
– Les dimensions d’une matrice se lisent “lignes par colonnes”. Exemple : une matrice 3x2 a 3 lignes et 2 colonnes.
– Deux matrices peuvent être additionnées ou soustraites seulement si elles ont exactement la même taille.
– Les matrices permettent de décrire plusieurs opérations : addition, multiplication, transposition et inversion.
3- Règles et hypothèses
– Addition et soustraction :
Chaque élément correspondant des deux matrices est additionné ou soustrait.
En finance, cela sert à comparer deux portefeuilles ou deux séries de rendements.
Exemple : la différence entre les matrices des rendements réels et prévus donne la matrice des erreurs de prévision.
– Multiplication par un scalaire :
Multiplier une matrice par un nombre revient à multiplier chaque élément par ce nombre.
Cela permet de simuler des scénarios de hausse ou de baisse proportionnelle d’un ensemble de données.
Exemple : appliquer une hausse de 10 % à tous les prix d’un portefeuille revient à multiplier la matrice des prix par 1,10.
– Multiplication entre matrices :
Pour multiplier A par B, le nombre de colonnes de A doit être égal au nombre de lignes de B.
L’élément en position (i, k) du produit correspond à la somme des produits des éléments de la ligne i de A par ceux de la colonne k de B.
Cette opération combine des variables interdépendantes. En finance, c’est l’équivalent d’un calcul de rendement pondéré : une matrice de rendements multipliée par une matrice de pondérations donne un rendement global.
Exemple concret :
Un portefeuille composé de trois actifs a une matrice de rendements (3 lignes, une par actif) et une matrice de pondérations (3 colonnes, une par actif). Leur multiplication donne la valeur agrégée du portefeuille pour chaque période.
– Transposition :
La transposée d’une matrice échange ses lignes et ses colonnes.
Cela est utile pour réorienter les données selon les besoins d’analyse.
Exemple : dans un fichier Excel, transposer une matrice de rendements mensuels (actifs en colonnes, mois en lignes) permet d’analyser la performance de chaque actif dans le temps.
– Identité et matrices particulières :
La matrice identité agit comme le “1” de la multiplication : multiplier une matrice par l’identité ne change rien.
La matrice nulle est l’équivalent du “0”.
Ces matrices servent souvent à vérifier des équilibres ou à construire des modèles où certaines variables restent constantes.
4- Applications concrètes
– En gestion de portefeuille :
Les matrices permettent de regrouper toutes les données de rendement et de risque dans un seul cadre.
Exemple : le calcul de la variance d’un portefeuille s’exprime sous forme matricielle, combinant la matrice des covariances avec celle des pondérations.
– En évaluation d’actifs :
Les modèles multifactoriels (comme le modèle APT) utilisent des matrices pour relier le rendement de chaque actif à plusieurs facteurs de risque.
Chaque ligne de la matrice représente un actif, chaque colonne un facteur (inflation, taux d’intérêt, croissance du PIB, etc.).
– En prévision et économétrie :
Les régressions linéaires utilisent des matrices pour calculer rapidement les coefficients reliant les variables explicatives aux variables dépendantes.
Cette approche permet d’évaluer des centaines de relations économiques à la fois.
– En finance d’entreprise :
Lorsqu’une entreprise prévoit ses flux de trésorerie sur plusieurs années, les matrices facilitent la simulation de scénarios (hausse des ventes, variation des coûts, changements de taux d’intérêt).
Exemple concret :
Une entreprise veut analyser l’effet combiné de trois variables (prix, volume, taux de change) sur son chiffre d’affaires. Les données historiques de chaque variable sont placées dans une matrice, et une autre matrice de coefficients exprime leur influence relative. La multiplication donne une estimation des ventes totales prévues pour chaque période.
5- Matière complémentaire
– Le calcul matriciel est le fondement de l’intelligence artificielle appliquée à la finance. Les modèles de machine learning (réseaux neuronaux, régressions multiples, analyse en composantes principales) reposent sur la manipulation de grandes matrices.
– En statistique, les matrices permettent de calculer rapidement les moyennes, variances et covariances d’un ensemble d’observations.
– En économie, elles servent à représenter les relations entre secteurs (modèle input-output de Leontief) où chaque case indique la dépendance d’un secteur envers un autre.
– En finance de marché, les matrices de corrélation permettent d’identifier les actifs qui évoluent ensemble, facilitant la diversification du risque.
– Les matrices sont aussi essentielles dans les simulations Monte Carlo : elles permettent de générer des séries corrélées de variables aléatoires pour modéliser les scénarios de marché.
🟩 Fiche 4 — Types particuliers de matrices
[Matrices diagonales, triangulaires, symétriques et élémentaires]
1- Objectif et usage
– Certaines matrices ont des formes ou des propriétés spécifiques qui simplifient considérablement les calculs.
– Ces structures particulières apparaissent dans de nombreux contextes financiers, par exemple dans les modèles de risque, les calculs de corrélation, l’évaluation de portefeuilles et la modélisation de scénarios économiques.
– Comprendre ces types de matrices permet d’interpréter plus rapidement les relations entre variables et d’optimiser les calculs dans des modèles complexes.
Exemple concret :
Lorsqu’une institution financière calcule la covariance entre plusieurs actifs, la matrice résultante est symétrique. Cette propriété garantit que la covariance entre l’actif A et B est la même que celle entre B et A, ce qui réduit le nombre de calculs nécessaires.
2- Concepts clés
– Une matrice diagonale est une matrice carrée dont tous les éléments en dehors de la diagonale principale sont nuls.
Les valeurs sur la diagonale représentent souvent des coefficients d’importance ou des pondérations individuelles.
Exemple : dans une matrice de risque simplifiée, chaque actif peut être représenté sur la diagonale avec sa variance propre, sans interaction avec les autres actifs.
Les opérations sur les matrices diagonales sont très simples : leur inverse, leur produit ou leur puissance sont toujours des matrices diagonales.
– Une matrice triangulaire supérieure a des valeurs nulles sous la diagonale principale, tandis qu’une matrice triangulaire inférieure a des valeurs nulles au-dessus de cette diagonale.
Ces matrices apparaissent lors de la résolution de systèmes d’équations par la méthode de Gauss ou lors de la décomposition LU.
En finance, elles sont utilisées pour séparer les effets directs et indirects entre variables économiques.
Exemple : dans un modèle de propagation de chocs économiques, une matrice triangulaire supérieure peut représenter l’ordre chronologique dans lequel les secteurs réagissent à un choc initial.
– Une matrice symétrique est une matrice égale à sa transposée.
Cela signifie que la relation entre les variables est réciproque.
Exemple : la matrice de covariance ou de corrélation utilisée en gestion de portefeuille est toujours symétrique, car la covariance entre deux actifs est la même dans les deux directions.
Si une matrice symétrique est inversible, son inverse est aussi symétrique. Cette propriété est utile dans le calcul du risque global d’un portefeuille.
– Une matrice élémentaire est obtenue en appliquant une seule opération élémentaire sur la matrice identité (échanger deux lignes, multiplier une ligne par un nombre, ou ajouter une ligne à une autre).
Ces matrices servent à représenter les transformations successives effectuées lors de la résolution d’un système d’équations.
Multiplier une matrice de données par une matrice élémentaire revient à appliquer directement une transformation aux équations du système.
Exemple : dans un modèle financier, cela peut représenter une normalisation des données (comme ajuster les flux de trésorerie par un facteur d’inflation).
3- Règles et hypothèses
– Les matrices diagonales et triangulaires sont toujours carrées.
– Une matrice triangulaire supérieure devient diagonale si tous les éléments au-dessus ou en dessous de la diagonale sont nuls.
– La transposée d’une matrice triangulaire supérieure est une matrice triangulaire inférieure, et inversement.
– Une matrice symétrique doit avoir des dimensions égales (nombre de lignes = nombre de colonnes).
– Les matrices élémentaires sont toujours inversibles, et leur inverse est aussi une matrice élémentaire.
– Dans la pratique, ces matrices sont utilisées pour accélérer les calculs, car leurs structures permettent de réduire la complexité du traitement.
4- Applications concrètes
– En gestion du risque :
Les matrices de variance-covariance et de corrélation sont des matrices symétriques. Elles servent à mesurer la dépendance entre plusieurs actifs d’un portefeuille.
Exemple : dans un portefeuille diversifié, une matrice symétrique permet d’identifier rapidement les actifs dont les variations de prix sont fortement liées.
– En modélisation économique :
Les modèles structurels (comme les modèles VAR ou SVAR) utilisent des matrices triangulaires pour représenter les effets causaux entre variables.
Exemple : dans un modèle VAR, une matrice triangulaire inférieure peut être utilisée pour décrire la réaction différée des variables économiques à un choc de politique monétaire.
– En finance quantitative :
Les matrices diagonales sont utilisées pour isoler des effets spécifiques, par exemple pour appliquer des coefficients de pondération individuels à une série de données.
Exemple : une matrice diagonale contenant des facteurs de risque permet de calculer l’exposition spécifique de chaque actif sans interaction entre eux.
– En informatique financière :
Les matrices triangulaires sont utilisées dans les algorithmes numériques pour résoudre efficacement de grandes équations, notamment via la décomposition LU ou la factorisation de Cholesky.
Exemple : la factorisation de Cholesky, utilisée dans le calcul de la matrice de covariance pour les simulations Monte Carlo, produit une matrice triangulaire inférieure utilisée pour générer des variables aléatoires corrélées.
5- Matière complémentaire
– Les matrices diagonales représentent souvent des systèmes indépendants, c’est-à-dire des situations où chaque variable évolue sans influencer les autres. Dans un modèle financier, cela correspond à des actifs totalement décorrélés.
– Les matrices triangulaires traduisent souvent une hiérarchie ou un ordre temporel : elles sont utilisées pour modéliser des chaînes de dépendance, par exemple l’effet séquentiel d’un choc économique sur plusieurs marchés.
– Les matrices symétriques jouent un rôle central dans la décomposition spectrale : toute matrice symétrique peut être décomposée en valeurs propres et vecteurs propres, ce qui permet d’analyser la structure de la variance dans un ensemble de données.
– Les matrices élémentaires constituent la base des transformations linéaires : elles sont utilisées dans les programmes informatiques pour implémenter les étapes de calcul d’un modèle d’optimisation ou d’équilibre financier.
– En apprentissage automatique appliqué à la finance, la symétrie et la triangularité sont exploitées pour réduire la complexité des calculs lors de l’entraînement des modèles sur de grandes bases de données.
Excellent 👌
Voici la Fiche 5, toujours en format texte brut, complète, claire et avec beaucoup de matière complémentaire et d’exemples concrets financiers et économiques.
🟩 Fiche 5 — Déterminant d’une matrice
[Signification, propriétés et interprétations économiques]
1- Objectif et usage
– Le déterminant est un nombre associé à une matrice carrée qui renseigne sur la “structure interne” du système qu’elle représente.
– Il permet de savoir si une matrice est inversible, si un système d’équations a une solution unique ou s’il est redondant.
– En finance, le déterminant est utilisé pour vérifier la stabilité et la solvabilité des modèles, pour détecter les dépendances entre variables et pour évaluer la cohérence des portefeuilles ou des modèles statistiques.
Exemple concret :
Lorsqu’un analyste construit un modèle de régression pour expliquer les rendements d’actifs à l’aide de plusieurs facteurs, un déterminant nul de la matrice des variables explicatives signifie que certaines variables sont redondantes (elles apportent la même information). Cela rend le modèle non fiable.
2- Concepts clés
– Le déterminant mesure la “déformabilité” d’un système : il indique dans quelle mesure une transformation linéaire change le volume de l’espace qu’elle occupe.
– En dimension deux, le déterminant peut être interprété comme l’aire d’un parallélogramme formé par les vecteurs colonnes de la matrice. En dimension trois, il correspond au volume du parallélépipède défini par ces vecteurs.
– Le signe du déterminant (positif ou négatif) renseigne sur le sens de la transformation :
3- Règles et hypothèses
– Si une matrice possède une ligne ou une colonne nulle, son déterminant est nul. Cela traduit un manque d’information ou une variable inactive dans le modèle.
– Si deux lignes ou deux colonnes sont proportionnelles ou identiques, le déterminant est nul : cela indique une redondance parfaite entre les variables.
– Multiplier une ligne ou une colonne par un nombre k multiplie le déterminant par ce même facteur k.
– Échanger deux lignes ou deux colonnes change le signe du déterminant.
– Le déterminant d’un produit de matrices est égal au produit de leurs déterminants.
– Le déterminant d’une matrice transposée est égal au déterminant de la matrice originale.
– Ces règles permettent d’interpréter directement la stabilité d’un modèle sans effectuer tous les calculs : un déterminant nul signifie que le modèle ne peut pas être inversé, donc qu’il est impossible de trouver une solution unique.
4- Applications concrètes
– En gestion de portefeuille :
– En économétrie :
– En évaluation du risque :
– En finance d’entreprise :
Exemple concret :
Un gestionnaire d’actifs construit un modèle reliant le rendement d’un portefeuille à trois facteurs : la croissance économique, le taux d’intérêt et le prix du pétrole. Si le déterminant de la matrice des facteurs est nul, cela signifie que deux de ces variables évoluent presque toujours ensemble. Le modèle ne peut alors pas identifier correctement l’effet individuel de chaque facteur.
5- Matière complémentaire
– Le déterminant est un outil clé pour déterminer si une matrice est inversible : seule une matrice dont le déterminant est non nul peut être inversée. L’inverse est utilisé pour résoudre des systèmes linéaires et calculer les coefficients optimaux dans des modèles de régression.
– Dans les modèles économiques complexes (comme les modèles d’équilibre général), le déterminant de la matrice jacobienne permet de vérifier la stabilité d’un équilibre. Si ce déterminant est nul ou négatif, cela signifie que le système risque de diverger au lieu de se stabiliser.
– En mathématiques financières, la stabilité d’un modèle d’évaluation dépend souvent du signe et de la valeur du déterminant associé aux coefficients. Un déterminant faible signale une sensibilité accrue aux erreurs de mesure, un phénomène appelé “mauvais conditionnement”.
– Dans les simulations numériques, les logiciels comme Matlab, R ou Python vérifient le déterminant avant d’inverser une matrice : un déterminant proche de zéro déclenche souvent un avertissement (“matrix is singular or nearly singular”).
– En finance comportementale ou dans les modèles de stress tests, l’évolution du déterminant d’une matrice de corrélation au fil du temps peut révéler une augmentation de la connectivité entre actifs — un signe précurseur de contagion financière ou de crise de liquidité.
🟩 Fiche 6 — Inversion d’une matrice
[Principe, interprétation et applications financières]
1- Objectif et usage
– L’inverse d’une matrice joue le même rôle qu’un inverse en arithmétique : elle permet de “revenir en arrière” dans une transformation linéaire.
– Si une matrice A transforme un ensemble de variables X en résultats Y, alors son inverse A⁻¹ permet de retrouver X à partir de Y.
– En finance, l’inverse de matrice est un outil essentiel pour :
Exemple concret :
Dans la gestion de portefeuille de Markowitz, l’inverse de la matrice de covariance est utilisée pour déterminer la combinaison optimale des actifs qui minimise le risque pour un rendement donné.
2- Concepts clés
– Une matrice carrée A est dite inversible si et seulement si son déterminant est non nul.
– L’inverse d’une matrice est notée A⁻¹ et vérifie la relation suivante :
A × A⁻¹ = I et A⁻¹ × A = I
où I est la matrice identité.
Cette relation signifie que multiplier une matrice par son inverse ramène le système à son état d’origine, comme “diviser” par un nombre en algèbre.
– L’inverse peut être calculée par différentes méthodes :
– En finance, l’inverse de matrice permet de neutraliser des effets combinés entre variables. Par exemple, dans une analyse multifactorielle, elle sert à isoler la contribution indépendante de chaque facteur de risque sur le rendement total.
3- Règles et hypothèses
– Une matrice est inversible si et seulement si :
– Si une matrice n’est pas inversible, on dit qu’elle est “singulière”.
– La matrice inverse est unique : il n’existe qu’une seule matrice A⁻¹ telle que A × A⁻¹ = I.
– L’inverse d’un produit est l’inverse du produit pris dans l’ordre inverse : (A × B)⁻¹ = B⁻¹ × A⁻¹.
– La transposée de l’inverse est l’inverse de la transposée : (Aᵀ)⁻¹ = (A⁻¹)ᵀ.
4- Applications concrètes
– En gestion de portefeuille :
– En économétrie et en prévision :
– En modélisation économique :
– En gestion du risque :
Exemple concret :
Une société de gestion souhaite comprendre les interactions entre les rendements de ses actifs. La matrice de covariance montre la corrélation générale, mais son inverse (la matrice de précision) met en évidence les liens directs. Si deux actifs ont un élément de précision nul, cela signifie qu’ils ne s’influencent pas directement, mais seulement via d’autres actifs.
5- Matière complémentaire
– Dans la pratique, l’inversion de matrices de grande taille peut être instable à cause des erreurs d’arrondi. Les logiciels financiers (Excel, R, Python) utilisent des méthodes numériques robustes pour minimiser ces erreurs.
– Dans les grands modèles de gestion de portefeuille, on utilise parfois la “pseudo-inverse” (ou inverse de Moore-Penrose) pour traiter les matrices presque singulières. Cela permet d’obtenir une solution approchée lorsque la matrice n’est pas totalement inversible.
– En finance quantitative, les inverses de matrices apparaissent aussi dans les algorithmes de machine learning supervisé, comme la régression ridge ou la régression LASSO, où elles sont régularisées pour éviter la sur-spécification des modèles.
– En macroéconomie, les inverses de matrices permettent de simuler la réaction du système à des chocs exogènes. Par exemple, dans un modèle de type VAR, l’inverse de la matrice des coefficients structurels permet d’estimer la propagation temporelle des chocs monétaires ou budgétaires.
– Enfin, dans les modèles d’optimisation sous contraintes (par exemple les modèles d’arbitrage ou de tarification), l’inversion permet de “résoudre” la combinaison de contraintes qui maximise la performance ou minimise le risque.
🟩 Fiche 7 — Valeurs propres et vecteurs propres
[Concepts fondamentaux et interprétations financières]
1- Objectif et usage
– Les valeurs propres et vecteurs propres sont au cœur de l’analyse des systèmes complexes. Ils permettent d’identifier les “directions principales” d’un modèle et de mesurer la force de chaque composante.
– Dans un langage simple, un vecteur propre est une direction qui ne change pas lorsqu’on lui applique une transformation (représentée par une matrice), et sa valeur propre indique à quel point il est “étiré” ou “compressé”.
– En finance et en économie, ces concepts servent à comprendre la structure interne des risques, à identifier les facteurs dominants dans les rendements, et à simplifier les modèles statistiques grâce à des représentations plus compactes.
Exemple concret :
Dans une matrice de covariance représentant les rendements de 100 actions, les valeurs propres permettent d’identifier les principaux facteurs de marché. Si une seule valeur propre explique 60 % de la variance totale, cela signifie que la majorité du risque du portefeuille est due à un seul facteur commun (par exemple, la conjoncture économique).
2- Concepts clés
– Une valeur propre (aussi appelée “eigenvalue”) est un nombre qui mesure l’intensité avec laquelle une transformation agit sur un vecteur donné.
– Un vecteur propre (ou “eigenvector”) est un vecteur non nul qui garde la même direction après transformation par une matrice.
Lorsqu’une matrice A multiplie un vecteur propre v, le résultat est un multiple du même vecteur : A × v = λ × v, où λ est la valeur propre associée.
– Les valeurs propres et vecteurs propres apparaissent uniquement pour les matrices carrées.
– Les valeurs propres peuvent être positives, nulles ou négatives, et leur interprétation dépend du contexte :
λ > 1 : la transformation amplifie le vecteur (croissance ou levier).
0 < λ < 1 : la transformation le réduit (atténuation ou amortissement).
λ = 0 : le vecteur est “écrasé”, il perd toute influence (dépendance complète).
λ < 0 : la direction du vecteur s’inverse (changement de signe, retournement).
3- Règles et hypothèses
– Une matrice possède autant de valeurs propres que son ordre (une matrice 3x3 possède 3 valeurs propres, mais elles peuvent être identiques).
– Si toutes les valeurs propres d’une matrice sont distinctes, la matrice est dite diagonalisable, ce qui signifie qu’elle peut être représentée sous une forme simplifiée facilitant les calculs.
– Les valeurs propres d’une matrice symétrique sont toujours réelles (et non imaginaires), ce qui garantit la stabilité des modèles financiers utilisant des matrices de covariance ou de corrélation.
– La somme des valeurs propres d’une matrice est égale à la trace de la matrice (la somme de ses éléments diagonaux).
– Le produit des valeurs propres est égal au déterminant de la matrice.
– Ces relations sont souvent utilisées pour vérifier la cohérence interne d’un modèle.
4- Applications concrètes
– En gestion de portefeuille :
Les valeurs propres de la matrice de covariance révèlent la concentration du risque.
Si une seule valeur propre est dominante, le risque est principalement lié à un facteur unique (souvent le marché global).
Exemple : dans un portefeuille d’actions canadiennes, la première valeur propre peut correspondre au “facteur marché”, tandis que les suivantes représentent des effets sectoriels ou géographiques.
– En analyse factorielle :
Les valeurs propres servent à déterminer le nombre de facteurs à retenir.
Les vecteurs propres associés représentent les combinaisons linéaires des variables originales qui expliquent le plus de variance.
Exemple : en analyse en composantes principales (ACP), la première composante (liée à la plus grande valeur propre) capture la direction dans laquelle la variance des rendements est maximale.
– En économétrie et modélisation dynamique :
Les valeurs propres du système indiquent la stabilité du modèle.
Si toutes les valeurs propres sont inférieures à 1 (en valeur absolue), le système est stable et tend vers un équilibre.
Si au moins une valeur propre dépasse 1, le système est explosif, ce qui peut signaler une bulle financière ou un déséquilibre macroéconomique.
– En gestion du risque :
Les modèles de Value-at-Risk utilisent la décomposition en valeurs propres pour réduire la dimension des matrices de covariance et accélérer les calculs.
Cette approche permet de simuler des portefeuilles contenant des milliers d’actifs sans recalculer la covariance complète.
– En intelligence artificielle financière :
Les réseaux neuronaux et les modèles de réduction dimensionnelle utilisent les valeurs propres pour identifier les “axes” les plus informatifs dans les données financières.
Cela permet de réduire la complexité des modèles tout en conservant l’essentiel de l’information.
Exemple concret :
Une firme d’investissement utilise une analyse en composantes principales sur 500 actions pour identifier les 5 principaux facteurs de risque. Ces facteurs, associés aux plus grandes valeurs propres, expliquent plus de 90 % des variations de rendement observées. Cela permet de gérer le risque de manière plus ciblée et efficace.
5- Matière complémentaire
– Les valeurs propres et vecteurs propres sont à la base de nombreuses méthodes modernes en finance quantitative : analyse en composantes principales (ACP), modèles de facteurs, algorithmes d’apprentissage automatique, et gestion du risque systémique.
– En économie, ils servent à analyser la dynamique des systèmes d’équations différentielles linéaires, notamment pour étudier la stabilité des équilibres.
– Dans les modèles de stress tests bancaires, les valeurs propres permettent de mesurer la sensibilité du système financier à différents chocs : plus la plus grande valeur propre est élevée, plus le système est vulnérable à un choc commun.
– En mathématiques appliquées à la finance, la diagonalisation d’une matrice permet de transformer un problème complexe en une série d’équations indépendantes beaucoup plus faciles à résoudre.
– En apprentissage automatique, la décomposition en valeurs propres (SVD, PCA) est utilisée pour compresser l’information et réduire la dimension des données tout en minimisant la perte d’information pertinente.
– En gestion du risque systémique, la surveillance de l’évolution des plus grandes valeurs propres dans le temps permet de détecter une montée de la corrélation entre les actifs, souvent un signal précurseur de crise financière.
🟩 Fiche 8 — Décomposition spectrale et analyse en composantes principales (ACP)
[Réduction de dimension et interprétation en finance quantitative]
1- Objectif et usage
– La décomposition spectrale consiste à représenter une matrice comme le produit de ses vecteurs propres et de ses valeurs propres.
– Ce procédé permet de “démonter” une matrice complexe en composantes plus simples, révélant la structure interne des relations entre variables.
– En finance, cette idée est exploitée par l’analyse en composantes principales (ACP), une méthode qui identifie les facteurs dominants expliquant la majorité de la variance dans un ensemble de données.
– L’ACP est utilisée pour réduire la complexité des modèles, détecter les corrélations cachées et mieux comprendre les sources de risque d’un portefeuille.
Exemple concret :
Un gestionnaire d’actifs analyse les rendements de 200 actions. L’ACP lui montre que trois composantes principales suffisent à expliquer 85 % des variations totales. Ces trois composantes représentent les grands moteurs de marché (par exemple, la conjoncture mondiale, les taux d’intérêt et le secteur technologique).
2- Concepts clés
– Décomposition spectrale : toute matrice symétrique peut être représentée sous la forme : A = Q Λ Qᵀ, où Q contient les vecteurs propres et Λ les valeurs propres sur la diagonale.
Cette décomposition permet de “voir” comment la variance totale se répartit entre les différentes directions (vecteurs propres).
En finance, cela correspond à identifier les facteurs qui expliquent le plus de risque ou de rendement.
– Analyse en composantes principales (ACP) :
C’est une application directe de la décomposition spectrale à la matrice de covariance ou de corrélation.
L’ACP transforme des variables corrélées (comme les rendements d’actions) en nouvelles variables indépendantes appelées “composantes principales”.
Chaque composante correspond à une direction de variance maximale et est associée à une valeur propre mesurant son importance.
– Valeur propre dans l’ACP : indique la part de variance expliquée par la composante.
Plus la valeur propre est grande, plus la composante est importante.
La somme de toutes les valeurs propres correspond à la variance totale du système.
– Vecteur propre dans l’ACP : représente la combinaison linéaire d’actifs (ou de variables) associée à la composante principale.
En finance, il peut être interprété comme un “facteur latent” ou un “moteur de risque”.
3- Règles et hypothèses
– La matrice utilisée pour une ACP doit être symétrique et positive semi-définie (comme une matrice de covariance ou de corrélation).
– Les composantes principales sont toujours orthogonales (non corrélées entre elles).
– Le nombre maximal de composantes principales est égal au nombre de variables initiales, mais dans la pratique, seules les plus grandes valeurs propres sont retenues.
– En général, on retient assez de composantes pour expliquer au moins 80 % de la variance totale, mais le seuil dépend du contexte d’analyse.
– Une ACP ne crée pas de nouvelles informations : elle réorganise les données existantes de manière à les rendre plus lisibles et interprétables.
4- Applications concrètes
– Gestion de portefeuille et gestion du risque :
L’ACP aide à identifier les principaux moteurs de risque d’un portefeuille.
Exemple : une première composante peut représenter le facteur “marché global”, une seconde le facteur “taux d’intérêt” et une troisième le facteur “secteur technologique”.
En ne suivant que ces quelques facteurs, le gestionnaire peut simplifier le suivi du risque sans perdre d’information essentielle.
– Réduction de dimension :
En finance quantitative, les bases de données contiennent souvent des centaines de variables (rendements, ratios, indices). L’ACP permet de réduire ces dimensions sans perte majeure d’information.
Cela accélère les calculs et améliore la stabilité des modèles.
– Stress tests et gestion systémique :
Les banques centrales utilisent l’ACP pour mesurer la concentration du risque systémique.
Si une seule composante principale explique une part de variance anormalement élevée, cela signifie que le système est dominé par un facteur unique (souvent le marché global), rendant la contagion plus probable en période de crise.
– Évaluation de produits financiers complexes :
Dans les modèles de taux d’intérêt, l’ACP est utilisée pour décomposer la courbe des taux en trois composantes : le niveau, la pente et la courbure.
Cette méthode aide à comprendre les mouvements de la courbe de rendement et à calibrer les produits dérivés.
– Apprentissage automatique appliqué à la finance :
L’ACP est souvent utilisée comme étape préalable à la modélisation pour réduire le bruit et éviter la redondance entre variables.
Cela permet d’entraîner des modèles plus rapides et plus robustes.
Exemple concret :
Une institution financière utilise l’ACP pour résumer les données macroéconomiques (taux, inflation, chômage, PIB, indices boursiers) en quelques composantes principales. Ces composantes sont ensuite intégrées dans un modèle prédictif de risque de défaut pour des prêts d’entreprises.
5- Matière complémentaire
– L’ACP repose sur la géométrie des données : chaque observation peut être vue comme un point dans un espace multidimensionnel. La méthode cherche les axes (vecteurs propres) qui expliquent le mieux la dispersion des points.
– En finance, cette approche est particulièrement utile pour comprendre les sources communes de variation dans les rendements, les prix d’obligations ou les spreads de crédit.
– Les valeurs propres peuvent aussi servir à détecter des anomalies : une valeur propre très faible indique une variable presque redondante, tandis qu’une valeur propre exceptionnellement grande peut signaler une corrélation excessive ou un effet de marché unique.
– Dans les systèmes dynamiques, la décomposition spectrale est également utilisée pour simuler la réaction du système à différents chocs (exemple : une hausse du taux directeur ou une chute du prix du pétrole).
– L’ACP est à la base de nombreux modèles modernes de gestion du risque, comme le “Principal Component VaR”, qui estime la Value-at-Risk à partir des composantes principales plutôt que de la covariance complète.
Séance 2
🟩 Fiche 9 — Variables aléatoires et fonctions de distribution
[Notions fondamentales et applications en finance]
1- Objectif et usage
– Les probabilités servent à mesurer l’incertitude des phénomènes économiques et financiers.
– Une variable aléatoire est une grandeur numérique dont la valeur dépend du hasard : elle permet de modéliser un rendement boursier, un taux d’intérêt futur ou une perte potentielle.
– Les fonctions de distribution (probabilités, densités et cumulatives) décrivent comment cette incertitude se répartit.
– En finance, ces notions sont indispensables pour estimer les rendements attendus, les risques de perte, les prix d’options ou la Value-at-Risk (VaR).
Exemple concret :
Le rendement quotidien d’une action est une variable aléatoire ; la probabilité qu’il soit supérieur à 2 % ou inférieur à –1 % dépend de la distribution de cette variable.
2- Concepts clés
– Variable aléatoire discrète : prend un nombre fini ou dénombrable de valeurs possibles.
Exemples :
– nombre de défauts de paiement dans un portefeuille de prêts ;
– nombre de jours positifs sur une semaine boursière.
Chaque valeur possible a une probabilité associée p(x).
Les deux propriétés essentielles sont :
1. Toutes les probabilités sont comprises entre 0 et 1.
2. La somme des probabilités pour tous les résultats vaut 1.
– Variable aléatoire continue : peut prendre une infinité de valeurs dans un intervalle.
Exemples : taux d’intérêt, rendement journalier d’un indice, durée d’un prêt.
Sa distribution est décrite par une fonction de densité de probabilité (pdf) f(x).
La probabilité qu’un résultat appartienne à un intervalle [a,b] correspond à l’aire sous la courbe de f(x) entre a et b.
– Fonction de distribution cumulative (cdf) :
Définit la probabilité qu’une variable X prenne une valeur inférieure ou égale à x.
Cette fonction augmente toujours de 0 à 1 et donne une vue globale du risque accumulé.
Exemple concret :
La cdf d’un rendement boursier indique la probabilité d’obtenir un rendement inférieur à une certaine valeur. Si F(–0,05)=0,15, cela signifie qu’il y a 15 % de chance de perdre au moins 5 % sur la période considérée.
3- Règles et hypothèses
– La somme des probabilités d’une variable discrète ou l’aire totale sous une densité continue est toujours égale à 1.
– Une variable aléatoire peut être positive, négative ou nulle, selon la nature du phénomène étudié.
– Les distributions discrètes sont utilisées pour des événements isolés ; les distributions continues pour des phénomènes mesurables.
– La distribution d’une variable financière dépend souvent du temps : les rendements sont plus volatils sur de longues périodes.
– Les distributions peuvent être symétriques (ex. loi normale) ou asymétriques (ex. loi log-normale pour les prix d’actifs).
4- Applications concrètes
– Modélisation du rendement d’un actif :
On considère le rendement quotidien d’une action comme une variable aléatoire continue. Sa distribution de probabilité décrit la fréquence des gains et des pertes.
– Gestion du risque :
Les institutions financières utilisent les distributions de pertes pour estimer la Value-at-Risk (VaR), c’est-à-dire la perte maximale probable à un certain niveau de confiance (souvent 95 % ou 99 %).
– Tarification des produits dérivés :
Les modèles de prix d’options (comme Black-Scholes) reposent sur la distribution log-normale des rendements futurs des actifs.
– Prévision et analyse macroéconomique :
Les distributions de probabilité servent à simuler des scénarios économiques : croissance, inflation, chômage, etc.
Chaque variable est considérée comme aléatoire, avec sa propre loi et ses corrélations avec les autres.
Exemple concret :
Une banque veut estimer la probabilité que la perte journalière dépasse 10 millions $. Elle modélise la perte comme une variable aléatoire continue et utilise la cdf pour calculer cette probabilité.
5- Matière complémentaire
– Les distributions sont souvent paramétrées : moyenne, variance, asymétrie et aplatissement caractérisent leur forme. Ces paramètres seront approfondis dans les prochaines fiches (espérance, variance, moments).
– Dans les données financières réelles, les distributions ne sont pas toujours normales : elles présentent souvent des queues épaisses (forte probabilité d’événements extrêmes).
– En statistique appliquée, connaître la forme d’une distribution aide à choisir les bons tests, intervalles de confiance ou modèles de prévision.
– Dans les algorithmes d’apprentissage automatique, les distributions servent à générer des variables simulées, à évaluer des probabilités conditionnelles ou à estimer des densités inconnues.
– Enfin, la compréhension des distributions de probabilité est la base de toute mesure de risque : sans elle, il est impossible d’évaluer la volatilité, la corrélation ou la diversification d’un portefeuille.
🟩 Fiche 10 — Probabilités conditionnelles, indépendance et théorème de Bayes
[Analyse des dépendances et mise à jour des informations en finance]
1- Objectif et usage
– Les probabilités conditionnelles permettent d’actualiser la probabilité d’un événement lorsque de nouvelles informations deviennent disponibles.
– En finance, elles servent à estimer le risque de défaut conditionnel à une information (par exemple, la dégradation d’une note de crédit), ou la probabilité d’un scénario économique donné après l’observation d’un indicateur.
– Ces concepts sont à la base de la théorie de la décision, de l’évaluation du risque et de nombreux modèles bayésiens utilisés dans la finance quantitative et la gestion de portefeuille.
Exemple concret :
Si la probabilité qu’une entreprise fasse faillite est de 5 %, mais passe à 20 % après une baisse importante de son chiffre d’affaires, on utilise une probabilité conditionnelle pour mettre à jour cette information.
2- Concepts clés
– Probabilité inconditionnelle : c’est la probabilité d’un événement sans tenir compte d’autres informations.
Exemple : la probabilité qu’une action augmente demain, indépendamment du marché global.
– Probabilité conditionnelle : mesure la probabilité d’un événement sachant qu’un autre événement s’est produit.
Exemple : la probabilité qu’une action baisse (A) sachant qu’une récession est annoncée (B).
– Probabilité conjointe : c’est la probabilité que deux événements se produisent simultanément.
Exemple : la probabilité qu’un taux d’intérêt augmente et qu’un titre obligataire baisse en même temps.
– Relation clé : la probabilité conditionnelle s’écrit comme le rapport entre la probabilité conjointe et la probabilité de la condition.
Autrement dit, P(A|B) = P(A ∩ B) / P(B).
Cela permet de “pondérer” un événement par les informations nouvelles liées à B.
– Événements indépendants : deux événements sont indépendants si la réalisation de l’un n’affecte pas la probabilité de l’autre.
Cela signifie que P(A ∩ B) = P(A) × P(B).
Exemple : la probabilité qu’un titre boursier monte n’est pas influencée par la météo, ces événements sont indépendants.
– Événements mutuellement exclusifs : deux événements ne peuvent pas se produire simultanément.
Exemple : “le taux d’intérêt augmente” et “le taux d’intérêt baisse” sont mutuellement exclusifs.
Dans ce cas, P(A ∩ B) = 0 et P(A ∪ B) = P(A) + P(B).
3- Règles et hypothèses
– Règle d’addition : la probabilité qu’au moins un des événements A ou B se produise est P(A ∪ B) = P(A) + P(B) – P(A ∩ B).
– Règle du produit : la probabilité que A et B se produisent est P(A ∩ B) = P(A|B) × P(B).
– Les probabilités conditionnelles sont dynamiques : elles changent à mesure que de nouvelles informations apparaissent.
– Si A et B sont indépendants, alors P(A|B) = P(A). Cela signifie que connaître B ne change rien à la probabilité de A.
– Dans la pratique financière, très peu d’événements sont vraiment indépendants : les marchés, taux et entreprises sont fortement interconnectés.
4- Théorème de Bayes
– Le théorème de Bayes est une méthode pour mettre à jour la probabilité d’un événement à partir d’une nouvelle information.
– Il s’écrit :
P(A|B) = [P(B|A) × P(A)] / P(B).
Cette formule relie la probabilité a priori (avant information) à la probabilité a posteriori (après observation).
Exemple concret :
Une agence de notation estime qu’une entreprise a 2 % de chances de faire défaut (P(A)=0,02).
Si elle publie un rapport signalant des difficultés (événement B), et que la probabilité d’un tel rapport en cas de défaut est de 90 % (P(B|A)=0,9), alors le théorème de Bayes permet de recalculer la probabilité de défaut après observation du rapport.
– En finance, Bayes est utilisé dans :
les modèles de prévision (mise à jour des probabilités de scénarios économiques),
les modèles de crédit (probabilité de défaut conditionnelle),
les algorithmes d’apprentissage (filtrage bayésien, classification des risques),
la gestion de portefeuille (ajustement des croyances sur le marché après de nouvelles données).
5- Applications concrètes
– Gestion du risque de crédit :
Les banques mettent à jour la probabilité de défaut d’un emprunteur à partir d’informations nouvelles (baisse du revenu, retard de paiement, changement de notation).
Le théorème de Bayes permet d’intégrer ces signaux pour ajuster le risque.
– Prévision de marché :
Les analystes financiers mettent à jour leurs prévisions après chaque annonce économique.
Exemple : la probabilité d’une hausse des taux de la Banque du Canada est recalculée à chaque nouvelle donnée sur l’inflation.
– Apprentissage automatique (machine learning) :
Les algorithmes de classification bayésienne (comme Naive Bayes) sont utilisés pour détecter des fraudes ou identifier des comportements d’investissement.
– Analyse d’événements financiers :
Bayes permet d’estimer la probabilité qu’un choc boursier soit suivi d’une reprise, selon l’historique des crises passées.
6- Matière complémentaire
– Le raisonnement bayésien est central en économie comportementale : il modélise la manière dont les agents mettent à jour leurs croyances à mesure qu’ils reçoivent de nouvelles informations.
– En gestion d’actifs, ce raisonnement est utilisé pour adapter les portefeuilles aux conditions de marché changeantes : la probabilité d’un scénario économique “haussier” augmente après plusieurs indicateurs positifs, et le gestionnaire ajuste ses positions en conséquence.
– Dans les modèles d’intelligence artificielle financière, Bayes sert à combiner plusieurs sources d’information (prix, volumes, données macroéconomiques) pour produire une estimation probabiliste cohérente.
– La probabilité conditionnelle est aussi utilisée dans la corrélation conditionnelle, un concept avancé qui décrit comment les liens entre actifs changent selon les conditions de marché (forte corrélation en crise, faible en temps normal).
– Enfin, la théorie de Bayes constitue le fondement de la finance bayésienne, un domaine où les décisions d’investissement reposent sur la mise à jour constante des croyances selon les nouvelles données observées.
🟩 Fiche 11 — Espérance, variance et écart-type
[Mesure du rendement moyen et du risque financier]
1- Objectif et usage
– L’espérance, la variance et l’écart-type sont les mesures les plus fondamentales de la statistique descriptive et de la théorie du risque.
– L’espérance représente la valeur moyenne attendue d’un phénomène aléatoire, tandis que la variance et l’écart-type mesurent la dispersion ou la volatilité des résultats autour de cette moyenne.
– En finance, ces concepts permettent de quantifier le rendement espéré d’un investissement et le risque associé à sa volatilité.
– Ces notions sont à la base du modèle moyenne-variance de Markowitz, des modèles de tarification d’actifs (CAPM) et de la Value-at-Risk (VaR).
Exemple concret :
Un investisseur compare deux actions. L’action A offre un rendement moyen de 8 % avec une faible volatilité, tandis que l’action B a un rendement moyen de 10 % mais très variable. L’espérance reflète la performance moyenne, la variance et l’écart-type indiquent le risque pris pour l’obtenir.
2- Concepts clés
– Espérance (ou moyenne attendue) :
L’espérance d’une variable aléatoire est la moyenne pondérée de toutes les valeurs possibles, où les poids sont les probabilités associées à chaque résultat.
Elle représente la tendance centrale du phénomène étudié.
En finance, elle correspond au rendement moyen attendu d’un actif ou d’un portefeuille.
Si une action a 50 % de chance de rapporter +10 % et 50 % de chance de perdre –5 %, son espérance est (0,5 × 10 %) + (0,5 × –5 %) = 2,5 %.
– Propriétés de l’espérance :
L’espérance d’une constante est cette constante elle-même.
L’espérance est linéaire : E(aX + bY) = aE(X) + bE(Y).
Si X et Y sont indépendantes, E(XY) = E(X) × E(Y).
Si elles ne le sont pas, E(XY) ≠ E(X)E(Y).
– Variance :
Mesure la dispersion des valeurs d’une variable aléatoire autour de sa moyenne.
En finance, la variance indique le risque associé à un rendement.
Une variance élevée signifie que les rendements sont instables et donc plus risqués.
Elle se calcule comme la moyenne des carrés des écarts à la moyenne.
– Écart-type :
C’est la racine carrée de la variance.
Il exprime le risque dans les mêmes unités que la variable (par exemple, en pourcentage de rendement).
Plus l’écart-type est grand, plus la volatilité du rendement est importante.
3- Règles et hypothèses
– Si X est une variable aléatoire et a, b des constantes :
E(aX + b) = aE(X) + b
Var(aX + b) = a²Var(X)
Ces relations sont essentielles pour ajuster les rendements lorsqu’on applique un levier financier (a) ou une prime fixe (b).
– Si X et Y sont indépendantes :
Var(X + Y) = Var(X) + Var(Y)
Cela signifie que la variance totale d’un portefeuille dépend de la somme des variances individuelles si les actifs ne sont pas corrélés.
– Si X et Y ne sont pas indépendantes :
Var(X + Y) = Var(X) + Var(Y) + 2Cov(X,Y)
Cette formule sera essentielle dans la fiche suivante sur la covariance et la corrélation.
4- Applications concrètes
– Gestion de portefeuille :
L’espérance est utilisée pour estimer le rendement moyen d’un portefeuille.
La variance et l’écart-type mesurent le risque global.
Un portefeuille optimal cherche à maximiser l’espérance du rendement pour un écart-type donné, ou à minimiser l’écart-type pour une espérance donnée.
– Analyse du risque :
Dans la Value-at-Risk (VaR), l’écart-type sert à estimer la perte maximale probable d’un portefeuille à un niveau de confiance donné.
Exemple : si la moyenne de rendement d’un portefeuille est de 1 % par jour avec un écart-type de 2 %, la VaR à 95 % correspond à une perte potentielle d’environ 2,3 % en une journée.
– Évaluation d’actifs :
Dans le modèle du CAPM, l’espérance du rendement d’un actif est liée à son risque systématique (mesuré par le bêta).
Les investisseurs exigent un rendement plus élevé pour compenser une variance ou un écart-type plus importants.
– Analyse macroéconomique :
Les économistes utilisent la variance pour mesurer l’incertitude de la croissance du PIB, de l’inflation ou du chômage.
Un écart-type élevé des prévisions économiques traduit une incertitude importante sur la stabilité future.
Exemple concret :
Deux obligations d’entreprise offrent le même rendement moyen de 5 %, mais la première a une variance plus faible. Les investisseurs rationnels préfèrent la première, car elle offre le même rendement avec un risque moindre.
5- Matière complémentaire
– En statistique financière, on distingue le risque diversifiable (spécifique à chaque actif) et le risque systématique (lié au marché global). L’écart-type combine ces deux types de risque.
– Dans les portefeuilles, la diversification réduit la variance tant que les rendements ne sont pas parfaitement corrélés.
– En théorie moderne du portefeuille, la matrice de variance-covariance est utilisée pour agréger les variances individuelles et mesurer le risque combiné.
– L’espérance est parfois ajustée pour tenir compte du risque, donnant lieu à des mesures comme le rendement espéré excédentaire (rendement moyen – taux sans risque).
– Enfin, la variance et l’écart-type sont à la base de nombreux indicateurs de performance, tels que le ratio de Sharpe, qui compare le rendement excédentaire à la volatilité du portefeuille.
🟩 Fiche 12 — Covariance, corrélation et dépendance linéaire
[Relations entre variables et mesure de la diversification]
1- Objectif et usage
– La covariance et la corrélation mesurent la manière dont deux variables évoluent ensemble.
– En finance, ces notions sont essentielles pour comprendre comment les actifs d’un portefeuille interagissent entre eux : si leurs rendements évoluent dans le même sens ou non.
– Ces mesures permettent d’évaluer les avantages de la diversification et de construire des portefeuilles plus efficaces.
Exemple concret :
Si les actions d’une banque et d’une compagnie d’assurance montent ou baissent souvent ensemble, leur covariance est positive. Si elles évoluent en sens opposé, la covariance est négative. Cette relation influence directement le risque total du portefeuille.
2- Concepts clés
– Covariance : mesure la tendance commune de deux variables à s’écarter de leurs moyennes respectives.
Si les valeurs de X et Y augmentent ou diminuent ensemble, la covariance est positive.
Si elles évoluent en sens inverse, la covariance est négative.
Si elle est proche de zéro, les variables ne présentent pas de relation linéaire forte.
En finance, la covariance entre deux rendements indique si les actifs sont influencés par les mêmes facteurs de marché.
– Corrélation : mesure la force et la direction de la relation linéaire entre deux variables.
Elle est normalisée entre –1 et +1.
Une corrélation de +1 signifie une relation parfaitement positive (les variables évoluent ensemble).
Une corrélation de –1 signifie une relation parfaitement négative (elles évoluent en sens opposé).
Une corrélation de 0 signifie absence de relation linéaire.
Contrairement à la covariance, la corrélation n’a pas d’unité de mesure et permet de comparer plus facilement différentes relations.
– Relation entre covariance et corrélation :
La corrélation est la covariance divisée par le produit des écarts-types des deux variables.
Cela permet d’évaluer la dépendance relative sans être influencé par les unités de mesure.
3- Règles et hypothèses
– Si X et Y sont indépendantes, leur covariance est nulle.
– La covariance de X avec elle-même est égale à sa variance.
– Si a, b, c et d sont des constantes, Cov(aX + b, cY + d) = a × c × Cov(X, Y).
– Dans un portefeuille, la variance totale dépend à la fois des variances individuelles et des covariances croisées entre actifs.
– La corrélation ne mesure que la relation linéaire : deux variables peuvent être dépendantes sans être corrélées (cas de relation non linéaire).
Exemple concret :
Deux actions affichent une covariance positive mais une corrélation modérée. Cela signifie qu’elles partagent certains facteurs communs (comme la conjoncture économique), mais que leur relation n’est pas parfaitement proportionnelle.
4- Applications concrètes
– Gestion de portefeuille :
La covariance et la corrélation déterminent la structure de la matrice de variance-covariance du portefeuille.
Cette matrice permet de calculer la variance globale du portefeuille et donc son risque total.
Si les actifs ont une faible corrélation entre eux, le risque global est réduit grâce à la diversification.
– Diversification :
L’objectif d’un portefeuille diversifié est de combiner des actifs dont les corrélations sont faibles ou négatives.
Cela permet d’atténuer les pertes d’un actif par les gains d’un autre.
Exemple : combiner actions et obligations permet de réduire la variance totale, car ces deux classes d’actifs réagissent souvent différemment aux cycles économiques.
– Gestion du risque systématique et spécifique :
Le risque total d’un portefeuille se décompose en risque systématique (lié au marché global) et risque spécifique (lié à chaque actif).
Les covariances capturent la part du risque liée aux interactions entre actifs, donc au risque systématique.
– Modélisation économique :
En macroéconomie, la covariance sert à mesurer la co-mobilité des indicateurs : par exemple, comment la croissance du PIB et l’inflation évoluent ensemble.
Une corrélation élevée entre PIB et consommation traduit une économie cohérente, tandis qu’une corrélation faible signale une instabilité.
Exemple concret :
Si les rendements de deux actions ont une corrélation de +0,95, elles évoluent presque toujours dans le même sens. Les détenir ensemble ne réduit pas le risque. En revanche, une corrélation de –0,3 entre une action et une obligation améliore la diversification.
5- Matière complémentaire
– La corrélation peut varier selon les périodes : les actifs deviennent souvent plus corrélés pendant les crises financières, phénomène appelé “contagion du risque”.
– Les modèles de corrélation dynamique (comme DCC-GARCH) sont utilisés pour suivre ces variations dans le temps.
– Les corrélations élevées sont un signal de concentration du risque : elles indiquent que le portefeuille est trop exposé à un même facteur économique.
– Dans les stratégies quantitatives, les corrélations sont utilisées pour construire des portefeuilles de couverture (hedging) : un actif est choisi pour compenser le mouvement d’un autre.
– En gestion du risque systémique, les matrices de corrélation servent à détecter les interconnexions entre institutions financières. Une hausse de la corrélation moyenne entre banques est souvent interprétée comme un signe de fragilité collective.
🟩 Fiche 13 — Moments, asymétrie (skewness) et kurtosis
[Analyse de la forme des distributions et évaluation des risques extrêmes]
1- Objectif et usage
– Les moments d’une distribution décrivent sa forme, au-delà de la moyenne et de la variance.
– Ils permettent d’analyser la symétrie, l’épaisseur des queues et la concentration des valeurs autour de la moyenne.
– En finance, ces mesures servent à évaluer les risques non captés par la variance, notamment les événements extrêmes (crises, pertes massives) qui ne sont pas bien modélisés par la loi normale.
– L’étude des moments supérieurs (skewness et kurtosis) complète la vision du risque en ajoutant des dimensions qualitatives à la distribution des rendements.
Exemple concret :
Deux portefeuilles peuvent avoir le même rendement moyen et la même volatilité, mais des profils de risque très différents. L’un peut avoir une forte probabilité de perte extrême (kurtosis élevée), tandis que l’autre présente une distribution plus équilibrée.
2- Concepts clés
– Moments d’une distribution :
Le moment d’ordre k d’une variable aléatoire X est la moyenne pondérée des puissances de X.
Chaque moment donne une information spécifique :
Moment d’ordre 1 → moyenne (position).
Moment d’ordre 2 → variance (dispersion).
Moment d’ordre 3 → asymétrie (skewness).
Moment d’ordre 4 → aplatissement (kurtosis).
– Moments centraux :
Calculés autour de la moyenne, ils mesurent la dispersion relative des valeurs par rapport à cette moyenne.
Les moments centraux d’ordre 3 et 4 sont utilisés pour la skewness et la kurtosis.
– Asymétrie (skewness) :
Mesure la symétrie de la distribution.
Si la distribution est symétrique, la skewness est égale à zéro.
Si la skewness est positive, la distribution est étirée vers la droite (plus de gains extrêmes possibles).
Si elle est négative, la distribution est étirée vers la gauche (plus de pertes extrêmes).
En finance, une skewness négative est considérée comme un signe de risque : il y a plus de chances de pertes importantes que de gains exceptionnels.
– Kurtosis (aplatissement) :
Mesure l’épaisseur des queues de la distribution et la concentration autour de la moyenne.
Une kurtosis élevée indique une probabilité plus forte d’événements extrêmes (crises, bulles, krachs).
Si la kurtosis est inférieure à celle d’une loi normale, la distribution est dite “aplatie” (moins de valeurs extrêmes).
Si elle est supérieure, elle est “leptokurtique” (plus de valeurs extrêmes).
Les rendements financiers sont souvent leptokurtiques : plus de chocs extrêmes qu’attendu sous une loi normale.
3- Règles et hypothèses
– Skewness > 0 : la distribution favorise les rendements élevés (effet positif).
– Skewness < 0 : la distribution favorise les pertes importantes (effet négatif).
– Kurtosis normale = 3 (loi normale).
– Kurtosis > 3 : queues épaisses, événements extrêmes plus probables.
– Kurtosis < 3 : queues fines, distribution plus concentrée.
– Les investisseurs préfèrent, à espérance et variance égales, une skewness positive et une kurtosis faible (plus de chances de gains modérés et moins de pertes extrêmes).
4- Applications concrètes
– Gestion du risque :
Les gestionnaires de portefeuille surveillent la skewness et la kurtosis pour anticiper les chocs extrêmes.
Une skewness négative indique une asymétrie défavorable du risque : fortes pertes potentielles.
Une kurtosis élevée signale un portefeuille vulnérable aux événements rares, comme les crises de marché.
– Évaluation des performances :
Les ratios de performance ajustés au risque, comme le ratio de Sharpe modifié, intègrent la skewness et la kurtosis pour corriger les biais dus aux distributions non normales.
– Modélisation et simulation :
Les modèles de prévision (GARCH, Student-t, distributions mixtes) utilisent des paramètres de skewness et kurtosis pour représenter plus fidèlement les rendements observés.
Cela permet d’obtenir des prévisions de risque plus réalistes que celles basées sur la loi normale.
– Marchés dérivés et options :
La skewness est à l’origine du phénomène de “volatility skew” : les options de vente (puts) sont souvent plus chères car les investisseurs se couvrent contre les fortes baisses.
La kurtosis explique pourquoi les marchés attribuent une valeur plus élevée aux options éloignées du prix courant (deep out-of-the-money), car elles protègent contre les événements extrêmes.
– Macroéconomie et finance comportementale :
Une distribution des rendements très asymétrique traduit des comportements d’aversion ou de recherche du risque.
En période d’incertitude, les distributions de rendements deviennent plus asymétriques et leptokurtiques (plus de pertes soudaines et de volatilité).
Exemple concret :
Le rendement d’un indice boursier comme le S&P 500 a souvent une skewness négative et une kurtosis supérieure à 3. Cela signifie que les fortes baisses (crashes) sont plus fréquentes que ce que prédit la loi normale.
5- Matière complémentaire
– Les moments supérieurs sont utilisés dans la théorie moderne du portefeuille étendue (Higher-Moment CAPM), qui intègre la skewness et la kurtosis dans la décision d’investissement.
– Les investisseurs institutionnels mesurent ces moments pour comparer la qualité du risque : deux portefeuilles avec la même volatilité peuvent présenter des risques très différents en termes de pertes extrêmes.
– Les distributions financières réelles sont rarement normales : elles sont souvent asymétriques et leptokurtiques, ce qui explique pourquoi les modèles linéaires simples sous-estiment le risque.
– Dans la Value-at-Risk ajustée, la skewness et la kurtosis servent à corriger les estimations de pertes extrêmes.
– Enfin, la compréhension de ces mesures est essentielle pour calibrer correctement les modèles stochastiques utilisés en finance quantitative et en gestion du risque.
🟩 Fiche 14 — Introduction à l’optimisation
[Principes, cadre général et applications financières]
1- Objectif et usage
– L’optimisation est la science du “meilleur choix” : elle consiste à déterminer les valeurs d’un ensemble de variables qui maximisent ou minimisent une fonction donnée.
– En finance, elle permet de construire des portefeuilles optimaux, de réduire les coûts, de fixer des prix ou d’allouer efficacement des ressources.
– L’optimisation est au cœur de la finance quantitative : chaque décision d’investissement ou de gestion du risque repose sur la recherche d’un équilibre entre rendement espéré et risque.
– Dans un cadre général, on cherche à maximiser ou minimiser une fonction objectif sous certaines contraintes.
Exemple concret :
Un gestionnaire souhaite répartir un capital de 10 millions entre trois actifs pour maximiser le rendement attendu, tout en maintenant le risque (variance) sous un certain seuil. Ce problème est un exemple typique d’optimisation sous contrainte.
2- Concepts clés
– Fonction objectif : c’est la fonction que l’on cherche à maximiser (ex. rendement, profit) ou à minimiser (ex. risque, coût).
– Variables de décision : ce sont les paramètres que l’on peut contrôler ou ajuster (ex. montant investi dans chaque actif, quantité produite).
– Contraintes : ce sont les conditions que la solution doit respecter (ex. budget total, niveau de risque, réglementation).
– Région admissible : ensemble de toutes les solutions possibles qui respectent les contraintes.
– Solution optimale : la combinaison de variables qui donne la valeur maximale ou minimale de la fonction objectif parmi toutes les solutions admissibles.
– L’optimisation peut prendre plusieurs formes :
Sans contrainte : la fonction est libre, sans restriction sur les variables.
Avec contraintes : certaines valeurs sont interdites ou limitées.
Linéaire : la fonction et les contraintes sont linéaires.
Non linéaire : la fonction ou les contraintes impliquent des termes au carré, des produits ou des racines.
3- Règles et hypothèses
– La forme de la fonction et des contraintes détermine la nature du problème :
Si la fonction et les contraintes sont convexes, le problème d’optimisation est convexe et admet une solution unique et stable.
Si elles ne le sont pas, il peut exister plusieurs solutions locales (problème non convexe).
– En finance, on cherche souvent à minimiser le risque (variance) pour un rendement donné ou à maximiser le rendement pour un risque donné.
– Les méthodes de résolution varient selon la structure du problème :
Méthodes analytiques (dérivées, équations de Lagrange).
Méthodes numériques (algorithmes, simulations, programmation).
– Les contraintes traduisent souvent des réalités économiques :
Un portefeuille doit respecter un budget.
Les positions ne peuvent pas être négatives (pas de ventes à découvert).
Le rendement minimal exigé doit être atteint.
4- Applications concrètes
– Gestion de portefeuille (Markowitz) :
Minimiser la variance (risque) sous contrainte d’un rendement espéré.
Résultat : la frontière efficiente, qui regroupe les portefeuilles offrant le meilleur compromis risque-rendement.
– Finance d’entreprise :
Minimiser le coût du capital ou maximiser la valeur de l’entreprise en choisissant la combinaison optimale de dettes et de capitaux propres.
Exemple : choisir la structure de financement qui maximise la rentabilité financière sans dépasser un seuil de risque.
– Économie et macroéconomie :
Les gouvernements utilisent des modèles d’optimisation pour allouer les ressources publiques (santé, éducation, infrastructures) en maximisant le bien-être social sous contrainte budgétaire.
– Gestion du risque et assurance :
Les compagnies d’assurance utilisent l’optimisation pour fixer les primes qui maximisent le profit attendu tout en respectant les exigences de solvabilité.
– Trading algorithmique et intelligence artificielle :
Les modèles d’IA optimisent les stratégies de trading en ajustant automatiquement les poids des portefeuilles selon la volatilité du marché et les corrélations entre actifs.
Exemple concret :
Un fonds quantitatif définit une fonction objectif qui maximise le ratio de Sharpe (rendement excédentaire sur volatilité). Les variables de décision sont les pondérations des actifs, et les contraintes imposent une exposition maximale à certains secteurs.
5- Matière complémentaire
– L’optimisation constitue la base de nombreux domaines de la finance moderne :
Markowitz (1952) : modèle moyenne-variance.
Sharpe (1964) : modèle CAPM dérivé d’un problème d’optimisation sous contrainte.
Black-Scholes (1973) : valorisation d’options fondée sur une optimisation du portefeuille répliquant.
– Les algorithmes d’optimisation numérique (comme le gradient, la méthode de Newton, ou les algorithmes génétiques) sont utilisés pour résoudre les problèmes complexes où la solution analytique est impossible.
– En intelligence artificielle, l’optimisation intervient dans l’apprentissage des modèles : chaque réseau neuronal ajuste ses paramètres pour minimiser une fonction de perte, ce qui revient à un problème d’optimisation.
– En finance, les contraintes éthiques, réglementaires ou environnementales (ESG) ajoutent de nouvelles dimensions à l’optimisation moderne des portefeuilles.
– Enfin, la compréhension du cadre général de l’optimisation est essentielle pour les prochaines fiches sur les méthodes analytiques (Lagrange) et les programmes linéaires et quadratiques utilisés dans la gestion de portefeuille.
🟩 Fiche 15 — Optimisation sans et avec contraintes (méthode de Lagrange)
[Recherche des points optimaux et applications à la finance]
1- Objectif et usage
– L’optimisation sans et avec contraintes consiste à trouver les valeurs d’une ou plusieurs variables qui minimisent ou maximisent une fonction.
– En finance, ces méthodes servent à déterminer les pondérations optimales d’un portefeuille, le niveau de production ou la structure de coûts minimisant les dépenses, ou encore la frontière efficiente de Markowitz.
– La méthode de Lagrange est un outil mathématique qui permet d’intégrer directement les contraintes dans le calcul du point optimal, sans devoir les éliminer manuellement.
Exemple concret :
Un investisseur veut maximiser le rendement attendu d’un portefeuille sous la contrainte que la somme des pondérations des actifs soit égale à 1. Ce problème est typique d’une optimisation sous contrainte résolue par la méthode de Lagrange.
2- Concepts clés
– Optimisation sans contrainte :
On cherche les points critiques d’une fonction f(x) en annulant sa dérivée première : f’(x) = 0.
Ces points correspondent à des maxima, minima ou points d’inflexion.
Pour les distinguer, on analyse la dérivée seconde :
Si f’’(x) > 0 : minimum local.
Si f’’(x) < 0 : maximum local.
Si f’’(x) = 0 : point indéterminé (il faut examiner plus finement).
Cette méthode s’applique aux fonctions simples, comme celles représentant un coût ou un rendement sans restriction.
– Optimisation avec contraintes :
Certaines décisions sont limitées par des conditions économiques, budgétaires ou structurelles.
Ces contraintes sont exprimées sous la forme g(x) = 0 (égalité) ou h(x) ≤ 0 (inégalité).
La méthode de Lagrange permet d’intégrer ces contraintes dans une fonction appelée fonction de Lagrange :
L(x, λ) = f(x) + λ × [g(x)].
On résout ensuite les équations obtenues en annulant les dérivées partielles de L par rapport à x et λ.
– Multiplicateur de Lagrange (λ) :
λ mesure la variation du résultat optimal si la contrainte est légèrement assouplie.
En économie, il représente la “valeur marginale” d’une contrainte.
En finance, il peut être interprété comme le rendement marginal du capital investi ou la pénalité liée à une contrainte budgétaire.
3- Règles et hypothèses
– Si la fonction objectif et les contraintes sont différentiables, la méthode de Lagrange donne une condition nécessaire d’optimalité.
– La solution est optimale si :
le gradient de la fonction objectif est parallèle au gradient de la contrainte,
et que les contraintes sont respectées.
– Si plusieurs contraintes existent, on utilise un multiplicateur de Lagrange pour chacune d’elles.
– Pour les problèmes d’inégalités, on applique la version étendue appelée conditions de Kuhn-Tucker (utilisée en programmation quadratique).
– Les solutions peuvent être locales (valable dans une zone restreinte) ou globales (valable sur tout le domaine admissible).
4- Applications concrètes
– Portefeuille de Markowitz (optimisation quadratique) :
On minimise la variance du portefeuille Var(P) = wᵀΣw sous deux contraintes :
Somme des poids = 1.
Rendement attendu du portefeuille = rendement cible.
La fonction de Lagrange devient :
L(w, λ₁, λ₂) = wᵀΣw – λ₁(μᵀw – μ*) – λ₂(1ᵀw – 1).
La résolution donne les poids optimaux qui définissent la frontière efficiente.
– Maximisation du rendement sous contrainte de risque :
Un gestionnaire cherche le portefeuille qui maximise le rendement espéré μᵀw tout en respectant une limite de risque (écart-type).
La méthode de Lagrange intègre cette contrainte de volatilité directement dans le calcul.
– Minimisation des coûts de production :
Une entreprise souhaite minimiser ses coûts C(x, y) sous contrainte d’un niveau de production Q(x, y) = q*.
Le multiplicateur de Lagrange λ représente alors le coût marginal de production supplémentaire.
– Allocation optimale du capital :
Dans la finance d’entreprise, on peut modéliser la répartition optimale du capital entre plusieurs projets soumis à des budgets ou des risques différents.
Exemple concret :
Une banque souhaite maximiser ses revenus d’intérêts en prêtant un capital fixe entre des segments “ménages”, “entreprises” et “gouvernements”, tout en respectant une limite de risque globale. La méthode de Lagrange permet de déterminer combien allouer à chaque segment.
5- Matière complémentaire
– En finance quantitative, les méthodes de Lagrange sont généralisées dans des cadres plus complexes, comme l’optimisation stochastique (incertitude sur les variables) et l’optimisation dynamique (problèmes intertemporels).
– Les multiplicateurs de Lagrange apparaissent aussi dans les modèles économiques d’équilibre général (Walras, Arrow-Debreu) où ils représentent les prix implicites des ressources rares.
– En gestion de portefeuille, ces multiplicateurs peuvent être interprétés comme les “valeurs d’ombre” des contraintes : la valeur économique d’un assouplissement d’une contrainte de rendement ou de risque.
– Dans la programmation quadratique, la méthode de Lagrange est la base de tous les algorithmes de résolution numérique utilisés par les logiciels d’optimisation financière (Excel Solver, Matlab, R, Python).
– Enfin, cette méthode est à la base des modèles d’arbitrage et de couverture : les conditions de non-arbitrage peuvent être vues comme des contraintes dont les multiplicateurs de Lagrange représentent les prix d’équilibre.
🟩 Fiche 16 — Programmation linéaire et quadratique
[Optimisation sous contraintes et applications financières]
1- Objectif et usage
– La programmation linéaire et quadratique regroupe les méthodes mathématiques permettant d’optimiser une fonction sous contraintes, lorsque cette fonction est linéaire ou quadratique.
– Ces approches sont fondamentales dans la modélisation économique et financière car elles traduisent rigoureusement des problèmes de décision : allocation de ressources, planification budgétaire, gestion de portefeuille ou tarification d’actifs.
– En finance, elles servent principalement à minimiser le risque pour un rendement donné ou à maximiser le rendement pour un niveau de risque fixé.
Exemple concret :
Le modèle de Markowitz, qui permet de construire la frontière efficiente des portefeuilles, est un exemple classique de programmation quadratique : la fonction à minimiser (la variance) est quadratique, et les contraintes (budget, rendement) sont linéaires.
2- Concepts clés
– Programmation linéaire (PL) :
L’objectif et les contraintes sont des fonctions linéaires.
La solution optimale se situe toujours à un sommet de la région admissible, délimitée par les contraintes.
En économie, la PL modélise les problèmes d’allocation de ressources, de transport, de production ou de maximisation de profit.
Exemple : une entreprise veut maximiser son profit P = a₁x₁ + a₂x₂ sous contraintes de capacité et de coûts.
– Programmation quadratique (PQ) :
L’objectif est une fonction quadratique (souvent une somme de carrés), et les contraintes sont linéaires.
Cette forme permet de modéliser des situations où le coût ou le risque croît avec la variance des décisions.
Exemple : minimiser la variance d’un portefeuille (fonction quadratique) sous contrainte de budget et de rendement cible (contraintes linéaires).
– Forme générale d’un problème quadratique :
Minimiser f(x) = ½xᵀQx + cᵀx,
sous les contraintes : Aᵀx = b et x ≥ 0.
Q est une matrice symétrique et positive définie (garantissant une solution stable).
En finance, Q correspond souvent à la matrice de variance-covariance des rendements.
3- Règles et hypothèses
– Si la matrice Q est positive définie, la fonction est convexe, donc le problème a une solution unique et globale.
– Si Q est seulement semi-définie, le problème peut avoir plusieurs solutions optimales.
– Dans la programmation linéaire, on suppose que toutes les relations sont proportionnelles (pas d’effets d’échelle).
– Les contraintes linéaires forment une région admissible appelée polytope, dans laquelle on cherche le point optimal.
– En programmation quadratique, les contraintes restent linéaires, mais la courbure de la fonction objectif crée des solutions intérieures (non situées sur les frontières du polytope).
4- Applications concrètes
– Optimisation de portefeuille (Markowitz) :
Minimiser la variance du portefeuille (quadratique) sous contraintes de rendement et de budget.
Le résultat est la frontière efficiente, qui montre toutes les combinaisons optimales risque/rendement.
– Gestion du risque :
Minimiser la volatilité globale d’un portefeuille en tenant compte des covariances entre actifs.
Exemple : ajuster la pondération des actions, obligations et liquidités pour réduire la variance du portefeuille total.
– Arbitrage et couverture :
Trouver les positions optimales dans plusieurs produits dérivés pour couvrir un risque sous contrainte de coût minimal.
Exemple : minimiser l’écart entre le rendement du portefeuille et celui d’un indice de référence tout en respectant des contraintes réglementaires.
– Finance d’entreprise :
Maximiser le profit ou la valeur actuelle nette sous contraintes de capital, de capacité de production ou de structure financière.
Exemple : planifier les investissements d’une entreprise en respectant un budget fixe et des rendements minimums.
– Économie et planification :
Répartir les ressources d’un pays (travail, capital, matières premières) pour maximiser la production ou minimiser les coûts.
Ces modèles sont souvent utilisés par les gouvernements et les institutions internationales.
– Apprentissage automatique :
Les modèles de régression quadratique et les machines à vecteurs de support (SVM) utilisent la programmation quadratique pour minimiser les erreurs tout en respectant des contraintes de complexité.
Exemple concret :
Un gestionnaire souhaite minimiser le risque de son portefeuille composé de 5 actifs tout en garantissant un rendement annuel minimum de 7 %. Il définit un problème quadratique dont la matrice Q est la matrice de covariance des rendements et résout l’optimisation à l’aide d’un logiciel comme Excel Solver, R ou Python.
5- Matière complémentaire
– En pratique, la programmation linéaire est résolue avec des méthodes comme le simplexe ou les méthodes de points intérieurs, tandis que la programmation quadratique utilise des variantes du gradient conjugué ou de Newton-Raphson.
– Les outils logiciels les plus utilisés sont Excel Solver, Matlab, Python (SciPy, CVXOPT) et R (quadprog).
– En gestion de portefeuille avancée, on utilise la programmation quadratique stochastique, où les rendements sont eux-mêmes variables et incertains.
– Les contraintes peuvent aussi inclure des limites réglementaires (par exemple, une exposition maximale à un secteur) ou des conditions ESG (environnementales, sociales, de gouvernance).
– La programmation quadratique est également à la base du modèle Black-Litterman, qui combine les opinions des investisseurs avec les rendements de marché pour construire des portefeuilles équilibrés.
– En économie, ces modèles permettent de simuler des politiques publiques en optimisant des fonctions de bien-être social sous contraintes budgétaires.
🟩 Fiche 17 — Construction de portefeuille et frontière efficiente
[Modèle de Markowitz et théorie du compromis rendement–risque]
1- Objectif et usage
– La construction de portefeuille consiste à déterminer la combinaison d’actifs qui offre le meilleur équilibre entre rendement espéré et risque.
– La frontière efficiente, proposée par Harry Markowitz (1952), représente l’ensemble des portefeuilles optimaux qui maximisent le rendement attendu pour un niveau de risque donné, ou minimisent le risque pour un rendement cible.
– Ce modèle est à la base de toute la finance moderne : il structure la manière dont les investisseurs diversifient leurs portefeuilles, mesurent le risque et évaluent la performance.
Exemple concret :
Un investisseur détient des actions, des obligations et de la liquidité. En combinant ces trois classes d’actifs avec différentes pondérations, il obtient des portefeuilles ayant chacun un rendement et un risque différents. La frontière efficiente identifie les combinaisons optimales parmi toutes celles possibles.
2- Concepts clés
– Rendement espéré du portefeuille : c’est la moyenne pondérée des rendements espérés des actifs individuels.
– Risque du portefeuille : il est mesuré par la variance ou l’écart-type des rendements du portefeuille.
– Covariance et corrélation : ces mesures influencent la manière dont les actifs interagissent entre eux. Une faible corrélation réduit le risque global sans sacrifier le rendement.
– Diversification : en combinant des actifs imparfaitement corrélés, le portefeuille peut atteindre un niveau de risque plus faible qu’un portefeuille concentré.
– Frontière efficiente : c’est la courbe reliant les portefeuilles offrant le meilleur rapport rendement–risque. Les portefeuilles situés en dessous de cette frontière sont inefficaces (même rendement pour plus de risque).
– Portefeuille à risque minimal : c’est le point le plus à gauche de la frontière efficiente, celui où la variance est minimale.
– Portefeuille de marché : lorsque tous les investisseurs détiennent la même combinaison d’actifs risqués, ce portefeuille commun correspond au portefeuille de marché dans le modèle CAPM.
3- Règles et hypothèses
– Les rendements futurs des actifs sont considérés comme des variables aléatoires avec des moyennes, variances et covariances connues ou estimées.
– Les investisseurs sont averses au risque : ils préfèrent, à rendement égal, le portefeuille le moins risqué.
– La relation entre risque et rendement est quadratique (fonction moyenne–variance).
– Tous les investisseurs ont accès aux mêmes informations et peuvent prêter ou emprunter à un taux sans risque.
– Les portefeuilles sont évalués uniquement selon leurs deux premiers moments : la moyenne (rendement) et la variance (risque).
4- Applications concrètes
– Optimisation du portefeuille :
L’investisseur définit un objectif (minimiser la variance ou maximiser le rendement) et des contraintes (budget, rendement cible, interdiction de ventes à découvert).
À l’aide de la programmation quadratique, il obtient les pondérations optimales de chaque actif.
– Frontière efficiente :
Elle est obtenue en traçant la relation entre rendement et risque pour tous les portefeuilles optimaux possibles.
Sa partie concave montre que pour chaque niveau de risque, il existe un portefeuille unique offrant le rendement maximal.
– Portefeuille sans risque et ligne du marché des capitaux (CML) :
En introduisant un actif sans risque, on peut combiner ce dernier avec un portefeuille risqué optimal.
La droite reliant l’actif sans risque et le portefeuille risqué optimal s’appelle la CML (Capital Market Line).
Tout portefeuille situé sur cette droite est plus performant que ceux situés en dessous.
– Ratio de Sharpe :
Il mesure le rendement excédentaire par unité de risque.
Les investisseurs rationnels cherchent à maximiser ce ratio pour situer leur portefeuille sur la CML.
– Diversification sectorielle et géographique :
Les portefeuilles efficients incluent des actifs provenant de différentes régions ou secteurs pour réduire les covariances.
Exemple : combiner des actions canadiennes, américaines et européennes réduit le risque global si leurs rendements ne sont pas parfaitement corrélés.
Exemple concret :
Un gestionnaire calcule la variance et la corrélation entre cinq actifs. Après optimisation, il obtient la frontière efficiente : un portefeuille à 10 % de rendement avec 8 % de risque et un autre à 12 % de rendement avec 12 % de risque. En combinant ces portefeuilles, il peut choisir le meilleur compromis selon son aversion au risque.
5- Matière complémentaire
– Le modèle de Markowitz est la première application de la programmation quadratique en finance.
– Il a inspiré les modèles de tarification modernes, notamment le CAPM (Capital Asset Pricing Model), qui généralise la frontière efficiente à l’ensemble du marché.
– La diversification ne supprime pas le risque systématique, mais elle élimine le risque spécifique à chaque actif.
– En pratique, les matrices de covariance peuvent être instables ou mal estimées. Les gestionnaires utilisent alors des modèles de facteurs (ex. Fama-French) pour simplifier le calcul du risque.
– Les modèles récents intègrent aussi des contraintes supplémentaires : liquidité, ESG, ou objectifs multiples (rendement, volatilité, empreinte carbone).
– Les logiciels d’optimisation (Excel Solver, Python, R, Matlab) permettent de calculer la frontière efficiente à partir de données historiques ou simulées.
– Enfin, la compréhension de la frontière efficiente prépare l’étude des modèles d’équilibre des marchés (CAPM, APT), qui prolongent la logique de Markowitz en reliant risque et rendement à l’échelle du marché.
Séance 4
🟩 Fiche 18 — Introduction aux produits dérivés : définition et usages
[Concepts fondamentaux et fonctions économiques des produits dérivés]
1- Objectif et usage
– Un produit dérivé est un instrument financier dont la valeur dépend de celle d’un autre actif appelé sous-jacent.
– Le sous-jacent peut être un actif financier (actions, obligations, indices boursiers, devises) ou un actif réel (pétrole, gaz, or, céréales).
– Les produits dérivés sont essentiels pour la gestion du risque, la spéculation et l’arbitrage.
– Ils jouent un rôle fondamental dans la stabilité et l’efficience des marchés, car ils permettent de transférer, de répartir ou de neutraliser les risques financiers.
Exemple concret :
Une compagnie aérienne utilise un contrat à terme sur le pétrole pour se protéger contre une éventuelle hausse du prix du carburant. Ce contrat fixe à l’avance le prix d’achat du pétrole, réduisant ainsi l’incertitude liée aux coûts futurs.
2- Concepts clés
– Sous-jacent : actif dont dépend la valeur du produit dérivé.
Exemples : action (pour une option), indice boursier (pour un future), taux d’intérêt (pour un swap), devise (pour un contrat FX).
– Valeur dérivée : la valeur du contrat dépend du prix, du taux ou de la performance du sous-jacent.
– Position longue : engagement à acheter ou bénéficier de la hausse du sous-jacent.
– Position courte : engagement à vendre ou profiter de la baisse du sous-jacent.
– Prix d’exercice (K) : prix auquel le sous-jacent peut être acheté ou vendu.
– Maturité (T) : date à laquelle le contrat se règle ou expire.
3- Règles et hypothèses
– Tous les produits dérivés sont basés sur la notion de relation contractuelle future entre deux parties (acheteur et vendeur).
– La valeur du contrat évolue selon le prix du sous-jacent, le temps restant jusqu’à l’échéance, et la volatilité du marché.
– La plupart des contrats dérivés sont standardisés et échangés sur des marchés organisés (bourses), mais certains sont négociés de gré à gré (OTC – Over The Counter).
– L’évaluation d’un produit dérivé repose sur le principe d’absence d’arbitrage : il ne doit pas exister de stratégie sans risque permettant un profit certain.
4- Catégories principales de produits dérivés
– Contrats à terme (Forwards et Futures) : accords d’acheter ou de vendre un actif à une date future déterminée et à un prix fixé aujourd’hui.
Exemple : un producteur de blé vend un contrat à terme pour sécuriser le prix de sa récolte.
– Options : donnent le droit (mais non l’obligation) d’acheter (call) ou de vendre (put) un actif à un prix prédéterminé.
Exemple : un investisseur achète une option d’achat sur une action pour profiter d’une hausse potentielle sans risquer plus que la prime payée.
– Swaps : accords d’échange de flux financiers futurs (par exemple, taux fixe contre taux variable).
Exemple : une entreprise à taux variable échange ses paiements d’intérêt contre un taux fixe pour stabiliser ses coûts financiers.
5- Usages des produits dérivés
– Gestion du risque (hedging) : protéger la valeur d’un portefeuille ou d’un actif contre des fluctuations de prix défavorables.
Exemple : un exportateur canadien vend des contrats à terme sur le dollar américain pour se protéger contre une baisse du taux de change USD/CAD.
– Spéculation : prendre une position pour tirer profit des mouvements futurs de prix.
Exemple : un trader anticipe une hausse du prix de l’or et achète un contrat à terme pour réaliser un gain sur la variation de prix.
– Arbitrage : exploiter les différences de prix entre marchés ou produits similaires pour réaliser un profit sans risque.
Exemple : un arbitrageur constate une différence entre le prix d’un contrat à terme sur le S&P 500 et le prix implicite calculé à partir des actions composant l’indice. Il prend des positions compensatoires pour en tirer profit.
6- Matière complémentaire
– Les produits dérivés constituent un marché gigantesque : le marché mondial des dérivés OTC dépasse 600 000 milliards de dollars en valeur notionnelle.
– Ils permettent de rendre les marchés plus liquides, car ils facilitent la couverture des risques et attirent davantage d’investisseurs.
– Cependant, leur mauvaise utilisation peut amplifier les crises financières (exemples : crise de 2008, produits dérivés de crédit).
– Les produits dérivés sont souvent utilisés conjointement : par exemple, un futur combiné à une option peut créer une stratégie complexe de couverture dynamique.
– En finance quantitative, la valorisation des dérivés repose sur des modèles stochastiques (binomial, Black-Scholes, Monte Carlo), basés sur l’évolution aléatoire du sous-jacent.
– La maîtrise des dérivés est donc essentielle non seulement pour la gestion du risque, mais aussi pour comprendre la structure des marchés financiers modernes.
🟩 Fiche 19 — Contrats à livrer, contrats à terme et absence d’arbitrage
[Structure, valorisation et rôle dans les marchés financiers]
1- Objectif et usage
Les contrats à livrer (forwards) et les contrats à terme (futures) sont des accords entre deux parties pour acheter ou vendre un actif sous-jacent à un prix fixé aujourd’hui, à une date future déterminée.
Ils permettent aux acteurs économiques de se protéger contre l’incertitude en fixant dès maintenant le prix d’une transaction à venir.
Ces instruments sont essentiels dans la gestion du risque sur les taux d’intérêt, les devises, les matières premières ou les actions.
Exemple concret :
Un importateur canadien sait qu’il devra payer 1 million de dollars américains dans trois mois. Pour se protéger contre une hausse du taux de change USD/CAD, il achète aujourd’hui un contrat à terme sur le dollar américain, ce qui fixe à l’avance son coût d’achat.
2- Concepts clés
Un contrat à livrer (forward) est un accord de gré à gré (OTC) entre deux contreparties. Il se règle à l’échéance, soit par la livraison physique de l’actif, soit par le paiement de la différence entre le prix du marché et le prix convenu. Ces contrats sont souvent utilisés entre institutions financières et grandes entreprises.
Un contrat à terme (future) est une version standardisée du forward, négociée sur un marché organisé. Les gains et pertes sont réglés quotidiennement grâce à une chambre de compensation, qui élimine le risque de contrepartie. Ces contrats sont très liquides et utilisés massivement pour la couverture et la spéculation.
Les éléments clés d’un contrat à terme sont :
le prix d’exercice (K), c’est-à-dire le prix convenu à l’avance pour la transaction future ;
la maturité (T), la date à laquelle le règlement aura lieu ;
la position longue, représentant la partie qui s’engage à acheter le sous-jacent ;
la position courte, représentant la partie qui s’engage à le vendre.
3- Règles et hypothèses
Lorsqu’un contrat est signé (au temps t = 0), sa valeur initiale est nulle : aucune des deux parties ne paie ni ne reçoit de montant à la signature.
Le prix à terme F(t, T) est défini de manière à ce qu’il n’existe aucune opportunité d’arbitrage.
Selon la loi du prix unique, deux portefeuilles générant les mêmes flux futurs doivent avoir le même prix aujourd’hui.
Si le sous-jacent ne verse pas de dividende et que le taux sans risque r est constant, alors la relation entre le prix actuel et le prix à terme est déterminée par la valorisation sans arbitrage.
Toute différence entre le prix théorique et le prix observé crée une opportunité d’arbitrage exploitable (voir fiche 21).
4- Mécanismes de couverture et de règlement
Le règlement physique consiste à livrer l’actif sous-jacent à la date d’échéance contre le paiement du prix convenu.
Le règlement financier consiste simplement à régler la différence entre le prix de marché et le prix contractuel.
Ces contrats sont principalement utilisés pour la couverture (hedging).
Par exemple, un agriculteur qui craint une baisse du prix du blé vend à terme sa récolte pour verrouiller son revenu futur.
À l’inverse, une entreprise qui doit acheter du cuivre à l’avenir prend une position longue pour se protéger contre une hausse du prix.
5- Différences entre contrats à livrer (forwards) et contrats à terme (futures)
Les contrats à livrer et les contrats à terme remplissent la même fonction, mais leurs caractéristiques opérationnelles diffèrent.
Marché :
Le contrat à livrer est négocié de gré à gré (OTC) entre deux parties.
Le contrat à terme est négocié sur un marché organisé, comme le CME ou Euronext.
Standardisation :
Le contrat à livrer est personnalisé selon les besoins des parties (montant, échéance, conditions spécifiques).
Le contrat à terme est standardisé : la taille, les échéances et les modalités sont fixées par la bourse.
Risque de contrepartie :
Dans un forward, ce risque est présent car aucune garantie n’assure le paiement futur.
Dans un future, il est éliminé grâce à la chambre de compensation, qui joue le rôle d’intermédiaire et garantit les transactions.
Liquidité :
Les forwards sont peu liquides, car ils sont uniques et négociés en privé.
Les futures sont très liquides, car ils sont standardisés et largement échangés.
Règlement :
Le contrat à livrer est réglé à l’échéance, en une seule fois.
Le contrat à terme est réglé quotidiennement selon le mécanisme du mark-to-market, où les gains et pertes sont ajustés chaque jour.
Flexibilité :
Le forward est très flexible, car il peut être adapté sur mesure.
Le future est moins flexible, car ses conditions sont imposées par le marché organisé.
6- Applications concrètes
Les forwards et futures sont utilisés dans de nombreux contextes financiers :
Marché des devises :
Les entreprises exportatrices ou importatrices utilisent ces contrats pour verrouiller leur taux de change futur.
Marché des matières premières :
Les producteurs (comme les compagnies pétrolières ou agricoles) sécurisent leurs revenus futurs en vendant leurs produits à terme.
Marché obligataire :
Les investisseurs se couvrent contre les variations des taux d’intérêt en vendant ou en achetant des contrats à terme sur obligations.
Marché boursier :
Les gestionnaires de fonds utilisent les futures sur indices (comme le S&P 500) pour se protéger contre les baisses de marché.
Exemple concret :
Une compagnie d’électricité vend un contrat à livrer sur le gaz naturel à trois mois à un prix de 2,80 $/Mcf.
Si le prix du gaz monte à 3,10 $, elle doit acheter sur le marché spot à ce prix, mais reçoit 2,80 $ du contrat, neutralisant ainsi l’effet de la hausse.
7- Matière complémentaire
Les contrats à terme et à livrer sont fondés sur le principe du transfert de risque : chaque partie choisit de transférer son exposition à un prix connu aujourd’hui.
Leur valorisation dépend de plusieurs facteurs, notamment :
le coût de portage (stockage, financement, assurance),
les dividendes ou revenus du sous-jacent,
la liquidité et les conditions de marché.
Ces modèles sont à la base de la théorie de l’arbitrage et du modèle de valorisation de Black–Scholes, utilisés pour les options.
De plus, les marchés à terme jouent un rôle central dans la formation des anticipations économiques :
le prix à terme reflète la perception collective du marché sur les prix futurs attendus.
Enfin, ces marchés favorisent la découverte des prix (price discovery) et améliorent la liquidité globale des marchés financiers.
🟩 Fiche 20 — Actif sans risque, vente à découvert et portefeuille auto-financé
[Concepts essentiels à la valorisation et à l’arbitrage]
1- Objectif et usage
Ces trois concepts — actif sans risque, vente à découvert et portefeuille auto-financé — sont à la base de toute la théorie de l’arbitrage et de la valorisation des produits dérivés.
Ils permettent de construire des portefeuilles de réplication et de déterminer le prix théorique des contrats à terme et des options.
Comprendre ces notions, c’est comprendre le fondement de la finance sans arbitrage, sur lequel repose la valorisation moderne.
Exemple concret :
Un gestionnaire crée un portefeuille combinant une obligation sans risque et une position courte sur une action pour reproduire le comportement d’un contrat à terme. Cette combinaison permet de fixer le prix du contrat de manière cohérente avec l’absence d’arbitrage.
2- Concepts clés
– Actif sans risque :
C’est un actif dont le rendement futur est connu avec certitude.
Typiquement, il s’agit d’une obligation d’État à court terme, utilisée comme référence dans les modèles financiers.
Son taux de rendement, appelé taux sans risque (r), sert à actualiser les flux futurs.
En pratique, le taux des bons du Trésor (à 3 mois ou 1 an) est souvent utilisé comme approximation du taux sans risque.
– Vente à découvert :
Consiste à vendre un actif que l’on ne possède pas, en le empruntant à un autre investisseur, dans l’espoir de le racheter plus tard à un prix plus bas.
Si le prix baisse, le vendeur à découvert réalise un profit.
Si le prix augmente, il subit une perte.
La vente à découvert permet donc de tirer profit d’une baisse anticipée d’un actif ou de construire un portefeuille équilibré (long/short).
Exemple concret :
Un investisseur pense que le titre A est surévalué par rapport au titre B. Il vend le titre A à découvert et achète le titre B. Si le marché corrige cette différence, il réalise un profit sans risque — c’est une stratégie d’arbitrage relative.
– Portefeuille auto-financé :
Un portefeuille est dit auto-financé lorsqu’il ne nécessite aucune injection ou retrait de capital après sa mise en place.
Tout ajustement de position est financé par la vente d’un autre actif dans le portefeuille.
Cela signifie que la valeur totale du portefeuille évolue uniquement selon les variations des prix de marché, et non selon de nouveaux apports.
Les modèles de valorisation des dérivés (comme Black–Scholes) reposent sur la création de portefeuilles auto-financés.
Exemple concret :
Un investisseur décompose une option en une position longue sur une action et une position courte sur un contrat à terme. Les variations de ces positions s’équilibrent de façon à maintenir la valeur du portefeuille sans ajout de capital : c’est un portefeuille auto-financé.
3- Règles et hypothèses
– Un actif sans risque a une volatilité nulle et un rendement certain : il ne comporte aucun risque de perte de capital ni de défaut.
– La vente à découvert implique un coût de financement (intérêts payés sur l’actif emprunté).
– Le portefeuille auto-financé est le point de départ de la réplication : s’il reproduit parfaitement les flux d’un produit dérivé, la valeur du dérivé doit être égale à la valeur du portefeuille, sinon il y aurait arbitrage.
– Dans un marché sans arbitrage, la valeur actuelle d’un actif est égale à la valeur actualisée de ses flux futurs au taux sans risque.
– Les marchés sont supposés parfaits : pas de coûts de transaction, pas de restrictions sur les ventes à découvert, et possibilité d’emprunter ou prêter au taux sans risque.
4- Applications concrètes
– Valorisation des contrats à terme :
Le prix à terme d’un actif est déterminé en comparant deux stratégies :
Acheter l’actif aujourd’hui et le détenir jusqu’à la date future.
Acheter un contrat à terme et investir le montant équivalent dans un actif sans risque.
En absence d’arbitrage, ces deux stratégies doivent donner le même résultat financier.
– Arbitrage avec vente à découvert :
Si le prix du contrat à terme est trop élevé par rapport au prix théorique, un investisseur peut vendre à découvert le contrat et acheter le sous-jacent, réalisant ainsi un profit sans risque.
– Réplication d’options :
Dans le modèle Black–Scholes, une option peut être reproduite (ou “répliquée”) par un portefeuille composé d’une action et d’un actif sans risque.
Ce portefeuille auto-financé assure que la variation de valeur de l’option est identique à celle du portefeuille sous-jacent.
– Gestion de portefeuille long/short :
Les stratégies dites “long/short equity” combinent des positions longues et des ventes à découvert pour neutraliser le risque de marché et se concentrer sur les différences de performance relative.
– Taux sans risque et actualisation :
Dans la gestion d’actifs, le taux sans risque sert de référence pour mesurer la performance ajustée au risque, comme le ratio de Sharpe ou le coût du capital.
Exemple concret :
Un investisseur souhaite détenir un portefeuille sans risque composé d’une obligation d’État (rendement certain de 2 %) et d’une position courte sur une action volatile. En ajustant continuellement les proportions, il obtient une exposition neutre au risque de marché, reproduisant ainsi la valeur d’un dérivé sans incertitude.
5- Matière complémentaire
– Les marchés sans arbitrage sont la base de toute la théorie de la valorisation. Si un arbitrage est possible, il sera immédiatement exploité, et les prix s’ajusteront pour rétablir l’équilibre.
– Le portefeuille auto-financé est le concept clé derrière les modèles de couverture dynamique : la variation du portefeuille compense exactement celle du produit dérivé.
– La vente à découvert est également une composante essentielle du mécanisme de correction des prix : elle permet aux investisseurs de ramener un actif surévalué vers sa valeur juste.
– En pratique, les ventes à découvert peuvent être limitées par la réglementation, ce qui crée parfois des inefficiences de marché.
– Enfin, l’actif sans risque sert non seulement à la valorisation, mais aussi à la mesure de performance : les rendements excédentaires par rapport au taux sans risque déterminent la prime de risque exigée par les investisseurs.
🟩 Fiche 21 — Arbitrage et détermination du prix à terme
[Principe de non-arbitrage et valorisation des contrats à terme]
1- Objectif et usage
L’arbitrage est le principe selon lequel il ne doit pas exister de stratégie permettant de réaliser un profit certain sans risque et sans investissement initial.
Ce principe fonde toute la valorisation moderne des produits dérivés, y compris le prix des contrats à terme.
En pratique, il permet de déterminer le prix théorique d’un actif dérivé en comparant deux stratégies équivalentes.
Exemple concret :
Un investisseur compare deux stratégies :
Acheter une action aujourd’hui et la financer en empruntant au taux sans risque.
Signer un contrat à terme pour acheter la même action dans trois mois.
En absence d’arbitrage, ces deux stratégies doivent coûter exactement la même chose.
2- Concepts clés
– Arbitrage : opportunité de profit certain obtenue en exploitant des différences de prix entre actifs ou marchés.
– Loi du prix unique : deux portefeuilles qui produisent les mêmes flux futurs doivent avoir le même prix aujourd’hui.
– Prix à terme théorique : déterminé de façon à éliminer toute opportunité d’arbitrage.
– Coût de portage : coûts liés à la détention de l’actif sous-jacent (financement, stockage, assurance).
– Prix spot (S₀) : prix actuel de l’actif sur le marché.
– Taux sans risque (r) : utilisé pour actualiser ou capitaliser les flux futurs.
3- Règles et hypothèses
– Les marchés sont supposés parfaits : pas de coûts de transaction, pas de taxes, et possibilité d’emprunter/prêter au taux sans risque.
– Le prix du contrat à terme est obtenu en égalisant le coût des deux stratégies suivantes :
Stratégie A : acheter l’actif aujourd’hui au prix spot et financer son coût.
Stratégie B : acheter un contrat à terme.
– En absence d’arbitrage, le prix à terme doit rendre ces stratégies équivalentes.
– Si le contrat est mal évalué, une stratégie de couverture (long/short) permet de réaliser un profit garanti, jusqu’à ce que le marché corrige l’écart.
4- Applications concrètes
– Arbitrage sur actions :
Si le prix à terme d’une action est supérieur à son prix théorique, un arbitrageur peut vendre le contrat à terme, acheter l’action au comptant et financer son achat par emprunt.
Le profit certain sera encaissé à l’échéance.
– Arbitrage sur devises :
Les contrats à terme sur devises (forward FX) doivent respecter la parité de taux d’intérêt couverte.
Sinon, un investisseur peut emprunter dans une devise, la convertir, investir dans l’autre devise, et verrouiller le taux de conversion futur via un forward.
– Arbitrage sur matières premières :
Le prix à terme doit inclure le coût de portage (stockage, assurance).
Si le contrat est trop cher, un arbitrageur peut vendre à terme la marchandise, l’acheter au comptant et supporter les frais de stockage.
– Arbitrage sur indices boursiers :
Le prix à terme d’un indice doit intégrer les dividendes attendus des actions composant l’indice.
Sinon, un arbitrageur peut ajuster une position entre l’indice et ses contrats à terme pour profiter de l’écart.
Exemple concret :
Supposons qu’une action vaut 100 $ aujourd’hui et que le taux sans risque annuel est de 5 %.
Un contrat à terme à un an devrait valoir environ 105 $.
Si le marché affiche un prix à terme de 110 $, un arbitrageur peut :
vendre le contrat à terme à 110 $,
acheter l’action à 100 $ en l’empruntant à 5 %,
et obtenir un profit garanti à l’échéance.
5- Matière complémentaire
– La valorisation par arbitrage est la base de tous les modèles modernes, y compris le Black–Scholes pour les options.
– En réalité, les frictions de marché (coûts de transaction, restrictions de ventes à découvert, risques de liquidité) peuvent limiter les opportunités d’arbitrage.
– L’arbitrage reste néanmoins un mécanisme essentiel de discipline des prix : les investisseurs corrigent rapidement les écarts, ce qui aligne les prix sur leur valeur théorique.
– En finance internationale, l’arbitrage sur devises est particulièrement utilisé par les banques pour garantir la cohérence entre taux d’intérêt et taux de change.
– Enfin, l’arbitrage est aussi au cœur des stratégies des hedge funds, qui exploitent des anomalies de prix temporaires sur différents marchés.
🟩 Fiche 22 — Options : définitions, notation et payoff
[Concepts fondamentaux des options et structure du rendement]
1- Objectif et usage
Une option est un contrat dérivé qui donne à son détenteur le droit, mais non l’obligation, d’acheter ou de vendre un actif à un prix déterminé (appelé prix d’exercice) avant ou à une date donnée (appelée échéance).
Les options permettent de se couvrir contre les fluctuations des prix, de spéculer sur les mouvements de marché ou de concevoir des stratégies de rendement asymétriques.
Exemple concret :
Un investisseur qui détient une action Apple à 180 $ peut acheter une option de vente (put) lui donnant le droit de vendre à 175 $.
Si le prix chute à 160 $, il exerce son option et limite sa perte à 5 $ par action — c’est une forme d’assurance contre le risque de baisse.
2- Concepts clés
– Option d’achat (call) : donne le droit d’acheter le sous-jacent à un prix donné (prix d’exercice K) avant ou à l’échéance.
– Option de vente (put) : donne le droit de vendre le sous-jacent à K avant ou à l’échéance.
– Acheteur (long) : paie une prime pour acquérir le droit lié à l’option.
– Vendeur (short) : reçoit la prime, mais prend une obligation potentielle (livrer ou acheter le sous-jacent selon le cas).
– Prix d’exercice (K) : prix fixé dans le contrat auquel l’actif peut être acheté (call) ou vendu (put).
– Échéance (T) : date à laquelle l’option arrive à expiration.
– Prime de l’option : prix payé pour acquérir l’option. Elle dépend du prix du sous-jacent, du temps restant, de la volatilité, du taux sans risque et des dividendes éventuels.
3- Types d’options
– Option européenne : ne peut être exercée qu’à l’échéance.
– Option américaine : peut être exercée à tout moment jusqu’à l’échéance.
– Option exotique : dépend de conditions spécifiques (ex. barrières, paniers d’actifs, options asiatiques).
4- Structure du payoff (gain brut) et du profit (gain net)
Le payoff correspond au résultat brut du contrat à l’échéance, tandis que le profit tient compte de la prime payée ou reçue.
Option d’achat (call) :
Payoff = max(S_T – K, 0)
Profit = max(S_T – K, 0) – prime
Option de vente (put) :
Payoff = max(K – S_T, 0)
Profit = max(K – S_T, 0) – prime
Exemple concret :
Un investisseur achète un call sur une action à K = 100 $ pour une prime de 5 $.
Si à l’échéance l’action vaut 120 $, son profit est de 15 $.
Si elle vaut 95 $, l’option expire sans valeur et sa perte est limitée à la prime (–5 $).
5- Moneyness (position du prix du sous-jacent par rapport au prix d’exercice)
– In the money (ITM) :
Call : S_T > K (l’option a une valeur positive).
Put : S_T < K (l’option a une valeur positive).
– At the money (ATM) : S_T ≈ K (l’option est à la limite d’être rentable).
– Out of the money (OTM) :
Call : S_T < K (l’option n’a aucune valeur à l’échéance).
Put : S_T > K (l’option n’a aucune valeur à l’échéance).
Exemple concret :
Une option d’achat sur une action à 50 $ :
Si le prix monte à 60 $, elle est in the money.
Si le prix reste à 50 $, elle est at the money.
Si le prix baisse à 40 $, elle est out of the money.
6- Valeur intrinsèque et valeur temps
– Valeur intrinsèque : différence entre le prix du sous-jacent et le prix d’exercice lorsqu’elle est positive.
Pour un call : max(S – K, 0).
Pour un put : max(K – S, 0).
– Valeur temps : partie de la prime qui reflète le potentiel futur de gain lié à la volatilité et au temps restant avant l’échéance.
Plus il reste de temps avant l’échéance, plus la valeur temps est élevée.
À l’échéance, la valeur temps est nulle.
Exemple concret :
Une option d’achat coûte 8 $, dont 5 $ de valeur intrinsèque et 3 $ de valeur temps.
Si l’action approche de son échéance sans variation du prix, la valeur temps diminue progressivement — c’est la décroissance temporelle (ou time decay).
7- Applications concrètes
– Couverture (hedging) :
Les entreprises utilisent des puts pour se protéger contre la baisse d’un actif.
Exemple : un producteur d’or achète un put pour garantir un prix minimal de vente de sa production.
– Spéculation :
Les investisseurs utilisent des calls pour parier sur une hausse du sous-jacent ou des puts pour miser sur une baisse.
L’effet de levier des options permet de réaliser des gains importants avec une mise initiale faible.
– Arbitrage :
Les relations entre puts, calls et sous-jacent permettent de repérer des incohérences de prix et d’en tirer profit (voir fiche 23 sur la parité put–call).
Exemple concret :
Un trader anticipe une forte volatilité à court terme sur Tesla. Il achète simultanément un call et un put (straddle). Quelle que soit la direction du mouvement, il profite d’un écart important du prix à l’échéance.
8- Matière complémentaire
– Les options sont des instruments asymétriques : le détenteur d’un call a un potentiel de gain illimité, mais une perte limitée à la prime.
– Les modèles de valorisation (comme Black–Scholes) reposent sur l’hypothèse que le prix du sous-jacent suit un processus stochastique (mouvement brownien géométrique).
– La volatilité implicite est un facteur déterminant du prix d’une option : elle reflète les anticipations du marché sur la variabilité future du sous-jacent.
– Les institutions financières utilisent massivement les options pour créer des produits structurés, combinaisons complexes d’options, d’obligations et d’indices.
– Enfin, les options sont un outil pédagogique central pour comprendre le principe de réplication et le risque neutre, qui seront développés dans les fiches suivantes.