ANALYSE DES SÉRIES TEMPORELLES
1. Concepts
1.1. Micro-économie
1.1.1. Coût moyen et marginal
1.2. Macro-économie
2. Modèle monétaire
3. Théorie de l'offre et de la demande
3.1. Théorie de la préférence
3.2. Modèle contrarié à perte nette
4. Capitalisation et actuariat
4.1. Intervalle de dates
4.2. Equivalence de taux
4.3. Intérêt simples
4.3.1. Escomptes
4.4. Intérêt composé
4.5. Intérêt continu
4.6. Intérêt progressif (rentes)
4.6.1. Rentes postnumerando
4.6.2. Rentes praenumerando
4.7. Arrondis
5.1. Emprunt à échéance fixe
5.2. Emprunt à amortissement constant
5.3. Emprunt à annuité constant
6. Théorie moderne des portefeuilles
6.1. Absence d'opportunité d'arbitrage (A.O.A)
6.2. Portefeuilles
6.2.1. Actions
6.2.2. Obligations
6.2.3. Options
6.2.4. Bons de souscriptions
6.2.5. Fonds de placements
6.3. Retours et taux d'investisssements
6.3.1. Return on investment
6.3.2. Goodwill
6.3.3. Money weighted rate of return
6.3.4. Time weighted rate of return
6.4. Modèle spéculatif de Bachelier
6.5. Modèle de diversification efficiente de Markovitz
6.5.1. Frontière efficiente
6.6. Modèle de diversification efficiente de Sharpe
6.6.1. Coefficient bêta
6.7. Modèle d'évaluation des actifs financiers (MEDAF)
6.7.1. Capital Market Line (C.M.L.)
6.7.2. Security Market Line (S.M.L.)
6.8. Modèle d'évaluation des options de Black & Scholes
6.8.1. Equation de parité Call-Put
6.8.2. Hypothèse efficiente du marché
6.8.3. Processus de Wiener
6.8.4. Mouvement Brownien
6.8.5. Processus d'Ito
6.8.6. Equation de Black & Scholes
6.8.7. Portefeuille autofinancant sur sous-jacent risqué
6.8.8. Les grecs et autres...
6.8.9. Résolution de l'E.D.P. de Black & Scholes
6.9.1. VaR relative
6.9.2. VaR absolue
6.9.3. VaR historique
6.9.4. VaR variance-covariance
7. Analyse des séries temporelles
7.1. Coefficient d'autocorrélation
7.2. Régression logistique
Contrairement à l'économétrie traditionnelle, le but de l'analyse des séries temporelles (AST) n'est pas de relier des variables entre elles, mais de s'intéresser à la dynamique d'une variable dans le temps pour découvrir certaines régularités afin de pouvoir extrapoler ou d'établir des prévisions sous réserve de l'hypothèse qu'on puisse relier une observation à celles qui l'ont précédée. Avec une analyse fine, il est même possible d'établir des prévisions "robustes" vis-à-vis de ruptures brusques et de changements non-anticipables.
Définition: Une "série temporelle" (plus rigoureusement
on devrait parler de "suite"!) est une suite d'observation d'une
variable y à différentes dates t. Habituellement
l'espace de base de t est dénombrable, de sorte que
.
Le tout étant noté:
(395)
Une série temporelle est donc toute suite d'observations correspondant à la même variable: il peut s'agit de données macroéconomiques (le PIB d'un pays, l'inflation, les exportations), microéconomiques (les ventes d'une entreprise donnée, son nombre d'employés, le revenu d'un individu, ...), financières (le CAC40, le prix d'une option d'achat ou de ventre, le cours d'une action), météorologiques (la pluviosité, le nombre de jours de soleil par an...), politiques (le nombre de votants, de voix reçues par un candidat...), démographiques (la taille moyenne des habitants, leur âge...).
En pratique, tout ce qui est chiffrable et varie en fonction du temps peut être analysé relativement pertinemment sous forme de AST tant que la personne qui manipule le modèles sait ce qu'elle fait (ce qui est rare dès qu'on sort du domaine publique et étatique...).
(396)
La dimension temporelle est ici importante car il s'agit de l'analyse d'une chronique historique: des variations d'une même variable au cours du temps, afin de pouvoir en comprendre la dynamique. On représente en général les séries temporelles sur des graphiques de valeurs (ordonnées) en fonction du temps (abscisses). Une telle observation constitue un outil essentiel qui permet au modélisateur ayant un peu d'expérience de tout de suite se rendre compte des propriétés dynamiques principales, afin de savoir quel test statistique pratiquer. La figure précédente montrent différentes séries temporelles à titre d'exemples.
Définitions:
D1. Les séries qui oscillent autour de leur moyenne sont appelées "séries stationnaires".
D2. Les séries qui semblent croître ou baisser sur l'ensemble de l'échantillon observé sont appelles des "séries tendancières" et leur moyenne n'est pas constante.
D3. Les séries qui ne sont ni stationnaires ni tendancières haussière ou baissière à long terme sont appelées "séries non-stationnaires".
D4. Les séries qui présentent une périodicité régulière sont appelées "séries saisonnières".
Les caractéristiques de ces graphiques sont toutes modélisables et analysables dans le cadre de l'analyse des séries temporelles. Il existe pour cela des outils plus ou moins complexes dont certains ne peuvent être mis en doute et dont d'autres sont des modèles heuristiques qu'il faut savoir manipuler et utiliser avec précaution.
Dans le texte qui va suivre, nous allons nous intéresser qu'aux modèles élémentaires accessibles sans une artillerie mathématique lourde.
Définition: Nous appelons "processus Autorégressifs d'ordre 1" AR(1) le modèle déjà établi lors de notre étude du processus de Wiener et noté dans le cas d'étude des séries temporelles par:
où la fonction WN (pour Wiener) est pour rappel ce que nous appelons un "bruit blanc".
La seule différence par rapport au mouvement "mouvement
brownien standard" c'est qu'il y a ici la présence d'un facteur
d'inertie qui
influence fortement la dynamique du processus. Effectivement, comme
il est très facile de le faire dans MS Excel conformément à la
procédure indiquée lors de notre étude des processus de Wiener:
Voici différents tracés de la série temporelle en fonction de quelques valeurs du facteur d'inertie:
(397)
Si nous considérons comme
un variable aléatoire spécifique (ayant une fonction de densité donnée)
que nous noterions X et
comme
une autre variable aléatoire spécifique (ayant une fonction de
densité donnée) que nous noterions Y, alors rien ne nous
empêche étant connue les fonctions de densité de chacune des ces
variables, de calculer leur covariance:
Par exemple, dans la pratique nous connaissions souvent les espérances des
deux variables aléatoires aux deux moments différents ainsi que
quelques unes des valeurs de leurs distributions sous jacentes
(réalisations aléatoires). Alors il devient aisé de calculer leur
covariance. Mais ce n'est pas un indicateur vraiment utile. Rien
ne nous empêche en supposant une relation linéaire d'utiliser le
coefficient de corrélation linéaire:
(398)
Mais qui se note alors traditionnellement et trivialement dans le cas des séries temporelles:
(399)
et est appelé "coefficient d'autocorrélation".
Voici par exemple une famille de séries temporelles:
(400)
avec leur "corrélogramme" correspondant pour différentes
valeurs de h (en abscisse) et la valeur de en
ordonnée:
(401)
Définition: Une série temporelle est dite "stationnaire au sens faible" si les premiers (espérance) et second (ordre) moments existent et sont constant dans le temps:
(402)
La première condition (constance de l'espérance) élimine donc
toute tendance. Si la fonction de densité sous jacente à chaque est
une loi Normale, alors nous parlons de "processus
Gaussien".
Dans le cas contraire, nous dirons sur ce site qu'elle est non
stationnaire.
Considérons un cas important dans de nombreuses entreprises sur certaines périodes plus ou moins longues. Soit:
(403)
la moyenne temporelle. Si converge
en probabilité vers
quand
nous
disons que le processus est "ergodique
pour la moyenne".
Donc quand
:
(404)
RÉGRESSION LOGISTIQUE
Il arrive toujours dans les entreprises que dans l'analyse d'un produit ou d'un service, que celui-ci voie son nombre de ventes croître, ensuite passer par un point d'inflexion et ensuite aller vers une asymptote pour diminuer à nouveau par la suite avec une caractéristique similaire.
Le modèle logistique permettant de simuler un tel comportement dans le cadre de l'analyse des séries temporelles (à ne pas confondre avec celle définie en Statistiques) est défini ainsi:
(405)
et inspiré de nombreux modèle que nous retrouvons
en physique et où est
le seuil de saturation (asymptote horizontale) qui peut être déterminée
suite à un audit du marché et son % de pénétration.
b et r sont eux deux paramètres du modèle tels que:
(406)
le point d'inflexion est toujours donné par le cumul de 50% du seuil de saturation. Le résultat est alors une courbe en S du type suivant:
(407)
où en jaune a été représenté les données actuelles d'une entreprise et en bleu le modèle théorique prévisionnel associé.
Pour déterminer l'équation de la courbe logistique nous pouvons utiliser directement les solveurs de certains logiciels. Mais ceux-ci ont parfois besoin d'avoir des données de départ proches de la valeur théorique. Nous allons donc d'abord montrer comment ces valeurs de départ peuvent être déterminées avec un exemple.
Considérons le tableau suivant fait avec MS Excel (les ventes sont en centaines de millier d'unités):
(408)
et le graphique associé:
(409)
qui pourrait être jugé comme linéaire à un néophyte suivant à quel moment commence l'analyse descriptive des ventes dans l'entreprise.
Pour déterminer le modèle théorique, nous allons linéariser l'équation logistique en utilisant un seuil hypothétique (objectif de ventes du marché) 800.
Donc:
(410)
Soit à calculer la nouvelle variable à expliquer:
(411)
et le modèle linéaire s'écrit donc:
(412)
avec :
(413)
Soit:
(414)
Dans notre exemple, la régression linéaire (cf. chapitre de Méthodes Numériques) donne:
(415)
Nous avons alors immédiatement:
(416)
Soit sous forme graphique:
(417)
avec ce modèle formel, nous avons une somme des carrés des écarts entre les mesures et le modèle (cf. chapitre de Statistique) de:
(418)
Maintenant, entrons ces données dans MS Excel sous la forme suivante:
(419)
avec la structure suivante:
(420)
Si nous lançons le solveur avec les paramètres suivants:
(421)
Ce qui donne:
(422)
Soit:
(423)
avec:
(424)
soit nettement inférieur à notre approche utilisant la régression linéaire et donc meilleur. Effectivement voyons le tableau de résultat:
(425)
et graphiquement cela donne:
(426)
Nous voyons nettement que le modèle du solveur (modèle numérique) est meilleur que le modèle formel donné par une régression linéaire et il est aussi meilleur comme déjà mentionné que le lissage exponentiel proposé par l'utilitaire d'analyse de MS Excel!