Résumé
Dans
ce présent rapport, nous exposons un aperçu général sur les notions de
stationnarité (intégration) et de cointégration des variables. Bien qu’elles
occupent une place importante en statistique et en économétrie, leurs concepts
ont, pour beaucoup de chercheurs, été un peu flous. Je me permets d’en étayer
davantage en proposant que l’essentiel du point de vue théorique et empirique
sur l’intégration et la cointégration des variables.
Keys Words: ARDL, Box-Jenkins, Engle & Granger (1987),
Johansen (1988)
Introduction
Une
variable temporelle, un processus de courte ou de longue mémoire nécessite
avant d’être analyser, une étude permettant de soulever les grandes
caractéristiques d’une grandeur sur le plan statistique. Il s’agit entre autres,
sa tendance ; sa saisonnalité ; sa stationnarité, sa loi de
probabilité ou sa densité, …etc. L’une
de volet très intéressant et qui dans la plupart des cas se présente est la
question de la stationnarité de la chronique. Plusieurs procédés sont à notre
disposition pour sa mise en œuvre. En outre, l’intérêt de cointégrées les
variables dans le cas d’une combinaison linéaire est devenu viral dans les
études économétriques. De peur de présenter un modèle illusoire avec des
coefficients hors normes, la littérature se dépêche de proposer un tas d’outils
pour venir contourner cet obstacle majeur en économétrique. Dans les sections
suivantes, nous présentons la stationnarité de la variable de manière plus
concise et discutons par la suite la notion de cointégration.
I.
Intégration des
Variables (IV)
Une
des notions fondamentales en statistique et en économétrie est effectivement
celle liée à l’intégration des variables. Qu’est-ce que, véritablement
l’intégration des variables ? Il se
trouve qu’en statistique, l’idée de non-stationnarité est plutôt couramment
utilisée par rapport à celle d’intégration des variables. Or, la signification
de cette dernière est polyvalente d’une discipline à l’autre. En statistique, un processus temporel
fluctuant indépendamment du temps est dit stationnaire. Par illustration
(chronogramme et corrélogramme), on peut assister une concentration de la
chronique autour de sa valeur moyenne (espérance mathématique) ou une
décroissance rapide de la fonction d’autocorrélation. En termes de probabilité,
la distribution jointe (loi ou densité) est identique pour les k et les k+1
premières variables. En ce sens, le processus est stationnaire au sens stricte
(dit aussi de premier ordre ou fort). Pour en dire plus, quel que soit l’instant
t considéré, la variation de la chronique en t et t+1 est n’est pas influencé
par le référentiel temporel. De ce point de vue, ses propriétés, connue aussi
sous la désignation « conditions de stationnarité » à savoir la
moyenne, la variance et la covariance sont tous convergentes et indépendantes
du temps. Vue de la complexité que relève l’estimation d’une la loi de nature
probabiliste pour une distribution donnée, il a été proposé pour remédier à
cela, un second sens de stationnarité dite stationnarité au second ordre (sens
faible ou à covariance). Seules les conditions de l’espérance et la variance de
la variable sont requises et indispensables pour pouvoir juger et affirmer sur
la stationnarité à l’encontre d’une variable. Sachant la troisième condition
inclut également à la seconde lorsque k est nul (cov(xt,xt-k)).
Celle-ci assure un rôle pionnier notamment dans la prévision d’une série
temporelle. En principe, l’intervalle de confiance des valeurs estimés en
dépend pour sa validité. Il est mentionné
dans la littérature l’existence d’une multitude forme de non-stationnarité
d’une suite temporelle parmi lesquelles la stationnarité avec tendance
(TS : Trend Stationnarity, Nelson et Plosser ( 1982)), qui graphiquement,
on assiste à une évolution croissance de la série au cours du temps : de
ce fait, les conditions de stationnarités ne sont pas remplies. Pour contourner
cette adversité et obtenir par la suite la série dépourvue de composante
tendancielle, nous avons aux choix une de trois techniques notamment par droite
de moindres carrés ordinaires, moyen mobile simple ou encore par le filtre
Hodrick-Prescott. On obtient par-là, un bruit blanc Hamilton (1994), par
définition stationnaire mais de second ordre. Dans le vocabulaire statistique,
on évoque aussi le bruit blanc indépendant, du fait de l’indépendance entre les
variables, qui implique la nullité de la valeur de la covariance ou simplement
la décorrélation entre les variables (la réciproque étant déjà fausse). Parfois
de nature gaussien, il est, à la fois indépendant et suit une loi normale. Dans
ces conditions, le bruit blanc est strictement stationnaire (ou stationnaire au
sens strict). A la différence, un processus stochastique n’est pas forcement
stationnaire. La deuxième forme de
stationnarité, quant à elle est de type stationnarité par
différence (DS : Difference Stationnnarity, Nelson et Plosser (
1982)). Elle est dû, en particulier, à l’influence de la série par ses propres
valeurs historiques. En évidence, la différenciée selon un ordre bien diffèrent
de zéro permet de stationnariser la série.
Dans la pratique, deux familles de test de stationnarité s’annoncent.
C’est en effet, d’une part le test ayant comme hypothèse nulle de stationnarité
(Test KPSS) et d’autre part, les tests ayant comme hypothèse nulle de
non-stationnarité (Test de Dickey-Fuller ou Phillips-Perron). Encore plus, une
variable peut être stationnaire avec constante et tendance ; ni l’un et ni
l’autre ou avec constante seulement, selon les significativités de ces paramètres.
La nuance qu’il semble adéquat de préciser est celle de se dire comment une
série peut être stationnaire avec tendance, alors que c’est la composante
tendancielle qu’il faut la dénuée. Assez logique, en réalité, ça voudrait dire
la même chose et non vue comme deux proposition différentes ou contradictoires.
En un mot, l’intégration de variable consiste à priver de la série
chronologique de toute perturbation tendancielle ou historique pour pouvoir
identifier la série stable afin de s’en servir dans des analyses variées.
Enfin, c’est avec l’aval de cette étape primordiale et impérieuse que l’on peut
se permettre d’entamer l’estimation des modèles suivants précisément modèles de
Box-Jenkins (ARIMA, SARIMA, VAR, ARMAX,…etc) ou encore Engle (ARCH, GARCH, …etc).
II.
Cointégration des
Variables (CV)
La cointégration est indispensable
dans l’analyse bidimensionnelle aussi bien en statistique qu’en économétrie.
Nous sommes conscients de l’erreur imminent que peut nous conduire la prise en
compte simultanée de deux ou plusieurs variables sans avoir eu recours au
préalable une étude par variable. En quelque sorte, « mieux d’abord
évaluer chaque variable avant de la considérée serviable ». Introduite en
économie par Engle et Newbold (1974), puis développé par Granger et Engle
(1987) et poursuivie en 1991 par Johansen, la notion de cointégration est en
effet, l’intégration de la combinaison linéaire entre deux variables prise
ensemble auxquels des tests dans la littérature nous permet d’affirmer en cas
de présence de vecteur de cointégration. Il s’agit à savoir le tests Engle et
Granger (1987) ; Johansen
(1988) ; Johansen et
Juselius (1990), …etc. Il est si fréquent de se retrouver avec le problème
de régression fallacieuse dans la
modélisation des variables, en raison d’une régression linéaire sur
des variables non-stationnaires, qui témoigne en principe, un pouvoir
explicative R² et un t de Student très appréciables alors qu’en réalité, il
n’existe aucun relation entre elles . Dans cette optique, la distribution des
paramètres estimés ne suit plus une loi
de Student mais un
processus de Wiener (mouvement brownien), qui survient
quand la variance au moins de l’une des variables diverge, du fait de sa
dépendance au dimension temporelle et bien identifiable avec procédure de
récurrence. En effet, des bonnes perspectives de l’analyse résiduelle
accompagne pour la validité finale du modèle. Lorsque le résidu n’est pas
stationnaire, elle est assimilée au cas de présence d’autocorrélation entre les
résidus du modèle. L’ordre d’intégration du modèle résiduelle n’est pas
forcement au deçà de ceux des variables du modèle. En évidence, une composante
résiduelle du modèle stationnaire à un ordre diffèrent de 0 est considérée
comme un modèle où l’autocorrélation des résidus est imminente. Autrement-dit
l’autocorrélation et la stationnarité s’implique indirectement au travers de la
dernière condition de la covariance (au sens faible de stationnarité). Le but de la cointégration est de pouvoir
déterminer un résidu stationnaire tout en travaillant sur deux variables non
stationnaires en niveau. L’idée proposé par Engle va dans la sens qu’à court
terme les variables divergent, mais existe à long terme une stabilité, un
équilibre entre elles. Une évolution commune des variables. Or connaissant la
possibilité d’une cointégration d’ordre non nul, à long terme la perspective
souhaitée existe selon des conditions bien définis en amont et en aval. Parmi
lesquelles le même ordre d’intégration des variables, vérification de la possibilité
de cointégré les variables, autrement dit un ordre inférieur ou égal à l’ordre
commune d’intégration des variables. Outre, en aval, un signe négatif et
significatif du coefficient de force de rappel à l’équilibre (ou vitesse
d’ajustement) est requis tout en vérifiant la stationnarité de résidus obtenus.
Le théorème de Granger (1983) met en évidence la relation de cointégration et
du modèle à correction d’erreur. L’estimation de relation de court terme avec
MCO n’est possible que quand on différencie les variables. En d’autres termes,
en intégrant dans le modèle, les variables retardées comme explicatives. En
revanche la relation de long terme sont estimées en niveau par MCO. Aucune
méthode n’est parfaite, en ce sens, l’inconvénient de l’approche Engle-Granger
(1987) est la non-distinction de relation de cointégration. En principe, elle
ne présente qu’une seule relation de cointégration, alors qu’elle est de nombre
k-1 relation avec k le nombre des variables. Johansen (1988) apporte une
solution à cette problématique avec son approche multivariée de maximum de
vraisemblance. Pour la validité du
modèle VECM, il faut un rang de cointégration inférieur au nombre de variable
et non nul, qui est mise en évidence par la maximisation du log de vraisemblance.
Dns le cas contraire, un modèle VAR(p) est estimé à la place d’un VECM. D’autre
part comme dans le modèle Vectorielle autorégressif, la spécification du modèle
selon l’absence ou la présence d’un constant et tendance est nécessaire. On
peut les déterminés avec leurs significativités une fois estimé. La méthode à une seule étape de BANERJEE et
al. ou MCE à la Handry permet de faciliter l’interprétation de la relation de
long terme. En outre, pour estimer les relations à long terme dans le cas sur
petits échantillons, le modèle à deux étapes pourrait conduire à de biais
d’estimation selon Banerjee, Dolado, Hendry et Smith (1986). La modélisation ARDL « AutoRegressive
Distributed Lag/ARDL » et
le test de cointégration aux bornes de Pesaran et al. (2001) ont une approche
de nouvelle venue pour pallier le cas de cointégration des variables à des
différents ordres de stationnarités. En revanche, quand l’ordre d’intégration
de variable est supérieur à 1, l’application du modèle ARDL pose un problème.
Conclusion
La
stationnarité est plus que jamais une condition d’étude préalable sur les
variables avant leurs introduisons dans des études plus considérables. Il
s’agit de dénuer du processus temporel des perturbations tendancielle et
historiques avec des procédures appropriées pour pouvoir mener des analyses
statistiques et économétriques. De même, la cointégration s’avère encore plus
complexe, du fait que l’on désire s’intéresser à travailler sur des variables
en niveau, tout en évitant que la régression ne soit fallacieuse. Plusieurs
approches se pressent, l’une plus performant que l’autre. Dans les deux cas,
ces notions ne peuvent être prise avec négligence, car une production
scientifique fondé sur le processus temporel en dépend inévitablement.
Bibliographie :
1. Atoumane Diagne (2015) :
Modélisation économétrique de la consommation d’électricité au Sénégal de 1999
à 2015
2. Hélène Hamisultane: Modèle à correction d'erreur et
applications
3. Jonas Kibala Kuma (2018) :
Modélisation ARDL, Test de cointégration aux bornes et Approche de
Toda-Yamamoto : éléments de théorie et pratiques sur logiciels
4. Lonzo Lubu Gastonfils (2015) :
Application De La Methode De Prevision De Box-Jenkins