lundi 1 octobre 2018

Intégration et Cointégration des Variables (ICV)


Résumé 
Dans ce présent rapport, nous exposons un aperçu général sur les notions de stationnarité (intégration) et de cointégration des variables. Bien qu’elles occupent une place importante en statistique et en économétrie, leurs concepts ont, pour beaucoup de chercheurs, été un peu flous. Je me permets d’en étayer davantage en proposant que l’essentiel du point de vue théorique et empirique sur l’intégration et la cointégration des variables.
Keys Words: ARDL, Box-Jenkins, Engle & Granger (1987), Johansen (1988)


Introduction
Une variable temporelle, un processus de courte ou de longue mémoire nécessite avant d’être analyser, une étude permettant de soulever les grandes caractéristiques d’une grandeur sur le plan statistique. Il s’agit entre autres, sa tendance ; sa saisonnalité ; sa stationnarité, sa loi de probabilité ou sa densité, …etc.  L’une de volet très intéressant et qui dans la plupart des cas se présente est la question de la stationnarité de la chronique. Plusieurs procédés sont à notre disposition pour sa mise en œuvre. En outre, l’intérêt de cointégrées les variables dans le cas d’une combinaison linéaire est devenu viral dans les études économétriques. De peur de présenter un modèle illusoire avec des coefficients hors normes, la littérature se dépêche de proposer un tas d’outils pour venir contourner cet obstacle majeur en économétrique. Dans les sections suivantes, nous présentons la stationnarité de la variable de manière plus concise et discutons par la suite la notion de cointégration.





I.                   Intégration des Variables (IV)

Une des notions fondamentales en statistique et en économétrie est effectivement celle liée à l’intégration des variables. Qu’est-ce que, véritablement l’intégration des variables ?  Il se trouve qu’en statistique, l’idée de non-stationnarité est plutôt couramment utilisée par rapport à celle d’intégration des variables. Or, la signification de cette dernière est polyvalente d’une discipline à l’autre.  En statistique, un processus temporel fluctuant indépendamment du temps est dit stationnaire. Par illustration (chronogramme et corrélogramme), on peut assister une concentration de la chronique autour de sa valeur moyenne (espérance mathématique) ou une décroissance rapide de la fonction d’autocorrélation. En termes de probabilité, la distribution jointe (loi ou densité) est identique pour les k et les k+1 premières variables. En ce sens, le processus est stationnaire au sens stricte (dit aussi de premier ordre ou fort). Pour en dire plus, quel que soit l’instant t considéré, la variation de la chronique en t et t+1 est n’est pas influencé par le référentiel temporel. De ce point de vue, ses propriétés, connue aussi sous la désignation « conditions de stationnarité » à savoir la moyenne, la variance et la covariance sont tous convergentes et indépendantes du temps. Vue de la complexité que relève l’estimation d’une la loi de nature probabiliste pour une distribution donnée, il a été proposé pour remédier à cela, un second sens de stationnarité dite stationnarité au second ordre (sens faible ou à covariance). Seules les conditions de l’espérance et la variance de la variable sont requises et indispensables pour pouvoir juger et affirmer sur la stationnarité à l’encontre d’une variable. Sachant la troisième condition inclut également à la seconde lorsque k est nul (cov(xt,xt-k)). Celle-ci assure un rôle pionnier notamment dans la prévision d’une série temporelle. En principe, l’intervalle de confiance des valeurs estimés en dépend pour sa validité.  Il est mentionné dans la littérature l’existence d’une multitude forme de non-stationnarité d’une suite temporelle parmi lesquelles la stationnarité avec tendance (TS : Trend Stationnarity, Nelson et Plosser ( 1982)), qui graphiquement, on assiste à une évolution croissance de la série au cours du temps : de ce fait, les conditions de stationnarités ne sont pas remplies. Pour contourner cette adversité et obtenir par la suite la série dépourvue de composante tendancielle, nous avons aux choix une de trois techniques notamment par droite de moindres carrés ordinaires, moyen mobile simple ou encore par le filtre Hodrick-Prescott. On obtient par-là, un bruit blanc Hamilton (1994), par définition stationnaire mais de second ordre. Dans le vocabulaire statistique, on évoque aussi le bruit blanc indépendant, du fait de l’indépendance entre les variables, qui implique la nullité de la valeur de la covariance ou simplement la décorrélation entre les variables (la réciproque étant déjà fausse). Parfois de nature gaussien, il est, à la fois indépendant et suit une loi normale. Dans ces conditions, le bruit blanc est strictement stationnaire (ou stationnaire au sens strict). A la différence, un processus stochastique n’est pas forcement stationnaire.  La deuxième forme de stationnarité, quant à elle est de type stationnarité par différence (DS : Difference Stationnnarity, Nelson et Plosser ( 1982)). Elle est dû, en particulier, à l’influence de la série par ses propres valeurs historiques. En évidence, la différenciée selon un ordre bien diffèrent de zéro permet de stationnariser la série.   Dans la pratique, deux familles de test de stationnarité s’annoncent. C’est en effet, d’une part le test ayant comme hypothèse nulle de stationnarité (Test KPSS) et d’autre part, les tests ayant comme hypothèse nulle de non-stationnarité (Test de Dickey-Fuller ou Phillips-Perron). Encore plus, une variable peut être stationnaire avec constante et tendance ; ni l’un et ni l’autre ou avec constante seulement, selon les significativités de ces paramètres. La nuance qu’il semble adéquat de préciser est celle de se dire comment une série peut être stationnaire avec tendance, alors que c’est la composante tendancielle qu’il faut la dénuée. Assez logique, en réalité, ça voudrait dire la même chose et non vue comme deux proposition différentes ou contradictoires. En un mot, l’intégration de variable consiste à priver de la série chronologique de toute perturbation tendancielle ou historique pour pouvoir identifier la série stable afin de s’en servir dans des analyses variées. Enfin, c’est avec l’aval de cette étape primordiale et impérieuse que l’on peut se permettre d’entamer l’estimation des modèles suivants précisément modèles de Box-Jenkins (ARIMA, SARIMA, VAR, ARMAX,…etc) ou encore Engle (ARCH, GARCH, …etc).



II.               Cointégration des Variables (CV)

La cointégration est indispensable dans l’analyse bidimensionnelle aussi bien en statistique qu’en économétrie. Nous sommes conscients de l’erreur imminent que peut nous conduire la prise en compte simultanée de deux ou plusieurs variables sans avoir eu recours au préalable une étude par variable. En quelque sorte, « mieux d’abord évaluer chaque variable avant de la considérée serviable ». Introduite en économie par Engle et Newbold (1974), puis développé par Granger et Engle (1987) et poursuivie en 1991 par Johansen, la notion de cointégration est en effet, l’intégration de la combinaison linéaire entre deux variables prise ensemble auxquels des tests dans la littérature nous permet d’affirmer en cas de présence de vecteur de cointégration. Il s’agit à savoir le tests Engle et Granger (1987) ; Johansen  (1988) ; Johansen  et Juselius (1990), …etc. Il est si fréquent de se retrouver avec le problème de régression fallacieuse dans la modélisation des variables, en raison d’une régression linéaire sur des variables non-stationnaires, qui témoigne en principe, un pouvoir explicative R² et un t de Student très appréciables alors qu’en réalité, il n’existe aucun relation entre elles . Dans cette optique, la distribution des paramètres estimés ne suit plus une loi de Student mais un  processus de Wiener (mouvement brownien), qui survient quand la variance au moins de l’une des variables diverge, du fait de sa dépendance au dimension temporelle et bien identifiable avec procédure de récurrence. En effet, des bonnes perspectives de l’analyse résiduelle accompagne pour la validité finale du modèle. Lorsque le résidu n’est pas stationnaire, elle est assimilée au cas de présence d’autocorrélation entre les résidus du modèle. L’ordre d’intégration du modèle résiduelle n’est pas forcement au deçà de ceux des variables du modèle. En évidence, une composante résiduelle du modèle stationnaire à un ordre diffèrent de 0 est considérée comme un modèle où l’autocorrélation des résidus est imminente. Autrement-dit l’autocorrélation et la stationnarité s’implique indirectement au travers de la dernière condition de la covariance (au sens faible de stationnarité).  Le but de la cointégration est de pouvoir déterminer un résidu stationnaire tout en travaillant sur deux variables non stationnaires en niveau. L’idée proposé par Engle va dans la sens qu’à court terme les variables divergent, mais existe à long terme une stabilité, un équilibre entre elles. Une évolution commune des variables. Or connaissant la possibilité d’une cointégration d’ordre non nul, à long terme la perspective souhaitée existe selon des conditions bien définis en amont et en aval. Parmi lesquelles le même ordre d’intégration des variables, vérification de la possibilité de cointégré les variables, autrement dit un ordre inférieur ou égal à l’ordre commune d’intégration des variables. Outre, en aval, un signe négatif et significatif du coefficient de force de rappel à l’équilibre (ou vitesse d’ajustement) est requis tout en vérifiant la stationnarité de résidus obtenus. Le théorème de Granger (1983) met en évidence la relation de cointégration et du modèle à correction d’erreur. L’estimation de relation de court terme avec MCO n’est possible que quand on différencie les variables. En d’autres termes, en intégrant dans le modèle, les variables retardées comme explicatives. En revanche la relation de long terme sont estimées en niveau par MCO. Aucune méthode n’est parfaite, en ce sens, l’inconvénient de l’approche Engle-Granger (1987) est la non-distinction de relation de cointégration. En principe, elle ne présente qu’une seule relation de cointégration, alors qu’elle est de nombre k-1 relation avec k le nombre des variables. Johansen (1988) apporte une solution à cette problématique avec son approche multivariée de maximum de vraisemblance.  Pour la validité du modèle VECM, il faut un rang de cointégration inférieur au nombre de variable et non nul, qui est mise en évidence par la maximisation du log de vraisemblance. Dns le cas contraire, un modèle VAR(p) est estimé à la place d’un VECM. D’autre part comme dans le modèle Vectorielle autorégressif, la spécification du modèle selon l’absence ou la présence d’un constant et tendance est nécessaire. On peut les déterminés avec leurs significativités une fois estimé.  La méthode à une seule étape de BANERJEE et al. ou MCE à la Handry permet de faciliter l’interprétation de la relation de long terme. En outre, pour estimer les relations à long terme dans le cas sur petits échantillons, le modèle à deux étapes pourrait conduire à de biais d’estimation selon Banerjee, Dolado, Hendry et Smith (1986).  La modélisation ARDL « AutoRegressive Distributed Lag/ARDL » et le test de cointégration aux bornes de Pesaran et al. (2001) ont une approche de nouvelle venue pour pallier le cas de cointégration des variables à des différents ordres de stationnarités. En revanche, quand l’ordre d’intégration de variable est supérieur à 1, l’application du modèle ARDL pose un problème.

Conclusion 

La stationnarité est plus que jamais une condition d’étude préalable sur les variables avant leurs introduisons dans des études plus considérables. Il s’agit de dénuer du processus temporel des perturbations tendancielle et historiques avec des procédures appropriées pour pouvoir mener des analyses statistiques et économétriques. De même, la cointégration s’avère encore plus complexe, du fait que l’on désire s’intéresser à travailler sur des variables en niveau, tout en évitant que la régression ne soit fallacieuse. Plusieurs approches se pressent, l’une plus performant que l’autre. Dans les deux cas, ces notions ne peuvent être prise avec négligence, car une production scientifique fondé sur le processus temporel en dépend inévitablement.



Bibliographie :

1.       Atoumane Diagne (2015) : Modélisation économétrique de la consommation d’électricité au Sénégal de 1999 à 2015
2.       Hélène Hamisultane: Modèle à correction d'erreur et applications
3.       Jonas Kibala Kuma (2018) : Modélisation ARDL, Test de cointégration aux bornes et Approche de Toda-Yamamoto : éléments de théorie et pratiques sur logiciels
4.       Lonzo Lubu Gastonfils (2015) : Application De La Methode De Prevision De Box-Jenkins

Aucun commentaire:

Enregistrer un commentaire

Access Various Climate Data, Manipulate Different File Formats, and Downscale GCM (CMIP5 and CMP6) and RCM (CORDEX and CORDEX CORE) Models Using a Stochastic Approach, ALL with the R programming Language

  Abdi-Basid ADAN "The purpose of this document is to consolidate and improve the various R scripts used to perform the cited analy...