jeudi 13 septembre 2018

Les préceptes de la statistique


Introduction
Le concept de la Statistique, de nos jours, demeure mitigé depuis fort longtemps. Elle représente une discipline (science) tout comme autre, mais à la différence pour les uns, il s’agit d’une branche de la mathématique pour d’autres un domaine à part entière. Cette fameuse expression a cependant, vu le jour en XVIème siècles (1771 en français, 1798 statistics en anglais). Etymologiquement, elle dérive de l’expression en latin dite « status » (état). Nonobstant, sa mise en oeuvre débute des 3000 avant J.-C. par la collecte d’observations (recensement) sur des personnes ou matériels afin de permettre au décideur public de pouvoir connaitre davantage leur puissance ou leur évolution dans un domaine précis (exemple : Mésopotamie).
Par ailleurs, Wilcox (1935) a relevé plus d’une centaine des définitions sur la notion de la Statistique. Il est clair de voir à quel point ce concept divise les opinions de la communauté scientifique, qui demeure aussi perplexe que l’on imagine. Dans cette circonstance, Kendall à mis en évidence qu’il s’agissait un des propos sur lesquels les statisticiens semblent plus que jamais opposer sur la conception de la Statistique.
Outre, la définition la plus acceptée est paru en 1982, annonçant que la Statistique est un ensemble des méthodes ayant pour vocation de collecter, traiter, interpréter et de diffuser des données statistiques. En général, elle est une science qui est vouée tout simplement aux données autrement-dit une science de données (data science en anglais).
Les statistiques (en singulier une statistique) représentent les procédées par les quels on étudie un ensemble d’observations (personnes, matériels, phénomène naturelle, comportement humain, espèces chimiques, végétaux, les animaux…etc. Il s’agit des approches méthodiques ou grandeurs mathématiques (outils statistiques). D’autant plus, John Tukey considère la ramification de la statistique en deux approches qui s’entre mêlent entre elles : la statistiques exploratoire et la statistique confirmatoire.
Page 2
Du point de vue générale, La Statistique se subdivise en deux sections à savoir la statistique descriptive et celle inférentielle : La première permettant d’abord la mise en place des données (recensement ou échantillonnage) puis l’étude unidimensionnelle et multidimensionnelle des caractères étudiés et collectés sur les observations (prévision, Data Manning, régression, corrélation…).
La seconde s’intéresse plutôt à généraliser avec une marge d’erreur (extrapolation) l’information déduite à partir d’un échantillon représentatif sur l’ensemble de la population. Pour y parvenir à déceler une information pertinente dans un milieu très complexe, on sollicite à la fois des approches mathématique et informatique. Souvent on laisse entendre diverses tendances de domaine d’application de la Statistique. Selon moi, elle est primordialement au service des décideurs publics, de la recherche et de l’enseignement.
I. Statistique descriptive ou exploratoire
L’un de rôle essentiel de la statistique est la faculté en elle de pouvoir extraire une information capitale dans une base de données complexe et structurée, ce qui n’est pas évident avec une simple lecture. Les outils par les quels on parvient à le faire sont divers, certains sont dites paramétriques et d’autres non paramétriques.
Il est indispensable de distinguer deux procédés de la statistique descriptive qui consiste à faciliter une information sur un ensemble d’observations. Ils peuvent s’agir des grandeurs synthétiques ou des figures récapitulatifs sur les caractères étudiés. Sollicitons l’approche unidimensionnelle des variables. Je la définis comme étant la spéculation dans un espace à deux dimensions de la position de chaque observation par rapport à un super-point (centre de gravité) et d’autre part un regroupement selon un critère spécifique.
Néanmoins, la liaison entre deux variables suscite encore plus attention, du fait de sa considération au-delà de la limité de la première analyse. La dépendance, la forte liaison ou la causalité entre deux variables porte un jugement sur le lien entre deux caractères différents observée ou pas sur une même population.
Page 3
Plus encore, cette introspection peut être reporter vers des dimensions assez complexe dépassant largement la visibilité perçue l’oeil. Bongré tout, Cela est rendu possible par la technique d’optimisation linéaire pour consentir une prouesse qui demande assez de réduction sans déformation de la réalité. La statistique descriptive est fondée en générale sur trois grandes approches : approche par rapport à un super-point, approche de regroupement selon un critère et enfin celle qui consiste d’expliciter la liaison entre deux ou plusieurs phénomènes donnés.
II. Statistique mathématique ou inférentielle
L’inférence statistique est d’abord non descriptive mais plutôt inductive. Parce qu’elle consent d’estimer un caractère inconnu d’un ensemble d’observations à partir d’un prélèvement d’un échantillon aux propriétés bien défini. Il s’agit, par cette définition un moyen de contourner la difficulté d’accès à une information très couteuse par une estimation (inférence) avec l’inclusion d’une marge d’erreur.
Le but est de pouvoir conclure sur l’ensemble avec des estimateurs de façon judicieuse et efficace. Toutefois, l’histoire de l’inférence débute à la fin de XIXème siècle avec les travaux des mathématiciens éminents sur la vraisemblance, le test, les intervalles de confiances, la qualité des estimateurs. Ces travaux connaissent une montée époustouflante avec l’arrivées des machines à calculer plus puissantes.
En général, on peut regrouper les techniques de l’inférence statistique, quant à elle, selon deux approches : l’une repose sur l’estimation des paramètres d’une population statistique et l’autre sur l’affirmation d’une hypothèse. C’est pourquoi, elle est, selon moi, la seule discipline capable d’étudier à la fois la réalité et l’irréalité sur les principes de la scientificité.
De ce fait, elle est compétitive avec les autres disciplines sans distinctions notamment la statistique et la physique ont permis la découverte majeure du boson de Higgs ; la statistique et la mathématique : l’entropie de Shannon ; la statistique et la biologie : la classification ascendante hiérarchique…etc.
Page 4
Conclusion :
En terme général, la Statistique est la science qui étudie les données, qui resurgit une information clé dans un ensemble de données (tout comme un trésor dans un coffre) et qui permet de mieux expliciter tous faits ou phénomènes absurdes. D’autre part, elle est un instrument qui part au-delà de la limite des autres sciences (la puissance de la statistique ou super science) avec des techniques d’estimations aléatoires.
Abdi-Basid ADAN

Aucun commentaire:

Enregistrer un commentaire

Access Various Climate Data, Manipulate Different File Formats, and Downscale GCM (CMIP5 and CMP6) and RCM (CORDEX and CORDEX CORE) Models Using a Stochastic Approach, ALL with the R programming Language

  Abdi-Basid ADAN "The purpose of this document is to consolidate and improve the various R scripts used to perform the cited analy...