Statistiques Descriptives

Statistique qui cherche à résumer toutes les données ou caractéristiques d’une série de valeurs.

Qu’est-ce qu’une statistique descriptive ?

Les statistiques descriptives sont un type de statistiques qui tentent de condenser ou de résumer toutes les données ou caractéristiques d’une série de valeurs, de décrire certains aspects de la série , également identifiées comme des statistiques déductives .

Cette méthode constitue un moyen relativement simple et efficace de synthétiser et de caractériser les données, offrant une manière adéquate de présenter les informations collectées.

La statistique descriptive formule des recommandations sur la manière de résumer, de manière claire et simple, les données d’une enquête sous forme de graphiques, de tableaux, de figures ou de graphiques. Avant de procéder à une analyse descriptive, il est essentiel de préciser le ou les objectifs de la recherche, ainsi que d’identifier les échelles de mesure des différentes variables étudiées.

En statistique descriptive, lorsque des données de recherche sont obtenues, il est nécessaire de les condenser et de les résumer à travers une ou plusieurs valeurs qui déterminent les principales caractéristiques du phénomène étudié. Les mesures qui forment ce type de méthodes statistiques sont celles qui réalisent cette synthèse.

Instruments ou mesures de statistiques descriptives

Les principales mesures des statistiques descriptives sont les suivantes :

  • Ratios, taux et pourcentages : sont des mesures relatives qui condensent l’information sur l’incidence d’une caractéristique parmi un groupe d’unités.
  • Distribution de fréquence : manière de regrouper les données, dans laquelle celles-ci sont présentées en classes et chaque classe présente sa fréquence respective.
  • Mesures de position ou de tendance centrale : elles se divisent en moyennes mathématiques : l’arithmétique, la géométrique et l’harmonique ; et des moyennes non mathématiques : la médiane et le mode .
  • Mesures de dispersion – Pour les variables quantitatives, les mesures de dispersion qui peuvent être identifiées sont l’écart moyen, l’écart type ou l’écart type, les écarts interquartiles et les valeurs minimales et maximales.

Exemples de statistiques descriptives

Ratios, taux et pourcentages

Raison

Le rapport est défini comme la valeur qui indique la relation quantitative entre deux quantités. Par exemple, s’il y a 40 000 enfants scolarisés et 10 000 non scolarisés dans une zone géographique donnée, le rapport scolarisé/non scolarisé serait exprimé par le quotient :

Selon le résultat, on dirait alors que pour quatre enfants scolarisés, il y a un enfant non scolarisé.

Évaluer

Dans la proportion ou le taux, contrairement à l’indice précédent, le dénominateur du quotient est le nombre total d’unités déclarées. En prenant l’exemple précédent pour le ratio, les proportions d’enfants scolarisés et non scolarisés seraient :

Il est à noter qu’en additionnant les deux taux obtenus (0,80 + 0,20), le résultat est un (1), puisqu’il s’agit de proportions complémentaires.

Pourcentage

Comme on peut le voir dans l’exemple du taux, la solution est exprimée en valeurs décimales, et bien que d’un point de vue statistique ce ne soit pas un inconvénient, les résultats sont généralement présentés en pourcentages. C’est pourquoi il est d’usage de multiplier les proportions par 100, pour convertir les valeurs décimales en pourcentages.

répartition des fréquences

La distribution de fréquence est le regroupement des données en catégories mutuellement exclusives indiquant le nombre d’observations dans chaque catégorie, ce qui apporte une valeur ajoutée au regroupement des données collectées .

A titre d’illustration, ci-dessous un graphique de fréquence avec les préférences sportives des élèves d’une école secondaire, avec un effectif de 1 000 élèves.

 

Mesures de position ou de tendance centrale

A titre d’exemple, voici 3 des mesures les plus utilisées en tendance centrale : moyenne arithmétique, médiane et mode.

Moyenne arithmétique

Il est déterminé en ajoutant la valeur de toutes les données dont nous disposons. Le résultat est ensuite divisé par le nombre total de ces données.

La moyenne arithmétique est calculée comme suit :

Sur la base de la formule précédente, la moyenne arithmétique des séries de chiffres suivantes serait déterminée de cette manière :

Nombres : 5, 9, 10, 12, 16, 19, 22, 27.

N = 8 (le numéro de données).

Médian

Cette mesure de position est définie comme la valeur qui divise une distribution de sorte qu’un nombre égal de termes reste de chaque côté.

Selon cette définition, pour déterminer la médiane, il sera nécessaire d’ordonner les données, et la valeur médiane peut coïncider ou non avec une valeur de série, selon que le nombre de données est pair ou impair. Dans le premier cas, ça correspond et dans le second non.

S’il existe une série de valeurs X 1 + X 2 + X 3 + …….+ X n , classées du plus petit au plus grand, la médiane est située comme la valeur (N + 1) ÷ 2, lorsque le nombre de termes (N) est impair. Lorsque N est pair, la formule serait (N ÷ 2) + 1.

Exemples:

  • Ayant pour valeurs : 4 + 8 + 12 + 14 + 18, la médiane se situerait à la valeur 12 car elle est impaire. 5 + 1 = 6 ÷ 2 = 3 (position 3) . Si la série a un nombre impair de mesures, la médiane sera le score central de la série.
  • Ayant les valeurs : 7 + 8 + 14 + 15 + 18 + 20, dans ce cas, puisque le nombre de termes est pair, tout nombre non inférieur à 14 ni supérieur à 15 peut être considéré comme la médiane, puisqu’il n’y aura pas plus supérieur à N ÷ 2 = 3 observations inférieures à lui, ni supérieures à lui. Dans ces cas, il est normal de prendre la valeur 14,5 comme médiane, qui est le point médian entre 14 et 15. 14 + 15 = 29 ÷ 2 = 14,5

Mode

Elle est définie comme la valeur de la série qui se répète le plus, la valeur la plus typique. Dans une distribution de fréquence, c’est la valeur autour de laquelle les termes ont tendance à être le plus densément concentrés.

Quelques exemples courants du mode sont : la taille la plus courante, le salaire le plus courant, la qualification la plus répétée, etc. Autrement dit, le mode est le point où la concentration est maximale .

A titre d’exemple, voici les tailles de 12 joueurs qui composent l’effectif d’une équipe de basket professionnelle.

Joueur Hauteur Joueur Hauteur Joueur Hauteur
1 1,79 mètres 5 1,95 mètres 9 2,04 mètres
deux 1,87 mètres 6 1,95 mètres dix 2,04 mètres
3 1,89 mètres sept 1,95 mètres Onze 2,10 mètres
4 1,90 mètres 8 1,99 mètres 12 2,15 mètres

Le mode, c’est-à-dire la hauteur qui se répète le plus dans la liste de cette équipe de basket-ball est de 1,95 mètre. (3 fois).

Mesures de dispersion

Par dispersion on entend le fait que les valeurs d’une série diffèrent les unes des autres ; la dispersion sera alors plus ou moins grande selon l’ importance de ces différences .

Exemple : calcul de l’écart moyen à la moyenne arithmétique.

Pour ce processus, les différences de valeurs absolues sont prises par rapport à la moyenne arithmétique, avec les étapes suivantes :

  1. La moyenne arithmétique des valeurs de la série est calculée.
  2. Les écarts des valeurs de la série par rapport à leur moyenne arithmétique sont déterminés. Ces écarts s’additionnent et on obtient Σ |x – x̄| .
  3. L’écart moyen est calculé par la formule :

La série suivante : 4, 8, 12, 16, 20, a une moyenne arithmétique de 12, et les calculs pour déterminer l’écart moyen sont les suivants :

X |x – x̄|
4 8
8 4
12 0
16 4
vingt 8
Total 24

Résultant en:

Bibliographie:
  • Qu’est-ce qu’une statistique descriptive ? Récupéré de esan.edu.pe.
  • Gonzalez, Ernest. Statistiques générales (6e éd.) . Éditions de la Bibliothèque de l’Université Centrale du Venezuela. Caracas, Venezuela. 1979.
  • Rendon Macias, Villasis Miguel et Miranda Maria. Statistiques descriptives . Magazine sur les allergies au Mexique. 2016.