Sommaire
ILe vocabulaire des séries statistiquesAPopulation et caractèreBEffectif et fréquenceCSéries statistiques regroupées en classesIILes paramètres de position d'une série statistiqueALa moyenneBLes médianesIIIUn paramètre de dispersion d'une série statistique : l'étendueIVReprésentations graphiquesLe vocabulaire des séries statistiques
Population et caractère
Population
Une population est un ensemble d'individus.
L'ensemble des Français constitue une population.
Caractère
Un caractère est une caractéristique qui définit les individus d'une population, et dont les valeurs peuvent être différentes d'un individu à un autre de la population.
Le groupe sanguin est un caractère que l'on peut étudier sur la population constituée par l'ensemble des Français.
Caractère qualitatif ou quantitatif
Un caractère peut être quantitatif si ses valeurs sont numériques ou qualitatif si ses valeurs ne sont pas numériques.
Le groupe sanguin (caractère étudié sur la population constituée par l'ensemble des Français) est un caractère qualitatif, car les valeurs possibles ne sont pas numériques.
Effectif et fréquence
Effectif total
L'effectif total d'une série statistique correspond au nombre d'individus de la population étudiée.
On regroupe en général une série statistique par valeurs identiques au sein d'un tableau, qui précise l'effectif de chaque valeur, c'est-à-dire le nombre d'individus présentant chaque valeur. Pour chaque valeur, on peut alors calculer également la fréquence, égale au quotient de l'effectif de la valeur par l'effectif total.
- La somme de la ligne des effectifs est égale à l'effectif total de la série.
- La somme de la ligne des fréquences est égale à 1.
Dans un sac de 60 billes, on trouve des billes rouges, bleues, vertes ou jaunes.
Couleur | Rouge | Bleu | Vert | Jaune | TOTAL |
---|---|---|---|---|---|
Effectif | 12 | 28 | 7 | 13 | 60 |
Fréquence | \dfrac{12}{60} | \dfrac{28}{60} | \dfrac{7}{60} | \dfrac{13}{60} | 1 |
Effectifs cumulés croissants
On considère une série statistique quantitative dont les valeurs sont rangées dans l'ordre croissant.
L'effectif cumulé croissant d'une valeur (ou d'une classe) est l'effectif des valeurs inférieures ou égales à la valeur (ou la classe).
Dans une classe de 24 élèves, on a noté les pointures des élèves :
Pointures | 37 | 38 | 39 | 40 | TOTAL |
---|---|---|---|---|---|
Effectifs | 6 | 5 | 6 | 7 | 24 |
Effectifs cumulés croissants | 6 | 11 | 17 | 24 |
On peut définir de la même façon les fréquences cumulées croissantes.
Séries statistiques regroupées en classes
Série statistique regroupée en classes
Une série statistique regroupée en classes est une série statistique dont les valeurs sont regroupées par intervalles.
Taille x (en cm) | 10 \leq x \lt 20 | 20 \leq x \lt 25 | 25 \leq x \lt 40 | 40 \leq x \leq 50 |
---|---|---|---|---|
Effectif | 11 | 8 | 16 | 3 |
Les paramètres de position d'une série statistique
La moyenne
Moyenne
La moyenne d'une série quantitative est égale au quotient de la somme des valeurs de la série par l'effectif total.
Pour calculer plus facilement une moyenne, on peut utiliser la formule de la moyenne pondérée :
- On multiplie chaque valeur par son effectif.
- On calcule la somme de ces produits.
- On divise enfin cette somme par l'effectif total.
Le tableau d'effectifs suivant présente les notes obtenues par un groupe d'élèves :
Notes | 5 | 8 | 9 | 10 | 10,5 | 11 | 13 | 14 | 14,5 | 16 |
---|---|---|---|---|---|---|---|---|---|---|
Nombre d'élèves | 1 | 3 | 5 | 6 | 2 | 5 | 6 | 1 | 2 | 1 |
On peut ainsi calculer facilement la moyenne pondérée :
m = \dfrac{5 \times 1 + 8 \times 3 + 9 \times 5 + 10 \times 6 + 10{,}5 \times 2 + 11 \times 5 + 13 \times 6 + 14 \times 1 + 14{,}5 \times 2 + 16 \times 1}{32} \approx 10{,}8 (arrondie au dixième).
Pour une série regroupée en classes, on remplace chaque classe par la valeur centrale de la classe pour calculer la moyenne.
Taille x (en cm) | 10 \leq x \lt 20 | 20 \leq x \lt 25 | 25 \leq x \lt 40 | 40 \leq x \leq 50 |
---|---|---|---|---|
Centre de la classe (cm) | 15 | 22,5 | 32,5 | 45 |
Effectif | 11 | 8 | 16 | 3 |
La moyenne des tailles est donc :
m\approx \dfrac{15\times11+22{,}5\times8+32{,}5\times16+45\times3}{11+8+16+3}\approx26{,}3 cm (arrondie au dixième).
Les médianes
Médiane
On appelle médiane d'une série rangée par ordre croissant toute valeur d'une série qui la partage en deux séries de même effectif.
Si on considère une série dont les valeurs des n individus sont rangées par ordre croissant.
- Si n est impair, on choisit souvent comme médiane la \dfrac{n+1}{2}^{\text{ème}} valeur de la série ordonnée.
- Si n est pair, on choisit souvent comme médiane la valeur centrale entre la \dfrac{n}{2}^{\text{ème}} valeur et la \dfrac{n}{2}+ 1 ^{\text{ème}} valeur.
Reprenons l'exemple des pointures des 24 élèves :
Pointures | 37 | 38 | 39 | 40 | TOTAL |
---|---|---|---|---|---|
Effectifs | 6 | 5 | 6 | 7 | 24 |
Effectifs cumulés croissants | 6 | 11 | 17 | 24 |
L'effectif total, n=24, est pair.
Ainsi \dfrac{n}{2}=12.
On choisit comme médiane la valeur centrale entre la 12e et la 13e valeur.
La ligne des effectifs cumulés croissants nous indique que :
- La 12e valeur est 39.
- La 13e valeur est également 39.
On choisit donc comme médiane 39.
Si la série est regroupée en classes, on utilise un graphique des effectifs cumulés croissants (ou des fréquences cumulées croissantes) pour choisir une médiane.
On donne les tailles de 100 élèves d'un internat :
Tailles | [150;160[ | [160;170[ | [170;180[ | [180;190[ | [190;200[ |
Effectifs | 30 | 28 | 19 | 20 | 3 |
Fréquences (en %) | 30 | 28 | 19 | 20 | 3 |
Fréquences cumulées croissantes (en %) | 30 | 58 | 77 | 97 | 100 |
Déterminons une médiane de la série des tailles.
Pour cela, on va tracer le graphique des fréquences cumulées croissantes et on lira la taille correspondant à la fréquence cumulée croissante de 50 %.
Voici le graphique :
La taille correspondant à une fréquence cumulée croissante de 50 % est environ de 167 cm.
On choisira cette valeur comme médiane.
Un paramètre de dispersion d'une série statistique : l'étendue
Étendue
L'étendue d'une série quantitative est égale à la différence entre la plus grande valeur et la plus petite valeur de la série.
Dans la série des pointures des élèves, l'étendue est 40-37=3.
Dans le cas d'une série continue (série rangée en classes), si l'énoncé ne demande pas de choisir comme valeur la plus grande une valeur particulière, on choisit la borne supérieure du dernier intervalle (de la dernière classe).
Dans la série des tailles des élèves de l'internat, l'étendue est 200-150=50 cm.
Représentations graphiques
Diagramme en bâtons
Pour représenter une série non regroupée en classes (ou série discrète), on peut construire un diagramme en bâtons : on associe un bâton à chacune des valeurs distinctes de la série, dont la hauteur est proportionnelle à l'effectif.
Histogramme
Pour représenter une série regroupée en classes (ou série continue), on peut construire un histogramme : on associe un rectangle à chacune des classes de la série, dont l'aire est proportionnelle à l'effectif.
Une société fabrique des barres métalliques à l'aide d'un appareil qui est calibré pour couper des barres d'une longueur de 120 cm.
Une étude a été effectuée sur 40 barres coupées.
Voici les mesures obtenues :
Si l'on choisit 1 cm pour 0,5 cm en abscisse et 1 cm2 pour une barre, on obtient l'histogramme suivant :
Diagramme circulaire
Pour représenter une série statistique, on peut construire un diagramme circulaire. L'angle des portions est proportionnel aux effectifs.
Pour obtenir la mesure de l'angle, on peut multiplier l'effectif de la valeur par \dfrac{360}{\text{effectif total}}.
Dans une classe de 24 élèves, on a demandé le sport préféré à chacun.
Voici les résultats :
On en déduit le diagramme circulaire suivant :