Seconde 2015-2016

En vous inscrivant, vous autorisez Kartable à vous envoyer ses communications par email.

ou
Se connecter
Mot de passe oublié ?
ou

Les statistiques

I

Les séries statistiques

A

Vocabulaire

Population

Une population est un ensemble d'individus.

Les enfants nés à Paris en 2000 représentent une population.

Les voitures produites dans une usine au cours du mois de février 2010 représentent également une population.

Echantillon

Lorsque l'effectif d'une population est trop important, on étudie ses caractères à partir d'un échantillon représentatif qui est une partie de la population.

Si on veut par exemple étudier l'ensemble de la population française, il est préférable d'étudier un échantillon de cette population car l'effectif est trop grand.

Caractère

Un caractère est une caractéristique qui définit les individus d'une population, et dont les valeurs sont différentes d'un individu à un autre de la population.

La couleur, la taille, le poids, l'âge, la date de production sont des exemples des caractères.

Caractère quantitatif ou caractère qualitatif

Un caractère peut être quantitatif si ses valeurs sont numériques, ou qualitatif si ses valeurs ne sont pas numériques.

La taille est un caractère quantitatif alors que la couleur des yeux est un caractère qualitatif.

B

Les séries quantitatives discrètes

Série quantitative discrète

Soient \(\displaystyle{n}\) et \(\displaystyle{p}\) deux entiers naturels non nuls et \(\displaystyle{i}\) un entier naturel compris entre 1 et \(\displaystyle{p}\).
On appelle série quantitative discrète une liste de \(\displaystyle{n}\) réels : ce sont les valeurs d'un caractère pour chacun des individus composant l'échantillon d'effectif total \(\displaystyle{n}\). Pour étudier une telle série, on compte le nombre d'apparition \(\displaystyle{n_{i}}\) (effectif) de chaque réel de la liste, de manière à identifier \(\displaystyle{p}\) réels \(\displaystyle{x_{i}}\) distincts. On présente alors la série sous la forme de \(\displaystyle{p}\) couples :

\(\displaystyle{\left(x_{i} ; n_{i}\right)}\)

La série des pointures des 12 garçons d'une classe de seconde est donnée par la liste suivante :

{ (39 ; 2) ; (40 ; 3) ; (41 ; 5) ; (42 ; 1) ; (44 ; 1) }

Il y a donc parmi ces 12 garçons :

  • Deux qui chaussent du 39
  • Trois qui chaussent du 40
  • Cinq qui chaussent du 41
  • Un qui chausse du 42
  • Un qui chausse du 44

On présente en général une série quantitative discrète à l'aide d'un tableau.

\(\displaystyle{x_{i}}\) \(\displaystyle{x_{1}}\) \(\displaystyle{x_{2}}\) ... \(\displaystyle{x_{p}}\)
\(\displaystyle{n_{i}}\) \(\displaystyle{n_{1}}\) \(\displaystyle{n_{2}}\) ... \(\displaystyle{n_{p}}\)

La série des pointures des 12 garçons d'une classe de seconde, donnée par la liste suivante : { (39 ; 2) ; (40 ; 3) ; (41 ; 5) ; (42 ; 1) ; (44 ; 1) } peut être résumée dans un tableau.

Pointure \(\displaystyle{x_i}\) 39 40 41 42 44
Effectif \(\displaystyle{n_i}\) 2 3 5 1 1

Effectif total

L'effectif total est la somme des effectifs de chaque valeur. C'est donc l'effectif de la population que l'on étudie ou de l'échantillon si on étudie un échantillon.

\(\displaystyle{n =n_{1} + n_{2} +... + n_{p}}\)

Pointure \(\displaystyle{x_i}\) 39 40 41 42 44 TOTAL
Effectif \(\displaystyle{n_i}\) 2 3 5 1 1 12

L'effectif total est :

\(\displaystyle{n=2 +3+5+1+1=12}\)

Fréquence des \(\displaystyle{x_i}\)

La fréquence des \(\displaystyle{x_i}\) est le rapport de l'effectif d'une valeur par l'effectif total.

\(\displaystyle{f_{i} = \dfrac{n_{i}}{n}}\)

Pointure \(\displaystyle{x_i}\) 39 40 41 42 44 TOTAL
Effectif \(\displaystyle{n_i}\) 2 3 5 1 1 12
Fréquence \(\displaystyle{f_i}\) \(\displaystyle{\dfrac{2}{12}}\) \(\displaystyle{\dfrac{3}{12}}\) \(\displaystyle{\dfrac{5}{12}}\) \(\displaystyle{\dfrac{1}{12}}\) \(\displaystyle{\dfrac{1}{12}}\) 1

La somme des fréquences d'une série est égale à 1.

\(\displaystyle{f_{1}+f_{2}+...+f_{p}= 1}\)

Pointure \(\displaystyle{x_i}\) 39 40 41 42 44 TOTAL
Effectif \(\displaystyle{n_i}\) 2 3 5 1 1 12
Fréquence \(\displaystyle{f_i}\) \(\displaystyle{\dfrac{2}{12}}\) \(\displaystyle{\dfrac{3}{12}}\) \(\displaystyle{\dfrac{5}{12}}\) \(\displaystyle{\dfrac{1}{12}}\) \(\displaystyle{\dfrac{1}{12}}\) 1

On a bien :

\(\displaystyle{\dfrac{2}{12}+\dfrac{3}{12}+\dfrac{5}{12}+\dfrac{1}{12}+\dfrac{1}{12}=1}\)

C

Les séries quantitatives regroupées en classes

Série quantitative regroupée en classes

Une série quantitative regroupée en classes (de même amplitude ou non), ou série continue, est une série quantitative dont les valeurs \(\displaystyle{x_{i}}\) sont regroupées par intervalles de réels.

Taille (en cm) [10 ; 20[ [20 ; 25[ [25 ; 40[ [40 ; 50]
Effectif 11 8 16 3
D

Les séries qualitatives

Série qualitative

Une série qualitative est une suite de valeurs d'un caractère non quantitatif.

Couleur Rouge Bleu Vert Jaune
Effectif 12 28 7 13
II

Les paramètres de position d'une série quantitative

A

La moyenne

Moyenne

On appelle moyenne d'une série, généralement notée \(\displaystyle{\overline{x}}\), le réel :

\(\displaystyle{\overline{x} =\dfrac{n_{1} x_{1} + n_{2} x_{2} +... + n_{p} x_{p}}{n}}\)

Le tableau d'effectifs suivant présente les notes obtenues par un groupe d'élèves :

Note 5 8 9 10 10,5 11 13 14 14,5 16
Nombre d'élèves 1 3 5 6 2 5 6 1 2 1

On peut ainsi calculer facilement la moyenne pondérée (arrondie au dixième) :

\(\displaystyle{m = \dfrac{5 \times 1 + 8 \times 3 + 9 \times 5 + 10 \times 6 + 10,5 \times 2 + 11 \times 5 + 13 \times 6 + 14 \times 1 + 14,5 \times 2 + 16 \times 1}{32} \approx 10,8}\)

Pour une série regroupée en classes, on détermine une valeur approchée de la moyenne en remplaçant chaque classe par son centre.

On considère la série statistique suivante :

Taille x (en cm) \(\displaystyle{10 \leq x \lt 20}\) \(\displaystyle{20 \leq x \lt 25}\) \(\displaystyle{25 \leq x \lt 40}\) \(\displaystyle{40 \leq x \leq 50}\)
Centre de la classe (cm) 15 22,5 32,5 45
Effectif 11 8 16 3

La moyenne des tailles est donc :

\(\displaystyle{m\approx\dfrac{15\times11+22,5\times8+32,5\times16+45\times3}{11+8+16+3}\approx26,3}\) cm (arrondie au dixième)

On peut calculer la moyenne d'une série en utilisant la fréquence de chaque valeur :

\(\displaystyle{\overline{x} =f_{1} x_{1}+f_{2} x_{2}+...+f_{p} x_{p}}\).

On considère la série statistique suivante :

Pointure \(\displaystyle{x_i}\) 39 40 41 42 44 TOTAL
Effectif \(\displaystyle{n_i}\) 2 3 5 1 1 12
Fréquence \(\displaystyle{f_i}\) \(\displaystyle{\dfrac{2}{12}}\) \(\displaystyle{\dfrac{3}{12}}\) \(\displaystyle{\dfrac{5}{12}}\) \(\displaystyle{\dfrac{1}{12}}\) \(\displaystyle{\dfrac{1}{12}}\) 1

On calcule la moyenne :

\(\displaystyle{\overline{x}=39\times\dfrac{2}{12}+40\times\dfrac{3}{12}+41\times \dfrac{5}{12}+42\times \dfrac{1}{12}+44\times\dfrac{1}{12}=\dfrac{163}{4}=40,75}\)

B

Les médianes

Médiane

On appelle médiane d'une série rangée par ordre croissant toute valeur qui partage la série en deux séries de même effectif.

On considère une série dont les valeurs des \(\displaystyle{n}\) individus sont rangées par ordre croissant.

  • Si n est impair, on prend en général pour médiane la \(\displaystyle{\dfrac{n+1}{2}^{\text{ème}}}\) valeur de la série ordonnée.
  • Si n est pair, on prend en général pour médiane le centre de l'intervalle \(\displaystyle{\left[\dfrac{n}{2}^{\text{ème}} \text{ valeur ; }\dfrac{n}{2}+ 1 ^{\text{ème}} \text{ valeur}\right]}\).

Une médiane de la série : 3, 5, 6, 11, 14, 21, 27 est la valeur 11.

Une médiane de la série : 12, 13, 14, 19, 31, 41 est la valeur arbitraire 16,5.

Ne pas confondre le rang d'une médiane et sa valeur.

Une médiane n'est pas toujours une valeur observée dans la série statistique.

Lorsque la série est une série continue, on prend comme médiane la valeur pour laquelle on obtient une fréquence cumulée de 50%.

Lors d'un devoir commun, les notes de tout l'établissement ont été regroupées en classes.

Notes \(\displaystyle{\left[ 0;4 \right[}\) \(\displaystyle{\left[ 4;8 \right[}\) \(\displaystyle{\left[ 8;10 \right[}\) \(\displaystyle{\left[ 10;12 \right[}\) \(\displaystyle{\left[ 12;16 \right[}\) \(\displaystyle{\left[ 16;20 \right[}\)
Centre de la classe 2 6 9 11 14 18
Effectifs 21 46 117 123 86 7
Fréquences (en %) 5,25 11,5 29,25 30,75 21,5 1,75
Fréquences cumulées croissantes (en %) 5,25 16,75 46 76,75 98,25 100

Le graphique (ou polygone) des fréquences cumulées croissantes (F.C.C.) est alors le suivant :

-

On y lit que 10,26 est une médiane de cette série

C

Les quartiles

Premier quartile

Le premier quartile est la plus petite valeur, notée \(\displaystyle{Q_1}\), d'une série, rangée par ordre croissant, telle qu'au moins 25% de l'effectif lui soit inférieur ou égal.

On considère la série suivante issue d'un échantillon de taille 8 : 3, 4, 5, 6, 11, 14, 21, 27.

Comme \(\displaystyle{\dfrac{25}{100}\times{8}=2}\), le premier quartile de cette série est son deuxième élément soit 4.

On considère la série suivante issue d'un échantillon de taille 7 : 10, 12, 13, 14, 19, 31, 41.

Comme \(\displaystyle{\dfrac{25}{100}\times7=1,75}\), le premier quartile de cette série est son deuxième élément soit 12.

Troisième quartile

Le troisième quartile est la plus petite valeur, notée \(\displaystyle{Q_3}\), d'une série, rangée par ordre croissant, telle qu'au moins 75% de l'effectif lui soit inférieur ou égal.

On considère la série suivante issue d'un échantillon de taille 8 : 3, 4, 5, 6, 11, 14, 21, 27.

Comme \(\displaystyle{\dfrac{75}{100}\times8=6}\), le troisième quartile de cette série est son sixième élément soit 14.

On considère la série suivante issue d'un échantillon de taille 7 : 10, 12, 13, 14, 19, 31, 41.

Comme \(\displaystyle{\dfrac{75}{100}\times7=5,25}\), le troisième quartile de cette série est son sixième élément soit 31.

Ecart interquartile

L'écart interquartile est le réel \(\displaystyle{Q_{3} - Q_{1}}\).

L'écart interquartile de la série 3, 4, 5, 6, 11, 14, 21, 27 est la valeur \(\displaystyle{14 − 4 = 10}\).

L'écart interquartile de la série : 10, 12, 13, 14, 19, 31, 41 est la valeur \(\displaystyle{31 − 12 = 19}\).

Alors que la médiane n'est pas toujours une valeur observée, les quartiles sont des valeurs observées.

De manière analogue, on peut définir le premier décile \(\displaystyle{D_{1}}\), l'avant-dernier décile \(\displaystyle{D_{9}}\), et l'écart interdécile.
-

Lorsque la série est une série à caractère continu :

  • On choisit comme premier quartile la valeur pour laquelle on obtient une fréquence cumulée de 25%.
  • On choisit comme troisième quartile la valeur pour laquelle on obtient une fréquence cumulée de 75%.

On reprend l'exemple précédent des notes et le polygone des fréquences cumulées croissantes :

-

On obtient graphiquement :

  • \(\displaystyle{Q_1\approx 8,56}\)
  • \(\displaystyle{Q_3\approx 11,89}\)
III

Les représentations graphiques

A

Les diagrammes en bâtons

Diagramme en bâtons

Pour représenter une série non regroupée en classes, on peut construire un diagramme en bâtons : on associe un bâton à chacune des valeurs distinctes de la série, dont la hauteur est proportionnelle à l'effectif.

On considère la série statistique suivante :

Couleur Rouge Bleu Vert Jaune
Effectif 12 28 7 13

Le diagramme en bâtons suivant représente la série ce tableau, où un carreau en hauteur est égal à un effectif de 4.

-
B

Les histogrammes

Histogramme

Pour représenter une série regroupée en classes, on peut construire un histogramme : on associe un rectangle à chacune des classes de la série, dont l'aire est proportionnelle à l'effectif.

On considère la série statistique suivante :

Taille (en cm) [5 ; 20[ [20 ; 30[ [30 ; 40[ [40 ; 60]
Effectif 12 8 16 4

L'histogramme suivant représente la série de ce tableau, où un carreau en abscisse est égal à 5 cm et l'aire d'un carreau est égale à un effectif de 1.

-
C

Les diagrammes en boîte (ou boîtes à moustaches)

Diagramme en boîte

Un diagramme en boîte est un diagramme donnant la position du minimum, du maximum, des quartiles et de la médiane choisie d'une série.

On représente, au-dessus d'un axe donnant les valeurs, un rectangle dont un des côtés donne la position de \(\displaystyle{Q_1}\) et le côté opposé la position de \(\displaystyle{Q_3}\). On ajoute une marque, dans ce rectangle, pour indiquer la position de la médiane choisie. On ajoute enfin des "moustaches" aux extrémités.

Dans l'exemple précédent des notes, on obtient le diagramme en boîte suivant :

-

Un tel diagramme peut permettre de comparer deux séries si l'on représente les diagrammes en boîte des deux séries au-dessus du même axe.