Organisation et gestion de données Fiche brevet

I

Le vocabulaire des séries statistiques

A

Population et caractère

Population

Une population est un ensemble d'individus.

L'ensemble des Français constitue une population.

Caractère

Un caractère est une caractéristique qui définit les individus d'une population, et dont les valeurs peuvent être différentes d'un individu à un autre de la population.

Le groupe sanguin est un caractère que l'on peut étudier sur la population constituée par l'ensemble des Français.

Caractère qualitatif ou quantitatif

Un caractère peut être quantitatif si ses valeurs sont numériques ou qualitatif si ses valeurs ne sont pas numériques.

Le groupe sanguin (caractère étudié sur la population constituée par l'ensemble des Français) est un caractère qualitatif, car les valeurs possibles ne sont pas numériques.

B

Effectif et fréquence

Effectif total

L'effectif total d'une série statistique correspond au nombre d'individus de la population étudiée.

On regroupe en général une série statistique par valeurs identiques au sein d'un tableau, qui précise l'effectif de chaque valeur, c'est-à-dire le nombre d'individus présentant chaque valeur. Pour chaque valeur, on peut alors calculer également la fréquence, égale au quotient de l'effectif de la valeur par l'effectif total.

  • La somme de la ligne des effectifs est égale à l'effectif total de la série.
  • La somme de la ligne des fréquences est égale à 1.

Dans un sac de 60 billes, on trouve des billes rouges, bleues, vertes ou jaunes.

Couleur Rouge Bleu Vert Jaune TOTAL
Effectif 12 28 7 13 60
Fréquence \(\displaystyle{\dfrac{12}{60}}\) \(\displaystyle{\dfrac{28}{60}}\) \(\displaystyle{\dfrac{7}{60}}\) \(\displaystyle{\dfrac{13}{60}}\) 1

Effectifs cumulés croissants

On considère une série statistique quantitative dont les valeurs sont rangées dans l'ordre croissant.

L'effectif cumulé croissant d'une valeur (ou d'une classe) est l'effectif des valeurs inférieures ou égales à la valeur (ou la classe).

Dans une classe de 24 élèves, on a noté les pointures des élèves :

Pointures 37 38 39 40 TOTAL
Effectifs 6 5 6 7 24
Effectifs cumulés croissants 6 11 17 24

On peut définir de la même façon les fréquences cumulées croissantes.

C

Séries statistiques regroupées en classes

Série statistique regroupée en classes

Une série statistique regroupée en classes est une série statistique dont les valeurs sont regroupées par intervalles.

Taille x (en cm) \(\displaystyle{10 \leq x \lt 20}\) \(\displaystyle{20 \leq x \lt 25}\) \(\displaystyle{25 \leq x \lt 40}\) \(\displaystyle{40 \leq x \leq 50}\)
Effectif 11 8 16 3
II

Les paramètres de position d'une série statistique

A

La moyenne

Moyenne

La moyenne d'une série quantitative est égale au quotient de la somme des valeurs de la série par l'effectif total.

Pour calculer plus facilement une moyenne, on peut utiliser la formule de la moyenne pondérée :

  • On multiplie chaque valeur par son effectif.
  • On calcule la somme de ces produits.
  • On divise enfin cette somme par l'effectif total.

Le tableau d'effectifs suivant présente les notes obtenues par un groupe d'élèves :

Notes 5 8 9 10 10,5 11 13 14 14,5 16
Nombre d'élèves 1 3 5 6 2 5 6 1 2 1

On peut ainsi calculer facilement la moyenne pondérée :

\(\displaystyle{m = \dfrac{5 \times 1 + 8 \times 3 + 9 \times 5 + 10 \times 6 + 10,5 \times 2 + 11 \times 5 + 13 \times 6 + 14 \times 1 + 14,5 \times 2 + 16 \times 1}{32} \approx 10,8}\) (arrondie au dixième).

Pour une série regroupée en classes, on remplace chaque classe par la valeur centrale de la classe pour calculer la moyenne.

Taille x (en cm) \(\displaystyle{10 \leq x \lt 20}\) \(\displaystyle{20 \leq x \lt 25}\) \(\displaystyle{25 \leq x \lt 40}\) \(\displaystyle{40 \leq x \leq 50}\)
Centre de la classe (cm) 15 22,5 32,5 45
Effectif 11 8 16 3

La moyenne des tailles est donc :

\(\displaystyle{m\approx \dfrac{15\times11+22,5\times8+32,5\times16+45\times3}{11+8+16+3}\approx26,3}\) cm (arrondie au dixième).

B

Les médianes

Médiane

On appelle médiane d'une série rangée par ordre croissant toute valeur d'une série qui la partage en deux séries de même effectif.

Si on considère une série dont les valeurs des \(\displaystyle{n}\) individus sont rangées par ordre croissant.

  • Si \(\displaystyle{n}\) est impair, on choisit souvent comme médiane la \(\displaystyle{\dfrac{n+1}{2}^{\text{ème}}}\) valeur de la série ordonnée.
  • Si \(\displaystyle{n}\) est pair, on choisit souvent comme médiane la valeur centrale entre la \(\displaystyle{\dfrac{n}{2}^{\text{ème}}}\) valeur et la \(\displaystyle{\dfrac{n}{2}+ 1 ^{\text{ème}}}\) valeur.

Reprenons l'exemple des pointures des 24 élèves :

Pointures 37 38 39 40 TOTAL
Effectifs 6 5 6 7 24
Effectifs cumulés croissants 6 11 17 24

L'effectif total, \(n=24\), est pair.

Ainsi \(\dfrac{n}{2}=12\).

On choisit comme médiane la valeur centrale entre la 12e et la 13e valeur.

La ligne des effectifs cumulés croissants nous indique que :

  • La 12e valeur est 39.
  • La 13e valeur est également 39.

On choisit donc comme médiane 39.

Si la série est regroupée en classes, on utilise un graphique des effectifs cumulés croissants (ou des fréquences cumulées croissantes) pour choisir une médiane.

On donne les tailles de 100 élèves d'un internat :

Tailles [150;160[ [160;170[ [170;180[ [180;190[ [190;200[
Effectifs 30 28 19 20 3
Fréquences (en %) 30 28 19 20 3
Fréquences cumulées croissantes (en %) 30 58 77 97 100

Déterminons une médiane de la série des tailles.

Pour cela, on va tracer le graphique des fréquences cumulées croissantes et on lira la taille correspondant à la fréquence cumulée croissante de 50 %.

Voici le graphique :

-

La taille correspondant à une fréquence cumulée croissante de 50 % est environ de 167 cm.

On choisira cette valeur comme médiane.

III

Un paramètre de dispersion d'une série statistique : l'étendue

Étendue

L'étendue d'une série quantitative est égale à la différence entre la plus grande valeur et la plus petite valeur de la série.

Dans la série des pointures des élèves, l'étendue est \(40−37=3\).

Dans le cas d'une série continue (série rangée en classes), si l'énoncé ne demande pas de choisir comme valeur la plus grande une valeur particulière, on choisit la borne supérieure du dernier intervalle (de la dernière classe).

Dans la série des tailles des élèves de l'internat, l'étendue est \(200−150=50\) cm.

IV

Représentations graphiques

Diagramme en bâtons

Pour représenter une série non regroupée en classes (ou série discrète), on peut construire un diagramme en bâtons : on associe un bâton à chacune des valeurs distinctes de la série, dont la hauteur est proportionnelle à l'effectif.

-

Histogramme

Pour représenter une série regroupée en classes (ou série continue), on peut construire un histogramme : on associe un rectangle à chacune des classes de la série, dont l'aire est proportionnelle à l'effectif.

Une société fabrique des barres métalliques à l'aide d'un appareil qui est calibré pour couper des barres d'une longueur de 120 cm.

Une étude a été effectuée sur 40 barres coupées.

Voici les mesures obtenues :

-

Si l'on choisit 1 cm pour 0,5 cm en abscisse et 1 cm2 pour une barre, on obtient l'histogramme suivant :

-

Diagramme circulaire

Pour représenter une série statistique, on peut construire un diagramme circulaire. L'angle des portions est proportionnel aux effectifs.

Pour obtenir la mesure de l'angle, on peut multiplier l'effectif de la valeur par \(\displaystyle{\dfrac{360}{\text{effectif total}}}\).

Dans une classe de 24 élèves, on a demandé le sport préféré à chacun.

Voici les résultats :

-

On en déduit le diagramme circulaire suivant :

-