Première ES 2016-2017
Kartable
Première ES 2016-2017

Les statistiques

I

Les séries statistiques

A

Vocabulaire

Population

Une population est un ensemble d'individus.

Les enfants nés à Paris en 2000 représentent une population.

Les voitures produites dans une usine au cours du mois de février 2010 représentent également une population.

Echantillon

Lorsque l'effectif d'une population est trop important, on étudie ses caractères à partir d'un échantillon représentatif qui est une partie de la population.

Si on veut par exemple étudier l'ensemble de la population française, il est préférable d'étudier un échantillon de cette population car l'effectif est trop grand.

Caractère

Un caractère est une caractéristique qui définit les individus d'une population, et dont les valeurs sont différentes d'un individu à un autre de la population.

La couleur, la taille, le poids, l'âge, la date de production sont des exemples de caractères.

Caractère quantitatif ou qualitatif

Un caractère peut être quantitatif, si ses valeurs sont numériques, ou qualitatif, si ses valeurs ne sont pas numériques.

La taille est un caractère quantitatif alors que la couleur des yeux est un caractère qualitatif.

B

Les séries quantitatives discrètes

Série quantitative discrète

On appelle série quantitative discrète une liste de n réels (n étant un entier naturel non nul) : ce sont les valeurs d'un caractère pour chacun des individus composant l'échantillon d'effectif total n. Pour étudier une telle série, on compte le nombre d'apparition ni (effectif) de chaque réel de la liste, de manière à identifier p réels xi distincts (p est un entier naturel non nul et i un entier compris entre 1 et p). On présente alors la série sous la forme de p couples :

(xi;ni)

La série des pointures des 12 garçons d'une classe de seconde est donnée par la liste suivante :

{(39;2);(40;3);(41;5);(42;1);(44;1)}

On présente en général une série quantitative discrète à l'aide d'un tableau.

xix1x2...xp
nin1n2...np

La série des pointures des 12 garçons d'une classe de seconde est donnée par la liste suivante : {(39;2);(40;3);(41;5);(42;1);(44;1)}.

Elle peut être résumée dans un tableau :

Pointure xi3940414244
Effectif ni23511

Effectif total

L'effectif total est la somme des effectifs de chaque valeur.

n=n1+n2+...+np

Dans la série statistique suivante :

Pointure xi3940414244TOTAL
Effectif ni2351112

L'effectif total est :

n=2+3+5+1+1=12

Fréquence des xi

La fréquence des valeurs xi est le rapport de l'effectif de cette valeur par l'effectif total.

fi=nin

Pointure xi3940414244TOTAL
Effectif ni2351112
Fréquence fi2123125121121121

La somme des fréquences d'une série est égale à 1.

f1+f2+...+fp=1

Dans la série statistique suivante, on a calculé les fréquences :

Pointure xi3940414244TOTAL
Effectif ni2351112
Fréquence fi2123125121121121

On remarque que l'on a bien :

212+312+512+112+112=1

C

Les séries quantitatives regroupées en classes

Série quantitative regroupée en classes

Une série quantitative regroupée en classes (de même amplitude ou non), ou série continue, est une série quantitative dont les valeurs xi sont regroupées par intervalles de réels.

Taille (en cm)[10 ; 20[[20 ; 25[[25 ; 40[[40 ; 50]
Effectif118163
D

Les séries qualitatives

Série qualitative

Une série qualitative est une suite de valeurs d'un caractère non quantitatif.

CouleurRougeBleuVertJaune
Effectif1228713
II

Les paramètres de position d'une série quantitative

A

Le mode

Mode

On appelle mode(s) d'une série la ou les valeurs du caractère dont l'effectif est le plus grand.

On considère la série statistique suivante :

Pointure xi3940414244TOTAL
Effectif ni2351112

Le mode de cette série est 41.

Une série peut avoir plusieurs modes.
B

La moyenne

Moyenne

On appelle moyenne d'une série, généralement notée x, le réel :

x=n1x1+n2x2+...+npxpn

Le tableau d'effectifs suivant présente les notes obtenues par un groupe d'élèves :

Note5891010,511131414,516
Nombre d'élèves1356256121

On peut ainsi calculer facilement la moyenne pondérée :

m=5×1+8×3+9×5+10×6+10,5×2+11×5+13×6+14×1+14,5×2+16×132

On arrondit au dixième :

m10,8

Pour une série regroupée en classes, on détermine une valeur approchée de la moyenne en remplaçant chaque classe par son centre.

La série suivante est regroupée en classes. On ajoute une ligne qui donne le centre de chaque classe avant de pouvoir calculer la moyenne :

Taille x (en cm)10x<2020x<2525x<4040x50
Centre de la classe (cm)1522,532,545
Effectif118163

La moyenne des tailles est donc :

m15×11+22,5×8+32,5×16+45×311+8+16+326,3 cm (arrondie au dixième).

La moyenne peut également être calculée à partir des fréquences :

x=i=1p(fixi)=f1x1+f2x2+...+fpxp

On considère la série statistique suivante pour laquelle on connaît les fréquences :

Pointure xi3940414244TOTAL
Effectif ni2351112
Fréquence fi2123125121121121

La moyenne vaut :

x=39×212+40×312+41×512+42×112+44×112=1634=40,75

C

Les médianes

Médiane

On appelle médiane d'une série rangée par ordre croissant toute valeur qui partage la série en deux séries de même effectif.

On considère une série dont les valeurs des n individus sont rangées par ordre croissant.

  • Si n est impair, on prend en général pour médiane la n+12ème valeur de la série ordonnée.
  • Si n est pair, on prend en général pour médiane le centre de l'intervalle [n2ème valeur ; n2+1ème valeur].

Une médiane de la série : 3, 5, 6, 11, 14, 21, 27 est la valeur 11.

Une médiane de la série : 12, 13, 14, 19, 31, 41 est la valeur arbitraire 16,5.

Ne pas confondre le rang d'une médiane et sa valeur.

Une médiane n'est pas toujours une valeur observée dans la série statistique.

Lorsque la série est une série continue, on prend comme médiane la valeur pour laquelle on obtint une fréquence cumulée de 50%.

Lors d'un devoir commun, les notes de tout l'établissement ont été regroupées en classes :

Notes[0;4[[4;8[[8;10[[10;12[[12;16[[16;20[
Centre de classe269111418
Effectif2146117123867
Fréquence en %5,2511,529,2530,7521,51,75
Fréquence cumulée croissante5,2516,754676,7598,25100

Le graphique (ou polygone) des fréquences cumulées croissantes (F.C.C.) est alors le suivant :

-

On y lit que 10,26 est une médiane de cette série.

III

Les paramètres de dispersion d'une série quantitative

A

L'étendue

Etendue

On appelle étendue d'une série la différence entre le plus grand des xi et le plus petit des xi, c'est-à-dire entre la plus grande et la plus petite valeur observées.

Note5891010,511131414,516
Nombre d'élèves1356256121

L'étendue de cette série est :

165=11

Dans le cas d'une série statistique continue (dont les valeurs sont regroupées en classes), et sauf mention contraire de l'énoncé, on prend pour valeurs extrêmes la borne inférieure du premier intervalle et la borne supérieure du deuxième intervalle.

B

Les quartiles

Premier quartile

Le premier quartile est la plus petite valeur, notée Q1, d'une série, rangée par ordre croissant, telle qu'au moins 25% de l'effectif lui soit inférieur ou égal.

On considère une série dont les valeurs des n individus sont rangées par ordre croissant.

  • Si n4 est un entier, le premier quartile est la (n4)ème valeur de la série.
  • Si n4 n'est pas un entier, le premier quartile est la valeur dont le rang dans la série est l'entier directement supérieur à n4.

Le premier quartile de la série : 3, 5, 6, 11, 14, 19, 21, 27 est la valeur 5.

Le premier quartile de la série : 12, 13, 14, 19, 31, 41 est la valeur 13.

On considère une série dont les valeurs des n individus sont rangées par ordre croissant.

  • Si n2 est un entier, le deuxième quartile est la (n2)ème valeur de la série.
  • Si n2 n'est pas un entier, le deuxième quartile est la valeur dont le rang dans la série est l'entier directement supérieur à n2.

Le deuxième quartile de la série : 3, 5, 6, 11, 14, 19, 21, 27 est la valeur 11.

Le deuxième quartile de la série : 12, 13, 14, 19, 31, 41 est la valeur 14.

Troisième quartile

Le troisième quartile est la plus petite valeur, notée Q3, d'une série, rangée par ordre croissant, telle qu'au moins 75% de l'effectif lui soit inférieur ou égal.

On considère une série dont les valeurs des n individus sont rangées par ordre croissant.

  • Si 3n4 est un entier, le troisième quartile est la (3n4)ème valeur de la série.
  • Si 3n4 n'est pas un entier, le troisième quartile est la valeur dont le rang dans la série est l'entier directement supérieur à 3n4.

Le troisième quartile de la série : 3, 5, 6, 11, 14, 19, 21, 27 est la valeur 19.

Le troisième quartile de la série : 12, 13, 14, 19, 31, 41 est la valeur 31.

Ecart interquartile

L'écart interquartile est le réel Q3Q1.

L'écart interquartile de la série : 3, 5, 6, 11, 14, 19, 21, 27 est la valeur 195=14.

L'écart interquartile de la série : 12, 13, 14, 19, 31, 41 est la valeur 3113=18.

Alors que la médiane n'est pas toujours une valeur observée, les quartiles sont des valeurs observées.

De manière analogue, on peut définir le premier décile D1, l'avant-dernier décile D9, et l'écart interdécile.
-

Lorsque la série est une série à caractère continu :

  • On choisit comme premier quartile la valeur pour laquelle on obtient une fréquence cumulée de 25%.
  • On choisit comme troisième quartile la valeur pour laquelle on obtient une fréquence cumulée de 75%.

On reprend l'exemple précédent et le polygone des fréquences cumulées croissantes :

-

On obtient graphiquement :

  • Q18,56
  • Q311,89
C

La variance et l'écart-type

Variance

On appelle variance d'une série, notée V, le réel :

V=n1(x1x)2+...+np(xpx)2n

Considérons la série suivante d'effectif total n=12 et de moyenne x=40,75.

Pointure xi3940414244TOTAL
Effectif ni2351112

On a alors :

V=2×(3940,75)2+3×(4040,75)2+5×(4140,75)2+1×(4240,75)2+1×(4440,75)212=1,6875

La variance peut également être calculée par la formule suivante :

V=1n×[i=1p(nix2i)]x2=1n×[n1x21+n2x22+...+npx2p]x2

Considérons la série suivante d'effectif total n=12 et de moyenne x=40,75.

Pointure xi3940414244TOTAL
Effectif ni2351112

On a alors :

V=112×(2×392+3×402+5×412+1×422+1×442)40,752=1,6875

Dans le cas d'une série statistique continue, les valeurs xi sont remplacées par les centres des classes. Le résultat obtenu n'est alors qu'une valeur approchée de la variance.

Ecart-type

On appelle écart-type d'une série, noté σ, le réel :

σ=V

V représente la variance de la série.

Considérons la série suivante de variance V=1,6 875.

Pointure xi3940414244TOTAL
Effectif ni2351112

L'écart-type est donc :

σ=1,68751,299

La variance n'a pas la même unité que la moyenne contrairement à l'écart-type.

D

Associer le paramètre de dispersion au paramètre de position

Pour étudier une série statistique, on cherche à la fois à étudier sa position et sa dispersion.

On associe la moyenne à l'écart-type. La moyenne est un paramètre de tendance centrale alors que l'écart-type traduit la dispersion des valeurs autour de cette position. C'est un écart moyen par rapport à la moyenne.

On associe la médiane à l'écart interquartile. La médiane est un paramètre de tendance centrale alors que l'écart interquartile traduit la dispersion des valeurs autour de cette position.

IV

Les représentations graphiques

A

Les histogrammes

Histogramme

Pour représenter une série regroupée en classes, on peut construire un histogramme : on associe un rectangle à chacune des classes de la série, dont l'aire est proportionnelle à l'effectif.

Taille (en cm)[5 ; 20[[20 ; 30[[30 ; 40[[40 ; 50]
Effectif128164

L'histogramme suivant représente la série de ce tableau, où un carreau en abscisse est égal à 5 cm et l'aire d'un carreau est égale à un effectif de 1.

-
B

Les diagrammes en boîte

Diagramme en boîte

Un diagramme en boîte est un diagramme donnant la position du minimum, du maximum, des quartiles et de la médiane choisie d'une série.

  • On représente, au-dessus d'un axe donnant les valeurs, un rectangle dont un des côtés donne la position de Q1 et le côté opposé la position de Q3.
  • On ajoute une marque, dans ce rectangle, pour indiquer la position de la médiane choisie.
  • On ajoute des "moustaches" comme on le voit dans l'exemple ci-dessous.

Reprenons l'exemple des notes. On obtient le diagramme en boîte suivant :

-

Que la série soit discrète ou continue, il s'agit du même type de diagramme.

Un tel diagramme peut permettre de comparer deux séries si l'on représente les diagrammes en boîte des deux séries au-dessus du même axe.

pub

Demandez à vos parents de vous abonner

Vous ne possédez pas de carte de crédit et vous voulez vous abonner à Kartable.

Vous pouvez choisir d'envoyer un SMS ou un email à vos parents grâce au champ ci-dessous. Ils recevront un récapitulatif de nos offres et pourront effectuer l'abonnement à votre place directement sur notre site.

J'ai une carte de crédit

Vous utilisez un navigateur non compatible avec notre application. Nous vous conseillons de choisir un autre navigateur pour une expérience optimale.