Seconde 2015-2016
Kartable
Seconde 2015-2016

L'échantillonnage

I

Fluctuation d'échantillonnage

A

Echantillon

Echantillon

Soit n un entier naturel non nul. Un échantillon de taille n est obtenu en prélevant au hasard, successivement et avec remise, n éléments d'une population.

Prélever 100 pièces dans une production successivement, au hasard et avec remise permet de constituer un échantillon. A chaque tirage, on note si la pièce présente un défaut ou non avant de la remettre dans la production.

Souvent, il n'y a pas de remise lors du prélèvement. Mais lorsque l'effectif total est très grand par rapport au nombre d'objets prélevés, on considère néanmoins que l'échantillon est constitué, au sens de la définition donnée, avec remise.

B

Détermination d'un intervalle de fluctuation

Au sein d'une population, on connaît la proportion p des individus ayant un caractère donné.

Parmi les échantillons de taille n extraits de cette population, la fréquence d'apparition f du caractère varie avec l'échantillon prélevé.

Lors d'une élection, un candidat a reçu 58% des suffrages. Si on prélève différents échantillons d'électeurs, la proportion de personnes ayant voté pour ce candidat dans l'échantillon, varie d'un échantillon à l'autre, tout en restant assez proche de 0,58.

Intervalle de fluctuation

Si p est la proportion d'un caractère dans une population (avec 0,2p0,8 ) alors pour un échantillon de taille n (avec n25 ), la fréquence f du caractère dans l'échantillon appartient à l'intervalle [p1n;p+1n] avec une probabilité d'au moins 0,95.

Lors d'une élection, un candidat a reçu 58% des suffrages (p=0,58 avec 0,2p0,8). Si on prélève un échantillon de n=100 (n25) électeurs, la fréquence de personnes ayant voté pour ce candidat dans l'échantillon, est dans l'intervalle de fluctuation [0,581100;0,58+1100] soit [0,48;0,68], avec une probabilité d'au moins 0,95.

L'intervalle de fluctuation à 95% est un intervalle qui contient au moins 95% des fréquences observées dans les échantillons de taille n. Ceci signifie qu'il y a un risque de 5% pour cette fréquence de ne pas se trouver dans cet intervalle.

On peut choisir d'autres coefficients à la place de 95%. Le niveau de confiance le plus fréquemment utilisé après 95% est 99%.

C

Prise de décision sur un échantillon

Prise de décision

On considère une population dans laquelle on suppose que la proportion d'un caractère est p. Après expérience, on observe f comme fréquence de ce caractère dans un échantillon de taille n.

Soit l'hypothèse : "La proportion de ce caractère dans la population est p ".

Si I est l'intervalle de fluctuation de la fréquence à 95% dans les échantillons de taille n, alors :

  • Si fI : on rejette cette hypothèse au seuil de risque 5%
  • Sinon, on ne rejette pas cette hypothèse au seuil de risque 5%.

Un laboratoire annonce qu'un médicament sauve 40% (p=0,40 avec 0,2p0,8) des patients atteints d'une maladie rare. Pour contrôler cette affirmation, on le teste sur n=100 (n25) patients atteints de cette maladie.

La fréquence des malades sauvés est de 25% (f=0,25). Que penser de l'affirmation du laboratoire ?

L'intervalle de fluctuation à 95%, de la fréquence des patients sauvés, dans les échantillons de taille 100 est [0,401100;0,40+1100] soit [0,30;0,50].

La fréquence observée, qui est 0,25, n'appartient pas à l'intervalle de fluctuation, donc, au seuil de risque 5%, on rejette l'hypothèse selon laquelle ce médicament sauve 40% des malades.

II

Estimer une proportion inconnue

A

Mise en situation

Mise en situation

Dans une population, on désire estimer la proportion inconnue p d'un caractère donné.

On étudie un échantillon de taille n, n25. Le caractère étudié apparaît avec la fréquence f (0,2f0,8). On peut estimer la proportion p du caractère dans la population totale grâce à un intervalle de confiance.

B

Intervalle de confiance

Intervalle de confiance

On considère un échantillon de taille n (n25) d'une population, où un caractère apparaît avec la fréquence f (0,2f0,8).

La proportion inconnue p, du caractère dans la population totale, appartient à l'intervalle de confiance [f1n;f+1n] avec une probabilité d'au moins 0,95 (ou avec un risque d'au plus 5%).

Lors du premier tour d'une élection, trois candidats A, B et C s'affrontaient. Les deux candidats placés en tête au premier tour participaient à un éventuel second tour.

Deux jours avant le scrutin, était paru le sondage suivant réalisé sur un échantillon de 1000 personnes de 18 ans et plus :

CandidatABC
Résultat30%28%24%

La simple lecture du sondage pouvait laisser présager un duel entre les candidats A et B au second tour.

Le résultat du premier tour ne confirme pas le sondage :

CandidatABC
Résultat29,9%26,2%26,9%

Faut-il remettre en question la validité du sondage réalisé avant l'élection ?

Déterminons l'intervalle de confiance à 95% pour chacun des candidats sachant que les conditions n25 et 0,2f0,8 sont respectées :

  • Candidat A : [0,26;0,34].
  • Candidat B : [0,24;0,32].
  • Candidat C : [0,20;0,28].

Représentons ces intervalles sur un axe gradué.

-

Les intervalles de confiance permettent d'estimer les résultats réels de chaque candidat, avec un risque de 5%, au regard de l'échantillon de taille 1000 choisi. Ces 3 intervalles se chevauchent partiellement, ce qui signifie que le résultat du premier tour est incertain. Il est théoriquement impossible de conclure quant aux candidats qui vont s'affronter au second tour.

Néanmoins, on peut noter que les résultats réels de l'élection, donnés dans le second tableau, appartiennent tous à l'intervalle de confiance respectif de chaque candidat. On peut en déduire que le sondage a bien été réalisé et fut relativement fiable.

pub

Demandez à vos parents de vous abonner

Vous ne possédez pas de carte de crédit et vous voulez vous abonner à Kartable.

Vous pouvez choisir d'envoyer un SMS ou un email à vos parents grâce au champ ci-dessous. Ils recevront un récapitulatif de nos offres et pourront effectuer l'abonnement à votre place directement sur notre site.

J'ai une carte de crédit

Vous utilisez un navigateur non compatible avec notre application. Nous vous conseillons de choisir un autre navigateur pour une expérience optimale.