Devenir Premium
Se connecter
ou

L'échantillonnage Cours

I

Échantillon

Échantillon

Soit n un entier naturel non nul. Un échantillon de taille \(\displaystyle{n}\) est obtenu en prélevant au hasard, successivement et avec remise, \(\displaystyle{n}\) éléments d'une population.

Prélever 100 pièces dans une production successivement, au hasard et avec remise permet de constituer un échantillon. A chaque tirage, on note si la pièce présente un défaut ou non avant de la remettre dans la production.

Souvent, il n'y a pas de remise lors du prélèvement. Mais lorsque l'effectif total est très grand par rapport au nombre d'objets prélevés, on considère néanmoins que l'échantillon est constitué, au sens de la définition donnée, avec remise.

II

Détermination d'un intervalle de fluctuation

Au sein d'une population, on connaît la proportion \(\displaystyle{p}\) des individus ayant un caractère donné.

Parmi les échantillons de taille \(\displaystyle{n}\) extraits de cette population, la fréquence d'apparition \(\displaystyle{f}\) du caractère varie avec l'échantillon prélevé.

Lors d'une élection, un candidat a reçu 58% des suffrages. Si on prélève différents échantillons d'électeurs, la proportion de personnes ayant voté pour ce candidat dans l'échantillon, varie d'un échantillon à l'autre, tout en restant assez proche de 0,58.

Intervalle de fluctuation

Si \(\displaystyle{p}\) est la proportion d'un caractère dans une population (avec \(\displaystyle{0,2\leq p\leq0,8}\) ) alors pour un échantillon de taille \(\displaystyle{n}\) (avec \(\displaystyle{n\geq 25}\) ), la fréquence \(\displaystyle{f}\) du caractère dans l'échantillon appartient à l'intervalle \(\displaystyle{\left[ p-\dfrac{1}{\sqrt{n}};p+ \dfrac{1}{\sqrt{n}}\right]}\) avec une probabilité d'au moins 0,95.

Lors d'une élection, un candidat a reçu 58% des suffrages (\(\displaystyle{p=0,58}\) avec \(\displaystyle{0,2\leq p\leq 0,8}\)). Si on prélève un échantillon de \(\displaystyle{n=100}\) (\(\displaystyle{n\geq 25}\)) électeurs, la fréquence de personnes ayant voté pour ce candidat dans l'échantillon, est dans l'intervalle de fluctuation \(\displaystyle{\left[ 0,58-\dfrac{1}{\sqrt{100}};0,58+ \dfrac{1}{\sqrt{100}}\right]}\) soit \(\displaystyle{\left[ 0,48;0,68 \right]}\), avec une probabilité d'au moins 0,95.

L'intervalle de fluctuation à 95% est un intervalle qui contient au moins 95% des fréquences observées dans les échantillons de taille \(\displaystyle{n}\). Ceci signifie qu'il y a un risque de 5% pour cette fréquence de ne pas se trouver dans cet intervalle.

On peut choisir d'autres coefficients à la place de 95%. Le niveau de confiance le plus fréquemment utilisé après 95% est 99%.

III

Prise de décision sur un échantillon

Prise de décision

On considère une population dans laquelle on suppose que la proportion d'un caractère est \(\displaystyle{p}\). Après expérience, on observe \(\displaystyle{f}\) comme fréquence de ce caractère dans un échantillon de taille \(\displaystyle{n}\).

Soit l'hypothèse : "La proportion de ce caractère dans la population est \(\displaystyle{p}\) ".

Si \(\displaystyle{I}\) est l'intervalle de fluctuation de la fréquence à 95% dans les échantillons de taille \(\displaystyle{n}\), alors :

  • Si \(\displaystyle{f\notin I}\) : on rejette cette hypothèse au seuil de risque 5%
  • Sinon, on ne rejette pas cette hypothèse au seuil de risque 5%.

Un laboratoire annonce qu'un médicament sauve 40% (\(\displaystyle{p=0,40}\) avec \(\displaystyle{0,2\leq p \leq0,8}\)) des patients atteints d'une maladie rare. Pour contrôler cette affirmation, on le teste sur \(\displaystyle{n=100}\) (\(\displaystyle{n\geq25}\)) patients atteints de cette maladie.

La fréquence des malades sauvés est de 25% (\(\displaystyle{f=0,25}\)). Que penser de l'affirmation du laboratoire ?

L'intervalle de fluctuation à 95%, de la fréquence des patients sauvés, dans les échantillons de taille 100 est \(\displaystyle{\left[ 0,40-\dfrac{1}{\sqrt{100}};0,40+ \dfrac{1}{\sqrt{100}}\right]}\) soit \(\displaystyle{\left[ 0,30 ; 0,50 \right]}\).

La fréquence observée, qui est 0,25, n'appartient pas à l'intervalle de fluctuation, donc, au seuil de risque 5%, on rejette l'hypothèse selon laquelle ce médicament sauve 40% des malades.