Aux États-Unis en 2057, des élections sont organisées entre un candidat républicain et un candidat démocrate et le candidat démocrate annonce qu'il va gagner avec 53% des voix.
On réalise un sondage auprès de 3000 personnes. On peut assimiler le choix des personnes à un tirage avec remise. On constate que la proportion de personnes souhaitant voter pour le candidat républicain est 47,9%.
On suppose que le candidat démocrate a raison.
X est la variable aléatoire qui à chaque échantillon de 3000 personnes associe le nombre de personnes qui votent pour le candidat républicain.
Quelle est la loi de X ?
L'expérience "interroger une personne" a deux issues possibles :
- Succès : l'individu vote pour le candidat républicain, obtenu avec la probabilité p = 1-0{,}53=0{,}47.
- Echec : l'individu ne vote pas pour le candidat républicain, obtenu avec la probabilité q = 0{,}53.
Cette expérience est répétée 3000 fois de manière indépendante (le choix d'une personne est assimilé à un tirage avec remise).
X est la variable aléatoire qui dénombre les succès.
Donc X suit une loi binomiale de paramètres n=3\ 000 et p=0{,}47.
On souhaite valider ou rejeter l'hypothèse faite sur la proportion p d'Américains qui votent pour le candidat républicain.
Quelle proposition correspond à un intervalle de fluctuation asymptotique au seuil de 95% de la fréquence des Américains qui devraient voter pour le candidat républicain sur un échantillon aléatoire de 3 000 personnes ?
Vérifications des conditions
D'après le cours on sait qu'on peut déterminer un intervalle de fluctuation asymptotique si les conditions suivantes sont satisfaites :
- n \geq 30
- np \geq 5
- n\left(1-p\right) \geq 5
Ici, on a :
- n=3\ 000 , donc n\geqslant30
- np = 3\ 000 \times 0{,}47 = 1\ 410 , donc np\geqslant5
- n\left(1-p\right) = 3\ 000 \times 0{,}53= 1\ 590, donc n\left(1-p\right)\geqslant5
On peut donc déterminer un intervalle de fluctuation asymptotique.
Calcul des bornes l'intervalle de fluctuation asymptotique
D'après le cours, un intervalle de fluctuation asymptotique au seuil 95% de la fréquence est :
I = \left[ p- 1{,}96\dfrac{\sqrt{p(1-p)}}{\sqrt n}; p+ 1{,}96\dfrac{\sqrt{p(1-p)}}{\sqrt n}\right]
Ici, on a p=0{,}47 et n=3\ 000.
On obtient donc :
I = \left[0{,}47- 1{,}96\dfrac{\sqrt{0{,}47\times 0{,}53}}{\sqrt{3\ 000}}; 0{,}47+ 1{,}96\dfrac{\sqrt{0{,}47\times 0{,}53}}{\sqrt{3\ 000}}\right]
En arrondissant la borne inférieure par défaut et la borne supérieure par excès, on obtient :
I=[0{,}452;0{,}488]
Un intervalle de fluctuation asymptotique au seuil de 95% pour la fréquence des personnes votant pour le candidat républicain sur un échantillon aléatoire de 3 000 personnes est :
I=[0{,}452;0{,}488].
Peut-on affirmer que le candidat démocrate avait raison ?
Notons f la fréquence des personnes souhaitant voter pour le candidat républicain sur l'échantillon.
On a : f\in I.
Donc, au risque de 5%, on accepte l'hypothèse selon laquelle le candidat démocrate a raison.