Lors d'une expérience aléatoire qui se répète, on souhaite connaître la proportion des échantillons proche de l'espérance. Pour cela, on utilise l'inégalité de concentration.
Soit X une variable aléatoire réelle d'espérance \mu et de variance V .
Comment l'inégalité de Bienaymé-Tchebychev s'écrit-elle ?
L'inégalité de Bienaymé-Tchebychev nous renseigne sur la probabilité que la variable X prenne des valeurs plus ou moins éloignées de son espérance. Elle permet de mesurer l'éloignement en fonction de l'écart-type.
Elle s'écrit ainsi : pour tout réel \delta>0 , P(|X-\mu|\geq \delta)\leq \dfrac{V}{\delta^2} .
Soit X une variable aléatoire réelle d'espérance \mu et de variance V .
Soit a un entier naturel non nul.
Quelle inégalité est vraie ?
Soit X une variable aléatoire réelle d'espérance \mu , de variance V et d'écart-type \sigma .
Soit a un entier naturel non nul.
En choisissant \delta=a\sigma dans l'inégalité de Bienaymé-Tchebychev, on obtient :
P(|X-\mu|\geq a\sigma)\leq \dfrac{\sigma^2}{a^2\sigma^2} car V=\sigma^2
P(|X-\mu|\geq a\sigma)\leq \dfrac{1}{a^2}
Ainsi, on a une information sur la probabilité que l'écart entre X et son espérance dépasse un certain nombre de fois l'écart-type.
On a donc : P(|X-\mu|\geq a\sigma)\leq \dfrac{1}{a^2} .
Soit n un entier naturel non nul.
Soient une loi de probabilité et (X_1;X_2;...;X_n) un échantillon de cette loi constitué de variables aléatoires d'espérance \mu et de variance V .
Soit M_n=\dfrac{X_1+X_2+...+X_n}{n} la variable aléatoire moyenne.
Comment l'inégalité de concentration s'écrit-elle ?
On sait que si X une variable aléatoire réelle d'espérance \mu , de variance V et d'écart-type \sigma et si a un entier naturel non nul, alors :
P(|X-\mu|\geq a\sigma)\leq \dfrac{1}{a^2} (*)
Soient une loi de probabilité et (X_1;X_2;...;X_n) un échantillon de cette loi constitué de variables aléatoires d'espérance \mu et de variance V et soit M_n=\dfrac{X_1+X_2+...+X_n}{n} la variable aléatoire moyenne.
On rappelle que :
E(M_n)=E(X)=\mu, V(M_n)=\dfrac{1}{n}V(X) et \sigma(M_n)=\dfrac{1}{\sqrt{n}}\sigma(X)
La formule (*) écrite pour la variable moyenne M_n donne donc :
P\left(|M_n-\mu|\geq a\sigma(M_n)\right)\leq \dfrac{1}{a^2}
P\left(|M_n-\mu|\geq \dfrac{a\sigma}{\sqrt{n}}\right)\leq \dfrac{1}{a^2}
En choisissant a=k\sqrt{n} où k\in\mathbb{N}^{\star}, on en déduit :
P\left(|M_n-\mu|\geq k\sigma\right)\leq \dfrac{1}{nk^2}
Ainsi, plus la taille de l'échantillon est grande, plus la probabilité que l'écart entre M_n et \mu dépasse un certain nombre de fois \sigma est faible.
On a donc : P\left(|M_n-\mu|\geq k\sigma\right)\leq \dfrac{1}{nk^2} .
Jeanne joue, tous les jours d'un mois de 30 jours, 50 fois à « pile ou face » avec une pièce équilibrée.
Soit X_i la variable aléatoire comptant le nombre de « pile » obtenus durant ces 50 lancers le i -ème jour.
On note M = \dfrac{X_1 + \cdots + X_{30}}{30} la variable aléatoire moyenne.
Quelle inégalité obtient-on pour P\left(|M_n - \mu| \geq 2 \sigma\right) ?
On sait que quel que soit l'entier i compris entre 1 et 30 :
- X_i suit la loi binomiale \mathcal{B}(50;0{,}5) ;
- son espérance est E(X_i)=\mu=50\times 0{,}5=25 ;
- sa variance est V(X_i)=V=50\times 0{,}5\times 0{,}5=12{,}5 ;
- son écart-type est \sigma(X_i)=\sqrt{V}=\sqrt{50\times 0{,}5\times 0{,}5}=\sqrt{12{,}5}\approx 3{,}5 .
Ainsi, pour tout entier naturel non nul k , on a :
P\left(|M-50|\geq k\sigma\right)\leq \dfrac{1}{30k^2}
Pour k = 2 :
P\left(|M-50|\geq 2\sigma \right)\leq \dfrac{1}{30 \times 4}
P\left(|M-50|\geq 2\sigma \right)\leq \dfrac{1}{120}
On a donc : P\left(|M-50|\geq 2\sigma \right)\leq 0{,}8 \text{ \%}.