La loi des grands nombresCours

I

L'inégalité de Bienaymé-Tchebychev

L'écart-type \sigma d'une variable aléatoire X est une mesure de dispersion correspondant à un écart moyen entre les valeurs prises par X et son espérance \mu. On peut se questionner sur la probabilité que la variable X prenne des valeurs plus ou moins éloignées de son espérance et mesurer cet éloignement avec l'écart-type.

Inégalité de Bienaymé-Tchebychev

Soit X une variable aléatoire réelle d'espérance \mu et de variance V.

Pour tout réel \delta>0, on a :

P(|X-\mu|\geq \delta)\leq \dfrac{V}{\delta^2}

On joue 100 fois à « pile ou face » avec une pièce équilibrée.

Soit X la variable aléatoire comptant le nombre de « pile » obtenus durant ces 100 lancers.

On sait que X suit la loi binomiale \mathcal{B}(100;0{,}5).
Son espérance est \mu=100\times 0{,}5=50.
Sa variance est V=100\times 0{,}5\times 0{,}5=25.

Ainsi, pour tout réel \delta>0, on a :
P(|X−50|\geq \delta)\leq \dfrac{25}{\delta^2}

En particulier :
P(|X−50|\geq 10)\leq \dfrac{25}{100}, soit P(|X−50|\geq 10)\leq 0{,}25.

Soit X une variable aléatoire réelle d'espérance \mu, de variance V et d'écart-type \sigma.
Soit n un entier naturel non nul.

En choisissant \delta=n\sigma dans l'inégalité de Bienaymé-Tchebychev, on obtient :
P(|X-\mu|\geq n\sigma)\leq \dfrac{1}{n^2}

Ainsi on obtient une information sur la probabilité que l'écart entre X et son espérance dépasse un certain de nombre de fois l'écart-type.

On joue 100 fois à « pile ou face » avec une pièce équilibrée.

Soit X la variable aléatoire comptant le nombre de « pile » obtenus durant ces 100 lancers.

On sait que X suit la loi binomiale \mathcal{B}(100;0{,}5).
Son espérance est \mu=100\times 0{,}5=50.
Sa variance est V=100\times 0{,}5\times 0{,}5=25.
Son écart-type est \sigma=\sqrt{25}=5.

Ainsi, pour tout entier naturel non nul n, on a :
P(|X−50|\geq 5n)\leq \dfrac{1}{n^2}

Soit X une variable aléatoire réelle d'espérance \mu, de variance V et d'écart-type \sigma.

  • L'inégalité de Bienaymé-Tchebychev a un caractère universel.
  • En contrepartie, elle est loin d'être optimale. En effet, elle montre qu'un écart à \mu supérieur à 2\sigma est de probabilité inférieure ou égale à \dfrac{1}{4}, alors que par simulation on obtient que cette probabilité est souvent majorée par 0,05.
II

L'inégalité de concentration

On peut ensuite majorer l'écart entre une variable aléatoire et son espérance dans le cas où l'on répète plusieurs fois la même épreuve et où l'on calcule la moyenne des résultats obtenus.

Soit n un entier naturel non nul.

Soient une loi de probabilité et (X_1;X_2;...;X_n) un échantillon de cette loi constitué de variables aléatoires d'espérance \mu et de variance V.

Soit M_n=\dfrac{X_1+X_2+...+X_n}{n} la variable aléatoire moyenne.

Alors pour tout réel \delta>0, on a :
P\left(|M_n-\mu|\geq \delta\right)\leq \dfrac{V}{n\delta^2}

Jeanne joue tous les jours d'une semaine donnée 100 fois à « pile ou face » avec une pièce équilibrée.

Soit X_i la variable aléatoire comptant le nombre de « pile » obtenus durant ces 100 lancers le ième jour.

On sait que quel que soit l'entier i compris entre 1 et 7 :

  • X_i suit la loi binomiale \mathcal{B}(100;0{,}5) ;
  • son espérance est E(X_i)=\mu=100\times 0{,}5=50 ;
  • sa variance est V(X_i)=V=100\times 0{,}5\times 0{,}5=25.

 

Soit M=\dfrac{X_1+X_2+...+X_7}{7} la variable aléatoire moyenne.

Ainsi, pour tout réel \delta>0, on a :
P\left(|M−50|\geq \delta\right)\leq \dfrac{25}{7\delta^2}

En particulier :
P\left(|M−50|\geq 10\right)\leq \dfrac{25}{700}, soit P\left(|M−50|\geq 10\right)\leq \dfrac{1}{28}.

La propriété précédente porte le nom d'inégalité de concentration.

Soit n un entier naturel non nul.

Soit une loi de probabilité et (X_1;X_2;...;X_n) un échantillon de cette loi constitué de variables aléatoires d'espérance \mu et de variance V.

Soit M_n=\dfrac{X_1+X_2+...+X_n}{n} la variable aléatoire moyenne.

En choisissant \delta=m \sigma avec m entier naturel non nul dans l'inégalité de concentration, on obtient :
 P\left(|M_n-\mu|\geq m\sigma\right)\leq \dfrac{1}{nm^2}

Ainsi, plus la taille de l'échantillon est grand, plus la probabilité que l'écart entre M_n et \mu dépasse un certain nombre de fois \sigma est faible.

Jeanne joue tous les jours d'une semaine donnée 100 fois à « pile ou face » avec une pièce équilibrée.

Soit X_i la variable aléatoire comptant le nombre de « pile » obtenus durant ces 100 lancers le ième jour.

On sait que quel que soit l'entier i compris entre 1 et 7 :

  • X_i suit la loi binomiale \mathcal{B}(100;0{,}5) ;
  • son espérance est E(X_i)=\mu=100\times 0{,}5=50 ;
  • sa variance est V(X_i)=V=100\times 0{,}5\times 0{,}5=25 ;
  • son écart-type est \sigma(X_i)=\sqrt{V}=\sqrt{100\times 0{,}5\times 0{,}5}=\sqrt{25}=5.

 

Soit M=\dfrac{X_1+X_2+...+X_7}{7} la variable aléatoire moyenne.

Ainsi, pour tout entier naturel non nul, m, on a :
P\left(|M−50|\geq 5m\right)\leq \dfrac{1}{7m^2}

L'inégalité précédente permet de rechercher la taille n d'un échantillon pour majorer la probabilité que l'écart à l'espérance dépasse une valeur donnée.

Jeanne joue n jours de suite au même jeu :
Lancer 100 fois une pièce équilibrée et noter le nombre de « pile » obtenus.

Soit X_i la variable aléatoire comptant le nombre de « pile » obtenus durant ces 100 lancers le ième jour.

On sait que quel que soit l'entier i compris entre 1 et n :

  • X_i suit la loi binomiale \mathcal{B}(100;0{,}5) ;
  • son espérance est E(X_i)=\mu=100\times 0{,}5=50 ;
  • sa variance est V(X_i)=V=100\times 0{,}5\times 0{,}5=25.

 

Soit M_n=\dfrac{X_1+X_2+...+X_n}{n} la variable aléatoire moyenne.

Ainsi, pour tout réel \delta>0, on a :
P\left(|M_n−50|\geq \delta\right)\leq \dfrac{25}{n\delta^2}

En particulier :
P\left(|M_n−50|\geq 10\right)\leq \dfrac{25}{100n}, soit P\left(|M_n−50|\geq 10\right)\leq \dfrac{1}{4n}.

Si l'on souhaite majorer la probabilité P\left(|M_n−50|\geq 10\right) par \dfrac{1}{100}, on peut choisir n de telle sorte que \dfrac{1}{4n}\leq \dfrac{1}{100}.

Or :
\dfrac{1}{4n}\leq \dfrac{1}{10}\Leftrightarrow \dfrac{4n}{1}\geq \dfrac{100}{1}
\dfrac{1}{4n}\leq \dfrac{1}{10}\Leftrightarrow 4n\geq 100
\dfrac{1}{4n}\leq \dfrac{1}{10}\Leftrightarrow n\geq 25

Ainsi, si Jeanne joue au moins 25 jours de suite, la probabilité que l'écart entre la moyenne et l'espérance dépasse 10 sera inférieure à \dfrac{1}{100}.

III

La loi des grands nombres

On étudie ensuite l'écart entre M_n et \mu lorsque la taille de l'échantillon devient très grande.

Loi (faible) des grands nombres

Soit n un entier naturel non nul.

Soit une loi de probabilité et (X_1;X_2;...;X_n) un échantillon de cette loi constitué de variables aléatoires d'espérance \mu et de variance V.

Soit M_n=\dfrac{X_1+X_2+...+X_n}{n} la variable aléatoire moyenne.

Alors pour tout réel \delta>0, on a :

\lim\limits_{n\to +\infty}P\left(|M_n-\mu|\geq \delta\right)=0

Soit X une variable aléatoire dont la loi de probabilité est la suivante :

-

On a donc E(X)=0\times \dfrac{1}{3}+10\times \dfrac{2}{3}=\dfrac{20}{3}.

Soit n un entier naturel non nul, (X_1;X_2;...;X_n) un échantillon de cette loi de probabilité et M_n la variable aléatoire moyenne de cet échantillon.

On a donc, pour tout réel \delta>0 :
\lim\limits_{n\to +\infty}P\left(\left|M_n-\dfrac{20}{3}\right|\geq \delta\right)=0

Autrement dit, plus n est grand, plus la probabilité que la variable aléatoire M_n prenne des valeurs « éloignées » de l'espérance est faible.

Voici les graphiques donnant les valeurs P(M_n=k) pour toutes les valeurs possibles de k dans les cas n=1, n=10 et n=50 :

-