Loi hypergéométrique
Un article de Wikipédia, l'encyclopédie libre.
Une loi hypergéométrique de paramètres n, p et A correspond au modèle suivant:
On tire simultanément n boules dans une urne contenant pA boules gagnantes et qA boules perdantes (avec q = 1 - p). On compte alors le nombre de boules gagnantes extraites et on appelle X la variable aléatoire donnant le nombre de boules gagnantes.
L'univers X(Ω) est l'ensemble des entiers de 0 à n.
La variable aléatoire suit une loi de probabilité définie par
Cette loi de probabilité s'appelle la loi hypergéométrique de paramètres (n ; p ; A). Il est nécessaire que p soit un réel compris entre 0 et 1, que pA soit entier et que n ≤ A
Sommaire |
[modifier] Calcul de p(k)
Il s'agit d'un tirage de n éléments parmi A. Tirage que l'on considère comme équiprobable.
La combinatoire permet de dire que le cardinal de l'univers est .
L'événement « X=k » signifie que l'on a tiré k boules gagnantes parmi pA et n - k boules perdantes parmi qA. Le cardinal de cet événement est donc .
La probabilité de l'événement est donc
[modifier] Espérance, variance et écart type
L'espérance d'une variable aléatoire suivant une loi hypergéométrique est la même que dans le cas binômiale. suit une loi hypergéométrique de paramètres , alors son espérance est . (On a posé )
La variance d'une variable aléatoire suivant une loi hypergéométrique de paramètres n, p, A est
L'écart type est alors .
[modifier] Convergence
Pour n petit devant A, la loi hypergéométrique est équivalente à une loi binomiale de paramètres n et p. En fait, on considère que, pour A grand, tirer simultanément n boules revient à effectuer n fois une épreuve de Bernoulli dont la probabilité de succès serait p (p est la proportion de boules gagnantes dans l'ensemble des boules).
En pratique, on remplace la loi hypergéométrique de paramètres (n ; p ; A) par une loi binomiale de paramètres (n ; p) dès que 10n < A.
Un exemple très classique de ce remplacement concerne le sondage. On considère fréquemment le sondage de n personnes comme n sondages indépendants alors qu'en réalité le sondage est exhaustif (on n'interroge jamais deux fois la même personne). Comme n(nombre de personnes interrogées) < A(population sondée)/10, cette approximation est légitime.