Biostatistique

Paramètres de dispersion

Les deux ensembles d'observations suivants :

X=\{6,6,7,7, \underbrace{8}_{\bar{x}=M e}, 9,9,10,10\} \text { et } Y=\{1,2,4,6, \underbrace{8}_{\bar{y}=M e}, 10,12,14,15\}

ont la même moyenne et la même médiane , mais ils sont différents. Le premier ensemble est moins dispersé que le deuxième.

Étendu

On appelle étendu, notée , la différence entre la plus grande valeur et la plus petite valeur observée.

Exemple

L'étendu de est et l'étendu de est .

Variance et écart type

Variance

La variance notée est la moyenne des carrés des écarts des observations à la moyenne. Elle est définie par :

V(X)=\frac{1}{n} \sum_{1}^{k} n_{i}\left(x_{i}-\bar{x}\right)^{2}=\sum_{1}^{k} f_{i}\left(x_{i}-\bar{x}\right)^{2} .
Propriétés
  1. ;

  2. .

  3. Lorsqu'on compare les observations de deux variables statistiques et , celle qui possède l'écart-type le plus élevé est la plus dispersée.

Écart type

L'écart-type noté est la racine carrée de :

ExempleCas quantitatif discret

La variance des 200 lots de médicaments (exemple 1.5)) est :

\begin{aligned} V(X) & =\frac{1}{n} \sum_{1}^{k} n_{i} x_{i}^{2}-\bar{x}^{2} \\ & =\frac{\left(75 \times 0^{2}\right)+\left(53 \times 1^{2}\right)+\left(39 \times 2^{2}\right)+\left(23 \times 3^{2}\right)+\left(9 \times 4^{2}\right)+\left(1 \times 5^{2}\right)}{200}-(1.205)^{2} \\ & =1.473 \end{aligned}

et l'écart-type

ExempleCas quantitatif continu

La variance de l'exemple 1.6 est :

\begin{aligned} V(X) & =\frac{1}{n} \sum_{1}^{k} n_{i} c_{i}^{2}-\bar{x}^{2} \\ & =\frac{\left(8 \times 1.55^{2}\right)+\left(33 \times 1.65^{2}\right)+\left(31 \times 1.75^{2}\right)+\left(22 \times 1.85^{2}\right)+\left(6 \times 1.95^{2}\right)}{100}-(1.735)^{2} \\ & =0.010875 \end{aligned}

L'écart-type

Les quartiles

On utilise couramment les quartiles et .

est le quartile d'ordre , représente de l'échantillon;

est le quartile d'ordre , représente de l'échantillon;

est le quartile d'ordre , représente de l'échantillon.

Intervalle interquartile

contient de la population laissant à droite et à gauche . Cet intervalle est donnée par : .

Pour déterminer l'intervalle interquartile, il faut déterminer d'abord et .

Le premier quartile Q_1
Cas discret

est la valeur xi dont le rang (la position) est le plus petit entier qui suit

Exemple

Dans l'exemple des observations suivantes :   on a :

et . Le plus petit entier qui suit est 3 , alors est la troisième valeur. D'où

Exemple

Reprenons l'exemple des comprimés défectueux (exemple 1.5), où on a et la valeur pour laquelle les effectifs cumulés atteignent ou dépassent pour la première fois 50 est "moins 1 ", c'est à dire la valeur de 0 , alors .

Cas continu

Dans ce cas le premier quartile est donné par la formule suivante :

Q_{1}=L_{i}+\left(\frac{\frac{n}{4}-\sum_{i=1}^{<Q_{1}} n_{i}}{n_{Q_{1}}}\right) \cdot a
  • : borne inférieure de la classe de ;

  • : effectif total;

  • : somme des effectifs correspondant à toutes les classes inférieures à la classe de ;

  • : effectif de la classe de ;

  • : amplitude de la classe de .

Exemple

Prenons le tableau de l'exemple 1.6. Pour déterminer la classe de , il suffit de tirer une ligne horizontale partant du point 0.25 ( ) de l'axe des fréquences relatives cumulées dans la courbe cumulative, arriver à l'ogive on descend une ligne verticale jusqu'à l'axe des et la classe où se situe le point d'intersection est la classe de .

La classe de correspond, à la classe où les effectifs cumulées atteignent ou dépassent pour la première fois de l'effectif total.

Dans notre exemple, la classe de est la classe .

  • ;

  • ;

  • ;

  • ;

  • ;

Q_{1}=L_{i}+\left(\frac{\frac{n}{4}-\sum_{i=1}^{<Q_{1}} n_{i}}{n_{Q_{1}}}\right) \cdot a=1.6+\left(\frac{\frac{100}{4}-8}{33}\right) 0.1=1.65515 .
Le troisième quartile Q_3
Cas discret

est la valeur dont le rang (la position) est le plus petit entier qui suit .

Exemple

Dans le même exemple des observations : ; on a :

. Le plus petit entier qui suit est 9, alors est la valeur. D'où .

Exemple

Dans l'exemple des comprimés défectueux (exemple 1.5), on a et la valeur où les effectifs cumulés atteignent ou dépassent pour la première fois 150 est "moins 3", c'est à dire la valeur de 2, alors .

Cas continu

Dans le cas continu, le troisième quartile est donné par la formule suivante :

Q_{3}=L_{i}+\left(\frac{\frac{3 n}{4}-\sum_{i=1}^{<Q_{3}} n_{i}}{n_{Q_{3}}}\right) \cdot a
  • : borne inférieure de la classe de ;

  • : effectif total ;

  • : somme des effectifs correspondant à toutes les classes inférieures à la classe de ;

  • : effectif de la classe de ;

  • : amplitude de la classe de .

Exemple

Pour déterminer la classe de de l'exemple 1.6, également, il suffit de tirer une ligne horizontale partant du point ( ) de l'axe des fréquences relatives cumulées dans la courbe cumulative, arriver à l'ogive on descend une ligne verticale jusqu'à l'axe des et la classe où se situe le point d'intersection est la classe de .

La classe de correspond, à la classe où les effectifs cumulées atteignent ou dépassent pour la première fois de l'effectif total.

Dans notre exemple, la classe de est la classe .

  • ;

  • ;

  • ;

  • ;

Q_{3}=L_{i}+\left(\frac{\frac{3 n}{4}-\sum_{i=1}^{<Q_{3}} n_{i}}{n_{Q_{3}}}\right) \cdot a=1.8+\left(\frac{\frac{3 \times 100}{4}-(8+33+31)}{22}\right) 0.1=1.8136 .
PrécédentPrécédentFin
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)