Biostatistique

Paramètres d'une variable statistique

Lorsqu'on observe une représentation graphique d'une série statistique, on peut en tirer deux observations :

  1. Paramètres de tendance centrale ou de position : valeurs situées au centre de la distribution statistique.

  2. Paramètres de dispersion : fluctuations des observations autour de la valeur centrale, mesurées par des écarts à celles-ci.

Moyenne arithmétique

La moyenne arithmétique est la somme de toutes les valeurs observées divisée par le nombre total des observations.

Cas d'une variable statistique discrète (données non groupées) :

Soient une variable statistique discrète et ses valeurs, pour lesquelles correspondent les effectifs ; avec l'effectif total.

La moyenne arithmétique notée de cette série statistique, est définie par :

\bar{x}=\frac{1}{n} \sum_{i=1}^{k} n_{i} x_{i}
Remarque
\begin{aligned} \bar{x}=\frac{1}{n} \sum_{i=1}^{k} n_{i} x_{i} & =\frac{n_{1} x_{1}+n_{2} x_{2}+\ldots+n_{k} x_{k}}{n} \\ & =\frac{n_{1}}{n} x_{1}+\frac{n_{2}}{n} x_{2}+\ldots+\frac{n_{k}}{n} x_{k} \\ & =f_{1} x_{1}+f_{2} x_{2}+\ldots+f_{k} x_{k} \\ & =\sum_{i=1}^{k} f_{i} x_{i}, \end{aligned}

est la fréquence relative.

Exemple

La moyenne arithmétique de 200 lots de comprimés de l'exemple 1.5 est :

\begin{aligned} \bar{x} & =\frac{1}{n} \sum_{i=1}^{k} n_{i} x_{i} \\ & =\frac{75.0+53.1+39.2+23.3+9.4+1.5}{200}=\frac{241}{200}=1.205 . \end{aligned}
Cas d'une variable statistique continue (données groupées) :

Dans le cas d'une variable statistique continue, les observations sont groupées dans des classes; et nous avons la même formule que le cas discret, sauf qu'on remplace les par les centres des classes :

\bar{x}=\frac{1}{n} \sum_{i=1}^{k} n_{i} c_{i}=\sum_{i=1}^{k} f_{i} c_{i}
Exemple

Exemple 1.12. La moyenne arithmétique de la taille des étudiants de l'exemple 1.6 est :

\begin{aligned} \bar{x} & =\frac{1}{n} \sum_{i=1}^{k} n_{i} c_{i} \\ & =\frac{(8 \times 1.55)+(33 \times 1.65)+(31 \times 1.75)+(22 \times 1.85)+(6 \times 1.95)}{100} \\ & =\frac{173.5}{100}=1.735 . \end{aligned}
Propriétés de la moyenne arithmétique :

La moyenne de la somme des écarts d'un ensemble d'observations à leurs moyenne arithmétique est nulle .

En effet,

\begin{aligned} \frac{1}{n} \sum_{i=1}^{k} n_{i}\left(x_{i}-\bar{x}\right) & =\frac{1}{n} \sum_{i=1}^{k}\left(n_{i} x_{i}-n_{i} \bar{x}\right)=\frac{1}{n} \sum_{i=1}^{k} n_{i} x_{i}-\frac{1}{n} \sum_{i=1}^{k} n_{i} \bar{x} \\ & =\frac{1}{n} \sum_{i=1}^{k} n_{i} x_{i}-\bar{x} \frac{1}{n} \sum_{i=1}^{k} n_{i}=\frac{1}{n} \sum_{i=1}^{k} n_{i} x_{i}-\bar{x} \frac{n}{n} \\ & =\frac{1}{n} \sum_{i=1}^{k} n_{i} x_{i}-\bar{x}=\bar{x}-\bar{x}=0 . \end{aligned}

La médiane

La médiane est la valeur pour laquelle, on a le même nombre d'individus à gauche et à droite dans un échantillon. Elle correspond au milieu de la distribution.

Cas d'une variable statistique discrète :

Pour déterminer la médiane d'un échantillon ou d'une population :

  1. on classe les individus par ordre croissant;

  2. on prend celui du milieu.

Remarque

La médiane est la valeur qui se trouve au centre de la série statistique :

- Si la valeur de l'effectif total $n$ est impaire, i.e. , alors la médiane est la valeur qui se trouve à l'ordre $ (ou ) :

M e=x_{p+1}=x_{\frac{n+1}{2}}

Si la valeur de l'effectif total $n$ est paire, i.e. , alors la médiane est la moyenne des valeurs qui se trouve à l'ordre et (ou et ) :

M e=\frac{x_{p}+x_{p+1}}{2}=\frac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2} .
Exemple

Soit un échantillon de 11 personnes dont le poids en kg est :

45,68,89,74,55,62,56,74,49,52,63 .

Les poids classés par ordre croissant sont :

\underbrace{45,68,49,52,55,56}_{5}, \underbrace{62}_{x_{6}=M e}, \underbrace{63,68,74,74,89}_{5} .

Si le nombre d'individus est pair, , on prend la moyenne entre les deux valeurs centrales.

\begin{aligned} & \underbrace{45,68,49,52,55,55,56}_{6}, \underbrace{62,63,68,74,74,89}_{6} . \\ & 45,68,49,52,55,55, \underbrace{56,62}, 63,68,74,74,89 . \end{aligned}

La médiane .

Cas d'une variable statistique continue :

Dans ce cas la médiane est donnée par la formule suivante :

M e=L_{i}+\left(\frac{\frac{n}{2}-\sum_{i=1}^{<M e} n_{i}}{n_{M e}}\right) \cdot a

- : borne inférieure de la classe médiane (classe qui divise l'effectif en deux);

- : effectif total;

- : somme des effectifs correspondant à toutes les classes inférieures à la classe médiane;

- : effectif de la classe médiane;

- : amplitude de la classe médiane.

Exemple

Prenons le tableau des fréquences relatives cumulées de l'exemple 1.6. Pour déterminer la classe médiane, il suffit de tirer une ligne horizontale partant du point ( ) de l'axe des fréquences relatives cumulées dans la courbe cumulative, arriver à l'ogive on descend une ligne verticale jusqu'à l'axe des , et la classe où se situe le point d'intersection est la classe médiane. La classe médiane correspond, aussi, à la classe où les effectifs cumulées atteint ou dépasse pour la première fois le .

Dans notre exemple, la classe médiane est la classe .

- ;

- ;

- ;

- ;

- ;

M e=L_{i}+\left(\frac{\frac{n}{2}-\sum_{i=1}^{<M e} n_{i}}{n_{M e}}\right) \cdot a=1.7+\left(\frac{\frac{100}{2}-(33+8)}{31}\right) 0.1=1.7290

Le mode

Cas d'une variable statistique discrète :

Le mode d'un ensemble d'observations est l'observation que l'on rencontre le plus fréquemment et il correspond à la modalité ayant le plus grand effectif.

Remarque

Une distribution observée peut avoir plusieurs modes. Lorsqu'une distribution observée possède un seul mode, on parle de distribution unimodale. Lorsqu'une distribution observée possède deux modes, on parle de distribution bimodale.

Exemple
  1. Dans l'exemple des comprimés défectueux (exemple 1.5), le mode est .

  2. Dans l'exemple des observations suivantes : ; y a trois modes : et .

Cas d'une variable statistique continue :

Dans le cas des données groupées en classes, le mode se calcule par la formule :

M o=L_{i}+\left(\frac{\Delta_{1}}{\Delta_{1}+\Delta_{2}}\right) \cdot a
  • : borne inférieure de la classe modale (classe correspondant au plus grand effectif) ;

  • : excédent de l'effectif de la classe modale par rapport à l'effectif de la classe précédente;

  • : excédent de l'effectif de la classe modale par rapport à l'effectif de la classe suivante;

  • : amplitude de la classe modale.

Exemple

Prenons les données de l'exemple du cas quantitatif continu (exemple 1.6) et calculons le mode.

La classe modale est ;

  • ;

  • ;

  • ;

  • .

Le mode est :

M o=L_{i}+\left(\frac{\Delta_{1}}{\Delta_{1}+\Delta_{2}}\right) \cdot a=1.6+\left(\frac{33-8}{(33-8)+(33-31)}\right) \times 0.1=1.6926 \text { mètres. }
L'histogramme des effectifs avec une illustration.
PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)