Biostatistique

Tableaux statistiques et représentations graphiques

Soit une population composée de individus, sur laquelle on a étudié un caractère possédant  valeurs possibles. Ces valeurs sont des modalités (cas qualitatif) ou des nombres (cas quantitatif).

Soient :

n_1 \text{ le nombre d’individus ayant pris la valeur } x_1\\ n_2 \text{ le nombre d’individus ayant pris la valeur } x_2\\ .\\ .\\ .\\ n_k \text{ le nombre d’individus ayant pris la valeur }x_k

est appelé fréquence  ou effectif de la valeur et est l'effectif total.

  • On appelle fréquence relative ou effectif relatif de la valeur la quantité :

f_i=\frac{n_i}{n}\left(\text { ou en } \% f_i=\frac{n_i}{n} \times 100 \%\right) .

C'est la proportion d'individus ayant pris la valeur .

Remarque

\begin{aligned} &\begin{aligned} \sum_{i=1}^k n_i & =n_1+n_2+\ldots+n_k=n . \\ \sum_{i=1}^k f_i & =f_1+f_2+\ldots+f_k=\frac{n_1}{n}+\frac{n_2}{n}+\ldots+\frac{n_k}{n}=1 \end{aligned}\\ &\begin{array}{|c|c|c|} \hline \text { Modalités } & \text { Effectifs } & \text { Fréquences relatives } \\ x_i & n_i & f_i=\frac{n_i}{n} \\ \hline x_1 & n_1 & f_1=\frac{n_1}{n} \\ x_2 & n_2 & f_2=\frac{n_2}{n} \\ \vdots & \vdots & \vdots \\ x_k & n_k & f_k=\frac{n_k}{n} \\ \hline \text { Total } & \sum_{i=1}^k n_i=n & \sum_{i=1}^k f_i=1 \\ \hline \end{array} \end{aligned}

Tableau statistique relatif à un caractère qualitatif et sa représentation graphique

Exemple

On veut étudier les lois de Mendel sur le caractère couleur de la fleur de balsamine. Pour cela, on étudiera le croisement des plantes h'et'erozygotes. On obtient quatre couleurs : pourpre, rose, blanc-lavande et blanche.

Population : les plantes de balsamine.

Individu : une plante.

Caractère étudié : couleur de la fleur.

\begin{array}{|c|c|c|c|} \hline \text { Modalités } x_i & \text { Effectif } n_i & \text { Fréquences relatives } f_i & f_i \text { en \% } \\ \hline \text { Pourpre } & 1790 & 0.5778 & 57.78 \% \\ \hline \text { Rose } & 547 & 0.1766 & 17.66 \% \\ \hline \text { Blanc-Lavande } & 548 & 0.1769 & 17.69 \% \\ \hline \text { Blanche } & 213 & 0.0688 & 6.88 \% \\ \hline \text { Total } & 3098 & 1 & 100 \% \\ \hline \end{array}

Représentation graphique

L'information résumée dans un tableau statistique se traduit par un graphique pour en réaliser une synthèse visuelle.

a) Représentation par tuyaux d'orgue (diagramme en colonnes)

Dans ce cas, le graphe s'obtient en construisant autant de colonnes que de modalités du caractère qualitatif. Ces colonnes sont des rectangles de bases constantes et de hauteurs proportionnelles aux fréquences relatives.

Représentation en tuyaux d'orgue des fréquences relatives.
b) Représentation par le diagramme circulaire (Camembert)
\theta_i=360^{\circ} \times f_i=360^{\circ} \times \frac{n_i}{n}

Les angles correspondant de l'exemple sont :

\begin{aligned} & \theta_1=360^{\circ} \times 0.5778=208.01^{\circ} \longrightarrow \text { Pourpre } \\ & \theta_2=360^{\circ} \times 0.1766=63.58^{\circ} \longrightarrow \text { Rose } ; \\ & \theta_3=360^{\circ} \times 0.1769=63.68^{\circ} \longrightarrow \text { Blanc-Lavande; } \\ & \theta_4=360^{\circ} \times 0.0688=24.77^{\circ} \longrightarrow \text { Blanche } . \end{aligned}
Diagramme en camembert des fréquences relative

Tableaux statistiques relatifs à un caractère quantitatif et représentations graphiques

Cas d'une variable statistique discrète :

Exemple

Lors d'un contrôle d'une chaîne de médicaments, on s'interroge sur le nombre de comprimés d'effectueux dans un lot. L'étude de 200 lots a donné les résultats suivants :

75 lots ont 0 comprimés défectueux ;

53 lots ont 1 comprimé défectueux ;

39 lots ont 2 comprimés défectueux ;

23 lots ont 3 comprimés défectueux ;

9 lots ont 4 comprimés défectueux ;

1 lot a 5 comprimés défectueux.

Population : l'ensemble des lots des médicaments.

Individu : un lot

Caractère étudié : nombre de comprimés défectueux

Modalités : 0, 1, 2, 3, 4 et 5.

Les fréquences relatives obtenues sont données dans le tableau suivant :

\begin{array}{|c|c|c|c|} \hline \begin{array}{c} \text { Modalités } \\ \text { (Nbre de comprimés défectueux) } \end{array} & \begin{array}{c} \text { Nbre de lots } \\ n_i \end{array} & \begin{array}{c} \text { Fréq. rel. } \\ f_i=\frac{n_i}{n} \end{array} & \begin{array}{c} \text { Fréq. rel. } \\ \text { en } \% \end{array} \\ \hline 0 & 75 & 0.375 & 37.5 \% \\ 1 & 53 & 0.265 & 26.5 \% \\ 2 & 39 & 0.195 & 19.5 \% \\ 3 & 23 & 0.115 & 11.5 \% \\ 4 & 9 & 0.045 & 4.5 \% \\ 5 & 1 & 0.005 & 0.5 \% \\ \hline \text { Total } & 200 & 1 & 100 \% \\ \hline \end{array}

Représentation graphique :

On utilise le diagramme en bâtons pour représenter les effectifs et les fréquences relatives . Dans le cas du graphe des fréquences relatives, en joignant les sommets des batons, on obtient le polygone des fréquences relatives.

Diagramme en escalier des fréquences relatives
Cas d'une variable statistique continue :

Lorsque la variable statistique est continue, les donnes sont regroupées en classes.

\left[e_{0}, e_{1}\left[,\left[e_{1}, e_{2}\left[,\left[e_{2}, e_{3}\left[, \ldots,\left[e_{k-1}, e_{k}[\right.\right.\right.\right.\right.\right.\right.

Les modalités représentent les centres des classes ., avec :

  • est appelé l'extrémité inférieure de la classe

  • est appelé l'extrémité supérieure de la classe

  • est l'amplitude de la classe ;

  • est appelé l'étendu de la variable statistique.

Exemple1.6

Une étude faite sur la taille d'un groupe d'étudiants (en mètre) a donné les résultats suivants :

Population : les étudiants du groupe.

Individu : un étudiant.

Caractère étudié : la taille d'un étudiant.

Représentation graphique :

Dans le cas d'une variable statistique continue on utilise l'histogramme.

L'histogramme des effectifs
L'histogramme dans le cas des amplitudes inégales:

Dans ce cas les classes ont des amplitudes différentes. Du coup, il faut effectuer des corrections pour tenir compte des différences d'amplitude. Il convient de diviser les fréquences par leurs amplitudes correspondantes et on obtient ainsi, l'amplitude corrigée .

Exemple

Supposons que l'on regroupe les données de l'exemple précédent en classe d'amplitudes inégales.

L'histogramme des fréquences relatives

Représentation graphique :

Histogramme avec amplitudes inégales
PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)