Ce cours parle de choses très simples, mais sur un mode à la fois "recherche" (on joue avec les notions, on veut que chacune d'entre elles ait une raison d'être qui soit satisfaisante) et à la fois "applications" (on n'étudie que des choses qui peuvent être utiles professionnellement).
Ce document n'est pas fini, mais s'il est utile à quelqu'un qui aimerait avoir la suite, il n'y a qu'à demander par mail...
Voici le menu des réjouissances :
Dans le fil du texte, il y a tout un tas de petites questions. Essayez d'y répondre par vous même avant de regarder la solution.
Pour y répondre, vous pouvez faire le calcul de tête ou alors avec un tableur (avec une calculatrice, c'est trop facile !).
Voici un lien vers un fichier tableur (avec 2-3 explications), si vous n'avez pas le vôtre sous la main.
En général, en statistique, on a au départ un ensemble de nombres et on veut en rendre compte de façon rapide et simple.
Par exemple, on a les salaires de tous les employés d'une entreprise et on veut résumer tout cet ensemble de nombres.
Il y a essentiellement deux choses à dire pour faire ce résumé :
Mais avant de parler de ces indicateurs, permettant de résumer un grand nombre de valeurs, voyons déjà ce qu'on peut dire quand on n'a que deux valeurs, mettons et
Bon. Les fractions, c'est super, mais beaucoup de gens n'y comprennent pas grand chose. Souvent, on leur préfère les pourcentages.
Ce sont des fractions par rapport à 100 : 12% est une notation pour désigner
.
Combien de pour-cent représentent 6 mois par rapport à 21 ? Bonne question :-)
Pour le calculer, on utilise un calcul de proportionnalité. Suivant la façon dont vous l'avez appris à l'école, ce calcul peut être présenté différemment mais souvent les gens l'écrivent ainsi :
mois d'écart | 6 | ? |
par rapport à | 21 | 100 |
Pouvez-vous calculer les proportions suivantes ?
Un salaire de 1000€ sur une masse salariale totale de 8000€
en fraction :
,
en valeur décimale :
,
en pourcentage : 12, 5%
.
Un salaire de 1 000 000 € sur une masse salariale totale de 1 008 000€
en fraction : ou, après réduction,
,
en valeur décimale :
,
en pourcentage : 99%
.
Une semaine pour un bébé âgé de 2 mois (combien de semaines compte un mois ?
Réponse : dans un an de 12 mois, il y a 52 semaines, soit semaines par mois
)
en fraction : (ou en comptant 4 semaines par mois...)
,
en valeur décimale : (pour 4,3 semaine par mois)
,
en pourcentage : 12% (après avoir arrondi)
.
L'écart relatif est donc souvent utilisé dans un contexte d'augmentation ou de diminution : il est dans ce cas appelé pourcentage d'évolution.
Deux enfants sont âgés de 5 et 8 ans.
Quel est l'écart d'âge relatif par rapport au plus jeune ?
En pourcentage : 60%
.
Quel est l'écart d'âge relatif par rapport au plus âgé ?
En pourcentage : 37, 5%
.
Un prix augmente de 10€ à 15€. Quel pourcentage d'augmentation cela représente-t-il ?
En pourcentage : 50%
.
Un prix baisse de 15€ à 10€. Quel pourcentage de diminution cela représente-t-il ?
En pourcentage : -33%
.
Comme on le voit sur ces exemples, si on calcule un écart relatif par rapport à la première valeur
x1 on n'obtient pas le même résultat que si on le calcule par rapport à l'autre valeur.
Conventionnellement, on exprime toujours l'écart relatif par rapport à la première valeur.
Cela donne lieu à tout un tas d'erreurs : par exemple, si on a dans un sens une évolution de +50%,
on n'a pas dans l'autre sens une évolution de -50%, mais de -33%...
Si on augmente deux fois de 20%, l'augmentation globale n'est pas de 40%, etc.
En bref : attention en additionnant ou soustrayant des pourcentages. S'il s'agit d'écart relatif ou d'évolution
ces calculs avec les pourcentages sont faux.
Résumé de l'épisode précédent :
En statistique, on a en général de grandes séries de nombres qu'on cherche à résumer par des indicateurs.
Il y a des indicateurs de position, qui servent à avoir une idée de "autour de quelle valeur se situent les nombres
qu'on étudie".
Il y a des indicateurs de dispersion, qui servent à avoir une idée de "si les nombres étudiés sont proches les uns
des autres ou pas".
Comme auparavant, on commence par se demander ce qui se passe quand on a seulement deux valeurs : x1 et x2. Si on veut savoir "autour de combien ces deux valeurs se situent, il suffit de calculer la valeur qui est "au milieu entre x1 et x2". Par exemple, si x1=50€ et x2=100€, quelle est la valeur au milieu entre ces deux valeurs ? C'est 75€...
Comment calculer ce milieu ? Réponse : en calculant
On peut par exemple calculer le milieu entre 1000€ et 1500€
Réponse : 1250€
,
le milieu entre les températures -15°C et -17°C
Réponse : -16°C (bien sûr)
,
ou entre -8°C et +12°C
Réponse : 2°C
,
le milieu entre 1501,69€ et 1502,37€
Réponse : 1502, 03€
,
ou encore entre 8 mois et 1 an
Réponse : 10 mois.
.
Voyons maintenant ce qui se passe lorsqu'on a plus de deux valeurs.
Par exemple, trois :-)
Notons-les
x1,
x2 et
x3. Supposons en outre qu'elles sont rangées par ordre croissant, c'est à dire de la plus petite
à la plus grande, c'est à dire que
.
On a alors le choix : soit on considère que la valeur "du milieu" est
x2 : on utilise alors ce qui en statistique s'appelle la médiane (voir après) ;
soit on calcule la moyenne de
x1,
x2 et
x3.
On utilise alors la formule :
La moyenne est le nombre tel que si on additionne
x1,
x2 et
x3, on obtient la même somme qu'en additionnant 3 fois la moyenne : si les trois nombres
x1,
x2 et
x3 étaient égaux, mais que
leur somme restait inchangée, quelle devrait être leur valeur ? Réponse : cela devrait être leur moyenne.
La définition de la moyenne est donc assez abstraite, comme on vient de le constater. Cependant, on rencontre souvent des moyennes dans la vie courante, c'est pourquoi nous y sommes habitués.
Dans le cas où il y a plus que trois valeurs, la façon de calculer la moyenne est la même : on additionne tout et on divise par le nombre de valeurs.
Parfois, on affecte chaque valeur d'un coefficient, permettant de donner plus ou moins d'importance à la valeur. Le calcul de la moyenne est alors le suivant :
Multiplier chaque valeur par son coefficient, tout additionner : on obtient une première somme. Additionner tous les coefficients. Diviser la première somme par la somme des coefficients.
Voilà quelques exemples. Essayez de retrouver chaque moyenne. Si vous n'y arrivez pas, il y a des indications pour vous aider.
nom | Joe | Jack | Wiliam | Averell |
taille | 1.2 | 1.6 | 1.7 | 2 |
taille | 1.2 | 1.3 | 1.4 | 1.5 |
effectif | 2 | 3 | 5 | 1 |
valeur | 1200 | 1500 | 1700 | 2200 |
coefficient | 0.1 | 0.4 | 0.3 | 0.1 |
Si on reprend le cas où il y a trois valeurs, par exemple 2.3 ; 1.4 et 5.0, alors on peut bien sûr calculer leur moyenne pour obtenir un indicateur de position. Mais on peut aussi calculer leur médiane.
Ici, la médiane est 2.3. En effet, si je classe les valeurs dans l'ordre, celle du milieu est 2.3. Il y en a une qui est inférieure à cette valeur et une qui est supérieure.
Un autre exemple : on ajoute la valeur 1.1 à la liste précédente. Les 4 valeurs sont 1.1 ; 2.3 ; 1.4 et 5.0. Quelle est la médiane ? Si on classe les valeurs dans l'ordre, on obtient . Bien sûr, le problème est alors qu'il n'y a aucune valeur centrale : il y a le groupe des deux valeurs les plus petites, celui des deux valeurs les plus grandes, et rien entre les deux groupes. Dans ce cas, la médiane peut être n'importe quelle valeur située entre les deux groupes, c'est à dire entre 1.4 et 2.3. En général, pour fixer les choses, on prend pour médiane le milieu entre 1.4 et 2.3, soit ici 1.85 (pourquoi ?)
Plus généralement, pour obtenir la médiane d'une série de valeurs, on les classe et on essaye de les partager en deux groupes de même effectif : celui des plus petites valeurs et celui des plus grandes.
Si l'effectif total est impair, la médiane est la valeur restée "toute seule au milieu".
Si l'effectif total est pair, la médiane est le milieu entre la dernière valeur du premier groupe et la première du second groupe.
Pouvez-vous trouver la médiane dans les trois cas suivants ?
nom | Joe | Jack | Wiliam | Averell |
taille | 1.2 | 1.6 | 1.7 | 2 |
taille | 1.2 | 1.3 | 1.4 | 1.5 |
effectif | 2 | 3 | 5 | 1 |
taille | 1.2 | 1.3 | 1.4 |
effectif | 2 | 3 | 5 |
...à faire...