Correction Exercices d'entrainement types Bac : Statistiques - TL
Exercice 1
Le tableau donne l'évolution du pourcentage de ménages possédant au moins une voiture dans un pays A entre 1958 et 1986.
Année |
58 | 62 | 66 | 70 | 74 | 78 | 82 | 86 |
---|---|---|---|---|---|---|---|---|
% voiture |
25.9 | 35.7 | 49 | 56.5 | 62.1 | 66.8 | 71 | 74.7 |
1. Représenter le nuage de points
Axe horizontal : x, l’année (utiliser 1 cm pour 2 ans ou centrer autour de 1970 pour limiter la largeur).
Axe vertical : y, le pourcentage de ménages (échelle : 1 cm pour 5 % par exemple).
Tracer les points (58, 25.9), (62, 35.7),…, (86, 74.7)
2. Calculs statistiques
a) Moyennes ˉX et ˉY
On calcule les sommes des x et des y :
b) Variances V(X), V(Y), Covariance cov(X,Y)
On construit un tableau :
|
|
|
|
|
|
|
---|---|---|---|---|---|---|
58 | 25.9 | -14 | -29.31 | 196 | 858.36 | 4103.4 |
62 | 35.7 | -10 | -19.51 | 100 | 380.6 | 195.1 |
66 | 49 | -6 | -6.21 | 36 | 38.57 | 37.26 |
70 | 56.5 | -2 | 1.29 | 4 | 1.66 | -2.58 |
74 | 62.1 | 2 | 6.89 | 4 | 47.47 | 13.78 |
78 | 66.8 | 6 | 11.59 | 36 | 134.34 | 69.54 |
82 | 71 | 10 | 15.79 | 100 | 249.34 | 157.9 |
86 | 74.7 | 14 | 19.49 | 196 | 379.96 | 272.86 |
Totaux | 672 | 2090.3 | 4847.3 |
Variance de X :
Variance de Y :
Covariance :
3. Droite de régression de Y en X
Forme : y=ax+b, où :
a=cov(X,Y)V(X)=605.9184≈7.21
b=ˉY−aˉX=55.21−7.21×72=55.21−519.12=−463.91
Équation de la droite de régression :
4. Estimation pour l’année 2000
x=2000 ? Attention ! Nos années sont notées sans les deux premiers chiffres (1958 → 58), donc 2000 correspond à x = 100
Cela dépasse 100 %, donc il faut conclure que le modèle linéaire devient irréaliste à long terme. Il est probablement valide uniquement entre 1958 et 1986.
Conclusion
La proportion de ménages possédant au moins une voiture a fortement augmenté entre 1958 et 1986.
La relation entre année et pourcentage est bien linéaire sur cette période.
Le modèle de régression obtenu permet une estimation correcte sur une courte période, mais n’est pas fiable pour des projections trop lointaines comme l’an 2000.
Exercice 2 (Bac 2000, 1er groupe, série L1 et L'1)
On étudie ici l’évolution de la tension artérielle moyenne Y en fonction de l’âge X d’une population.
Âge |
36 | 42 | 48 | 54 | 60 | 66 |
---|---|---|---|---|---|---|
Tension |
11.8 | 14 | 12.6 | 15 | 15.5 | 15.1 |
1. Représenter le nuage de points
Échelles :
1/2 cm pour 1 an → 1 cm pour 2 ans
3 cm pour 1 unité de tension
Coordonnées des points à tracer :
(36, 11.8), (42, 14), (48, 12.6), (54, 15), (60, 15.5), (66, 15.1)
2.a. Moyennes et variances
Données :
X=[36,42,48,54,60,66]
Y=[11.8,14,12.6,15,15.5,15.1]
Calcul de la moyenne de X :
Moyenne de Y :
Variance de X :
Variance de Y :
2.b. Coefficient de corrélation r
La covariance est :
On fait le calcul détaillé :
|
|
|
|
Produit |
---|---|---|---|---|
60000 | 11 | -6000 | -7.25 | 43500 |
64000 | 17 | -2000 | -1.25 | 2500 |
68000 | 20 | 2000 | 1.75 | 3500 |
72000 | 25 | 6000 | 6.75 | 40500 |
|
|
|
|
|
---|---|---|---|---|
36 | 11.8 | -15 | -2.2 | 33.0 |
42 | 14 | -9 | 0 | 0 |
48 | 12.6 | -3 | -1.4 | 4.2 |
54 | 15 | 3 | 1 | 3.0 |
60 | 15.5 | 9 | 1.5 | 13.5 |
66 | 15.1 | 15 | 1.1 | 16.5 |
Le coefficient de corrélation :
Corrélation positive forte (car r≈0.83).
3. Droite de régression de Y en X
Forme : y=ax+b
a=cov(X,Y)V(X)=11.7105≈0.1114
b=ˉY−aˉX=14−0.1114⋅51≈14−5.68=8.32
Équation :
4. Estimation pour une femme de 70 ans
Estimation : La tension artérielle moyenne attendue est environ 16.1.
Exercice 3 (Bac 2000, 1er groupe, L2)
On donne la série statistique suivante :
|
1.2 | 1.4 | 1.6 | 1.8 | 2 |
---|---|---|---|---|---|
|
13 | 12 | 14 | 16 |
|
Et la droite de régression de y en x est donnée par :
1. Calcul de ¯X
2. Exprimer ¯Y en fonction de α
3. Déduire que α=20
L’idée ici est d’utiliser le fait que la droite de régression passe par le point moyen G(¯X,¯Y).
Or la droite est :
Donc :
Mais on a aussi :
Donc, α=20
4. Calcul du coefficient de corrélation linéaire
On utilise la formule :
Ou bien on utilise le fait que la droite de régression est connue y=9x+0.6, donc :
a=9
r=a⋅σXσY⇒r=cov(X,Y)σXσY=9⋅σ2XσXσY=9σXσY
Nous devons donc calculer les variances ou les écarts-types.
On peut aussi utiliser une méthode directe avec tableau.
Données mises à jour :
|
|
---|---|
1.2 | 13 |
1.4 | 12 |
1.6 | 14 |
1.8 | 16 |
2.0 | 20 |
5. Estimer Y pour X=3.2
À l’aide de la droite de régression :
Exercice 4
On note :
X : quantité de matières premières (en tonnes),
Y : chiffre d’affaires (en millions de francs),
Les valeurs sont :
X=[0.9,1.2,0.6,0.5,1.4,1.0],
Y=[37,40 ou 49,33,33,41,35]
Le deuxième mois donne une ambiguïté : deux valeurs pour Y, soit 40 ou 49. On va faire le calcul deux fois si nécessaire.
1. Nuage de points et point moyen
Valeurs (cas avec Y=40) :
Point moyen G(ˉx,ˉy) :
2.a. Covariance
Formule :
On calcule :
|
|
|
|
Produit |
---|---|---|---|---|
0.9 | 37 | -0.033 | 0.5 | -0.0165 |
1.2 | 40 | 0.267 | 3.5 | 0.9345 |
0.6 | 33 | -0.333 | -3.5 | 1.1655 |
0.5 | 33 | -0.433 | -3.5 | 1.5155 |
1.4 | 41 | 0.467 | 4.5 | 2.1015 |
1.0 | 35 | 0.067 | -1.5 | -0.1005 |
Total : ∑=5.6
2.b. Coefficient de corrélation
Formule :
On calcule :
σ2X=16∑(xi−ˉx)2
σ2Y=16∑(yi−ˉy)2
3. a. Équation de la droite de régression
Forme : y=ax+b
Donc :
4. Estimation de X pour Y=40
Donc, il faut environ 1.30 tonne de matières premières pour un chiffre d'affaires de 40 millions.
Exercice 5
Données :
X= salaire proposé : [60000,64000,68000,72000]
Y= candidatures : [11,17,20,25]
1. Nuage de points
2. Droite de régression de Y en X
On centre les X autour de leur moyenne pour simplifier :
ˉX=60000+64000+68000+720004=66000
ˉY=11+17+20+254=18.25
|
|
|
|
Produit |
---|---|---|---|---|
60000 | 11 | -6000 | -7.25 | 43500 |
64000 | 17 | -2000 | -1.25 | 2500 |
68000 | 20 | 2000 | 1.75 | 3500 |
72000 | 25 | 6000 | 6.75 | 40500 |
Donc, équation :
3. Estimation du salaire pour 30 candidatures
Il doit proposer environ 77 533 F CFA pour espérer 30 candidatures.
Ajouter un commentaire